發(fā)布時間:1970-01-01 人氣:334
如果你在疫情災(zāi)區(qū),你可能接到過這樣的電話。
作為一名社區(qū)服務(wù)人員,一位姐姐打電話給你,問你是否去過疫區(qū),關(guān)心你最近的身體狀況,發(fā)燒,接觸過疫區(qū)的親戚朋友,甚至最后生氣保護你。
不要想太多。其實這個電話可能是人工智能打來的。如果你不相信,聽聽下面的電話。
自新型冠狀病毒肺炎疫情發(fā)生以來,人工智能、大數(shù)據(jù)等技術(shù)正在幫助疫情防控。
使用智能外呼電話系統(tǒng)的社區(qū)負責人告訴我PingWest如果不是因為使用了人工智能外呼系統(tǒng),他們的外呼篩選工作應(yīng)該還是手工和筆紙完成的。
這本身的出發(fā)點并不深刻。這是疫情期間最常見的防控工作之一。但也正是因為疫情本身,挨家挨戶上門變得極其困難——一是如何快速統(tǒng)計社區(qū)幾萬甚至幾十萬人的健康狀況;二是工作量大,一般統(tǒng)計人員不多;第三,更可怕的是,上門調(diào)查增加了工作人員被感染的風險,事情可能會不小心變得更糟。
使用人工智能電話實際上是在解決一個數(shù)學問題。想象一下,如果你使用勞動力,一個人可能只能在一分鐘內(nèi)撥打一兩個統(tǒng)計電話。在擁有數(shù)千人甚至數(shù)萬人的社區(qū)里,這是一件非常費力的事情,你還需要在計算機前手動輸入收集到的信息。使用人工智能呼叫統(tǒng)計電話,您可以在一分鐘內(nèi)同時撥打數(shù)百個電話,電話回訪將自動記錄在案例中,基本上不需要人們做任何事情。
回訪電話中使用的人工智能技術(shù)來自同盾技術(shù)。后者旨在幫助企業(yè)和政府通過智能語音交互、自然語言處理、計算機視覺和機器學習四項核心研發(fā)技術(shù),提高質(zhì)量和效率。智能語音呼叫解決方案只是人工智能場景著陸的一部分。
定制智能外呼平臺
對于同盾科技來說,智能外呼解決方案其實最早可以追溯到2018年發(fā)布的智能語音服務(wù)平臺——“赫茲”。
根據(jù)同盾科技之前的新聞數(shù)據(jù),同盾智能語音服務(wù)平臺 赫茲是基于自然語言處理、語音識別、語義理解、語音合成、語音識別、政府、金融、互聯(lián)網(wǎng)等應(yīng)用場景客戶群體,提供智能語音服務(wù),提高客戶企業(yè)智能、信息、數(shù)字綜合能力。
隨著疫情期間語音對話和大數(shù)據(jù)調(diào)查技術(shù)的拓展,同盾在智能語音服務(wù)平臺 赫茲的基礎(chǔ)上開發(fā)了智能疫情回訪機器人。
利用智能疫情回訪機器人,社區(qū)負責人可以讓人工智能系統(tǒng)自動查詢和記錄居民疫情信息,最終生成數(shù)據(jù)統(tǒng)計報告,實現(xiàn)社區(qū)人員疫情的快速調(diào)查和調(diào)查。
PingWest查詢同盾科技官網(wǎng),發(fā)現(xiàn)同盾智能外呼解決方案提供了簡單易用的定制操作界面。
換句話說,通過簡單的參數(shù)設(shè)置配置平臺,客戶可以通過簡單的參數(shù)設(shè)置和流程操作進行靈活的場景對話流設(shè)計。
一方面,利用同盾開發(fā)的行業(yè)細分語義理解模型,也可以輕松構(gòu)建自己的語義理解模型。通過對話管理平臺,客戶還可以使用底層強大靈活的語音合成音庫生產(chǎn)工具,生成客戶獨特的機器人色彩,音質(zhì)突出。同盾科技語音實驗室負責人燕鵬告訴我PingWest對于不同的場景,同盾還提供定制開發(fā)的語言模型,以確保語音識別在特定場景下達到客戶期望的實用準確性。
TensorFlow讓一切更簡單可靠
事實上,同盾為客戶提供語音識別、語音合成、語義理解、語音紋理識別、語音質(zhì)量檢驗等一攬子語音交互技術(shù)方案。語音交互技術(shù)的底層是高度專業(yè)的機器學習模型,其中最重要的部分是深度學習。
燕鵬表示,同盾科技算法工程師基于對相關(guān)領(lǐng)域的深入了解,選擇了合適的模型結(jié)構(gòu),并使用流行的機器學習開源框架Google TensorFlow通過建模和模型培訓,建立準確性和效果達到或超過行業(yè)先進水平的對話系統(tǒng)。
具體來說,在建模和模型訓練過程中,工程師負責模型結(jié)構(gòu)的概念設(shè)計TensorFlow提供豐富和的設(shè)計API使用同盾科技快速構(gòu)建新模型,改進舊模型。
在同盾技術(shù)語音和自然語言處理的建模中,常用的模型結(jié)構(gòu)包括循環(huán)神經(jīng)(RNN)、卷積(Convolution)、注意力機制(Attention);通過靈活的數(shù)據(jù)輸入機制(input pipelines)將領(lǐng)域數(shù)據(jù)組織成小批量數(shù)據(jù)進行參數(shù)迭代;在學習過程中,使用統(tǒng)計信息使模型收斂到更佳狀態(tài)(例如early stopping);還可以在進行大規(guī)劃數(shù)據(jù)訓練時從容中斷和重啟中斷的訓練過程。
燕鵬告訴我們,在傳統(tǒng)的語音識別過程中,需要HMM模型訓練、強制性訓練、神經(jīng)模型訓練和區(qū)分訓練多個分離步驟,工程師往往需要維護數(shù)千行腳本,分幾個步驟啟動和監(jiān)督模型訓練過程。
而使用TensorFlow構(gòu)建端到端語音識別模型可以大大簡化語音識別訓練過程,縮短語音識別模型訓練時間,減少模型尺寸。整個模型訓練過程合并成一個步驟,節(jié)省了大量腳本工具的維護,將模型訓練所需的時間從前兩周縮短到不到一周。
在對話系統(tǒng)的多個步驟——語音識別、語音理解和語音合成中,TensorFlow也大大提高了生產(chǎn)效率。TensorFlow訓練模型快速構(gòu)建后,對話系統(tǒng)的指標也領(lǐng)先于行業(yè)。
在使用智能外呼解決方案時,經(jīng)常會遇到一個問題——如果外呼聽起來不像真人,會立即作為機器人電話掛斷。
使用同盾科技TensorFlow構(gòu)建端到端語音合成系統(tǒng),不僅使整個系統(tǒng)放棄了傳統(tǒng)引擎中必須存在的多個中間步驟,而且通過采用適當?shù)哪P秃筒粩鄡?yōu)化,語音合成的主觀音質(zhì)(MOS)實時率0%,實時率提高30%。TensorFlow構(gòu)建深度學習模型后,合成語音的音質(zhì)大大提高,與行業(yè)競爭產(chǎn)品相比,同盾語音機器人的掛機率降低了31%。
在現(xiàn)實世界中,由于環(huán)境噪聲、用戶口音等復(fù)雜因素,語音識別的準確性低于實驗室可控環(huán)境。如果是新的商業(yè)場景,語音識別的準確性會降低到更低的水平。
燕鵬表示,為了應(yīng)對語義理解中不可避免的語音識別錯誤對后續(xù)模塊的影響,使用它TensorFlow構(gòu)建深度語義理解模型,包括采用學習預(yù)訓練模型和分類模型的遷移學習,語義理解模型的準確性比傳統(tǒng)方法高15%。
同盾對話機器人增加了語音識別結(jié)果的后糾正模塊,使用深度學習模型轉(zhuǎn)換識別錯誤的文本,修復(fù)部分錯誤,以提高整體對話機器人對用戶意圖的理解準確性。語音識別錯誤修正后,用戶對語音的理解變得更加準確,交互輪數(shù)比以前減少了20%。
“TensorFlow燕鵬舉說:一些獨特或新推出的能源也在同盾建模過程中發(fā)揮了重要作用,如動態(tài)構(gòu)圖、平均模型、三元損失函數(shù)等。
當然,另一邊是,像TensorFlow該技術(shù)的進步大大提高了人工智能識別的準確性,也可能帶來發(fā)音太像人等新問題,如濫用技術(shù)作為騷擾電話。
任何技術(shù)進步都可能帶來新的問題,但技術(shù)本身是中立的。燕鵬菊還認為,同盾遵循用戶信息的保護,呼叫名單由同盾客戶指定,同盾只作為技術(shù)提供商為客戶提供呼叫工具。至于用戶的語音數(shù)據(jù)是否保留,客戶負責獲得用戶的授權(quán),保留的語音數(shù)據(jù)也由客戶使用。
在疫情防控機器人領(lǐng)域,其客戶主要是社區(qū)和政府機構(gòu),外呼電話大多以政府機構(gòu)的名義撥出。幫助機構(gòu)統(tǒng)計工作在疫情戰(zhàn)期間提高效率,是一項不錯的技術(shù)。
本文鏈接:http://m.xq001.cn/hangyeyedongtai/4091.html
熱線電話
18594279421
上班時間
周一到周五
公司電話
18594279421