環(huán)球時報報道 在5G移動通信、人工智能(AI)、物聯(lián)網(wǎng)車聯(lián)網(wǎng)高速發(fā)展的今天,語音交互正在成為普通人應用這些高科技的常見場景:可以控制家中智能電器的智能音箱、一句語音就可以設置導航軟件……第二屆世界聲博會暨2019科大訊飛全球1024開發(fā)者節(jié)10月24日在合肥開幕?!董h(huán)球時報》記者在大會現(xiàn)場感受到一系列令人震撼的黑科技,它們已經(jīng)從酷炫的應用走向滿足人們的剛需。
大會上,訊飛展示的“變聲領夾”讓人想起日本動漫《名偵探柯南》中同款產(chǎn)品??拼笥嶏wAI研究院常務副院長劉聰通過“變聲領夾”成功模仿了現(xiàn)場女主持人的聲音,甚至用合肥話來了一段當?shù)刂V語,讓現(xiàn)場觀眾驚呼這種實時變聲實在太酷了。會上還展示了語音合成技術的最新成果——真實語音與合成語音的無縫銜接:一段羅振宇的真實語音與一段他的合成語音被播放出來之后,完全分不出哪句是原音,哪句是合成的。
光有語音還不夠酷,《環(huán)球時報》記者在展會現(xiàn)場看到,一個視頻正在播放虛擬女主播小晴用中文、日語、英語、韓語播報新聞。據(jù)工作人員介紹,首先需要進行人像采集和語音采集,然后通過建模就可以合成出這樣的真人版虛擬主播。目前多家媒體都已采用了這種虛擬主播的技術。據(jù)介紹,未來只需要在網(wǎng)站上簡單輸入文稿、指定主播,就可以一鍵生成虛擬主播,可以用不同語音和方言播報新聞,還可以變換姿態(tài)、改變造型,讓現(xiàn)場的媒體記者直呼“要失業(yè)了”!
很多人擔心的是,目前社會上已經(jīng)出現(xiàn)利用換臉和換聲軟件進行詐騙的案例,如何防止訊飛的這些黑科技被不法之徒利用?工作人員介紹說,目前高度還原的語音和虛擬形象的服務只面向機構(gòu)用戶,比如為央視制作虛擬主播“紀小萌”,聲音和形象都要得到授權(quán)才能制造,個人用戶語音合成服務的聲音相似度被控制在60%左右,“主要就是從安全性角度來考慮”。
說到語音識別,最典型的應用場景就是家庭內(nèi)部和汽車里。《環(huán)球時報》記者在展館內(nèi)看到,一款產(chǎn)品可以在很遠的距離、嘈雜的環(huán)境內(nèi)進行精準識別。據(jù)工作人員介紹,這采用了聲源定位的技術,可以排除雜音、準確識別發(fā)出命令的用戶在什么位置。在現(xiàn)場演示時,盡管會場周邊非常嘈雜,它仍可以準確操控數(shù)米外的冰箱、電視、空調(diào)等電器。據(jù)訊飛專家在大會上宣布,超遠距離識別已經(jīng)達到20-50米,準確率達到90%以上。

除了語音識別方面,腦機接口技術的研究也是人工智能領域應用的重要方向之一。記者在華南理工大學的展臺看到一臺腦控輪椅。基于混合腦機接口,用戶在無須動用四肢、也無須發(fā)出聲音指令的情形下,可以用腦完成對輪椅前進后退的操控。一名研究人員坐在輪椅上向《環(huán)球時報》記者進行了演示(如圖),他頭戴一個能采集腦電波信號的設備,在手腳完全沒動的情況下,熟練操作輪椅。據(jù)他介紹,操作的過程需要人的精神高度集中。這個技術和國外相關研究有哪些區(qū)別呢?他表示,該技術最大的優(yōu)勢是只需一個像帽子一樣的頭戴設備,不需要在腦中植入設備。
在中美經(jīng)貿(mào)摩擦大背景下,訊飛等一些中國高科技企業(yè)上了美國第二批“實體清單”??拼笥嶏w輪值總裁胡郁在接受《環(huán)球時報》記者采訪時承認,美國“實體清單”對訊飛的部分原材料供應有影響,但在這個消息出來之前,訊飛已經(jīng)做了充足的準備,所以說近期內(nèi)不會存在太大問題。“從遠期看,我們會尋找替代方案的提供商,包括進一步增強自身能力,這也是一種解決方案。我認為對長期業(yè)績的影響會控制在一定的范圍之內(nèi),對最主要的國內(nèi)業(yè)務,影響范圍并不是特別大。”(環(huán)球時報赴合肥特派記者 劉揚)


 
          





