臺(tái)海網(wǎng)3月7日訊 據(jù)廈門廣電網(wǎng)報(bào)道 在語(yǔ)音識(shí)別領(lǐng)域,方言語(yǔ)音識(shí)別一直是需要解決的難題。近日,廈門大學(xué)智能語(yǔ)音團(tuán)隊(duì)就成功研發(fā)了閩南方言人工智能語(yǔ)音系統(tǒng),只要對(duì)著系統(tǒng)說(shuō)出閩南話,系統(tǒng)就能自動(dòng)翻譯成中文文字。未來(lái),這個(gè)系統(tǒng)將被應(yīng)用到更多領(lǐng)域。
按下錄音鍵,說(shuō)出閩南話,閩南方言人工智能語(yǔ)音系統(tǒng)就能很快翻譯出中文。這個(gè)系統(tǒng)由廈門大學(xué)許彬彬等老師帶領(lǐng)的科研團(tuán)隊(duì)共同研發(fā),目前已有微信小程序及APP等軟件工具可以使用。為了讓系統(tǒng)里的閩南方言數(shù)據(jù)盡可能全面,團(tuán)隊(duì)整理收錄了大量語(yǔ)音資料,最終囊括了多地閩南方言口音,詞匯量超過(guò)600萬(wàn)個(gè)。
廈門大學(xué)教師 許彬彬:覆蓋廈門漳州泉州甚至潮汕地區(qū),還有臺(tái)灣、臺(tái)北臺(tái)南地區(qū)、宜蘭、彰化這些地方,包括海外部分,屬于閩南話分布區(qū)域,像菲律賓馬尼拉,馬來(lái)西亞檳城、馬六甲、新加坡、印尼巴彥縣,也有采錄一些,所以我們盡可能覆蓋范圍廣一點(diǎn),各種口音各種詞匯。
盡管收錄了閩南話的多種口音,但閩南話中存在大量多音字,也有著復(fù)雜的文讀、白讀現(xiàn)象,因此許彬彬的團(tuán)隊(duì)不斷更新技術(shù),在識(shí)別上采取了發(fā)音詞典標(biāo)準(zhǔn),經(jīng)過(guò)多個(gè)階段的內(nèi)部測(cè)試及完善,目前系統(tǒng)的準(zhǔn)確率已經(jīng)達(dá)到80%以上。而隨著系統(tǒng)的逐漸成熟,團(tuán)隊(duì)目前也將軟件開(kāi)放免費(fèi)試用,他們希望通過(guò)這個(gè)系統(tǒng),進(jìn)一步擴(kuò)大人工智能領(lǐng)域的方言應(yīng)用范圍,促進(jìn)閩南方言與文化的傳播。
廈門大學(xué)教師 許彬彬:應(yīng)用到一些學(xué)習(xí)軟件,購(gòu)買機(jī)票,購(gòu)買火車票,給阿公阿嬤,不會(huì)說(shuō)普通話的,有一些軟件可以幫助他們識(shí)別,最終是達(dá)到人機(jī)對(duì)話,今后AI程序加入方言,閩南話可以先作為一個(gè)試點(diǎn)吧。


 
          





