閩南話被稱為“最難學(xué)的方言之一”。近日,國外互聯(lián)網(wǎng)企業(yè)家馬克·扎克伯格的一段視頻在網(wǎng)上引起了大家的關(guān)注,視頻中,扎克伯格展示了最新的AI翻譯技術(shù),可以實現(xiàn)閩南話和英語的無障礙交流。事實上,早在2019年,來自廈門大學(xué)的科研團隊就推出了會聽、會說、會寫的閩南話智能語音系統(tǒng)。

實現(xiàn)普通話閩南話無障礙交流
廈門大學(xué)的閩南話智能語音系統(tǒng)出自信息學(xué)院洪青陽和人文學(xué)院許彬彬的科研團隊之手。這個系統(tǒng)到底能做些什么?24日上午,在信息學(xué)院實驗室,洪青陽向記者做了演示。
不僅聽得懂、說得清,這套系統(tǒng)還會寫,可以實現(xiàn)文字和閩南話的互相轉(zhuǎn)換。洪青陽團隊認為,從現(xiàn)有資料看,扎克伯格發(fā)布的這項技術(shù)只是語音到語音的翻譯,沒有涉及文字。比如,不能形成識別文本,要延伸到其他應(yīng)用就比較難。在這點上,廈大版閩南話智能語音系統(tǒng)“更勝一籌”。
經(jīng)過不斷的迭代升級,目前廈大的這套語音系統(tǒng)不僅可以精準翻譯,還可以識別不同地區(qū)、不同口音的閩南話。這要歸功于科研團隊建立的龐大語音資料庫,里面有足夠多不同人群、不同口音的語音,并及時擴充詞典和語言材料。與此同時,系統(tǒng)后臺要不斷完善算法,以便學(xué)習(xí)更多口音和生僻詞匯。

普通話和閩南話混雜系統(tǒng)預(yù)計年底上線
眼下,研發(fā)團隊還在開發(fā)多語種和方言混雜的智能系統(tǒng),其中,針對普通話和閩南話混合語音的轉(zhuǎn)換技術(shù)預(yù)計將在年底上線。
廈門大學(xué)信息學(xué)院副教授 洪青陽:一個是識別要準,一個是要看得明白。這里面兩大挑戰(zhàn)都整合在一套系統(tǒng)里面,后面還要更強大,也就是有普通話跟閩南話混雜的。我們內(nèi)部已經(jīng)有研發(fā)了一個版本,還沒正式發(fā)布,普通話、英文、閩南話三種語言合起來的,這是我們下一步的目標。
結(jié)合硬件設(shè)施持續(xù)推廣
目前,廈大團隊的閩南話智能語音系統(tǒng)已經(jīng)上線,通過小程序和APP,就可以實現(xiàn)閩南話和普通話的無障礙溝通。同時,經(jīng)過定制化處理后,系統(tǒng)還被應(yīng)用在一些特定場景里。
廈門大學(xué)信息學(xué)院副教授 洪青陽:比如鄉(xiāng)村的喇叭,農(nóng)村需要閩南話播報,輸入文字就可以直接播報出來,這個很便利,更多的我們還是希望走進千家萬戶,更多的可能會結(jié)合一些硬件,讓小孩子可以直接操作,相當(dāng)于一個益智玩具,真正讓更多人感受到方言AI技術(shù)給他們帶來的便利。(來源:廈視新聞)
