黄网站色欧美视频,今夜无人入睡免费播放电视剧,日韩成人毛片在线,粉嫩av中文字幕,国产黄色大片在线观看,哥布林的洞窟,黄色小网站入口

您現(xiàn)在的位置:?臺海網(wǎng) >> 新聞中心 >> 天下 >> 國內  >> 正文

“中文十級”難題,AI怎樣解讀

m.dddjmc.com 來源: 科技日報 用手持設備訪問
二維碼

  “中文十級”難題,AI怎樣解讀

  產(chǎn)業(yè)界

  陶玉祥 本報記者 盛 利

  在人工智能領域,“懂語言者得天下”是普遍的共識。其中,可幫助人工智能識別人類語言的自然語言處理(NLP)被譽為人工智能語言“皇冠上的明珠”。

 

  當人工智能自然語言處理技術遇到“要你管和不要你管”“掉地上和掉地下”“我一把把把把住了”等中文“繞口令”,“小意思”“意思意思”等多義詞時,及“俺們那疙”“中不中”等方言時,該怎樣“聽懂”這些“中文十級”語句呢?日前在成都舉辦的科大訊飛未來科?;顒由?,記者采訪了相關專家。

  能分詞會斷句 機器尚在努力

  NLP就是機器讓計算機來理解和處理人類自然語言的技術,它和計算機視覺、語音處理的區(qū)別在于信息處理的類型。

  “計算機視覺主要處理圖像,語音技術處理聲音,而NLP主要是對文字的理解。”云浮科技的創(chuàng)始人兼CEO張文斌說,在人工智能中,語音識別是耳朵,語音合成是嘴巴,計算機視覺是眼睛,而NLP則負責將抽象的文字符號轉化為計算機能理解的語言。

  “‘中文十級’的某些語句,人類去理解都有很大難度,何況是計算機。”張文斌說,在口語和書寫上,漢字往往沒有詞與詞之間的邊界,即便機器能夠準確識別文字,但理解它的意思卻很難;再比如各種五花八門的地方口音和方言,也是“絆腳石”。

  “自然語言處理一般從最小的語意單位‘詞’開始,即分詞算法。這最簡單,也最成熟。”張文斌說, NLP的算法分為語法級別、句子級別分析等,其中分詞就是將字詞切開,讓機器明白哪幾個字組成一個詞,哪幾個詞組成一句話,從而理解整句、整段的意思。但在“分詞”實際的應用過程中,仍有各種問題。

  張文斌解釋,首先是分詞標準不確定、存在歧義,及新詞和實體詞困擾等問題。如“乒乓球,拍賣完了”和“乒乓球拍,賣完了”無論怎么切分都正確,這就要依賴上下文語境。其次,每年都會涌現(xiàn)出的網(wǎng)絡詞匯,“神馬”“不明覺厲”“佛系”等原來不存在的詞也需要計算機理解。

  聽語氣判關系 AI有新招

  如何讓機器讀懂上下文語境,從而進一步了解整段話的含義?

  “我們會嘗試利用聽人類說話時的停頓信息,作為一種分詞算法的輔助。”訊飛翻譯業(yè)務負責人翟吉博說。

  對于AI工程師們來說,更重要的是深層次的算法,如實體識別、屬性抽取等。“就是把人名、地名、機構名等實體識別出來后,再抽取實體之間的關系,搞清楚不同實體在句子中的不同屬性。”張文斌說,五花八門的算法還有很多,比如情感分析,分析文本里面蘊藏了什么樣的情感,是正面、負面還是中性的;文檔摘要,把長文生成一兩百字簡短的摘要等。而基于這些算法層,又可以做很多NLP的衍生應用,包括自動問答、機器翻譯等。

  那如何識別方言呢?在科大訊飛的新款翻譯機設備中,首次推出方言翻譯功能,實現(xiàn)河南話、東北話、粵語等方言互譯,或將之翻譯成外語。翟吉博說,針對不同類型方言,機器采用不同翻譯流程——對同屬北方方言區(qū)的河南話、東北話等,可先翻譯成普通話再翻譯成外語;對于粵語等南方語言,則建立獨立的語料庫,直接從粵語到外語進行翻譯。“考慮到方言中帶有許多地方特色的說法、語言、詞匯,‘雄起’‘中不中’等也可以作為獨立的語料,由機器單獨學習。”他說,人工智能的優(yōu)勢是在自然語言處理方面能夠不斷從用戶處積累語料,學習新的詞匯和表達方式,不斷完成自身數(shù)據(jù)庫和語料庫的更新。

相關新聞
俄媒:美俄開打“終結者”之戰(zhàn) 掀起AI領域軍備競賽

參考消息網(wǎng)8月2日報道 據(jù)俄羅斯《獨立報》8月1日發(fā)表的題為《美國和俄羅斯準備進行“終結者”之戰(zhàn)》,副題為《軍備競賽轉入人工智能領域》的文章稱,據(jù)美國《華爾街日報》報道,美國國防部正在與博思艾倫咨詢公司合作起草有關大規(guī)模發(fā)展軍用人工智能(AI)技術的合同。這份為期五年...

百度的3.0時代劍指開放

7月4日,2018百度AI開發(fā)者大會在京召開。在會上,百度發(fā)布多款3.0版本的產(chǎn)品和服務,比如百度在AI時代兩大開放平臺DuerOS、Apollo均更新到3.0版本,其背后的核心能力支撐——百度大腦也升級至3.0。此外,百度宣布首款L4級自動駕駛巴士“阿波龍”量產(chǎn),發(fā)布AI芯片“昆侖”,發(fā)布百度智能小程序等。   一列最新的產(chǎn)品和解決方案具有一個共同所指,那就是百度要打造更...

全國首座AI無人警亭在福州濱海新城投用

AI無人警亭。   臺海網(wǎng)7月7日訊 據(jù)福州日報報道,身份證遺失、損毀需補辦,或者居住證、港澳臺通行證需簽注,不用再大老遠跑派出所或公安局排隊辦手續(xù),家門口的智能化機器設備輕松就能搞定。6日,全國首座綜合性AI無人警亭在福州濱海新城正式投用。   這座AI無人警亭坐落于濱...

人腦電腦,誰更了解大腦

人腦電腦,誰更了解大腦   看片子,人腦電腦誰更強?日前,神經(jīng)影像領域一場“人機大戰(zhàn)”在北京落幕。醫(yī)療人工智能以更快的速度和更高的準確率,戰(zhàn)勝多位神經(jīng)疾病專家組成的“人類戰(zhàn)隊”。專家表示,人工智能有望將醫(yī)生從繁重的讀片診斷中解放出來,有更多時間做研究、給病人以溫暖,節(jié)省患者看病成本。同時,專家也提醒,影像判讀不是單純看片子,對患者的病史也要...

大數(shù)據(jù)時代, 美軍利用AI“挖”情報

“軍事ISR(情報、監(jiān)視和偵察)數(shù)據(jù)就像鐵礦,我們擁有很多礦山,必須挖掘出礦石并對其進行加工提煉”。對此,美軍“算法戰(zhàn)跨部門小組” 挖掘作戰(zhàn)數(shù)據(jù)的做法值得借鑒—— MQ-9“死神”無人機 美國防部“專家計劃”人工智能項目啟動剛滿一年,所開發(fā)的算法已部署至美國及其海外多個...