黄网站色欧美视频,今夜无人入睡免费播放电视剧,日韩成人毛片在线,粉嫩av中文字幕,国产黄色大片在线观看,哥布林的洞窟,黄色小网站入口

您現(xiàn)在的位置:?臺海網(wǎng) >> 新聞中心 >> 天下 >> 國際聚焦  >> 正文

英國研究人員發(fā)現(xiàn):用AI訓練AI,可能越練越“傻”

m.dddjmc.com 來源: 新華網(wǎng) 用手持設備訪問
二維碼

對于人工智能(AI)大語言模型來說,通常給予的訓練數(shù)據(jù)越多,模型就會越“聰明”。但英國《自然》雜志新發(fā)表的一項關于大模型的研究顯示,如果只用AI生成的數(shù)據(jù)來訓練大模型,會使模型性能下降、越練越“傻”。

  英國牛津大學、劍橋大學等機構研究人員發(fā)現(xiàn),如果在訓練大模型時,只用AI生成的內容,會導致大模型出現(xiàn)不可逆的缺陷,逐漸忘記真實數(shù)據(jù)的分布,這被稱為“模型崩潰”。

  研究人員首先使用大語言模型創(chuàng)建類似維基百科詞條的文本,然后利用這個內容來訓練該模型的新版本,并反復使用前代模型生成的文本訓練更新的版本。隨著AI生成的信息“污染”訓練集,模型的輸出逐漸失去意義。在模型的第九次迭代中,它完成了一篇關于英國教堂塔樓的文章,其中一段文字卻在講述野兔尾巴的多種顏色。

  研究發(fā)現(xiàn),導致“模型崩潰”的重要原因是,由于模型只能從其訓練數(shù)據(jù)中采樣,一些在第一代數(shù)據(jù)中本就低頻出現(xiàn)的詞匯,在每次迭代后出現(xiàn)的頻率變得更低,而一些常見詞匯出現(xiàn)的頻率則逐漸增加。

  這種變化的結果就是,模型逐漸無法正確模擬真實世界的復雜性。隨著時間推移,這種錯誤會在迭代中被層層累積、逐漸放大,最終導致“模型崩潰”。這有點像生物學中“近親繁殖”會導致后代缺陷,如果不能保證基因庫的多樣性,最終會導致一個物種的崩潰。

  研究人員還發(fā)現(xiàn),由于訓練數(shù)據(jù)被“污染”而導致“模型崩潰”的情況不止發(fā)生在大語言模型中,高斯混合模型、圖片生成器等也可能出現(xiàn)類似情況。

  不過,應對“模型崩潰”并非束手無策。研究人員發(fā)現(xiàn),如果能在模型微調過程中保留10%左右的真實數(shù)據(jù),崩潰就會發(fā)生得更緩慢。還可使用水印技術,將AI生成的數(shù)據(jù)與真實數(shù)據(jù)區(qū)分開來,這需要大型科技公司的協(xié)作。此外,在AI生成的文本重新進入數(shù)據(jù)池之前,可由人類先篩選過濾。

(來源:新華網(wǎng))

相關新聞
龍巖AI盛宴:華為引爆人工智能革命,200位大咖現(xiàn)場揭秘產(chǎn)業(yè)升級秘籍!

7月22日,由龍巖市工業(yè)和信息化局、科學技術局、數(shù)據(jù)管理局指導,華為技術有限公司主辦,龍巖市信息協(xié)會、龍巖市工業(yè)互聯(lián)網(wǎng)協(xié)會、龍巖市互聯(lián)網(wǎng)協(xié)會、龍巖市物聯(lián)網(wǎng)協(xié)會和龍巖市數(shù)字經(jīng)濟產(chǎn)業(yè)工會協(xié)辦的人工智能技術創(chuàng)新交流活動成功舉辦。本次活動邀請了人工智能產(chǎn)業(yè)領域的專家學者、...

民企競逐未來產(chǎn)業(yè)新賽道

人形機器人、量子計算機、腦機接口、超大規(guī)模新型智算中心……未來產(chǎn)業(yè)是帶動產(chǎn)業(yè)升級、改變競爭格局、催生增長動能的關鍵力量,吸引了一大批民營企業(yè)布局。如何更好布局未來產(chǎn)業(yè)賽道,記者采訪了民營企業(yè)和專家學者。   爭先,搶抓發(fā)展主動權   “這根頭發(fā)絲粗細的微針上有64個通道,可以采集單個神經(jīng)元放電情況,把腦電信號轉化為數(shù)字信號并進行解析,同時每個...

人工智能賦能新型工業(yè)化步伐提速

2024中國互聯(lián)網(wǎng)大會7月9日在京開幕。記者從會上獲悉,當前國產(chǎn)大模型產(chǎn)品不斷涌現(xiàn),相關部門將進一步推動人工智能賦能新型工業(yè)化,加快人工智能領域關鍵核心技術攻關,加快培育行業(yè)大模型,面向工業(yè)領域大模型建設一批高質量的工業(yè)數(shù)據(jù)庫,同時圍繞重點領域推動打造人工智能賦能新型工業(yè)化的應用試驗場。   當前,我國人工智能發(fā)展取得積極進展。來自工信部的信息顯...