與GPT-4 Turbo相比,OpenAI最新旗艦生成式AI模型GPT-4o的價(jià)格減半,速度提升2倍,速率限制高出5倍。
除了擁有多種模態(tài)的能力,GPT-4o的推出還伴隨著一大亮點(diǎn):免費(fèi)。據(jù)悉,它將在未來幾周內(nèi)分階段集成至OpenAI的各個(gè)產(chǎn)品之中。
“有史以來最好的模型”
北京時(shí)間14日凌晨,OpenAI首席技術(shù)官米拉·穆拉蒂在發(fā)布會(huì)上搬出新模型GPT-4o,并展示了公司的一系列創(chuàng)新之處。
GPT-4o在速度和價(jià)格方面都較上一代有顯著優(yōu)勢(shì),可以處理50種不同的語(yǔ)言,同時(shí)擁有處理文本、圖像、音頻等多種模態(tài)的能力,可以為用戶帶來更自然、流暢的交互體驗(yàn)。
本次發(fā)布會(huì),穆拉蒂主要列舉了幾個(gè)點(diǎn)。
第一,新模型GPT-4o用戶不用注冊(cè),功能全部免費(fèi)。
在此之前,ChatGPT的免費(fèi)用戶只能使用GPT-3.5。而更新后,用戶可以免費(fèi)使用GPT-4o來進(jìn)行數(shù)據(jù)分析、圖像分析、互聯(lián)網(wǎng)搜索、訪問應(yīng)用商店等操作。
當(dāng)然,免費(fèi)的前提被限制在一定的消息數(shù)量上,一旦超過規(guī)定數(shù)量,免費(fèi)用戶的模型將被切換回GPT-3.5。而付費(fèi)用戶將獲得更高的消息數(shù)量,至少是免費(fèi)用戶的5倍。
同日,OpenAI首席執(zhí)行官山姆·奧特曼發(fā)推文表示,新的GPT-4o是OpenAI“有史以來最好的模型”。
第二,ChatGPT增設(shè)了PC端桌面版本。
蘋果電腦用戶將迎來一款為macOS設(shè)計(jì)的ChatGPT桌面應(yīng)用,用戶可以通過快捷鍵“拍攝”桌面,然后將截屏同步給ChatGPT并向它提問。這種輕量化的使用體驗(yàn)可以無縫融入用戶的工作流程中,減少了登錄網(wǎng)頁(yè)消耗的時(shí)間。
OpenAI還表示,Windows版本將在今年晚些時(shí)候推出。穆拉蒂表示,這也是他們第一次在易用性上做出改進(jìn)。
此外,ChatGPT還優(yōu)化了用戶界面,旨在提升用戶體驗(yàn),使交互更加流暢自然,確保用戶聚焦于與ChatGPT的高效合作,而非界面操作本身。
發(fā)布會(huì)后,業(yè)界一片嘩然。有媒體稱這預(yù)示著“智能時(shí)代的一次進(jìn)化”,未來移動(dòng)設(shè)備中的互聯(lián)網(wǎng)可能會(huì)被濃縮在一個(gè)程序之中,用戶可以通過它解決一切需求:發(fā)短信、導(dǎo)航、識(shí)物、打車等。
更加健談
前幾天,奧特曼就在一檔播客中預(yù)告,OpenAI將改進(jìn)并提升ChatGPT的語(yǔ)音功能質(zhì)量,并表示相信語(yǔ)音交互是通向未來交互方式的一個(gè)重要途徑。
首先,它的響應(yīng)速度大幅提升。
GPT-4o與人類在對(duì)話中的反應(yīng)速度一致。也就是說,它已經(jīng)可以達(dá)到“實(shí)時(shí)”響應(yīng)的狀態(tài),不再像以前那樣,在得到回答前需要尷尬地等上幾秒鐘。
同時(shí),就像與真人聊天一樣,用戶可以在GPT-4o回應(yīng)的過程中打斷它,并提出更多的要求,比如轉(zhuǎn)變?cè)掝}、要求它改變語(yǔ)音語(yǔ)調(diào)甚至讓它用機(jī)器人或音樂劇的形式回答。
其次,它對(duì)情緒的捕捉顯得更敏感細(xì)膩。
發(fā)布會(huì)上,GPT-4o能夠從主持人的喘氣聲中理解“緊張”的含義,并指導(dǎo)他進(jìn)行深呼吸。當(dāng)受到稱贊后,它還會(huì)馬上接話:“別說了,你讓我臉都紅了。”
發(fā)布會(huì)上,主創(chuàng)團(tuán)隊(duì)還展示了GPT-4o各種功能的使用情況,包括實(shí)時(shí)翻譯、教學(xué)如何解方程式、識(shí)別人物表情等。目睹了GPT-4o應(yīng)答如流的過程,不少用戶評(píng)論這一新模型“顯得更加健談了,有時(shí)甚至有些輕浮”。
但GPT-4o的功能呈現(xiàn)也伴隨著一些失誤。它在現(xiàn)場(chǎng)把主持人的笑臉誤認(rèn)為是一個(gè)桌面,還在方程式尚未顯示的情況下嘗試解題。
消除神秘感
去年,馬斯克旗下xAI團(tuán)隊(duì)發(fā)布的首個(gè)人工智能大模型產(chǎn)品Grok,因回答用戶問題“無所忌諱”而出圈。xAI團(tuán)隊(duì)在介紹該產(chǎn)品時(shí)還說:“如果你不喜歡幽默,請(qǐng)不要使用它!”
其實(shí)不管是Grok,還是谷歌子公司DeepMind聯(lián)合創(chuàng)始人蘇萊曼開發(fā)的AI機(jī)器人Pi,都具有鮮明的個(gè)性化特點(diǎn)。
有評(píng)論稱,相較之下,GPT-4o穩(wěn)定處理文本、圖像、音頻的能力,讓OpenAI在這場(chǎng)人工智能爭(zhēng)霸賽中領(lǐng)先。
有趣的是,穆拉蒂在介紹GPT-4o時(shí)將其描述為“神奇的”。但她同時(shí)補(bǔ)充,隨著產(chǎn)品的推出,公司將“消除這種神秘感”。
有分析指出,GPT-4o實(shí)行免費(fèi)是一大關(guān)鍵,這意味著OpenAI開始加大將大模型推向市場(chǎng)的力度。
近日,蘋果公司被曝正與OpenAI敲定一項(xiàng)協(xié)議,今年將后者的部分技術(shù)引入iPhone。借此蘋果將能提供由ChatGPT支持的“聊天機(jī)器人”,作為iOS 18中人工智能功能的一部分。
雖然關(guān)于OpenAI與蘋果合作的傳聞一直存在,且都未得到證實(shí)。但眼尖的人也發(fā)現(xiàn),在OpenAI發(fā)布會(huì)的現(xiàn)場(chǎng),蘋果的產(chǎn)品被廣泛使用。
與此同時(shí),谷歌2024年I/O開發(fā)者大會(huì)將于北京時(shí)間5月15日1時(shí)舉行,正好在OpenAI最新發(fā)布會(huì)的24小時(shí)后。據(jù)悉,谷歌將在大會(huì)上展示其最新的人工智能開發(fā)成果,并發(fā)布Gemini大模型的最新動(dòng)態(tài)。
去年底,谷歌宣布推出其認(rèn)為規(guī)模最大、功能最強(qiáng)大的人工智能模型Gemini,同樣在識(shí)別文本、圖像、視頻上具備強(qiáng)理解和推理能力。
當(dāng)各大科技巨頭都亮出自己的法寶爭(zhēng)做王者,公眾也很好奇,誰(shuí)會(huì)更受市場(chǎng)和業(yè)界青睞。
(來源:解放日?qǐng)?bào))


 
          

