日韩av视屏 I 欧美人与动牲交xxxxbbbb I 超碰在线人人爱 I 亚洲欧洲综合 I 久久国产乱子伦免费精品无码 I av无码中文字幕不卡一区二区三区 I 日本www在线 I 亚洲最大成人免费视频 I 色噜噜人体337p人体 I 五月综合婷 I 成人免费激情 I 国产日韩欧美高清在线 I 91黄在线 I 国产日产精品一区二区三区的介绍 I www在线视频观看 I 色婷婷亚洲五月 I 黄色三级软件 I av动漫精品 I 日本欧美一区二区三区在线播放 I 国产情人综合久久777777 I 日韩在线视频线观看一区 I 青青草av I 91在线公开视频 I 长腿校花无力呻吟娇喘 I 国产又粗又长又爽视频一区二区 I av片在线看 I 91视频最新网址 I 久久久久久免费免费精品软件 I 日韩精品欧美精品 I 国产区在线视频 I 97精品欧美91久久久久久 I 你懂的午夜在线视频 I 色丫头综合网 I 美女呻吟一区 I 亚洲色图 美腿丝袜

登錄
首頁 > 每日報(bào)道 > “最強(qiáng)模型”GPT-5發(fā)布后評價(jià)褒貶不一,奧特曼回應(yīng)

“最強(qiáng)模型”GPT-5發(fā)布后評價(jià)褒貶不一,奧特曼回應(yīng)

發(fā)布時間:2025-08-11 19:49:03

北京時間8月9日,據(jù)彭博社報(bào)道,幾個月來,OpenAI CEO薩姆·奧特曼(Sam Altman)一直在大力宣傳GPT-5的性能,把它的發(fā)布描繪成了公司歷史上的關(guān)鍵時刻。但是在GPT-5發(fā)布后的24小時內(nèi),這款新模型收到了褒貶不一的評價(jià)

在周四的發(fā)布會上,OpenAI聲稱GPT-5在編程和處理復(fù)雜問題的推理能力方面更勝一籌,并表示它已先進(jìn)到足以讓聊天機(jī)器人ChatGPT達(dá)到“博士級專家”的水平。

令人失望

雖然一些早期使用者稱贊了該模型,但也保留了意見。開發(fā)者西蒙·威利森(Simon Willison)在博客文章中寫道,“它是我目前最喜歡的新模型”,稱其“性能出眾”,“偶爾令人驚艷”,“但與之前的版本相比并沒有重大飛躍”。

在各大社交媒體平臺上,ChatGPT用戶對GPT-5持續(xù)存在編造信息、搞錯基礎(chǔ)數(shù)學(xué)和拼寫問題的情況表示失望。本特利大學(xué)數(shù)學(xué)系副教授諾亞·詹西拉庫薩(Noah Giansiracusa)認(rèn)為,這次升級“令人失望”。他指出,雖然GPT-5“確實(shí)有些改進(jìn)”,但“改進(jìn)幅度比我期望的要小得多”。

奧特曼

奧特曼

部分用戶的負(fù)面反應(yīng),或許源于他們對技術(shù)底層運(yùn)作機(jī)制的誤解。與OpenAI此前發(fā)布的模型不同,GPT-5會根據(jù)查詢內(nèi)容自動切換不同復(fù)雜程度的模型。這種設(shè)計(jì)雖然能優(yōu)化公司的計(jì)算資源配置,但也意味著用戶并不總能調(diào)用到最強(qiáng)大的技術(shù)版本。

例如,在一次測試中,當(dāng)被問及單詞“blueberry”中字母“b”出現(xiàn)了多少次時,GPT-5最初給出了“三次”的錯誤答案。但當(dāng)被提示“仔細(xì)想一想”后,GPT-5似乎切換到了更高級的推理模型,給出了正確答案。

奧特曼:系統(tǒng)出故障

周五,奧特曼對部分用戶反饋?zhàn)鞒龌謴?fù),承認(rèn)系統(tǒng)存在技術(shù)故障。“從今天開始,GPT-5會顯得更聰明些,”他表示,“昨天自動切換器出現(xiàn)故障,大半天都無法正常工作,導(dǎo)致GPT-5表現(xiàn)得異常遲鈍。”

此次升級對OpenAI至關(guān)重要。OpenAI正在努力保持領(lǐng)先地位,應(yīng)對來自美國和中國競爭對手日益激烈的競爭。同時,它還要說服企業(yè)用戶和個人用戶為其付費(fèi)服務(wù)買單,以抵消其在人才、芯片和數(shù)據(jù)中心等方面的巨額投入,維持AI研發(fā)。

隨著AI系統(tǒng)的不斷進(jìn)步,想要明確評判各類服務(wù)的優(yōu)劣變得越來越困難。截至周五中午,GPT-5已在LMArena(基于用戶評分的熱門AI模型排行榜)上登頂多個類別的榜首。但另一個基準(zhǔn)測試ARC-AGI-2則顯示,GPT-5落后于埃隆·馬斯克(Elon Musk)旗下xAI的最新版Grok。

一些用戶認(rèn)為GPT-5寫作更差

一些用戶認(rèn)為GPT-5寫作更差

在缺乏更明確評估標(biāo)準(zhǔn)的情況下,模型之爭有時更多靠感覺來判斷。如今每周有近7億人使用ChatGPT,難免會有人對模型的表現(xiàn)感受不一。要評估一個新AI系統(tǒng)對個人生活與工作的價(jià)值,短短一天時間遠(yuǎn)遠(yuǎn)不夠。

賓夕法尼亞大學(xué)沃頓商學(xué)院教授伊桑·莫利克(Ethan Mollick)經(jīng)常試用各類AI模型,他對GPT-5的研究能力、機(jī)智的文字應(yīng)答以及編程簡化功能(即便是對新手)贊嘆不已。

“GPT-5會自主完成各種任務(wù),常常是超凡的任務(wù),有時是奇怪的任務(wù),有時則是非常AI式的任務(wù),”他在博客中寫道,“而這正是它最迷人的地方。”

然而,在社交論壇Reddit上,用戶的反應(yīng)卻截然不同。在周五的“有問必答”活動中,奧特曼面對了一些用戶的質(zhì)疑。這些用戶對自己無法掌控和了解具體由哪個模型響應(yīng)查詢感到不滿。奧特曼表示,OpenAI將采取措施解決這些抱怨,包括提高系統(tǒng)的“透明度”。

在活動中,奧特曼曾回應(yīng)一位Reddit用戶的問題。他指出,OpenAI認(rèn)為GPT-5的某個版本在“寫作質(zhì)量”上優(yōu)于GPT-4.5。隨后他問道:“你覺得它更差嗎?”接著,用戶們立刻接二連三地回答說:“是的。”

Copyright 2017-2025 新車測評網(wǎng) 版權(quán)所有  ICP備18049689號-30