AVt天堂网 手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

當(dāng)前位置:首頁 > 科技  > 網(wǎng)絡(luò)

AI遭遇靈魂拷問!這道題所有模型集體翻車 網(wǎng)友:我也不會(huì)啊

來源: 責(zé)編: 時(shí)間:2025-05-20 10:04:03 20觀看
導(dǎo)讀 拷打AI的難度還在升級?這不,圖像推理又出現(xiàn)了新難題。該問題在Reddit上引起熱議:目前沒有任何AI能真正解決復(fù)雜推理問題。問題定義其實(shí)非常簡單——在下圖中還需要添加多少個(gè)小立方體能形成一個(gè)完整

拷打AI的難度還在升級?這不,圖像推理又出現(xiàn)了新難題。ijS28資訊網(wǎng)——每日最新資訊28at.com

該問題在Reddit上引起熱議:目前沒有任何AI能真正解決復(fù)雜推理問題。ijS28資訊網(wǎng)——每日最新資訊28at.com

AI遭遇靈魂拷問!這道題所有模型集體翻車 網(wǎng)友:我也不會(huì)啊ijS28資訊網(wǎng)——每日最新資訊28at.com

問題定義其實(shí)非常簡單——在下圖中還需要添加多少個(gè)小立方體能形成一個(gè)完整的大立方體?ijS28資訊網(wǎng)——每日最新資訊28at.com

AI遭遇靈魂拷問!這道題所有模型集體翻車 網(wǎng)友:我也不會(huì)啊ijS28資訊網(wǎng)——每日最新資訊28at.com

針對這一難題,國內(nèi)外支持圖像輸入的大模型紛紛給出了不同的答案。ijS28資訊網(wǎng)——每日最新資訊28at.com

其中,o3給出的答案是45個(gè),Gemini 2.5Pro給出的答案僅有10個(gè)。ijS28資訊網(wǎng)——每日最新資訊28at.com

AI遭遇靈魂拷問!這道題所有模型集體翻車 網(wǎng)友:我也不會(huì)啊ijS28資訊網(wǎng)——每日最新資訊28at.com

AI遭遇靈魂拷問!這道題所有模型集體翻車 網(wǎng)友:我也不會(huì)啊ijS28資訊網(wǎng)——每日最新資訊28at.com

而國內(nèi)大模型,如DeepSeek、Qwen3的答案分別為14和9。ijS28資訊網(wǎng)——每日最新資訊28at.com

AI遭遇靈魂拷問!這道題所有模型集體翻車 網(wǎng)友:我也不會(huì)啊ijS28資訊網(wǎng)——每日最新資訊28at.com

AI遭遇靈魂拷問!這道題所有模型集體翻車 網(wǎng)友:我也不會(huì)啊ijS28資訊網(wǎng)——每日最新資訊28at.com

出現(xiàn)這些不同答案的原因是什么呢?請往下看。ijS28資訊網(wǎng)——每日最新資訊28at.com

為什么會(huì)出現(xiàn)不同的答案ijS28資訊網(wǎng)——每日最新資訊28at.com

核心原因:大模型對組成的大立方體的規(guī)格理解不同。ijS28資訊網(wǎng)——每日最新資訊28at.com

o3將終組成的大立方體的規(guī)格理解為5x5x5,但它對于缺失的小立方體的數(shù)目仍舊給出了錯(cuò)誤答案,用人類視覺來看,要形成5x5x5的大立方體需要125個(gè)小立方體,而圖中已經(jīng)給出了46個(gè),所以答案應(yīng)該為79。ijS28資訊網(wǎng)——每日最新資訊28at.com

而AI的錯(cuò)誤源于它對圖片中小立方體的結(jié)構(gòu)和數(shù)目的分析錯(cuò)誤。ijS28資訊網(wǎng)——每日最新資訊28at.com

AI遭遇靈魂拷問!這道題所有模型集體翻車 網(wǎng)友:我也不會(huì)啊ijS28資訊網(wǎng)——每日最新資訊28at.com

Gemini 2.5 Pro將終組成的大立方體的規(guī)格理解為4x4x4。ijS28資訊網(wǎng)——每日最新資訊28at.com

AI遭遇靈魂拷問!這道題所有模型集體翻車 網(wǎng)友:我也不會(huì)啊ijS28資訊網(wǎng)——每日最新資訊28at.com

而DeepSeek和Qwen都將終的大立方體規(guī)格設(shè)定為了3x3x3。ijS28資訊網(wǎng)——每日最新資訊28at.com

AI遭遇靈魂拷問!這道題所有模型集體翻車 網(wǎng)友:我也不會(huì)啊ijS28資訊網(wǎng)——每日最新資訊28at.com

AI遭遇靈魂拷問!這道題所有模型集體翻車 網(wǎng)友:我也不會(huì)啊ijS28資訊網(wǎng)——每日最新資訊28at.com

對于終要組成的大立方體的規(guī)模理解不同,各大模型自然而然就會(huì)給出不同的答案。ijS28資訊網(wǎng)——每日最新資訊28at.com

不過,結(jié)合提示多次嘗試,也有大模型能夠漸漸找準(zhǔn)方向。ijS28資訊網(wǎng)——每日最新資訊28at.com

網(wǎng)友針對這些錯(cuò)誤答案提供了一些解決辦法:ijS28資訊網(wǎng)——每日最新資訊28at.com

例如用o3進(jìn)行測試,在前兩次嘗試時(shí)給出一些小提示,雖然這樣也得到錯(cuò)誤答案,但第三次,即使沒有提示也得到了正確的結(jié)果。ijS28資訊網(wǎng)——每日最新資訊28at.com

AI遭遇靈魂拷問!這道題所有模型集體翻車 網(wǎng)友:我也不會(huì)啊ijS28資訊網(wǎng)——每日最新資訊28at.com

網(wǎng)友認(rèn)為是由于ChatGPT的長期記憶功能,讓它記住了前兩次嘗試的提示(比如考慮長運(yùn)行中有多少個(gè)立方體,專注于嚴(yán)格計(jì)數(shù)而不是估計(jì)),考慮到了失敗的經(jīng)驗(yàn),并將它們?nèi)空显谝黄稹?span style="display:none">ijS28資訊網(wǎng)——每日最新資訊28at.com

因此,可以說o3會(huì)通過記憶來學(xué)習(xí)。而這道難題也會(huì)成為未來的訓(xùn)練數(shù)據(jù)。ijS28資訊網(wǎng)——每日最新資訊28at.com

網(wǎng)友:人類也會(huì)困惑ijS28資訊網(wǎng)——每日最新資訊28at.com

有人說,這根本就不是一個(gè)推理問題,而是一個(gè)視覺理解問題。ijS28資訊網(wǎng)——每日最新資訊28at.com

出現(xiàn)作者認(rèn)為的錯(cuò)誤答案是由于問題表述不清楚導(dǎo)致AI的分析過程出現(xiàn)了偏差。ijS28資訊網(wǎng)——每日最新資訊28at.com

甚至人類面對這種問題也會(huì)出現(xiàn)類似的困惑,比如題目的要求到底是以原來的排列結(jié)構(gòu)為基礎(chǔ)還是可以打亂結(jié)構(gòu)重新排列?ijS28資訊網(wǎng)——每日最新資訊28at.com

AI遭遇靈魂拷問!這道題所有模型集體翻車 網(wǎng)友:我也不會(huì)啊ijS28資訊網(wǎng)——每日最新資訊28at.com

AI遭遇靈魂拷問!這道題所有模型集體翻車 網(wǎng)友:我也不會(huì)啊ijS28資訊網(wǎng)——每日最新資訊28at.com

并且,如果能夠更清晰地為AI解釋圖片內(nèi)容(告知其圖片中小立方體的排列結(jié)構(gòu)):ijS28資訊網(wǎng)——每日最新資訊28at.com

AI遭遇靈魂拷問!這道題所有模型集體翻車 網(wǎng)友:我也不會(huì)啊ijS28資訊網(wǎng)——每日最新資訊28at.com

那么o3得到的答案也是正確的:ijS28資訊網(wǎng)——每日最新資訊28at.com

AI遭遇靈魂拷問!這道題所有模型集體翻車 網(wǎng)友:我也不會(huì)啊ijS28資訊網(wǎng)——每日最新資訊28at.com

無論是3x3x3、4x4x4還是5x5x5,或者是NxNxN,人類自己都無法統(tǒng)一答案的問題,對AI來說是不是太難了點(diǎn)!ijS28資訊網(wǎng)——每日最新資訊28at.com

網(wǎng)友:ijS28資訊網(wǎng)——每日最新資訊28at.com

AI遭遇靈魂拷問!這道題所有模型集體翻車 網(wǎng)友:我也不會(huì)啊ijS28資訊網(wǎng)——每日最新資訊28at.com

AI:或許我需要一個(gè)更科學(xué)的訓(xùn)練方式!ijS28資訊網(wǎng)——每日最新資訊28at.com


文章出處:量子位

本文鏈接:http://www.tebozhan.com/showinfo-17-151740-0.htmlAI遭遇靈魂拷問!這道題所有模型集體翻車 網(wǎng)友:我也不會(huì)啊

聲明:本網(wǎng)頁內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問題請及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com

上一篇: 黃仁勛重磅演講:Q3推出下一代GB300 將向合作者授權(quán)NVLink技術(shù)

下一篇: 中國AI大廠 被Deepseek掀了牌桌之后

標(biāo)簽:
  • 熱門焦點(diǎn)
Top