當(dāng)前位置：首頁 > 科技 > 網(wǎng)絡(luò)

蘋果炮轟AI推理模型：全是假思考！所謂思考只是一種假象

來源：責(zé)編：時(shí)間：2025-06-09 09:37:10 42觀看

導(dǎo)讀快科技6月8日消息，蘋果近日發(fā)表了一篇研究論文，稱推理模型全都沒真正思考，無論DeepSeek、o3-mini還是Claude 3.7都只是另一種形式的“模式匹配”，所謂思考只是一種假象。有人總結(jié)到：蘋果剛剛當(dāng)了一回

快科技6月8日消息，蘋果近日發(fā)表了一篇研究論文，稱推理模型全都沒真正思考，無論DeepSeek、o3-mini還是Claude 3.7都只是另一種形式的“模式匹配”，所謂思考只是一種假象。

有人總結(jié)到：蘋果剛剛當(dāng)了一回馬庫斯，否定了所有大模型的推理能力。

蘋果團(tuán)隊(duì)認(rèn)為，現(xiàn)有評(píng)估主要集中在既定的數(shù)學(xué)和編碼基準(zhǔn)上，看模型終答案是否正確，但可能存在模型訓(xùn)練時(shí)見過類似題目。

并且，這些評(píng)估大都缺乏對(duì)“思考過程質(zhì)量”的分析，比如中間步驟是否邏輯一致、是否繞彎路等。

為了更客觀測(cè)試推理模型的推理能力，他們?cè)O(shè)計(jì)了4類謎題環(huán)境：漢諾塔、跳棋交換、過河問題、積木世界，并且這4類謎題的難度可以精確控制.

隨著問題變難，推理模型初始會(huì)延長(zhǎng)思考，但隨后思考深度反而下降，盡管仍有充足token預(yù)算，它們卻在需要深入思考時(shí)選擇了放棄！

并且，當(dāng)問題復(fù)雜度繼續(xù)增加并超過某個(gè)臨界點(diǎn)時(shí)，無論是推理模型還是標(biāo)準(zhǔn)模型都會(huì)經(jīng)歷完全的性能崩潰，準(zhǔn)確率直線下降至零。

對(duì)此，有網(wǎng)友諷刺到：“蘋果擁有多的資金，2年了也沒有拿出像樣的成果，現(xiàn)在自己落后了，卻來否定別人的成果。”

據(jù)悉，Apple Intelligence在2024年WWDC正式亮相，在這一年里，蘋果宣傳中的許多功能都經(jīng)歷延期、不夠完善甚至被下架。

不過也有人指出，這篇論文沒有看上去那么消極，而是呼吁設(shè)立更好的推理機(jī)制和評(píng)估辦法。

本文鏈接：http://www.tebozhan.com/showinfo-17-157770-0.html蘋果炮轟AI推理模型：全是假思考！所謂思考只是一種假象

聲明：本網(wǎng)頁內(nèi)容旨在傳播知識(shí)，若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系，我們將在第一時(shí)間刪除處理。郵件：2376512515@qq.com

上一篇：每人獎(jiǎng)勵(lì)3000元！京東外賣表彰三名助考騎手

下一篇： “韋神”的牙齒問題其實(shí)很多人都有：從牙齒出血到掉光僅有三步

標(biāo)簽：

熱門焦點(diǎn)

8月總票房已突破10億！《封神》第一：口碑已經(jīng)成了

8月5日消息，據(jù)燈塔專業(yè)版數(shù)據(jù)，截至8月5日9時(shí)35分，8月總票房（含預(yù)售）已突破10億。其中，《封神》以大比分的優(yōu)勢(shì)領(lǐng)先。根據(jù)官方消息，目前該片總票房已經(jīng)超過14.
在線圖片編輯器，支持PSD解析、AI摳圖等

自從我上次分享一個(gè)人開發(fā)仿造稿定設(shè)計(jì)的圖片編輯器到現(xiàn)在，不知不覺已過去一年時(shí)間了，期間我經(jīng)歷了裁員失業(yè)、面試找工作碰壁，寒冬下一直沒有很好地履行計(jì)劃.....這些就放在日
只需五步，使用start.spring.io快速入門Spring編程

步驟1打開https://start.spring.io/，按照屏幕截圖中的內(nèi)容創(chuàng)建項(xiàng)目，添加 Spring Web 依賴項(xiàng)，并單擊“生成”按鈕下載 .zip 文件，為下一步做準(zhǔn)備。請(qǐng)?jiān)谶M(jìn)入步驟2之前進(jìn)行解壓。圖
一個(gè)注解實(shí)現(xiàn)接口冪等，這樣才優(yōu)雅！

場(chǎng)景碼猿慢病云管理系統(tǒng)中其實(shí)高并發(fā)的場(chǎng)景不是很多，沒有必要每個(gè)接口都去考慮并發(fā)高的場(chǎng)景，比如添加住院患者的這個(gè)接口，具體的業(yè)務(wù)代碼就不貼了，業(yè)務(wù)偽代碼如下：圖片上述代碼有
為什么你不應(yīng)該使用Div作為可點(diǎn)擊元素

按鈕是為任何網(wǎng)絡(luò)應(yīng)用程序提供交互性的最常見方式。但我們經(jīng)常傾向于使用其他HTML元素，如 div span 等作為 clickable 元素。但通過這樣做，我們錯(cuò)過了許多內(nèi)置瀏覽器的功能。
網(wǎng)紅炒股不為了賺錢，那就是耍流氓！

來源：首席商業(yè)評(píng)論6月26日高調(diào)宣布入市，網(wǎng)絡(luò)名嘴大v胡錫進(jìn)居然進(jìn)軍了股市。在一次財(cái)經(jīng)媒體峰會(huì)上，幾個(gè)財(cái)經(jīng)圈媒體大佬就“胡錫進(jìn)炒股是否知道認(rèn)真報(bào)道”展開討論。有
華為Mate 60系列用上可變靈動(dòng)島：正式版體驗(yàn)將會(huì)更出色

這段時(shí)間以來，關(guān)于華為新旗艦的爆料日漸密集。據(jù)此前多方爆料，今年華為將開始恢復(fù)一年雙旗艦戰(zhàn)略，除上半年推出的P60系列外，往年下半年的Mate系列也將
華為HarmonyOS 4.0將于8月4日發(fā)布或搭載AI大模型技術(shù)

華為宣布HarmonyOS4.0將于8月4日正式發(fā)布。此前，華為已經(jīng)針對(duì)開發(fā)者公布了HarmonyOS4.0，以便于開發(fā)者提前進(jìn)行適配，也因此被曝光出了一些新系統(tǒng)的特性
聯(lián)想的ThinkBook Plus下一版曝光，鍵盤旁邊塞個(gè)平板

ThinkBook Plus 是聯(lián)想的一個(gè)特殊筆記本類別，它在封面放入了一塊墨水屏，也給人留下了較為深刻的印象。據(jù)有人爆料，聯(lián)想的下一款 ThinkBook Plus 可能更特殊，它

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

蘋果炮轟AI推理模型：全是假思考！所謂思考只是一種假象

8月總票房已突破10億！《封神》第一：口碑已經(jīng)成了

在線圖片編輯器，支持PSD解析、AI摳圖等

只需五步，使用start.spring.io快速入門Spring編程

一個(gè)注解實(shí)現(xiàn)接口冪等，這樣才優(yōu)雅！

為什么你不應(yīng)該使用Div作為可點(diǎn)擊元素

網(wǎng)紅炒股不為了賺錢，那就是耍流氓！

華為Mate 60系列用上可變靈動(dòng)島：正式版體驗(yàn)將會(huì)更出色

華為HarmonyOS 4.0將于8月4日發(fā)布或搭載AI大模型技術(shù)

聯(lián)想的ThinkBook Plus下一版曝光，鍵盤旁邊塞個(gè)平板

最新推薦

猜你喜歡

熱門推薦

相關(guān)資訊