AVt天堂网 手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

當(dāng)前位置:首頁 > 元宇宙 > AI

蘋果研究員質(zhì)疑AI:簡單數(shù)學(xué)題一改就出錯(cuò)?

來源: 責(zé)編: 時(shí)間:2024-10-12 16:25:52 70觀看
導(dǎo)讀【ITBEAR】近年來,人工智能(AI)在各個(gè)領(lǐng)域取得了顯著進(jìn)展,尤其是大型語言模型(LLM),它們能夠生成人類水平的文本,甚至在某些任務(wù)上超越人類。然而,一項(xiàng)新研究對LLM的推理能力提出了質(zhì)疑。蘋果公司的一組研究人員發(fā)現(xiàn),這些模型在

【ITBEAR】近年來,人工智能(AI)在各個(gè)領(lǐng)域取得了顯著進(jìn)展,尤其是大型語言模型(LLM),它們能夠生成人類水平的文本,甚至在某些任務(wù)上超越人類。然而,一項(xiàng)新研究對LLM的推理能力提出了質(zhì)疑。蘋果公司的一組研究人員發(fā)現(xiàn),這些模型在解決簡單數(shù)學(xué)問題時(shí),只要問題稍有變動(dòng),就容易出錯(cuò),暗示它們可能并不具備真正的邏輯推理能力。pn028資訊網(wǎng)——每日最新資訊28at.com

pn028資訊網(wǎng)——每日最新資訊28at.com

研究人員在一篇名為《理解大型語言模型中數(shù)學(xué)推理的局限性》的論文中揭示了LLM在解決數(shù)學(xué)問題時(shí)易受干擾的現(xiàn)象。他們通過對數(shù)學(xué)問題進(jìn)行微小改動(dòng),例如添加無關(guān)信息,來測試LLM的推理能力。結(jié)果發(fā)現(xiàn),面對這樣的變化,模型的表現(xiàn)急劇下降。pn028資訊網(wǎng)——每日最新資訊28at.com

例如,當(dāng)給出一個(gè)簡單的數(shù)學(xué)問題:“奧利弗星期五摘了44個(gè)奇異果,星期六摘了58個(gè)。星期日,他摘的是星期五的兩倍。他一共摘了多少個(gè)?”LLM能正確回答。但若添加無關(guān)細(xì)節(jié):“星期日摘的是星期五的兩倍,其中5個(gè)比平均小。”LLM的回答則出錯(cuò)。GPT-o1-mini的回答是:“...星期日,其中5個(gè)奇異果比平均小。我們需要從總數(shù)中減去它們:88 - 5 = 83個(gè)。”pn028資訊網(wǎng)——每日最新資訊28at.com

這只是一個(gè)例子,研究人員修改了數(shù)百個(gè)問題,幾乎所有改動(dòng)都導(dǎo)致模型回答成功率大幅下降。他們認(rèn)為,這表明LLM并未真正理解數(shù)學(xué)問題,而只是根據(jù)訓(xùn)練數(shù)據(jù)中的模式進(jìn)行預(yù)測。一旦需要真正的“推理”,如是否計(jì)算小的奇異果,它們就會(huì)產(chǎn)生不合常理的結(jié)果。pn028資訊網(wǎng)——每日最新資訊28at.com

這一發(fā)現(xiàn)對AI的發(fā)展具有啟示意義。盡管LLM在許多領(lǐng)域表現(xiàn)出色,但其推理能力仍有局限。未來,研究人員需進(jìn)一步探索如何提高LLM的推理能力,使其更好地理解和解決復(fù)雜問題。pn028資訊網(wǎng)——每日最新資訊28at.com

本文鏈接:http://www.tebozhan.com/showinfo-45-8549-0.html蘋果研究員質(zhì)疑AI:簡單數(shù)學(xué)題一改就出錯(cuò)?

聲明:本網(wǎng)頁內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問題請及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com

上一篇: 方程豹豹8預(yù)售開啟,40-50萬元,年內(nèi)上市交付!

下一篇: 上海交大新突破!AI預(yù)警平臺(tái),首次實(shí)現(xiàn)孕前預(yù)測流產(chǎn)風(fēng)險(xiǎn)?

標(biāo)簽:
  • 熱門焦點(diǎn)
  • AI網(wǎng)紅能年賺百萬,普通人的新機(jī)會(huì)來了?

    來源|運(yùn)營研究社作者 | 張知白編輯 | 楊佩汶設(shè)計(jì) | 晏談夢潔2023 年 ,數(shù)字人成為了當(dāng)紅的“流量話題”和“商業(yè)機(jī)會(huì)"。不管是 AI 孫燕姿走紅網(wǎng)絡(luò),還是 AI 數(shù)字
  • 區(qū)塊鏈產(chǎn)業(yè)人才發(fā)展報(bào)告

    工業(yè)和信息化部作為工業(yè)和信息化行業(yè)主管部門,正在著力推進(jìn)“兩個(gè)強(qiáng)國”建設(shè),加快推動(dòng)以區(qū)塊鏈為代表的新興技術(shù)與實(shí)體經(jīng)濟(jì)深度融合。我國區(qū)塊鏈技術(shù)和應(yīng)用想要
  • 上海虹口成立10億元元宇宙基金,香港首只元宇宙ETF擬上市

    區(qū)塊鏈日報(bào)17日訊 今日《元宇宙新鮮事》有:上海虹口將成立總額約10億元的元宇宙產(chǎn)業(yè)基金;香港市場首只元宇宙主題ETF擬于2月21日上市;元宇宙平臺(tái)Roblox出現(xiàn)違禁游
  • 虛擬數(shù)字人:元宇宙的主角破圈而來

    虛擬數(shù)字人市場逐步進(jìn)入成熟期,商業(yè)化進(jìn)程加速。1982年世界第一位虛擬歌姬林明美誕生,虛擬數(shù)字人行業(yè)經(jīng)歷了萌芽、探索、初級(jí)和成長四個(gè)階段。隨技術(shù)逐年突破,制
  • 元宇宙風(fēng)歸何處?

    元宇宙持續(xù)大火,在過去一段時(shí)間內(nèi),其屢次登上熱點(diǎn),吸引了一波又一波投資者。近期,在“2022中國·金魚嘴元宇宙生態(tài)賦能大會(huì)”上,南京建鄴區(qū)金魚嘴基金街區(qū)宣布計(jì)劃
  • 頭像類NFTs的統(tǒng)治能持續(xù)多久?

    在過去的一兩年里,NFTs在互聯(lián)網(wǎng)世界中掀起了一場風(fēng)暴。今天,當(dāng)我們想到NFTs時(shí),我們主要想到的是那些充斥著我們的社交媒體屏幕的數(shù)字卡通--無聊猿、punks 和介于
  • 百度虛擬人——AI手語主播首次亮相冬奧會(huì)!

    除了火遍全國的冰墩墩,虛擬人也成為這屆冬奧會(huì)的一大亮點(diǎn)元素。以體育明星谷愛凌為原型的數(shù)智人Meet Gu最先亮相。在2月5日谷愛凌首秀、2月7日谷愛凌首金的兩天
  • 從概念到落地 Web3.0初具雛形

    加密資產(chǎn)熱潮催生出的鏈上應(yīng)用中,除了DeFi、NFT、鏈游GameFi等場景外,還有一個(gè)熱詞叫「Web3.0」。Web3.0的概念最早出現(xiàn)在2014年,由以太坊聯(lián)合創(chuàng)始人及波卡創(chuàng)建者
  • 全球十大元宇宙概念游戲

    A股市場中,不少游戲公司早早搭上了元宇宙概念。舉例,中青寶宣稱將發(fā)布一款元宇宙概念的模擬經(jīng)營類游戲,盡管游戲尚在研發(fā)中,這一消息已經(jīng)讓中青寶的股價(jià)在51個(gè)交易
Top