當前位置：首頁 > 元宇宙 > AI

中國電信發(fā)布“復雜推理大模型”TeleAI-t1-preview：能解《九章算術(shù)》題目

來源：責編：時間：2025-01-28 08:57:51 60觀看

導讀 1 月 25 日消息，從中國電信人工智能研究院獲悉，其“復雜推理大模型”TeleAI-t1-preview 現(xiàn)已正式發(fā)布，即將上線天翼 AI 開放平臺。TeleAI-t1-preview 使用了強化學習訓練方法，通過引入探索、反思等思考范式，大幅提

1 月 25 日消息，從中國電信人工智能研究院獲悉，其“復雜推理大模型”TeleAI-t1-preview 現(xiàn)已正式發(fā)布，即將上線天翼 AI 開放平臺。TeleAI-t1-preview 使用了強化學習訓練方法，通過引入探索、反思等思考范式，大幅提升模型在邏輯推理、數(shù)學推導等復雜問題的準確性。

官方表示，在美國數(shù)學競賽 AIME 2024 、MATH500 兩項數(shù)學基準評測中，TeleAI-t1-preview 分別以 60 和 93.8 分的成績，大幅超越 OpenAI o1-preview、GPT-4o 等標桿模型。在研究生級別問答測試 GPQA Diamond 中，TeleAI-t1-preview 得分超過 GPT-4o，并比肩 Claude 3.5 Sonnet 的性能水準。

評測顯示，將《九章算術(shù)》中的一道題目給到 TeleAI-t1-preview 后，其能夠先針對文言文進行理解和簡化，再轉(zhuǎn)換成現(xiàn)代漢語，隨之給出數(shù)學推導和答案。

據(jù)介紹，在此過程中，TeleAI-t1-preview 可將形象思維與抽象思維結(jié)合，對所涉及的場景進行具象化思考，輔助理解題目。不僅如此，其還能夠嚴謹?shù)剡M行古今單位換算。

TeleAI引入了創(chuàng)新的訓練策略，從而保障思考推理過程準確有效。

數(shù)據(jù)準備階段：收集、構(gòu)建了一個以數(shù)學為核心、多學科為補充的高質(zhì)量推理數(shù)據(jù)集，確保模型能夠適應(yīng)不同類型的推理任務(wù)。

Judge Model（評估模型）：訓練了一個 Judge Model 專門用于分析和評估模型長思考鏈路的正確性，為模型的反思和錯誤修正提供指導。

SFT（監(jiān)督微調(diào)）階段：用 MCTS（蒙特卡洛樹搜索）構(gòu)造高質(zhì)量長推理數(shù)據(jù)，結(jié)合每個步驟的準確率和解決方案長度來選擇最優(yōu)的完整路徑，在保證推理答案準確性的同時有效拉長思考鏈路以獲得更細粒度的推理過程。同時使用 Judge Model 對推理過程中正確率較低的路徑進行分析，引導模型對錯誤的推理步驟進行反思和修正，從而構(gòu)造出高質(zhì)量的思維鏈數(shù)據(jù)進行 SFT 訓練。

強化學習階段：額外構(gòu)造了 Rule-based Reward Model（基于規(guī)則的獎勵模型），以提供足夠準確的獎勵信號，通過在線強化學習算法進一步提升模型的邏輯推理能力。

本文鏈接：http://www.tebozhan.com/showinfo-45-10218-0.html中國電信發(fā)布“復雜推理大模型”TeleAI-t1-preview：能解《九章算術(shù)》題目

聲明：本網(wǎng)頁內(nèi)容旨在傳播知識，若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：印度首富計劃建設(shè)“世界最大”數(shù)據(jù)中心，預計投資 200~300 億美元

下一篇： OpenAI 又將面臨版權(quán)訴訟：印度出版商指控其擅自使用受保護內(nèi)容訓練模型

標簽：

熱門焦點

這一超級富豪“逆襲”，身價大增4330億

來源：侃見財經(jīng)互聯(lián)網(wǎng)的突圍沒有“終點”。在快節(jié)奏的商業(yè)環(huán)境下，不斷的試錯成了互聯(lián)網(wǎng)企業(yè)的標配，一年一個風口，一個風口造就一個熱點，但是回頭來看，最終受益的還是身處
元媧2.7上線：虛擬人視頻制作速度瘋狂翻倍！

來源：清元宇宙炎炎夏日努力工作的Q仔的電腦都冒煙兒啦～今天要給大家介紹兩個新小伙伴——小元和小媧，他們將給大家解讀元媧2.7版本重磅更新內(nèi)容～大家掌聲歡迎～～～本次更
不同于傳統(tǒng)數(shù)字經(jīng)濟，元宇宙賦予商業(yè)生態(tài)更多數(shù)字資產(chǎn)價值！

作者：中科基大數(shù)據(jù)元宇宙是一個去中心化的開放平臺，而為了維護這樣的平臺，需要建立一個公平的游戲規(guī)則，確保每個元宇宙的參與者通過這個規(guī)則都可以掙到錢，他們的利益都可以得到保
挖來Meta AR高管，難道蘋果也要進軍元宇宙？

“被曝光”的才是最吸引人的產(chǎn)品，相信有關(guān)注過蘋果硬件消息的朋友們都明白這樣的道理。往近了說有蘋果“即將發(fā)布”的iPhone SE 3和M2芯片，往遠了說有“折疊屏iP
百度元宇宙希壤是什么？（附下載）

百度元宇宙希壤是什么，最近很多人關(guān)注。還有很多人問希壤怎么下載、百度希壤怎么進入？今天小編帶你來全面了解一下。“希壤”是百度于2021年12月27日于百度AI開
餐桌上怎么變出元宇宙？

作者：星影“元宇宙讓餐飲業(yè)脫胎換骨。”實體的餐飲與虛擬的元宇宙，看起來風馬牛不相及，但最近全世界的餐飲企業(yè)都掀起了一股注冊元宇宙商標的熱潮。2月初，全球最大
元宇宙需要的5個重要安全功能

元宇宙的可能用途使其成為一個令人難以置信的概念，但是，就像科技界的任何事物一樣，需要做一些事情來控制其使用。元宇宙的安全功能需要仔細考慮和開發(fā)，以保護用戶
元宇宙收割了誰

作者：曉宇資本將元宇宙看作下一代互聯(lián)網(wǎng)的門票，畫大餅、割韭菜就成了一大選項。2021年被稱為元宇宙元年。在這一年里，先是號稱元宇宙第一股的沙盒游戲Roblox盛裝
Ceramic：為Web3.0社交應(yīng)用打造的中間件

大家關(guān)注老雅痞公眾號這么久，對Web3的概念不陌生吧？讓我們做一個簡短的回顧，Web3主要被描述為去中心化的網(wǎng)絡(luò)，旨在實現(xiàn)無服務(wù)器、去中心化的互聯(lián)網(wǎng)，即用戶掌握自己

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

首頁

元宇宙

NFT

區(qū)塊鏈

虛擬人

AR/VR

AI

元宇宙百科

中國電信發(fā)布“復雜推理大模型”TeleAI-t1-preview：能解《九章算術(shù)》題目

這一超級富豪“逆襲”，身價大增4330億

元媧2.7上線：虛擬人視頻制作速度瘋狂翻倍！

不同于傳統(tǒng)數(shù)字經(jīng)濟，元宇宙賦予商業(yè)生態(tài)更多數(shù)字資產(chǎn)價值！

挖來Meta AR高管，難道蘋果也要進軍元宇宙？

百度元宇宙希壤是什么？（附下載）

餐桌上怎么變出元宇宙？

元宇宙需要的5個重要安全功能

元宇宙收割了誰

Ceramic：為Web3.0社交應(yīng)用打造的中間件

最新推薦

一份全面清單：Web3行業(yè)高薪酬的13種工作

城市數(shù)字孿生標準化白皮書（2022版）

DAO登上了歷史舞臺，但是主流準備好采用DAO了嗎？

頭頂光環(huán)無數(shù)卻估值極低，以太坊這位&——quot;最強殺手&——quot;有望涅槃重生？

又一家數(shù)字營銷公司入局元宇宙，國內(nèi)首個藝術(shù)元宇宙社區(qū)“Meta彼岸”上線

利用元宇宙平臺10天收入160萬，風口還是虎口？

猜你喜歡

熱門推薦

相關(guān)資訊