3 月 16 日消息,百度今日正式發(fā)布文心大模型 4.5 和文心大模型 X1,兩款模型已在文心一言官網(wǎng)上線,免費向用戶開放。
文心大模型 4.5 已上線百度智能云千帆大模型平臺,企業(yè)用戶和開發(fā)者登錄即可調(diào)用 API;文心大模型 X1 也即將在千帆上線,百度搜索、文小言 App 等產(chǎn)品也將陸續(xù)接入文心大模型 4.5 和文心大模型 X1。
據(jù)了解,文心大模型 4.5 是百度首個原生多模態(tài)大模型,在多模態(tài)理解、文本和邏輯推理等方面有顯著提升,多項測試表現(xiàn)優(yōu)于 GPT4.5,API 調(diào)用價格僅為 GPT4.5 的 1%;文心大模型 X1 則是一款性能上對標(biāo) DeepSeek-R1 的深度思考模型,同時還支持多模態(tài)、多工具調(diào)用能力,API 調(diào)用價格約為 R1 的一半。
官方表示,文心大模型 4.5 具備如下關(guān)鍵技術(shù):
FlashMask 動態(tài)注意力掩碼:加速大模型靈活注意力掩碼計算,有效提升長序列建模能力和訓(xùn)練效率,優(yōu)化長文處理能力和多輪交互表現(xiàn);
多模態(tài)異構(gòu)專家擴(kuò)展技術(shù):根據(jù)模態(tài)特點構(gòu)建模態(tài)異構(gòu)專家,結(jié)合自適應(yīng)模態(tài)感知損失函數(shù),解決不同模態(tài)梯度不均衡問題,提升多模態(tài)融合能力;
時空維度表征壓縮技術(shù):在時空維度對圖片和視頻的語義表征進(jìn)行高效壓縮,大幅提升多模態(tài)數(shù)據(jù)訓(xùn)練效率,增強了從長視頻中吸取世界知識的能力;
基于知識點的大規(guī)模數(shù)據(jù)構(gòu)建技術(shù):基于知識分級采樣、數(shù)據(jù)壓縮與融合、稀缺知識點定向合成技術(shù),構(gòu)建高知識密度預(yù)訓(xùn)練數(shù)據(jù),提升模型學(xué)習(xí)效率,大幅降低模型幻覺;
基于自反饋的 Post-training 技術(shù):融合多種評價方式的自反饋迭代式后訓(xùn)練技術(shù),全面提升強化學(xué)習(xí)穩(wěn)定性和魯棒性,大幅提升預(yù)訓(xùn)練模型對齊人類意圖能力。
文心大模型 X1 則具備如下技術(shù):
遞進(jìn)式強化學(xué)習(xí)訓(xùn)練方法:創(chuàng)新性地應(yīng)用遞進(jìn)式強化學(xué)習(xí)方法,在創(chuàng)作、搜索、工具調(diào)用、推理等場景全面提升模型的綜合應(yīng)用能力;
基于思維鏈和行動鏈的端到端訓(xùn)練:針對深度搜索、工具調(diào)用等場景,根據(jù)結(jié)果反饋進(jìn)行端到端的模型訓(xùn)練,顯著提升訓(xùn)練效果;
多元統(tǒng)一的獎勵系統(tǒng):建立了統(tǒng)一的獎勵系統(tǒng),融合多種類型的獎勵機制,為模型訓(xùn)練提供更加魯棒的反饋。
據(jù)此前報道,在百度 2024 年 Q4 及全年財報電話會上,百度創(chuàng)始人、董事長兼首席執(zhí)行官李彥宏透露,文心大模型 4.5 將開源,4.5 將是百度有史以來最強大的大模型,“希望客戶和用戶能比之前更方便地體驗這款模型”。
百度更早前曾表示,隨著文心大模型的迭代升級和成本不斷下降,文心一言將于 4 月 1 日零時起全面免費,所有 PC 端和 App 端用戶均可體驗文心系列最新模型。此外,即日起,文心一言上線深度搜索功能;該功能也將于 4 月 1 日起免費開放使用。
本文鏈接:http://www.tebozhan.com/showinfo-45-11553-0.html百度發(fā)布“史上最強”文心大模型 4.5 及支持深度思考的文心大模型 X1,免費開放
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com
上一篇: 百度文心大模型4.5與X1驚艷亮相,免費開放引領(lǐng)AI新風(fēng)尚!
下一篇: DeepSeek AI 爆紅引發(fā)業(yè)界“狂歡”,三千“李鬼”網(wǎng)站號稱“49 元本地部署”“198 元永久會員”