1 月 24 日消息,百川智能今日宣布推出全場景深度思考模型 Baichuan-M1-preview,聚齊三大核心推理能力。同時,百川智能還推出了行業首個開源醫療增強大模型 Baichuan-M1-14B。
據官方介紹,Baichuan-M1-preview 同時具備語言、視覺和搜索三大領域推理能力,在數學、代碼等多個權威評測中的表現可對標 o1-preview。
注意到,它還解鎖了“醫療循證模式”,實現了從證據檢索到深度推理的完整端到端服務,能夠快速、精準地回答醫療臨床、科研問題。
Baichuan-M1-14B 則是 Baichuan-M1-preview 的小尺寸版本,同時也是行業首個開源的醫療增強大模型。據介紹,其醫療能力超越了更大參數量的 Qwen2.5-72B,與 o1-mini 相差無幾。
Github:https:https//github.com/baichuan-inc/Baichuan-M1-14B
Huggingface(base):https://huggingface.co/baichuan-inc/Baichuan-M1-14B-Base
Huggingface(Instruct):https://huggingface.co/baichuan-inc/Baichuan-M1-14B-Instruct
NPU 版本支持 BF16 推理:https://modelers.cn/models/MindIE/Baichuan-M1-14B-Base
語言推理方面,其在 AIME 和 Math 等數學基準測試,以及 LiveCodeBench 代碼任務上的成績均超越了 o1-preview 等模型。
視覺推理能力方面,在 MMMU-val、MathVista 等權威評測中的成績,超越了 GPT-4o、Claude3.5 Sonnet、QVQ-72B-Preview 等模型。
本文鏈接:http://www.tebozhan.com/showinfo-45-10178-0.html百川智能發布深度思考模型 Baichuan-M1-preview,同時具備語言、視覺和搜索三大領域推理能力
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com