當前位置：首頁 > 元宇宙 > AI

DeepSeek R1 Preview 模型亮相，代碼能力與 OpenAI o1 相當且確認開源

來源：責編：時間：2025-01-21 12:16:57 148觀看

導讀 DeepSeek 版 o1，有消息了。還未正式發布，已在代碼基準測試 LiveCodeBench 霸榜前三，表現與 OpenAI o1 的中檔推理設置相當。注意了，這不是在 DeepSeek 官方 App 已經能試玩的 DeepSeek-R1-Lite-Preview（輕量預覽版

DeepSeek 版 o1，有消息了。

還未正式發布，已在代碼基準測試 LiveCodeBench 霸榜前三，表現與 OpenAI o1 的中檔推理設置相當。

注意了，這不是在 DeepSeek 官方 App 已經能試玩的 DeepSeek-R1-Lite-Preview（輕量預覽版）。

而是摘掉了輕量版的帽子，稱為 DeepSeek-R1-Preview（預覽版），意味著替換了規模更大的基礎模型。

LiveCodeBench 團隊透露，他們正在與 DeepSeek 合作評估新模型的能力，在合作過程中，DeepSeek 團隊還幫他們找出并解決了評分系統的一些 bug。

與此同時，他們還曬出了目前僅有的一張 DeepSeek-R1-Preview 的思考過程。

鑒于 DeepSeek 此前已宣布 R1 模型將開源，有網友表示，與 OpenAI o1 編程能力相當的開源模型即將發布，2025 年的編程就只剩下按 Tab 鍵了。

DeepSeek 推理大模型滿血版

兩個月前，DeepSeek 在官網上線 DeepSeek-R1-Lite-Preview 時曾透露：

DeepSeek-R1-Lite-Preview 使用強化學習訓練，推理含大量反思和驗證，遵循新的 Scaling Laws——推理越長，表現越強。

在 AIME 測試基準中，隨著推理長度的增加，DeepSeek-R1-Lite-Preview 表現出穩定的得分提升。

DeepSeek-R1-Lite 推理的特點在網友們的后續測試中也得到了驗證：

在某些情況下，模型似乎能夠在生成推理步驟時自我糾正，表現出類似原生“自我反思”的能力。不過，沒有訓練數據、模型架構和技術報告 / 論文的細節，很難確認這一點。

期待未來的開源模型和 API！

摘掉 Lite 的帽子，變成 DeepSeek-R1-Preview，意味著換了更大的基礎模型。

之前 Lite 版就在難度較高數學和代碼任務上超越 o1-preview，大幅領先 GPT-4o。

這次在 LiveCodeBench 上，這次的 DeepSeek-R1-Preview 的表現又與 OpenAI o1-Medium 相當，網友們更加期待開源模型和 API 了。

LiveCodeBench 由 UC 伯克利、MIT 和康奈爾大學團隊推出，旨在對大模型的代碼能力進行全面且無污染的評估。

具體避免測試數據泄露的方法，是隨著時間的推移不斷從人類的編程競賽平臺收集新的題目。

除了代碼生成，還會評估模型在代碼自修復、執行和測試輸出預測等方面的能力。這樣實時更新、確保公平性和可靠性的測試方法，獲得了開發者社區的認可。

還有程序猿喊話 Cursor 直接把 R1-Preview 集成到 Agent mode 里：

One More Thing

趕在春節前，許多還在做訓練的國產大模型團隊，都把自家模型更新了一遍。OpenAI 似乎要趁這邊放假開始搞事情了（狗頭），阿爾特曼發帖透露：

o3-mini 完成外部合作測試，已確定最終版，將在幾周內推出，會同時上線 API 和 ChatGPT。

在后續對話中，阿爾特曼還確認了未來模型更多基本情況：

o3-mini 的速度會非常快

o3-mini 大多數情況下不如 o1-pro

o3 pro 收費從 $200 / 月起步

OpenAI 正在關注如何讓 AI 一次性輸出更多內容

2025 年計劃把 GPT 系列和 o 系列合并

本文來自微信公眾號：量子位（ID：QbitAI），作者：夢晨、西風，原標題《DeepSeek 新模型霸榜，代碼能力與 OpenAI o1 相當且確認開源，網友：今年編程只剩 Tab 鍵》

本文鏈接：http://www.tebozhan.com/showinfo-45-9490-0.htmlDeepSeek R1 Preview 模型亮相，代碼能力與 OpenAI o1 相當且確認開源

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：特斯拉人形機器人背后有“人”？遠程操控真相待解

下一篇：我國將建立基于大數據和 AI 支持的教育評價和科學決策制度，建立全國學生心理健康監測預警系統

標簽：

熱門焦點

元宇宙步入暗夜

撰文 | 文燁豪元宇宙的故事，似乎講不通了。當下，刮起元宇宙熱潮的Roblox股價已跌去大半，帶頭大哥Meta也正因元宇宙虧損深陷泥潭。再看國內，從字節“派對島&
25萬虛擬er在“元宇宙”追星

“默嘰默嘰，我是默默醬，我是在真元宇宙也有頭有臉的人。”12月11日晚20：00，虛擬偶像@默默醬的首場個人元宇宙演唱會《以夢為馬，抵達繁星》在大有空間APP
現在的元宇宙：一款低配版的科幻游戲

在2021年的歲末之際，不禁感嘆元宇宙元年之熱鬧，從元宇宙NFT頭像，到元宇宙數字地產，再到元宇宙旅游景區等等，仿佛科幻感十足的元宇宙眨眼間就從人們的概念認知中完全
韓國主權基金增加對硅谷初創公司投資押注元宇宙和人工智能

韓國投資公司(KIC)CEO Seoungho Jin預計，該公司在舊金山的辦事處今年將擴招人手，探索在硅谷投資科技、健康和綠色項目。規模高達2000億美元的韓國主權財富基金—
2022 區塊鏈 50 強榜單；垃圾NFT項目的十三個特性

本期關鍵字TerraZero在Decentraland完成元宇宙住房抵押貸款；騰訊發行齊白石畫作數字藏品；Ripple成為數字歐元協會成員；Gem上線稀有度排名功能；2022 區塊鏈 50 強榜
Meta證實Quest 2無法實現全身追蹤，未來將為虛擬化身配備“假腿”

上周，外媒UploadVR在Quest 2開發者文檔中發現了從未被公布過的“身體追蹤支持”選項，暗示Meta VR頭顯或支持全身追蹤。而在最近的Instagram問答環節中，Meta Reali
2022年6款最佳的NFT稀有度查詢工具

NFT正在風靡全球，但擁有一個你自認為看起來很酷的 NFT 是不夠的，因為它還應該是稀有的，稀有度會影響每個 NFT 的價值。因此，如果您打算投資 NFT，則需要使用 NFT 稀
從冰墩墩到無聊猿，解秘未來IP爆款的模因

打造IP，是建設元宇宙的剛需。NFT能直接讓IP的價值變現；虛擬人IP是元宇宙的第一入口，而元宇宙要搭建的，就是一個個品牌IP星球，考驗的是IP世界觀的建設能力。如果說在
元宇宙存在的意義和價值

科技公司目前都在猶豫，看誰能在元宇宙上押下更大的賭注。然而，除了巨額的資金投入，到底要怎樣才能獲勝在很大程度上還沒有得到證實。它是否僅僅是對當前數字景觀

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

DeepSeek R1 Preview 模型亮相，代碼能力與 OpenAI o1 相當且確認開源

元宇宙步入暗夜

25萬虛擬er在“元宇宙”追星

現在的元宇宙：一款低配版的科幻游戲

韓國主權基金增加對硅谷初創公司投資押注元宇宙和人工智能

2022 區塊鏈 50 強榜單；垃圾NFT項目的十三個特性

Meta證實Quest 2無法實現全身追蹤，未來將為虛擬化身配備“假腿”

2022年6款最佳的NFT稀有度查詢工具

從冰墩墩到無聊猿，解秘未來IP爆款的模因

元宇宙存在的意義和價值

最新推薦

聚焦虛擬數字人技術，這三大商機要抓??！

摩根大通：元宇宙市場預計每年收入超1萬億美元

元宇宙是數字共識生態的集成邏輯表達

虛擬數字人：元宇宙的主角破圈而來

韓國流行音樂巨頭SM與Binance達成NFT合作伙伴關系

這場虛擬發布會，當面“造假”！

猜你喜歡

熱門推薦

相關資訊

DeepSeek R1 Preview 模型亮相，代碼能力與 OpenAI o1 相當且確認開源

最新推薦

猜你喜歡

熱門推薦

相關資訊

DeepSeek R1 Preview 模型亮相，代碼能力與 OpenAI o1 相當且確認開源