AVt天堂网 手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

當前位置:首頁 > 元宇宙 > AI

DeepSeek 丟了開源第一王座,但繼任者“Kimi K2”依然來自中國

來源: 責編: 時間:2025-07-20 18:16:30 50觀看
導讀 幾千人盲投,Kimi K2 超越 DeepSeek 拿下全球開源第一!歪果網友們直接炸了,評論區秒變夸夸打卡現場:今天,競技場終于更新了 Kimi K2 的排名情況 ——開源第一,總榜第五,而且緊追馬斯克 Grok 4 這樣的頂尖閉源模型。并

幾千人盲投,Kimi K2 超越 DeepSeek 拿下全球開源第一!eoq28資訊網——每日最新資訊28at.com

歪果網友們直接炸了,評論區秒變夸夸打卡現場:eoq28資訊網——每日最新資訊28at.com

eoq28資訊網——每日最新資訊28at.com

今天,競技場終于更新了 Kimi K2 的排名情況 ——eoq28資訊網——每日最新資訊28at.com

開源第一,總榜第五,而且緊追馬斯克 Grok 4 這樣的頂尖閉源模型。eoq28資訊網——每日最新資訊28at.com

eoq28資訊網——每日最新資訊28at.com

并且各類單項能力也不差,能和一水兒閉源模型打得有來有回:eoq28資訊網——每日最新資訊28at.com

連續多輪對話并列第一,o3 和 Grok 4 均為第四;eoq28資訊網——每日最新資訊28at.com

編程能力第二,和 GPT 4.5、Grok 4 持平;eoq28資訊網——每日最新資訊28at.com

應對復雜提示詞能力第二,和 o3、4o 位于同一梯隊;eoq28資訊網——每日最新資訊28at.com

……eoq28資訊網——每日最新資訊28at.com

甚至眼尖的朋友也發現了,唯二闖入總榜 TOP 10 的開源模型都來自中國。(DeepSeek R1 總榜第 8)eoq28資訊網——每日最新資訊28at.com

當然了,即使拋開榜單不談,Kimi 這款新模型過去一周也確實火熱 ——eoq28資訊網——每日最新資訊28at.com

K2 過去一周真熱啊

公開可查戰績包括但不限于下面這些:eoq28資訊網——每日最新資訊28at.com

從實打實的數據來看,發布這一周里,Kimi K2 在開源社區就獲得了相當關注度和下載量。eoq28資訊網——每日最新資訊28at.com

GitHub 標星 5.6K,Hugging Face 下載量近 10 萬,這還不算它在中國社區的應用。eoq28資訊網——每日最新資訊28at.com

eoq28資訊網——每日最新資訊28at.com

eoq28資訊網——每日最新資訊28at.com

連 AI 搜索引擎明星創企 Perplexity CEO 也親自為它站臺,并透露:eoq28資訊網——每日最新資訊28at.com

Kimi K2 在內部評估中表現出色,Perplexity 計劃接下來基于 K2 模型進行后訓練。eoq28資訊網——每日最新資訊28at.com

eoq28資訊網——每日最新資訊28at.com

甚至由于訪問的用戶太多了,逼得 Kimi 官方也出來發公告:eoq28資訊網——每日最新資訊28at.com

訪問量大 + 模型體積大,導致 API 過慢。eoq28資訊網——每日最新資訊28at.com

eoq28資訊網——每日最新資訊28at.com

……eoq28資訊網——每日最新資訊28at.com

不過就在一片向好之時,人們關于“Kimi K2 采用了 DeepSeek V3 架構”的質疑聲再度升溫。eoq28資訊網——每日最新資訊28at.com

eoq28資訊網——每日最新資訊28at.com

對此,我們也找到了 Kimi 團隊成員關于 K2 架構的相關回應。eoq28資訊網——每日最新資訊28at.com

總結下來就是,確實繼承了 DeepSeek V3 的架構,不過后續還有一系列參數調整。eoq28資訊網——每日最新資訊28at.com

p.s. 以下分享均來自知乎 @劉少偉,內容經概括總結如下~eoq28資訊網——每日最新資訊28at.com

一開始,他們嘗試了各種架構方案,結果發現 V3 架構是最能打的(其他頂多旗鼓相當)。eoq28資訊網——每日最新資訊28at.com

所以問題就變成了,要不要為了不同而不同?eoq28資訊網——每日最新資訊28at.com

經過深思熟慮,團隊給出了否定答案。理由有兩點:eoq28資訊網——每日最新資訊28at.com

一是 V3 架構珠玉在前且已經經過大規模驗證,沒必要強行“標新立異”;二是自己和 DeepSeek 一樣,訓練和推理資源非常有限,而經過評估 V3 架構符合相關成本預算。eoq28資訊網——每日最新資訊28at.com

所以他們選擇了完全繼承 V3 架構,并引入適合自己的模型結構參數。eoq28資訊網——每日最新資訊28at.com

具體而言,K2 的結構參數改動有四點:eoq28資訊網——每日最新資訊28at.com

增加專家數量:團隊驗證了在激活參數量不變的情況下,MoE 總參數增加仍有益于 loss 下降。eoq28資訊網——每日最新資訊28at.com

注意力頭 head 數減半:減少 head 數節省的成本,剛好抵消 MoE 參數變大帶來的開銷,且效果影響很小。eoq28資訊網——每日最新資訊28at.com

只保留第一層 Dense:只保留第一層為 dense,其余都用 MoE,結果對推理幾乎無影響。eoq28資訊網——每日最新資訊28at.com

專家無分組:通過自由路由 + 動態重排(EPLB)可以應對負載不均衡,同時讓專家組合更靈活,模型能力更強。eoq28資訊網——每日最新資訊28at.com

eoq28資訊網——每日最新資訊28at.com

最終得到的推理方案就是,在相同專家數量下:eoq28資訊網——每日最新資訊28at.com

雖然總參數增大到 1.5 倍,但除去通信部分,理論的 prefill 和 decode 耗時都更小。即使考慮與通信 overlap 等復雜因素,這個方案也不會比 V3 有顯著的成本增加。eoq28資訊網——每日最新資訊28at.com

就是說,這是一種更“精打細算”的結構調優。eoq28資訊網——每日最新資訊28at.com

而且這種放棄自己的模型架構路線,徹底走 DeepSeek 路線的做法,也被國內網友評價為“相當大膽”。eoq28資訊網——每日最新資訊28at.com

eoq28資訊網——每日最新資訊28at.com

△ 來源:知乎網友 @蛙哥eoq28資訊網——每日最新資訊28at.com

OK,以上關于 Kimi 和 DeepSeek 架構之爭的問題落定后,我們再把目光拉回到這次最新排名。eoq28資訊網——每日最新資訊28at.com

開源追平 or 超越閉源 ing

一個很明顯的趨勢是:「開源 = 性能弱」的刻板印象正在被打破,開源模型已經越來越厲害了。eoq28資訊網——每日最新資訊28at.com

不僅榜單上的整體排名在上升,而且分數差距也越來越小。eoq28資訊網——每日最新資訊28at.com

仔細看,模型 TOP 10 總分均為 1400+,開源和閉源幾乎可以看成位于同一起跑線。eoq28資訊網——每日最新資訊28at.com

而且這次拿下開源第一的 Kimi K2,總分已經非常接近 Grok 4、GPT 4.5 等頂尖閉源模型了。eoq28資訊網——每日最新資訊28at.com

eoq28資訊網——每日最新資訊28at.com

換句話說,以前我們可能還要在模型能力和成本之間作取舍,但隨著開源力量的崛起,多思考一秒鐘都是對開源的不尊重(doge)。eoq28資訊網——每日最新資訊28at.com

與此同時,越來越多的行業人士也表達了對開源崛起的判斷。eoq28資訊網——每日最新資訊28at.com

艾倫人工智能研究所研究科學家 Tim Dettmers 表示:eoq28資訊網——每日最新資訊28at.com

開源擊敗閉源將變得越來越普遍。eoq28資訊網——每日最新資訊28at.com

eoq28資訊網——每日最新資訊28at.com

Perplexity CEO 也多次在公開場合表示:eoq28資訊網——每日最新資訊28at.com

開源模型將在塑造 AI 能力的全球擴散路徑中扮演重要角色。它們對于因地制宜地定制和本地化 AI 體驗至關重要。eoq28資訊網——每日最新資訊28at.com

而在已經逐漸崛起的開源模型領域,TOP 10 中唯二開源、且都是國產模型的含金量還在上升。eoq28資訊網——每日最新資訊28at.com

參考鏈接:eoq28資訊網——每日最新資訊28at.com

[1]https://x.com/lmarena_ai/status/1945866381880373490eoq28資訊網——每日最新資訊28at.com

[2]https://www.zhihu.com/question/1927140506573435010/answer/1927892108636849910eoq28資訊網——每日最新資訊28at.com

[3]https://zhuanlan.zhihu.com/p/1928863438324623337eoq28資訊網——每日最新資訊28at.com

本文來自微信公眾號:量子位(ID:QbitAI),作者:一水eoq28資訊網——每日最新資訊28at.com

本文鏈接:http://www.tebozhan.com/showinfo-45-14683-0.htmlDeepSeek 丟了開源第一王座,但繼任者“Kimi K2”依然來自中國

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 歐盟為具有系統性風險的 AI 模型定規矩:若發生嚴重事故必須上報,網安工作要到位

下一篇: Meta 全新 AI 組織架構曝光,這范兒有點字節

標簽:
  • 熱門焦點
  • 《從營銷AIGC化到AIGC營銷化》報告發布

    來源:清元宇宙7月2日上午,清華大學元宇宙文化實驗室舉辦元宇宙在線沙龍“AIGC熱潮與應用”。會議中,清華大學新聞與傳播學院教授、元宇宙文化實驗室主任、新媒體研究
  • 數字虛擬人23年最新變化!

    作者:小資來源:米塔之家自2021年元宇宙“爆炸”后,作為現實世界連接元宇宙的媒介之一,大批虛擬人跑步入場。到了2022年底,據天眼查數據顯示,我國目前企業名稱或經營范圍
  • 虛擬人再升級,企業可以解放雙手了?

    來源:伯虎財經今天想跟大家來嘮嘮AI,其實聊到這個話題很多人都不陌生了。在ChatGPT和AIGC大熱背后,還有一位低調的“大佬”——虛擬人。比如咱們熟知的虛
  • 8個最適合藝術家發行NFT的交易市場

    近年來,加密風靡全球。加密圈最令人興奮的方面之一是它能夠用于創建稱為NFT 的數字資產。從 CyberKitties 到 Cyber Galleries,NFT 已成為藝術家和藝術鑒賞家的
  • Meta、谷歌、微軟競相涌入元宇宙,小型企業該如何伺機而動?

    目前來看元宇宙不會影響到小型企業的發展,但在接下來的十年內可能會發生很多變化。很多有商業頭腦的企業家都在密切關注著元宇宙的發展。元宇宙這個詞,你一定或
  • 新款英特爾芯片將使NFT鑄造變得更加方便

    科技巨頭和微處理器制造商英特爾(Intel)正在發布一款適用于 NFT 鑄造和挖礦的新芯片。新產品專注于效率、易操作性和可持續性,該公司的戰略是從加密興起與 NFT爆
  • 紐約證券交易所母公司ICE收購tZero股份以探索代幣化股票

    2 月 22 日,紐約證券交易所 (NYSE) 的母公司洲際交易所 (ICE) 宣布,它將持有私人數字證券市場 tZERO 的所有權。根據公告,ICE 將成為 tZero 的“重要”少數股東,但
  • 下一個黃金賽道?NFT的碎片化!

    碎片化可能是我們一生中最重要的一個投資趨勢,碎片化本身并不新鮮。它已經存在了400年之久。早在1602年,荷蘭東印度公司是歷史上第一家在公共證券交易所上市的公
  • Interface正大光明的“跑路”,社區成員贊格局大

    今日凌晨,一個廣泛受社區期待的潛力藍籌項目Interfaces突然發文宣布項目停止運營,后續也不會有鑄造NFT系列的活動。這對社區來說就是一重磅炸彈,大多數人完全不明
Top