AVt天堂网 手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

當前位置:首頁 > 科技  > 數碼

全球閑置算力訓個模型 性能媲美R1 老黃天塌了

來源: 責編: 時間:2025-05-14 12:11:46 59觀看
導讀 一夜之間,老黃天塌了(doge)。全球首個分布式RL訓練模型INTELLECT-2發(fā)布,它僅通過整合全球閑置或分散的計算資源,就完成了模型的強化學習訓練,訓練成本大大降低。其模型性能與DeepSeek-R1媲美!一旦范式成立,這也就意

一夜之間,老黃天塌了(doge)。JjA28資訊網——每日最新資訊28at.com

全球首個分布式RL訓練模型INTELLECT-2發(fā)布,它僅通過整合全球閑置或分散的計算資源,就完成了模型的強化學習訓練,訓練成本大大降低。JjA28資訊網——每日最新資訊28at.com

其模型性能與DeepSeek-R1媲美!JjA28資訊網——每日最新資訊28at.com

全球閑置算力訓個模型 性能媲美R1 老黃天塌了JjA28資訊網——每日最新資訊28at.com

一旦范式成立,這也就意味RL訓練擺脫了對集中式算力的依賴,世界上任何一個人都可以參與到模型訓練當中,大公司壟斷算力時代可能就此終結。JjA28資訊網——每日最新資訊28at.com

Just like this~算力來算力來,算力從四面八方來。JjA28資訊網——每日最新資訊28at.com

全球閑置算力訓個模型 性能媲美R1 老黃天塌了JjA28資訊網——每日最新資訊28at.com

此模型版本有19個人/機構提供了算力資源支持(源自模型回答,還包括它自己)JjA28資訊網——每日最新資訊28at.com

全球閑置算力訓個模型 性能媲美R1 老黃天塌了JjA28資訊網——每日最新資訊28at.com

除了貢獻算力,還有不少大佬愿意投錢,包括不限于Karpathy大神、FlashAttention作者Tri Dao大神、HuggingFace聯(lián)創(chuàng)兼CEO Clem Delangue等等。JjA28資訊網——每日最新資訊28at.com

據團隊成員介紹,他們從編寫模型強化學習框架prime-rl,到今天發(fā)布大概只用了兩個月時間。JjA28資訊網——每日最新資訊28at.com

目前基礎設施已到位,并且經過驗證,超過那些先進實驗室只是時間問題。JjA28資訊網——每日最新資訊28at.com

(比如OpenAI?)JjA28資訊網——每日最新資訊28at.com

全球閑置算力訓個模型 性能媲美R1 老黃天塌了JjA28資訊網——每日最新資訊28at.com

有人已經開始斷言:未來的頂級開源模型將以分布式方式進行訓練。JjA28資訊網——每日最新資訊28at.com

全球閑置算力訓個模型 性能媲美R1 老黃天塌了JjA28資訊網——每日最新資訊28at.com

INTELLECT-2搶先測JjA28資訊網——每日最新資訊28at.com

目前INTELLECT-2支持網頁端體驗,只需簡單注冊就可以使用。與其他通用助手頁面類似差不多,不過輸入僅支持文本。JjA28資訊網——每日最新資訊28at.com

全球閑置算力訓個模型 性能媲美R1 老黃天塌了JjA28資訊網——每日最新資訊28at.com

那咱們先來一些基礎問題:INTELLECT-2大的特點是什么?JjA28資訊網——每日最新資訊28at.com

在推理思考了幾秒鐘之后,它給出了答案,首先強調了這是首個去中心化RL訓練的超大規(guī)模模型,其次還有強化學習訓練、參數規(guī)模與性能的平衡、數據隱私安全與社區(qū)驅動等特點。JjA28資訊網——每日最新資訊28at.com

全球閑置算力訓個模型 性能媲美R1 老黃天塌了JjA28資訊網——每日最新資訊28at.com

回答基本OK,那直接來上點難度:JjA28資訊網——每日最新資訊28at.com

一個外星人來到地球后,第一天有相等的可能選擇以下四件事中的一件完成:1,自我毀滅;2,分裂成兩個外星人;3,分裂成三個外星人;4,什么都不做。JjA28資訊網——每日最新資訊28at.com

此后每天,每個外星人均會做一次選擇,且彼此之間相互獨立,求地球上終沒有外星人的概率JjA28資訊網——每日最新資訊28at.com

在思考了一會兒之后,回答是醬嬸。JjA28資訊網——每日最新資訊28at.com

全球閑置算力訓個模型 性能媲美R1 老黃天塌了JjA28資訊網——每日最新資訊28at.com

全球閑置算力訓個模型 性能媲美R1 老黃天塌了JjA28資訊網——每日最新資訊28at.com

雖然格式有點亂,但是后回答正確,而且是解析解。(o゜▽゜)o☆[BINGO!]。JjA28資訊網——每日最新資訊28at.com

如果昨天是明天就好了,那么今天就是周五了。 問:句子中的今天可能是星期幾?JjA28資訊網——每日最新資訊28at.com

全球閑置算力訓個模型 性能媲美R1 老黃天塌了JjA28資訊網——每日最新資訊28at.com

可以看到基本能力有,但現(xiàn)在還不是特別穩(wěn)定。像當你開始新對話時,會碰到以下這種情況。JjA28資訊網——每日最新資訊28at.com

全球閑置算力訓個模型 性能媲美R1 老黃天塌了JjA28資訊網——每日最新資訊28at.com

已經有熱心網友已經制作成了GGUF格式上傳到HF。JjA28資訊網——每日最新資訊28at.com

全球閑置算力訓個模型 性能媲美R1 老黃天塌了JjA28資訊網——每日最新資訊28at.com

分布式強化學習訓練JjA28資訊網——每日最新資訊28at.com

INTELLECT-2是一個分布式的大模型訓練框架,采用了全球分布式異步強化學習的范式。JjA28資訊網——每日最新資訊28at.com

通俗講,INTELLECT-2就如同一個超大型的眾包項目,任何擁有閑置算力資源的人都可以參與其中。JjA28資訊網——每日最新資訊28at.com

“異步”則是指不同階段可以獨立、并行地進行,因此不同性能的設備可以同時參與,而不會相互影響。JjA28資訊網——每日最新資訊28at.com

具體來說,系統(tǒng)會利用全球貢獻者提供的異構算力在本地生成推理數據;這些數據經過驗證后匯集到中心,用于更新模型策略;更新后的策略再分發(fā)到每個節(jié)點,開始新一輪迭代。JjA28資訊網——每日最新資訊28at.com

全球閑置算力訓個模型 性能媲美R1 老黃天塌了JjA28資訊網——每日最新資訊28at.com

在這套流程當中,一共涉及了四大關鍵組件——JjA28資訊網——每日最新資訊28at.com

核心RL框架PRIME-RL,實現(xiàn)推理數據生成與模型訓練的解耦和異步進行;參數分發(fā)網絡SHARDCAST,負責將更新后的模型參數高效分發(fā)給全球各地的推理節(jié)點;推理驗證協(xié)議TOPLOC,驗證每個推理節(jié)點提交數據的可信性;Protocol Testnet,為不同學習任務構建獨立算力資源池,實現(xiàn)算力貢獻和使用的去中心化管理。JjA28資訊網——每日最新資訊28at.com

INTELLECT團隊已將這四大組件全部開源。JjA28資訊網——每日最新資訊28at.com

核心RL框架PRIME-RLJjA28資訊網——每日最新資訊28at.com

PRIME-RL的核心,是支持推理數據生成與模型訓練的解耦與異步執(zhí)行。JjA28資訊網——每日最新資訊28at.com

這種方式允許分散的推理節(jié)點按照自己的進度生成數據,無需彼此協(xié)調和等待。JjA28資訊網——每日最新資訊28at.com

為了進一步提升性能和減小顯存占用,PRIME-RL采用支持bfloat16精度的vLLM(vector LLM)作為推理運行時。JjA28資訊網——每日最新資訊28at.com

另外還集成了FSDP(Fully Sharded Data Parallel)技術對模型進行切片。JjA28資訊網——每日最新資訊28at.com

FSDP將模型的參數和梯度按層切分到不同的GPU上,每個GPU只負責一部分的計算和存儲。JjA28資訊網——每日最新資訊28at.com

參數分發(fā)網絡SHARDCASTJjA28資訊網——每日最新資訊28at.com

SHARDCAST是一個基于HTTP的參數分發(fā)網絡,負責將更新后的模型權重廣播給全球范圍內的推理節(jié)點。JjA28資訊網——每日最新資訊28at.com

在分布式強化學習中,由于文件體積極大,而網絡帶寬資源良莠不齊,模型權重的分發(fā)通常是一個難點。JjA28資訊網——每日最新資訊28at.com

為了解決這個問題,SHARDCAST引入了分片傳輸、多級緩存、智能調度等一系列優(yōu)化技術。JjA28資訊網——每日最新資訊28at.com

分片傳輸指的是將模型權重文件切分成多個小的分片,然后并行傳輸。這種做法不僅能充分利用網絡帶寬,降低傳輸延遲,還能提高傳輸的魯棒性,不會因為個別分片傳輸失敗而造成整體重傳。JjA28資訊網——每日最新資訊28at.com

多級緩存是一種類似于CDN的傳輸模式,具體來說,SHARDCAST在推理節(jié)點和中心節(jié)點之間引入了一層中繼服務器作為緩存。每當中心節(jié)點產生新的模型權重,它首先將權重文件推送到這些中繼服務器。JjA28資訊網——每日最新資訊28at.com

這樣一來,推理節(jié)點就可以就近從中繼服務器拉取權重文件,而不是直接從中心節(jié)點獲取,可以有效緩解中心節(jié)點的網絡I/O壓力。JjA28資訊網——每日最新資訊28at.com

全球閑置算力訓個模型 性能媲美R1 老黃天塌了JjA28資訊網——每日最新資訊28at.com

另外,與普通的被動響應式傳輸不同,SHARDCAST的中繼服務器會主動跟蹤每個推理節(jié)點的權重版本,當發(fā)現(xiàn)版本落后時,會主動將增量權重推送給節(jié)點,確保了權重更新的實時性。JjA28資訊網——每日最新資訊28at.com

同時,SHARDCAST還會根據網絡拓撲和帶寬狀況,動態(tài)調整傳輸策略和路由,選擇優(yōu)的分發(fā)路徑。JjA28資訊網——每日最新資訊28at.com

推理驗證協(xié)議TOPLOCJjA28資訊網——每日最新資訊28at.com

TOPLOC全稱Tierion backed Proof-of-Locality Protocol,是INTELLECT-2中負責驗證推理節(jié)點生成數據可信性的關鍵組件。JjA28資訊網——每日最新資訊28at.com

其目的是確保每個推理節(jié)點提交的數據可信,避免惡意節(jié)點通過提交虛假數據來破壞模型訓練。JjA28資訊網——每日最新資訊28at.com

TOPLOC通過密碼學證明和可驗證計算等技術實現(xiàn),可以概括為Proof生成和Proof檢查兩個主要步驟。JjA28資訊網——每日最新資訊28at.com

Proof生成是指當一個推理節(jié)點完成一組推理任務后,不僅要將生成的軌跡數據提交給中心節(jié)點,還要附帶提交一個密碼學proof。JjA28資訊網——每日最新資訊28at.com

這個proof證明了所提交的數據確實是由特定版本的模型、特定的輸入、特定的隨機數種子生成的,其生成基于安全哈希算法,確保了proof與推理過程綁定。JjA28資訊網——每日最新資訊28at.com

中心節(jié)點在收到推理數據和proof后,會定期抽查部分數據的可信性。驗證節(jié)點首先會重放推理節(jié)點的模型prefill,然后將計算得到的中間狀態(tài)與proof進行比對。JjA28資訊網——每日最新資訊28at.com

為了降低開銷,推理節(jié)點只需提交關鍵的中間狀態(tài),而非完整的計算過程;驗證節(jié)點也只需重放部分關鍵路徑,而不是全盤重做。JjA28資訊網——每日最新資訊28at.com

全球閑置算力訓個模型 性能媲美R1 老黃天塌了JjA28資訊網——每日最新資訊28at.com

Protocol TestnetJjA28資訊網——每日最新資訊28at.com

Protocol Testnet是INTELLECT-2的底層基礎設施,為全球范圍內的計算資源管理和任務調度提供了統(tǒng)一的接口和規(guī)范。JjA28資訊網——每日最新資訊28at.com

它將不同類別的人工智能訓練任務組織成獨立的計算域,每個計算域都有自己的資源池,由去中心化的“賬本系統(tǒng)”來管理節(jié)點的身份、貢獻和信譽值。JjA28資訊網——每日最新資訊28at.com

每個計算域對應了一種特定的訓練任務,如語言模型預訓練、多模態(tài)對齊、強化學習等。JjA28資訊網——每日最新資訊28at.com

針對一個特定的訓練任務,開發(fā)者會在Testnet上注冊一個新的計算域,計算域定義了任務的相關屬性和協(xié)議規(guī)范。JjA28資訊網——每日最新資訊28at.com

全球范圍內的算力提供者可以將自己的計算設備注冊到Testnet的資源池中。每個節(jié)點在加入時,,都需要在去中心化“賬本”上生成一個唯一的密碼學身份,用于后續(xù)的貢獻度記錄和信譽管理。JjA28資訊網——每日最新資訊28at.com

當一個計算域有新的訓練任務需要執(zhí)行時,Testnet的任務調度服務會根據各節(jié)點的算力特征和網絡狀況,將任務分發(fā)到合適的節(jié)點上。節(jié)點按照任務要求,執(zhí)行計算并生成結果。JjA28資訊網——每日最新資訊28at.com

節(jié)點生成的計算結果需要經過驗證,以確保其可信性,對于通過驗證的結果,節(jié)點的貢獻度會被記錄在去中心化賬本上,作為后續(xù)獎勵分配的依據。JjA28資訊網——每日最新資訊28at.com

服務支持:在整個任務執(zhí)行過程中,Testnet還提供了節(jié)點發(fā)現(xiàn)、健康監(jiān)控、日志管理等一系列配套服務,以協(xié)助節(jié)點的管理和問題診斷,保障分布式網絡的穩(wěn)定運行。JjA28資訊網——每日最新資訊28at.com

全球閑置算力訓個模型 性能媲美R1 老黃天塌了JjA28資訊網——每日最新資訊28at.com

更多訓練細節(jié)JjA28資訊網——每日最新資訊28at.com

另外在訓練過程中,INTELLECT2還采用了兩步異步強化學習的模式,也就是權重的廣播與正在進行的推理和訓練完全重疊,從而消除了通信瓶頸。JjA28資訊網——每日最新資訊28at.com

全球閑置算力訓個模型 性能媲美R1 老黃天塌了JjA28資訊網——每日最新資訊28at.com

以及雙面GRPO剪輯,通過使用雙面標記概率比剪輯來緩解梯度尖峰,從而使訓練更加穩(wěn)定。JjA28資訊網——每日最新資訊28at.com

全球閑置算力訓個模型 性能媲美R1 老黃天塌了JjA28資訊網——每日最新資訊28at.com

數據方面,INTELLECT2采用了來自NuminaMath-1.5、Deepscaler和 SYNTHETIC-1的28.5萬個可驗證任務(數學和編碼),并結合離線和在線過濾來選擇具有挑戰(zhàn)性的任務,顯著提高了模型學習效率。JjA28資訊網——每日最新資訊28at.com

QwQ-32B數學和代碼性能提升JjA28資訊網——每日最新資訊28at.com

INTELLECT-2的實驗主要包括兩個部分——TARGET-SHORT和TARGET-LONG,分別對應短目標長度和長目標長度的訓練設置。JjA28資訊網——每日最新資訊28at.com

TARGET-SHORT:隨著訓練的進行,任務獎勵(表示數學和編程能力)顯著提高,長度懲罰有所下降;TARGET-LONG:任務獎勵同樣大幅提升,長度懲罰也呈下降趨勢,但在實驗的有限時間內尚未完全收斂,模型還未完全學會嚴格遵守思考預算。JjA28資訊網——每日最新資訊28at.com

全球閑置算力訓個模型 性能媲美R1 老黃天塌了JjA28資訊網——每日最新資訊28at.com

與基線模型QwQ-32B(INTELLECT-2是由QwQ-32B經強化訓練而成)相比,INTELLECT-2在數學和編程基準測試(如AIME、LiveCodeBench)上的表現(xiàn)有所提升,但在IFEval上略有下降,可能是因為訓練只專注于數學和編程任務。JjA28資訊網——每日最新資訊28at.com

全球閑置算力訓個模型 性能媲美R1 老黃天塌了JjA28資訊網——每日最新資訊28at.com

在計算資源利用方面,INTELLECT-2通過異步強化學習成功實現(xiàn)了通信和計算的重疊。在兩個實驗設置中,SHARDCAST廣播平均耗時14分鐘,實現(xiàn)了約590Mb/s的帶寬吞吐量。JjA28資訊網——每日最新資訊28at.com

團隊曾獲Karpathy投資JjA28資訊網——每日最新資訊28at.com

INTELLEC-2背后的團隊,名叫Prime Intellect,位于美國舊金山。JjA28資訊網——每日最新資訊28at.com

創(chuàng)始人兼CEO是Vincent Weisser,來自德國(實際上團隊中很多人都有德國背景),之前參與過大量的創(chuàng)業(yè)項目,Prime Intellect是他新的創(chuàng)業(yè)成果。JjA28資訊網——每日最新資訊28at.com

全球閑置算力訓個模型 性能媲美R1 老黃天塌了JjA28資訊網——每日最新資訊28at.com

聯(lián)創(chuàng)兼CTO Johannes Hagemann,德國Hasso Plattner研究所碩士,本科畢業(yè)于多特蒙德工業(yè)大學。JjA28資訊網——每日最新資訊28at.com

CEO Weisser擔任核心成員的創(chuàng)業(yè)項目VitaDAO,Hagemann曾出任策略顧問。JjA28資訊網——每日最新資訊28at.com

全球閑置算力訓個模型 性能媲美R1 老黃天塌了JjA28資訊網——每日最新資訊28at.com

創(chuàng)始工程師Jannik Straube,慕尼黑工業(yè)大學碩士,之前曾在IBM工作。JjA28資訊網——每日最新資訊28at.com

全球閑置算力訓個模型 性能媲美R1 老黃天塌了JjA28資訊網——每日最新資訊28at.com

在INTELLEC-2之前,Prime Intellect團隊也發(fā)布過一系列分布式訓練的模型成果:JjA28資訊網——每日最新資訊28at.com

INTELLECT-1,第一個在分散式基礎設施上訓練的10B參數模型;METAGENE-1,用于早期流行病檢測和全球健康應用的生物模型;INTELLECT-MATH,使用RL訓練的數學推理模型。JjA28資訊網——每日最新資訊28at.com

另外,基于分布式強化學習,團隊還推出了從DeepSeek-R1 生成大的合成推理數據集GENESYS + SYNTHETIC-1。JjA28資訊網——每日最新資訊28at.com

今年2月,Prime Intellect團隊獲得了1500萬美元(約1.08億人民幣)的新投資,用來構建點對點AI協(xié)議。JjA28資訊網——每日最新資訊28at.com

這筆投資由創(chuàng)始人基金領銜,投資者中還包括大神Karpathy、Hugging Face聯(lián)創(chuàng)兼CEO Clem Delangue、FlashAttention作者Tri Dao、Stability AI前CEO Emad Mostaque等AI界名人。JjA28資訊網——每日最新資訊28at.com

加上之前已有的資金,Prime Intellect團隊獲得的總資金超過了2000萬美元。JjA28資訊網——每日最新資訊28at.com

全球閑置算力訓個模型 性能媲美R1 老黃天塌了JjA28資訊網——每日最新資訊28at.com

在接下來的計劃當中,Prime Intellect將進行提高推理-訓練計算的比例,為模型提供推理鏈中的內置工具(網絡搜索、Python 解釋器等),以及融合獨立訓練的RL模型等一系列工作。JjA28資訊網——每日最新資訊28at.com

宏觀方面,團隊也將擴大計算市場,擴展去中心化訓練,并與開源和去中心化人工智能領域的其他領先項目開展合作。JjA28資訊網——每日最新資訊28at.com


文章出處:量子位

本文鏈接:http://www.tebozhan.com/showinfo-24-149386-0.html全球閑置算力訓個模型 性能媲美R1 老黃天塌了

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 碾壓RTX 5060 Ti!藍寶石RX 9070 GRE GAMING OC 12GB DUAL顯卡圖賞

下一篇: Intel大氣!銳炫B580要上24GB大顯存

標簽:
  • 熱門焦點
  • 一加Ace2 Pro真機揭曉 鈦空灰配色質感拉滿

    終于,在經過了幾波預熱之后,一加Ace2 Pro的外觀真機圖在網上出現(xiàn)了。還是博主數碼閑聊站曝光的,這次的外觀設計還是延續(xù)了一加11的方案,只是細節(jié)上有了調整,例如新加入了鈦空灰
  • 直屏旗艦來了 iQOO 12和K70 Pro同臺競技

    旗艦機基本上使用的都是雙曲面屏幕,這就讓很多喜歡直屏的愛好者在苦等一款直屏旗艦,這次,你們等到了。據博主數碼閑聊站帶來的最新爆料稱,Redmi下代旗艦K70 Pro和iQOO 12兩款手
  • 6月iOS設備性能榜:M2穩(wěn)居榜首 A系列只能等一手3nm來救

    沒有新品發(fā)布,自然iOS設備性能榜的上榜設備就沒有什么更替,僅僅只有跑分變化而產生的排名變動,畢竟蘋果新品的發(fā)布節(jié)奏就是這樣的,一年下來也就幾個移動端新品,不會像安卓廠商,一
  • JVM優(yōu)化:實戰(zhàn)OutOfMemoryError異常

    一、Java堆溢出堆內存中主要存放對象、數組等,只要不斷地創(chuàng)建這些對象,并且保證 GC Roots 到對象之間有可達路徑來避免垃 圾收集回收機制清除這些對象,當這些對象所占空間超過
  • 騰訊蓋樓,字節(jié)拆墻

    來源 | 光子星球撰文 | 吳坤諺編輯 | 吳先之“想重溫暴刷深淵、30+技能搭配暴搓到爽的游戲體驗嗎?一起上晶核,即刻暴打!”曾憑借直播騰訊旗下代理格斗游戲《DNF》一
  • 阿里大調整

    來源:產品劉有媒體報道稱,近期淘寶天貓集團啟動了近年來最大的人力制度改革,涉及員工績效、層級體系等多個核心事項,目前已形成一個初步的“征求意見版”:1、取消P序列
  • 支持aptX Lossless無損傳輸 iQOO TWS 1賽道版發(fā)布限時優(yōu)惠價369元

    2023年7月4日,“無損音質,聲動人心”iQOO TWS 1正式發(fā)布,支持aptX Lossless無損傳輸,限時優(yōu)惠價369元。iQOO TWS 1耳機率先支持端到端aptX Lossless無
  • iQOO Neo8系列或定檔5月23日:首發(fā)天璣9200+ 安卓跑分王者

    去年10月,iQOO推出了iQOO Neo7系列機型,不僅搭載了天璣9000+,而且是同價位唯一一款天璣9000+直屏旗艦,一經上市便受到了用戶的廣泛關注。在時隔半年后,
  • 質感不錯!OPPO K11渲染圖曝光:旗艦IMX890傳感器首次下放

    一直以來,OPPO K系列機型都保持著較為均衡的產品體驗,歷來都是2K價位的明星機型,去年推出的OPPO K10和OPPO K10 Pro兩款機型憑借各自的出色配置,堪稱有
Top