AVt天堂网 手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

當前位置:首頁 > 科技  > 互聯網

百川智能與鵬城實驗室開展合作,突破國產算力大模型長窗口技術

來源: 責編: 時間:2023-11-17 17:14:08 402觀看
導讀 11月17日消息,百川智能與鵬城實驗室宣布攜手探索大模型訓練和應用,合作研發基于國產算力的128K長窗口大模型“鵬城-百川?腦海33B”。這是國產算力大模型創新與落地的一次實踐,對國產算力大模型

11月17日消息,百川智能與鵬城實驗室宣布攜手探索大模型訓練和應用,合作研發基于國產算力的128K長窗口大模型“鵬城-百川?腦海33B”。這是國產算力大模型創新與落地的一次實踐,對國產算力大模型發展具有積極示范作用。bxE28資訊網——每日最新資訊28at.com

百川智能攜手鵬城實驗室助力國產算力大模型創新bxE28資訊網——每日最新資訊28at.com

眾所周知,訓練大模型需要海量的算力,并且大模型參數數量的增長與算力的平方成正比。大模型性能的競爭,一定程度上是算力的比拼。在復雜多變的國際環境下,國內算力供給與需求之間的“鴻溝”持續擴大,國產化算力已經成為國內大模型企業的必要選擇。bxE28資訊網——每日最新資訊28at.com

雖然國內諸多企業在通用AI芯片方面早有布局,在芯片量產、生態構建、應用拓展領域也取得了不錯進展,但基于國產算力訓練大模型,仍面臨著生態建設、成本控制、能效比優化等阻礙。因此算力完全自主,仍需要芯片廠商、大模型企業、學術科研機構等多方共同努力。bxE28資訊網——每日最新資訊28at.com

鵬城實驗室表示,鵬城實驗室秉持“國產算力+自主大模型”的創新理念,依托“鵬城?腦海”開源聯合體,廣泛聯合企業、高校和科研院所,致力于通過開源群智的合作模式共享資源,為千行百業插上人工智能的“翅膀”。百川智能是國內領先的大模型企業,自成立以來一直在推動大模型研發和開源生態建設,其開源和閉源模型在同等量級權威評測中都取得了優異成績。雙方在合作過程中能夠充分發揮各自優勢形成合力,更好地滿足我國不斷增長的智能化轉型需求,助力中國人工智能產業快速崛起。bxE28資訊網——每日最新資訊28at.com

百川智能表示,百川智能希望通過開源、與合作伙伴共創等方式助力中國大模型創新,繁榮本土大模型生態。鵬城實驗室作為國家戰略科技力量的重要組成部分,在國產算力大模型研發和應用等方面一直處于國內領先位置。本次百川智能與鵬城實驗室合作研發“鵬城-百川?腦海33B”長窗口大模型,是國產算力大模型技術創新和落地的一次突破。未來,百川智能將在技術、算力等諸多維度不斷深化與鵬城實驗室的合作,持續助力本土大模型創新發展。bxE28資訊網——每日最新資訊28at.com

國產算力最長上下文窗口,“鵬城-百川?腦海33B”率先實現國產算力技術突破bxE28資訊網——每日最新資訊28at.com

論壇上,百川智能和鵬城實驗室展示了雙方共同研發的“鵬城-百川?腦海33B”大模型。“鵬城-百川?腦海33B”的128K長上下文窗口基于“鵬城云腦”國產算力平臺訓練,未來可升級至192K,是基于國產算力訓練的最長上下文窗口。bxE28資訊網——每日最新資訊28at.com

上下文窗口長度對模型理解和生成與特定上下文相關的文本至關重要,是大模型的核心技術之一。通常而言,更長的上下文窗口可以提供更豐富的語義信息、消除歧義,能夠讓模型生成的內容更準確、更流暢。bxE28資訊網——每日最新資訊28at.com

為了更好地提升“鵬城-百川?腦海33B”上下文窗口長度和模型整體性能,百川智能和鵬城實驗室對模型進行了全流程優化。在數據集構建方面,采用精細的數據構造,實現了段落、句子粒度的自動化數據過濾、選擇、配比,良好的提升了數據質量;在訓練架構上,通過NormHead、max-Z-Loss、dynamic-LR等自研或業界領先的模型訓練優化技術,對Transformer模塊進行深度優化,確保模型收斂穩定的同時,全面提升了模型優化效率和最終效果;此外,還在全生命周期的模型工具集中,通過與北京大學王亦洲、楊耀東老師團隊的合作,首創了帶安全約束的RLHF對齊技術,有效提升了模型內容生成質量和安全性。bxE28資訊網——每日最新資訊28at.com

未來,雙方將在國產算力大模型技術創新和模型落地等方面繼續加強合作,并與相關領域的優勢單位如北京大學、清華大學等開展協同創新,助力本土大模型在模型性能、技術創新方面持續突破,推動本土大模型進一步開源開放,為更多行業智能化轉型提供幫助和支持。bxE28資訊網——每日最新資訊28at.com

本文鏈接:http://www.tebozhan.com/showinfo-21-27955-0.html百川智能與鵬城實驗室開展合作,突破國產算力大模型長窗口技術

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 元戎啟行“無圖”智駕方案升級 真正做到即開即用

下一篇: 賈躍亭旗下法拉第未來宣布推出AI產品FF aiPal Beta

標簽:
  • 熱門焦點
Top