AVt天堂网 手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

當前位置:首頁 > 科技  > 互聯網

百川智能推出全球最長上下文窗口大模型Baichuan2-192K,一次可輸入35萬字超越Claude2

來源: 責編: 時間:2023-10-30 17:24:25 339觀看
導讀 10月30日消息,百川智能發布Baichuan2-192K大模型。其上下文窗口長度高達192K,是目前全球最長的上下文窗口。Baichuan2-192K能夠處理約35萬個漢字,是目前支持長上下文窗口最優秀大模型Claude2(支

10月30日消息,百川智能發布Baichuan2-192K大模型。其上下文窗口長度高達192K,是目前全球最長的上下文窗口。HB428資訊網——每日最新資訊28at.com

Baichuan2-192K能夠處理約35萬個漢字,是目前支持長上下文窗口最優秀大模型Claude2(支持100K上下文窗口,實測約8萬字)的 4.4倍,更是 GPT-4(支持32K上下文窗口,實測約 2.5萬字)的14倍。Baichuan2-192K不僅在上下文窗口長度上超越Claude2,在長窗口文本生成質量、長上下文理解以及長文本問答、摘要等方面的表現也全面領先Claude2。HB428資訊網——每日最新資訊28at.com

今年9月25日,百川智能已開放了Baichuan2的API接口,正式進軍企業級市場,開啟商業化進程。此次Baichuan2-192K將以API調用和私有化部署的方式提供給企業用戶,目前百川智能已經啟動Baichuan2-192K的API內測,開放給法律、媒體、金融等行業的核心合作伙伴。HB428資訊網——每日最新資訊28at.com

10項長文本評測7項取得SOTA,全面領先Claude2HB428資訊網——每日最新資訊28at.com

上下文窗口長度是大模型的核心技術之一,通過更大的上下文窗口,模型能夠結合更多上下文內容獲得更豐富的語義信息,更好的捕捉上下文的相關性、消除歧義,進而更加準確、流暢的生成內容,提升模型能力。HB428資訊網——每日最新資訊28at.com

Baichuan2-192K在Dureader、NarrativeQA、LSHT、TriviaQA等10項中英文長文本問答、摘要的評測集上表現優異,有7項取得SOTA,顯著超過其他長窗口模型。HB428資訊網——每日最新資訊28at.com

此外,LongEval的評測結果顯示,在窗口長度超過100K后Baichuan2-192K依然能夠保持非常強勁的性能,而其他開源或者商用模型在窗口增長后效果都出現了近乎直線下降的情況。Claude2也不例外,在窗口長度超過80K后整體效果下降非常嚴重。由此可見,Baichuan2-192K的長窗口內容記憶和理解能力大幅領先其他模型。HB428資訊網——每日最新資訊28at.com

HB428資訊網——每日最新資訊28at.com

(LongEval是加州大學伯克利分校聯合其他高校發布的針對長窗口模型的評測榜單,主要用來衡量模型對長窗口內容的記憶和理解能力,是業內公認的長上下文窗口理解權威評測榜單)HB428資訊網——每日最新資訊28at.com

動態采樣的位置編碼優化,4D并行的分布式方案,同步提升窗口長度和模型性能HB428資訊網——每日最新資訊28at.com

擴大上下文窗口能有效提升大模型性能是人工智能行業的共識,但是超長上下文窗口意味著更高的算力需求和更大的顯存壓力。目前,業內有很多提升上下文窗口長度的方式,包括滑動窗口、降采樣、小模型等。這些方式雖然能提升上下文窗口長度,但對模型性能均有不同程度的損害,換言之都是通過犧牲模型其他方面的性能來換取更長的上下文窗口。HB428資訊網——每日最新資訊28at.com

而本次百川發布的Baichuan2-192K通過算法和工程的極致優化,實現了窗口長度和模型性能之間的平衡,做到了窗口長度和模型性能的同步提升。HB428資訊網——每日最新資訊28at.com

算法方面,百川智能提出了一種針對RoPE和ALiBi動態位置編碼的外推方案,該方案能夠對不同長度的ALiBi位置編碼進行不同程度的Attention-mask動態內插,在保證分辨率的同時增強了模型對長序列依賴的建模能力。在長文本困惑度標準評測數據 PG-19上,當窗口長度擴大,Baichuan2-192K的序列建模能力持續增強。HB428資訊網——每日最新資訊28at.com

HB428資訊網——每日最新資訊28at.com

(PG-19是DeepMind發布的語言建模基準數據集,是業內公認的衡量模型長程記憶推理問題的評測標準)HB428資訊網——每日最新資訊28at.com

工程方面,在自主開發的分布式訓練框架基礎上,百川智能整合目前市場上所有先進的優化技術,包括張量并行、流水并行、序列并行、重計算以及Offload功能等,獨創了一套全面的4D并行分布式方案。該方案能夠根據模型具體的負載情況,自動尋找最適合的分布式策略,極大降低了長窗口訓練和推理過程中的顯存占用。HB428資訊網——每日最新資訊28at.com

百川智能在算法和工程上針對長上下文窗口的創新,不僅是大模型技術層面的突破,對于學術領域同樣有著重要意義。Baichuan2-192K驗證了長上下文窗口的可行性,為大模型性能提升開拓出了新的科研路徑。HB428資訊網——每日最新資訊28at.com

Baichuan2-192K正式開啟內測,已落地法律、媒體等諸多真實場景HB428資訊網——每日最新資訊28at.com

Baichuan2-192K現已正式開啟內測,以API調用的方式開放給百川智能的核心合作伙伴,已經與財經類媒體及律師事務所等機構達成了合作,將Baichuan2-192K全球領先的長上下文能力應用到了傳媒、金融、法律等具體場景當中,不久后將全面開放。HB428資訊網——每日最新資訊28at.com

全面開放API之后,Baichuan2-192K便能夠與更多的垂直場景深度結合,真正在人們的工作、生活、學習中發揮作用,助力行業用戶更好的降本增效。Baichuan2-192K 能夠一次性處理和分析數百頁的材料,對于長篇文檔關鍵信息提取與分析,長文檔摘要、長文檔審核、長篇文章或報告編寫、復雜編程輔助等真實場景都有巨大的助力作用。HB428資訊網——每日最新資訊28at.com

它可以幫助基金經理總結和解釋財務報表,分析公司的風險和機遇;幫助律師識別多個法律文件中的風險,審核合同和法律文件;幫助技術人員閱讀數百頁的開發文檔,并回答技術問題;還能幫助科員人員快速瀏覽大量論文,總結最新的前沿進展。HB428資訊網——每日最新資訊28at.com

不僅如此,更長的上下文還為其更好的處理和理解復雜的多模態輸入,以及實現更好的遷移學習提供了底層支撐,這將為行業探索Agent、多模態應用等前沿領域打下良好技術基礎。
 HB428資訊網——每日最新資訊28at.com

本文鏈接:http://www.tebozhan.com/showinfo-21-15841-0.html百川智能推出全球最長上下文窗口大模型Baichuan2-192K,一次可輸入35萬字超越Claude2

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 助力1000+企業后 亞馬遜云科技給出「構建生成式AI應用」的關鍵步驟

下一篇: 無良商家陳米冒充新米 京東超市多舉措助新米銷售

標簽:
  • 熱門焦點
  • 6月iOS設備好評榜:第一蟬聯榜首近一年

    作為安兔兔各種榜單里變化最小的那個,2023年6月的iOS好評榜和上個月相比沒有任何排名上的變化,僅僅是部分設備好評率的下降,長年累月的用戶評價和逐漸退出市場的老款機器讓這
  • 一加首款折疊屏!一加Open渲染圖出爐:罕見單手可握小尺寸

    8月5日消息,此前就有爆料稱,一加首款折疊屏手機將會在第三季度上市,如今隨著時間臨近,新機的各種消息也開始浮出水面。據悉,這款新機將會被命名為“On
  • Java NIO內存映射文件:提高文件讀寫效率的優秀實踐!

    Java的NIO庫提供了內存映射文件的支持,它可以將文件映射到內存中,從而可以更快地讀取和寫入文件數據。本文將對Java內存映射文件進行詳細的介紹和演示。內存映射文件概述內存
  • 三言兩語說透柯里化和反柯里化

    JavaScript中的柯里化(Currying)和反柯里化(Uncurrying)是兩種很有用的技術,可以幫助我們寫出更加優雅、泛用的函數。本文將首先介紹柯里化和反柯里化的概念、實現原理和應用
  • 使用LLM插件從命令行訪問Llama 2

    最近的一個大新聞是Meta AI推出了新的開源授權的大型語言模型Llama 2。這是一項非常重要的進展:Llama 2可免費用于研究和商業用途。(幾小時前,swyy發現它已從LLaMA 2更名為Lla
  • 重估百度丨“晚熟”的百度云,能等到春天嗎?

    ©自象限原創作者|程心排版|王喻可2016年7月13日,百度云計算戰略發布會在北京舉行,宣告著百度智能云的正式啟程。彼時的會場座無虛席,甚至排隊排到了門外,在場的所有人幾乎都
  • 自律,給不了Keep自由!

    來源 | 互聯網品牌官作者 | 李大為編排 | 又耳 審核 | 谷曉輝自律能不能給用戶自由暫時不好說,但大概率不能給Keep自由。近日,全球最大的在線健身平臺Keep正式登陸港交所,努力
  • 蘋果、三星、惠普等暫停向印度出口筆記本和平板電腦

    集微網消息,據彭博社報道,在8月3日印度突然禁止在沒有許可證的情況下向印度進口電腦/平板及顯示器等產品后,蘋果、三星電子和惠普等大公司暫停向印度
  • 2299元起!iQOO Pad明晚首銷:性能最強天璣平板

    5月23日,iQOO如期舉行了新品發布會,除了首發安卓最強旗艦處理器的iQOO Neo8系列新機外,還在發布會上推出了旗下首款平板電腦——iQOO Pad,其最大的賣點
Top