AVt天堂网 手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

當前位置:首頁 > 科技  > 互聯網

阿里云通義千問開源72B、1.8B兩款大語言模型 并首度開源音頻大模型

來源: 責編: 時間:2023-12-01 17:13:17 382觀看
導讀 12月1日消息,阿里云宣布開源通義千問720億參數模型Qwen-72B。Qwen-72B在10個權威基準測評創下開源模型最優成績,成為業界最強開源大模型,性能超越開源標桿Llama 2-70B和大部分商用閉源模型。未

12月1日消息,阿里云宣布開源通義千問720億參數模型Qwen-72B。Qwen-72B在10個權威基準測評創下開源模型最優成績,成為業界最強開源大模型,性能超越開源標桿Llama 2-70B和大部分商用閉源模型。未來,企業級、科研級的高性能應用,也有了開源大模型這一選項。y9028資訊網——每日最新資訊28at.com

通義千問還開源了18億參數模型Qwen-1.8B和音頻大模型Qwen-Audio。至此,通義千問共開源18億、70億、140億、720億參數的4款大語言模型,以及視覺理解、音頻理解兩款多模態大模型,實現“全尺寸、全模態”開源。y9028資訊網——每日最新資訊28at.com

業界最強開源模型,填補中國LLM開源領域空白y9028資訊網——每日最新資訊28at.com

Qwen-72B基于3T tokens高質量數據訓練,延續通義千問預訓練模型一貫以來的強勢表現,在10個權威基準測評中奪得開源模型最優成績,在部分測評中超越閉源的GPT-3.5和GPT-4。
英語任務上,Qwen-72B在MMLU基準測試取得開源模型最高分;中文任務上,Qwen-72B霸榜C-Eval、CMMLU、GaokaoBench等基準,得分超越GPT-4;數學推理方面,Qwen-72B在GSM8K、MATH測評中斷層式領先其他開源模型;代碼理解方面,Qwen-72B在HumanEval、MBPP等測評中的表現大幅提升,代碼能力有了質的飛躍。y9028資訊網——每日最新資訊28at.com

在10大權威測評中,通義千問720億參數模型獲得開源模型最優成績y9028資訊網——每日最新資訊28at.com

通義千問720億開源模型部分成績超越閉源的GPT-3.5和GPT-4y9028資訊網——每日最新資訊28at.com

Qwen-72B可以處理最多32k的長文本輸入,在長文本理解測試集LEval上取得了超越ChatGPT-3.5-16k的效果。研發團隊優化了Qwen-72B的指令遵循、工具使用等技能,使之能更好地被下游應用集成。比如,Qwen-72B搭載了強大的系統指令(System Prompt)能力,用戶只用一句提示詞就可定制AI助手,要求大模型扮演某個角色或者執行特定的回復任務。y9028資訊網——每日最新資訊28at.com

用戶僅用一句提示詞就可創建自己的AI助手y9028資訊網——每日最新資訊28at.com

此前,中國大模型市場還沒出現足以對標Llama 2-70B的優質開源模型。Qwen-72B填補了國內空白,以高性能、高可控、高性價比的優勢,提供不亞于商業閉源大模型的選擇。基于Qwen-72B,大中型企業可開發商業應用,高校、科研院所可開展AI for Science等科研工作。y9028資訊網——每日最新資訊28at.com

發布會上的另一開源模型Qwen-1.8B是目前尺寸最小的中國開源大模型,推理2K長度文本內容僅需3G顯存,可在消費級終端部署。y9028資訊網——每日最新資訊28at.com

從18億、70億、140億到720億參數規模,通義千問成為業界首個“全尺寸開源”的大模型。用戶可在魔搭社區直接體驗Qwen系列模型效果,也可通過阿里云靈積平臺調用模型API,或基于阿里云百煉平臺定制大模型應用。阿里云人工智能平臺PAI針對通義千問全系列模型進行深度適配,推出了輕量級微調、全參數微調、分布式訓練、離線推理驗證、在線服務部署等服務。y9028資訊網——每日最新資訊28at.com

此外,阿里云還首次開源音頻理解大模型Qwen-Audio。Qwen-Audio能夠感知和理解人聲、自然聲、動物聲、音樂聲等各類語音信號。用戶可以輸入一段音頻,要求模型給出對音頻的理解,甚至基于音頻進行文學創作、邏輯推理、故事續寫等等。音頻理解能夠賦予大模型接近人類的聽覺能力。y9028資訊網——每日最新資訊28at.com

據介紹,阿里云是國內最早開源自研大模型的科技企業,8月以來開源了Qwen-7B、Qwen-14B和視覺理解模型Qwen-VL。幾款模型先后沖上HuggingFace、Github大模型榜單,得到中小企業和個人開發者的青睞,累計下載量超過150萬,催生出150多款新模型、新應用。發布會現場,多位開發者伙伴現身說法,分享了他們用Qwen開發專屬模型和特定應用的實踐。y9028資訊網——每日最新資訊28at.com

阿里云CTO周靖人表示,開源生態對促進中國大模型的技術進步與應用落地至關重要,通義千問將持續投入開源,希望成為“AI時代最開放的大模型”,與伙伴們共同促進大模型生態建設。y9028資訊網——每日最新資訊28at.com

本文鏈接:http://www.tebozhan.com/showinfo-21-35817-0.html阿里云通義千問開源72B、1.8B兩款大語言模型 并首度開源音頻大模型

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 戴偉民、柴琇等業界大咖齊聚2023搜狐財經年度論壇 分享企業增長新路徑

下一篇: PTC可持續發展副總裁:及早著手CSRD的3個理由

標簽:
  • 熱門焦點
Top