當(dāng)前位置：首頁 > 科技 > 資訊

從龐大到精巧　讓AI大模型更接地氣

來源：責(zé)編：時間：2024-08-01 09:20:22 346觀看

導(dǎo)讀　　人工智能大模型以其龐大的參數(shù)規(guī)模和海量的訓(xùn)練數(shù)據(jù)量著稱，需要由數(shù)千塊AI芯片組成的服務(wù)器集群來支撐其運(yùn)算。相關(guān)數(shù)據(jù)顯示，在10天內(nèi)訓(xùn)練1000億參數(shù)規(guī)模、1PB訓(xùn)練數(shù)據(jù)集，約需1.08萬個英偉達(dá)A100GPU。這一數(shù)字揭示了

　　人工智能大模型以其龐大的參數(shù)規(guī)模和海量的訓(xùn)練數(shù)據(jù)量著稱，需要由數(shù)千塊AI芯片組成的服務(wù)器集群來支撐其運(yùn)算。相關(guān)數(shù)據(jù)顯示，在10天內(nèi)訓(xùn)練1000億參數(shù)規(guī)模、1PB訓(xùn)練數(shù)據(jù)集，約需1.08萬個英偉達(dá)A100GPU。這一數(shù)字揭示了AI大模型背后巨大的經(jīng)濟(jì)成本。

　　近日，AI初創(chuàng)企業(yè)Anthropic的CEO兼總裁達(dá)里奧·阿莫代（Dario Amodei）在一檔播客節(jié)目中表示，目前公司正在開發(fā)的AI模型訓(xùn)練成本高達(dá)10億美元，他預(yù)計，AI模型的訓(xùn)練成本在2027年之前提升到100億美元，甚至是1000億美元。

　　在此背景下，輕量化大模型的概念應(yīng)運(yùn)而生，對大模型進(jìn)行量化、剪枝等壓縮操作，已成為模型部署過程中常用的策略。這些技術(shù)旨在降低模型的計算復(fù)雜度和減少存儲需求，從而加快模型推理速度，降低運(yùn)行成本，并使其更易于在邊緣設(shè)備或資源受限的環(huán)境中部署。這一理念不僅有利于實現(xiàn)“雙碳”目標(biāo)，也為AI技術(shù)的普及和落地應(yīng)用開辟了新的道路。

　　知識蒸餾技術(shù)助力降低算力成本。近日，谷歌DeepMind開源了Gemma 2，這是其小型語言模型系列的下一代產(chǎn)品。谷歌團(tuán)隊在Gemma 2的架構(gòu)上進(jìn)行了多項改進(jìn)，特別是引入了知識蒸餾（Knowledge Distillation，簡稱KD）技術(shù)。這是一種機(jī)器學(xué)習(xí)技術(shù)，主要用于模型壓縮和遷移學(xué)習(xí)，其核心思想是通過將大型模型（即“教師模型”）的知識傳遞給小型模型（即“學(xué)生模型”），以提高小型模型的性能。這種技術(shù)在不犧牲性能的前提下，大幅減少了模型的計算資源需求，使得Gemma 2不僅在同類規(guī)模的模型中表現(xiàn)出眾，甚至能與兩倍于其大小的模型性能相媲美。

　　Gemma 2的發(fā)布，無疑延續(xù)了近年來小型、開源語言模型家族蓬勃發(fā)展的行業(yè)趨勢。微軟的Phi和Meta的Llama等模型，同樣通過引入創(chuàng)新的架構(gòu)改進(jìn)（如GQA等）以及利用高質(zhì)量的訓(xùn)練數(shù)據(jù)，實現(xiàn)了遠(yuǎn)超傳統(tǒng)小型模型的卓越性能。這一系列模型的涌現(xiàn)，不僅是技術(shù)進(jìn)步的結(jié)果，更是為了滿足更廣泛應(yīng)用場景的需求。通過軟硬件協(xié)同、算法優(yōu)化和模型壓縮等多種手段，大模型正逐步實現(xiàn)更高效、更經(jīng)濟(jì)、更親民的目標(biāo)，從而推動人工智能技術(shù)的廣泛應(yīng)用和發(fā)展。

　　創(chuàng)新模型量化方法，讓大模型“瘦身”90％。此前，清華大學(xué)和哈工大的一項聯(lián)合研究提出了大模型1bit極限壓縮框架OneBit，包括全新的1bit線性層結(jié)構(gòu)、基于量化感知知識蒸餾的深度遷移學(xué)習(xí)等。1bit量化模型在計算上具有優(yōu)勢，參數(shù)的純二進(jìn)制表示，不但可以節(jié)省大量的空間，還能降低矩陣乘法對硬件的要求。該架構(gòu)首次實現(xiàn)大模型權(quán)重壓縮超越90％并保留大部分（83％）能力，對于實現(xiàn)大模型在PC端甚至智能手機(jī)上的部署意義非凡。

　　輕量化大模型在端側(cè)AI中的應(yīng)用尤為重要。它降低了邊緣計算的成本門檻，使更多應(yīng)用程序和用戶能夠使用大模型進(jìn)行推理計算，從而推動了AI向端側(cè)場景的落地。小米集團(tuán)NLP首席科學(xué)家王斌此前指出，大模型將逐漸演進(jìn)為小模型，并在本地部署中發(fā)揮重要作用。這不僅符合技術(shù)發(fā)展的趨勢，也有利于滿足差異化的應(yīng)用需求。

　　輕量化大模型之所以受到如此廣泛的關(guān)注，是因為它解決了AI技術(shù)在實際應(yīng)用中的諸多痛點問題。傳統(tǒng)的大型語言模型雖然性能強(qiáng)大，但往往因為計算復(fù)雜度高、存儲需求大而無法在資源受限的設(shè)備上高效運(yùn)行。而輕量化大模型則通過減少模型的參數(shù)數(shù)量和降低復(fù)雜度，降低了對硬件資源的要求，使得AI技術(shù)能夠更廣泛地應(yīng)用于移動設(shè)備、邊緣計算和實時應(yīng)用等場景。

（記者　吳雙）

本文鏈接：http://www.tebozhan.com/showinfo-16-104964-0.html從龐大到精巧　讓AI大模型更接地氣

聲明：本網(wǎng)頁內(nèi)容旨在傳播知識，若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：適合量子技術(shù)應(yīng)用的特種光纖問世

下一篇：多城汽車限購政策“松綁”釋放何種信號？

標(biāo)簽：

熱門焦點

俄羅斯：將審查iPhone等外國公司設(shè)備保數(shù)據(jù)安全

iPhone和特斯拉都屬于在各自領(lǐng)域領(lǐng)頭羊的品牌，推出的產(chǎn)品也也都是數(shù)一數(shù)二的，但對于一些國家而言，它們的產(chǎn)品可靠性和安全性還是在限制范圍內(nèi)。近日，俄羅斯聯(lián)邦通信、信息技術(shù)
一篇聊聊Go錯誤封裝機(jī)制

%w 是用于錯誤包裝（Error Wrapping）的格式化動詞。它是用于 fmt.Errorf 和 fmt.Sprintf 函數(shù)中的一個特殊格式化動詞，用于將一個錯誤（或其他可打印的值）包裝在一個新的錯誤中。使
只需五步，使用start.spring.io快速入門Spring編程

步驟1打開https://start.spring.io/，按照屏幕截圖中的內(nèi)容創(chuàng)建項目，添加 Spring Web 依賴項，并單擊“生成”按鈕下載 .zip 文件，為下一步做準(zhǔn)備。請在進(jìn)入步驟2之前進(jìn)行解壓。圖
華為開發(fā)者大會2023日程公開：開設(shè)鴻蒙HarmonyOS 4體驗區(qū)

IT之家 7 月 31 日消息，華為今日公布了 HDC.Together 開發(fā)者大會 2023 的詳細(xì)日程。整場大會將于 8 月 4 日-6 日之間舉行，屆時將發(fā)布最新一代鴻蒙 H
蘋果、三星、惠普等暫停向印度出口筆記本和平板電腦

集微網(wǎng)消息，據(jù)彭博社報道，在8月3日印度突然禁止在沒有許可證的情況下向印度進(jìn)口電腦/平板及顯示器等產(chǎn)品后，蘋果、三星電子和惠普等大公司暫停向印度
三星Galaxy Z Fold/Flip 5國行售價曝光：最低7499元/12999元起

據(jù)官方此前宣布，三星將于7月26日也就是明天在韓國首爾舉辦Unpacked活動，屆時將帶來帶來包括Galaxy Buds 3、Galaxy Watch 6、Galaxy Tab S9、Galaxy
OPPO K11評測：旗艦級IMX890加持 2000元檔最強(qiáng)影像手機(jī)

【Techweb評測】中端機(jī)型用戶群體巨大，占了中國目前手機(jī)市場的大頭，一直以來都是各手機(jī)品牌的“必爭之地”，其中OPPO K系列機(jī)型一直以來都以高品質(zhì)、
onebot M24巧系列一體機(jī)采用輕薄機(jī)身設(shè)計，現(xiàn)已在各平臺開售

onebot M24 巧系列一體機(jī)目前已在線上線下各平臺同步開售。onebot M24 巧系列采用一體化輕薄機(jī)身設(shè)計，最薄處為 10.15mm，擁有寶石紅、午夜藍(lán)、石墨綠、雅致
“買真退假” 這種“羊毛”不能薅

□ 法治日報記者王春　　□ 本報通訊員胡佳麗　　2020年初，還在上大學(xué)的小東加入了一個大學(xué)生兼職QQ群。群主“七王”在群里介紹一些刷單賺

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

從龐大到精巧　讓AI大模型更接地氣

俄羅斯：將審查iPhone等外國公司設(shè)備保數(shù)據(jù)安全

一篇聊聊Go錯誤封裝機(jī)制

只需五步，使用start.spring.io快速入門Spring編程

華為開發(fā)者大會2023日程公開：開設(shè)鴻蒙HarmonyOS 4體驗區(qū)

蘋果、三星、惠普等暫停向印度出口筆記本和平板電腦

三星Galaxy Z Fold/Flip 5國行售價曝光：最低7499元/12999元起

OPPO K11評測：旗艦級IMX890加持 2000元檔最強(qiáng)影像手機(jī)

onebot M24巧系列一體機(jī)采用輕薄機(jī)身設(shè)計，現(xiàn)已在各平臺開售

“買真退假” 這種“羊毛”不能薅

最新推薦

猜你喜歡

熱門推薦

相關(guān)資訊

從龐大到精巧 讓AI大模型更接地氣

最新推薦

猜你喜歡

熱門推薦

相關(guān)資訊

從龐大到精巧　讓AI大模型更接地氣