當前位置：首頁 > 科技 > 資訊

大模型“獨角獸”亟須差異化應對價格沖擊

來源：責編：時間：2025-01-25 09:31:18 89觀看

導讀圖為位于上海徐匯濱江的全國首個大模型創(chuàng)新生態(tài)社區(qū)“模速空間”。資料圖片&emsp;&emsp;歲末年初，國內(nèi)外主流大模型的再次降價讓行業(yè)開始反思，無限追逐更大算力集群、更多數(shù)據(jù)量是否是大模型優(yōu)化的唯一道路。業(yè)界認為，

圖為位于上海徐匯濱江的全國首個大模型創(chuàng)新生態(tài)社區(qū)“模速空間”。資料圖片

歲末年初，國內(nèi)外主流大模型的再次降價讓行業(yè)開始反思，無限追逐更大算力集群、更多數(shù)據(jù)量是否是大模型優(yōu)化的唯一道路。業(yè)界認為，在與互聯(lián)網(wǎng)大廠價格比拼中不具備優(yōu)勢的創(chuàng)業(yè)公司，迫切需要找到一條差異化道路。

效率成為行業(yè)關鍵詞

日前，杭州深度求索人工智能基礎技術研究有限公司（DeepSeek）推出的新一代大模型DeepSeek-V3，因其訓練成本之低引發(fā)行業(yè)熱議。從其正式發(fā)布的技術報告來看，包括預訓練、上下文長度外推和后訓練在內(nèi)，DeepSeek-V3完整訓練只需2.788M H800 GPU小時。假設H800 GPU的租金為每GPU小時2美元，其總訓練成本僅為557萬美元。不過，Deepseek也透露，上述成本不包括與架構、算法或數(shù)據(jù)相關的先前研究以及精簡實驗的成本。

美國人工智能公司Anthropic的CEO達里奧·阿莫迪曾透露，GPT-4o這樣的模型訓練成本約為1億美元，這意味著DeepSeek的成本只有GPT-4o的1/20。

訓練成本降低的同時，DeepSeek-V3卻保持了高性能。根據(jù)其公告，DeepSeek-V3多項評測成績均表現(xiàn)優(yōu)秀，性能與世界頂尖的閉源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。

為什么DeepSeek-V3能夠實現(xiàn)低成本、高性能？“包括模型架構、基礎設施優(yōu)化、數(shù)據(jù)優(yōu)化在內(nèi)，DeepSeek-V3從端到端都進行了工程優(yōu)化，疊加后呈現(xiàn)出很好的效果。”Gartner研究總監(jiān)閆斌介紹說，大模型進入公眾視野時間尚短，只有兩年多時間。期間，行業(yè)模型訓練相對粗放，通過盡量多收集數(shù)據(jù)，建設更大的數(shù)據(jù)中心，以獲得更好的訓練結果，行業(yè)也用“Scaling Law”總結這一過程。

“DeepSeek-V3證明，通過更好的工程化能力，我們可以通過相對較少的算力資源、較小的模型，也可以達到不錯的訓練效果。”閆斌認為，“目前行業(yè)在數(shù)據(jù)和算法方面仍有優(yōu)化空間，低成本的訓練和高效推理應用或將是下一階段大模型發(fā)展的方向之一。”

值得關注的是，伯克利大學NovaSky團隊也剛剛發(fā)布了Sky-T1-32B-Preview開源模型，在常見的推理和編碼基準測試中，與OpenAI的o1-preview“平分秋色”。據(jù)稱，其訓練成本不到450美元，展示了以經(jīng)濟高效的方式復制高水平推理能力的可能性。

NovaSky團隊能夠以如此低成本進行模型訓練，其關鍵之處包括使用了數(shù)據(jù)篩選機制，如通過QwQ-32B-Preview生成初始數(shù)據(jù)，通過GPT-4o-mini重寫數(shù)據(jù)格式等。此外，NovaSky團隊選擇了Qwen2.5-32B-Instruct作為基礎模型進行訓練。行業(yè)人士評價稱，“這個項目證明，高水平AI研發(fā)不需要天價預算。”

瑞銀證券中國軟件分析師張維璇說：“效率是2025年大模型行業(yè)的關鍵詞之一。除了少數(shù)公司有能力、有愿景用萬卡，乃至十萬卡繼續(xù)追求頂級大模型，大多數(shù)公司未來要降本增效。事實上，優(yōu)化注意力機制、采用MOE架構、降低模型激活的參數(shù)量等，都已經(jīng)是很主流的降本方式。我們相信這會帶來AI門檻的降低，以及技術的普及化，不僅體現(xiàn)在應用側，還有研發(fā)側。”

大模型創(chuàng)業(yè)公司將直面降價沖擊

伴隨著訓練成本的降低，DeepSeek-V3的API價格目前為每百萬輸入tokens 0.5元（緩存命中）/2元（緩存未命中），每百萬輸出tokens 8元。同時，DeepSeek提供了45天優(yōu)惠價格體驗期，在2025年2月8日之前，所有用戶使用DeepSeek-V3 API的價格分別下降了80%（輸入命中）、50%（輸入未命中）、75%（輸出）。

事實上，2024年上半年中國大模型價格競爭的發(fā)起者正是DeepSeek。2024年5月，DeepSeek率先宣布降價，其發(fā)布的第二代MoE大模型DeepSeek-V2定為0.001元/千tokens的輸入價格與0.002元/千tokens的輸出價格。隨后，智譜AI、火山引擎、阿里云、百度、科大訊飛、騰訊云等國內(nèi)主要大模型廠商迅速跟進。

可以看到，2024年年底，除了DeepSeek-V3新版本的推出以及API價格調(diào)整，國內(nèi)大模型其他廠商也在降價。2024年12月31日，阿里云宣布2024年度第三輪大模型降價，通義千問視覺理解模型全線降價超80%，其中，Qwen-VL-Plus直降81%；更高性能的Qwen-VL-Max降幅高達85%。此前，在12月18日舉辦的火山引擎Force大會上，字節(jié)推出的豆包視覺理解模型也宣布進行降價。

“大模型的不斷降價，無疑有利于吸引更多企業(yè)使用新的技術，為大模型創(chuàng)業(yè)公司提供了更大的市場。同時，這也對大模型創(chuàng)業(yè)公司構成了挑戰(zhàn)。‘獨角獸’僅僅做到提升大模型能力還不夠，還要不斷優(yōu)化算法，快速降低模型的推理成本。只有真正做到為用戶提供更有性價比的大模型服務，才能贏得市場份額。”MiniMax副總裁劉華說。

經(jīng)過一年多來的行業(yè)競爭，中國人工智能大模型的行業(yè)格局不斷清晰，主要玩家從“百模大戰(zhàn)”時代不斷收斂。MiniMax與智譜AI、百川智能、月之暗面、階躍星辰、零一萬物6家行業(yè)“獨角獸”企業(yè)估值均超10億美元，被行業(yè)稱為國內(nèi)“大模型六小虎”；再加上關注度較高的幻方和面壁智能，以及互聯(lián)網(wǎng)大廠中的字節(jié)、阿里、百度和騰訊，行業(yè)主要玩家縮減到十來家。

API接口調(diào)用付費是大模型企業(yè)B端重要商業(yè)化實現(xiàn)路徑之一。不過，ToB業(yè)務中，由于互聯(lián)網(wǎng)大廠可以將AI功能綁定算力和云服務業(yè)務，二者疊加商業(yè)推廣效率更高。因此，在“價格戰(zhàn)”中，大廠因為業(yè)務復合、資金雄厚，也更有優(yōu)勢。面對價格競爭，創(chuàng)業(yè)公司只能化壓力為動力，從加快迭代模型、不斷優(yōu)化算法中尋找解法。

“如果要拼低價和資源，創(chuàng)業(yè)公司肯定不如大廠。下一步，大模型創(chuàng)業(yè)公司可以聚焦在提供個性化服務，比如提供情感類大模型的API接口。”行業(yè)人士對記者表示。

“獨角獸”還需差異化發(fā)展

無疑，大模型訓練成本、推理成本的下降，將進一步加快行業(yè)場景應用落地。事實上，尋找更合適的大規(guī)模落地場景、更好的商業(yè)閉環(huán)模式，已經(jīng)成為大模型企業(yè)下一階段發(fā)展的當務之急。

在接受采訪時，多位行業(yè)人士提到，上述“大模型六小虎”開始出現(xiàn)分化，已有獨角獸企業(yè)出現(xiàn)“掉隊”勢頭，“這也說明，大模型行業(yè)發(fā)展遇到了瓶頸。”

“從全球來看，大模型企業(yè)都面臨一定的融資壓力。大模型出現(xiàn)之初，大家對它的預期很高，后面又經(jīng)歷了預期的回調(diào)。與此同步，行業(yè)融資熱度稍降。當然這也符合一項新技術的發(fā)展曲線。單純通過講故事已經(jīng)很難找到投資人。”閆斌表示。

從B端應用來看，Gartner的一份最新調(diào)研結果顯示，截至2024年6月，只有8%的中國企業(yè)將生成式人工智能部署在生產(chǎn)環(huán)境中。對此，閆斌解釋稱，目前大模型在中國企業(yè)生產(chǎn)場景中小規(guī)模落地已出現(xiàn)，但大規(guī)模企業(yè)落地仍然較為少見。“如果把最終落地應用比作一場考試，那么大模型能力、數(shù)據(jù)、工程化、產(chǎn)品設計將是幾門關鍵課程。根據(jù)我們觀察，國內(nèi)很多大模型能力已經(jīng)不錯，目前落地短板更聚焦在其他幾個方面。”

再來看C端的落地情況。根據(jù)AI產(chǎn)品榜數(shù)據(jù)，目前用戶量排名靠前的應用分別為抖音的豆包、MiniMax的Talkie AI、月之暗面的Kimi智能助手、百度的文小言，全球2024年12月的月活分別為7117萬、2977萬、1669萬、1347萬，在全球主要C端產(chǎn)品榜單中，分別位列第2位、第4位、第15位、第20位。

與創(chuàng)業(yè)“獨角獸”相比，“大廠”在C端應用推廣上，展示出了流量和資本方面的巨大優(yōu)勢。字節(jié)2024年5月才推出AI對話助手“豆包”，憑借投流買量后來居上，成為過去半年增長最快的移動應用。“一些創(chuàng)業(yè)公司此前通過投流買量的方式迅速擴大了用戶量。但隨著‘大廠’下場，這種做法就顯得不那么劃算了。”有行業(yè)人士對記者表示。

“目前國內(nèi)大模型企業(yè)的C端產(chǎn)品存在‘同質化’的問題，很多企業(yè)都推出了AI對話助手類產(chǎn)品，功能大同小異。但是，大模型技術在不斷迭代。各家企業(yè)需要基于大模型能力的提升趨勢，去探索新的AI產(chǎn)品形態(tài)，去滿足客戶尚未被滿足的需要。尤其是創(chuàng)業(yè)公司，更是要把資源聚焦于技術和產(chǎn)品的創(chuàng)新，而不是通過投流買量進入變成‘紅海’的賽道。”劉華說。（記者杜康朱程）

本文鏈接：http://www.tebozhan.com/showinfo-16-127304-0.html大模型“獨角獸”亟須差異化應對價格沖擊

聲明：本網(wǎng)頁內(nèi)容旨在傳播知識，若有侵權等問題請及時與本網(wǎng)聯(lián)系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇： 880萬架算力產(chǎn)業(yè)量質齊升

下一篇：美國5000億美元AI投資計劃引發(fā)市場爭議

標簽：

熱門焦點

谷歌KDD'23工作：如何提升推薦系統(tǒng)Ranking模型訓練穩(wěn)定性

谷歌在KDD 2023發(fā)表了一篇工作，探索了推薦系統(tǒng)ranking模型的訓練穩(wěn)定性問題，分析了造成訓練穩(wěn)定性存在問題的潛在原因，以及現(xiàn)有的一些提升模型穩(wěn)定性方法的不足，并提出了一種新
2天漲粉255萬，又一賽道在抖音爆火

來源：運營研究社作者 | 張知白編輯 | 楊佩汶設計 | 晏談夢潔這個暑期，旅游賽道徹底火了：有的「地方」火了——貴州村超旅游收入 1 個月超過 12 億；有的「博主」火了&m
騰訊蓋樓，字節(jié)拆墻

來源 | 光子星球撰文 | 吳坤諺編輯 | 吳先之“想重溫暴刷深淵、30+技能搭配暴搓到爽的游戲體驗嗎？一起上晶核，即刻暴打！”曾憑借直播騰訊旗下代理格斗游戲《DNF》一
網(wǎng)傳小米汽車開始篩選交付中心建筑面積不低于3000平方米

7月7日消息，近日有微博網(wǎng)友@長三角行健者爆料稱，據(jù)經(jīng)銷商集團反饋，小米汽車目前已經(jīng)開始了交付中心的篩選工作，要求候選場地至少有120個車位，建筑不能低
華為Mate 60系列用上可變靈動島：正式版體驗將會更出色

這段時間以來，關于華為新旗艦的爆料日漸密集。據(jù)此前多方爆料，今年華為將開始恢復一年雙旗艦戰(zhàn)略，除上半年推出的P60系列外，往年下半年的Mate系列也將
華為Mate60標準版細節(jié)曝光：經(jīng)典星環(huán)相機模組回歸

這段時間以來，關于華為新旗艦的爆料日漸密集。據(jù)此前多方爆料，今年華為將開始恢復一年雙旗艦戰(zhàn)略，除上半年推出的P60系列外，往年下半年的Mate系列也將
最薄的14英寸游戲筆記本電腦 Alienware X14已可以購買

2022年1月份在國際消費電子展(CES2022)上首次亮相的Alienware新品——Alienware X14現(xiàn)在已經(jīng)可以購買了，這款筆記本電腦被譽為世界上最薄的 14 英寸游戲筆
電博會上海爾智家模擬500平大平層，還原生活空間沉浸式體驗

電博會為了更好地讓參展觀眾真正感受到智能家居的絕妙之處，海爾智家的程傳嶺先生同樣介紹了展會上海爾智家的模擬500平大平層，還原生活空間沉浸式體驗。程傳
外交部：美方應停止在網(wǎng)絡安全問題上不負責任地指責他國

　中國外交部今天（16日）舉行例行記者會。會上，有記者問，美國情報官員稱，他們正在阻攔來自中國以及其他國家的黑客獲取相關科研成果。中方對此有何評論？對此

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

大模型“獨角獸”亟須差異化應對價格沖擊

谷歌KDD'23工作：如何提升推薦系統(tǒng)Ranking模型訓練穩(wěn)定性

2天漲粉255萬，又一賽道在抖音爆火

騰訊蓋樓，字節(jié)拆墻

網(wǎng)傳小米汽車開始篩選交付中心建筑面積不低于3000平方米

華為Mate 60系列用上可變靈動島：正式版體驗將會更出色

華為Mate60標準版細節(jié)曝光：經(jīng)典星環(huán)相機模組回歸

最薄的14英寸游戲筆記本電腦 Alienware X14已可以購買

電博會上海爾智家模擬500平大平層，還原生活空間沉浸式體驗

外交部：美方應停止在網(wǎng)絡安全問題上不負責任地指責他國

最新推薦

猜你喜歡

熱門推薦

相關資訊