AVt天堂网 手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

當前位置:首頁 > 科技  > 資訊

大模型“獨角獸”亟須差異化應對價格沖擊

來源: 責編: 時間:2025-01-25 09:31:18 43觀看
導讀圖為位于上海徐匯濱江的全國首個大模型創新生態社區“模速空間”。 資料圖片  歲末年初,國內外主流大模型的再次降價讓行業開始反思,無限追逐更大算力集群、更多數據量是否是大模型優化的唯一道路。業界認為,

aSw28資訊網——每日最新資訊28at.com

圖為位于上海徐匯濱江的全國首個大模型創新生態社區“模速空間”。 資料圖片aSw28資訊網——每日最新資訊28at.com

  歲末年初,國內外主流大模型的再次降價讓行業開始反思,無限追逐更大算力集群、更多數據量是否是大模型優化的唯一道路。業界認為,在與互聯網大廠價格比拼中不具備優勢的創業公司,迫切需要找到一條差異化道路。aSw28資訊網——每日最新資訊28at.com

  效率成為行業關鍵詞aSw28資訊網——每日最新資訊28at.com

  日前,杭州深度求索人工智能基礎技術研究有限公司(DeepSeek)推出的新一代大模型DeepSeek-V3,因其訓練成本之低引發行業熱議。從其正式發布的技術報告來看,包括預訓練、上下文長度外推和后訓練在內,DeepSeek-V3完整訓練只需2.788M H800 GPU小時。假設H800 GPU的租金為每GPU小時2美元,其總訓練成本僅為557萬美元。不過,Deepseek也透露,上述成本不包括與架構、算法或數據相關的先前研究以及精簡實驗的成本。aSw28資訊網——每日最新資訊28at.com

  美國人工智能公司Anthropic的CEO達里奧·阿莫迪曾透露,GPT-4o這樣的模型訓練成本約為1億美元,這意味著DeepSeek的成本只有GPT-4o的1/20。aSw28資訊網——每日最新資訊28at.com

  訓練成本降低的同時,DeepSeek-V3卻保持了高性能。根據其公告,DeepSeek-V3多項評測成績均表現優秀,性能與世界頂尖的閉源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。aSw28資訊網——每日最新資訊28at.com

  為什么DeepSeek-V3能夠實現低成本、高性能?“包括模型架構、基礎設施優化、數據優化在內,DeepSeek-V3從端到端都進行了工程優化,疊加后呈現出很好的效果。”Gartner研究總監閆斌介紹說,大模型進入公眾視野時間尚短,只有兩年多時間。期間,行業模型訓練相對粗放,通過盡量多收集數據,建設更大的數據中心,以獲得更好的訓練結果,行業也用“Scaling Law”總結這一過程。aSw28資訊網——每日最新資訊28at.com

  “DeepSeek-V3證明,通過更好的工程化能力,我們可以通過相對較少的算力資源、較小的模型,也可以達到不錯的訓練效果。”閆斌認為,“目前行業在數據和算法方面仍有優化空間,低成本的訓練和高效推理應用或將是下一階段大模型發展的方向之一。”aSw28資訊網——每日最新資訊28at.com

  值得關注的是,伯克利大學NovaSky團隊也剛剛發布了Sky-T1-32B-Preview開源模型,在常見的推理和編碼基準測試中,與OpenAI的o1-preview“平分秋色”。據稱,其訓練成本不到450美元,展示了以經濟高效的方式復制高水平推理能力的可能性。aSw28資訊網——每日最新資訊28at.com

  NovaSky團隊能夠以如此低成本進行模型訓練,其關鍵之處包括使用了數據篩選機制,如通過QwQ-32B-Preview生成初始數據,通過GPT-4o-mini重寫數據格式等。此外,NovaSky團隊選擇了Qwen2.5-32B-Instruct作為基礎模型進行訓練。行業人士評價稱,“這個項目證明,高水平AI研發不需要天價預算。”aSw28資訊網——每日最新資訊28at.com

  瑞銀證券中國軟件分析師張維璇說:“效率是2025年大模型行業的關鍵詞之一。除了少數公司有能力、有愿景用萬卡,乃至十萬卡繼續追求頂級大模型,大多數公司未來要降本增效。事實上,優化注意力機制、采用MOE架構、降低模型激活的參數量等,都已經是很主流的降本方式。我們相信這會帶來AI門檻的降低,以及技術的普及化,不僅體現在應用側,還有研發側。”aSw28資訊網——每日最新資訊28at.com

  大模型創業公司將直面降價沖擊aSw28資訊網——每日最新資訊28at.com

  伴隨著訓練成本的降低,DeepSeek-V3的API價格目前為每百萬輸入tokens 0.5元(緩存命中)/2元(緩存未命中),每百萬輸出tokens 8元。同時,DeepSeek提供了45天優惠價格體驗期,在2025年2月8日之前,所有用戶使用DeepSeek-V3 API的價格分別下降了80%(輸入命中)、50%(輸入未命中)、75%(輸出)。aSw28資訊網——每日最新資訊28at.com

  事實上,2024年上半年中國大模型價格競爭的發起者正是DeepSeek。2024年5月,DeepSeek率先宣布降價,其發布的第二代MoE大模型DeepSeek-V2定為0.001元/千tokens的輸入價格與0.002元/千tokens的輸出價格。隨后,智譜AI、火山引擎、阿里云、百度、科大訊飛、騰訊云等國內主要大模型廠商迅速跟進。aSw28資訊網——每日最新資訊28at.com

  可以看到,2024年年底,除了DeepSeek-V3新版本的推出以及API價格調整,國內大模型其他廠商也在降價。2024年12月31日,阿里云宣布2024年度第三輪大模型降價,通義千問視覺理解模型全線降價超80%,其中,Qwen-VL-Plus直降81%;更高性能的Qwen-VL-Max降幅高達85%。此前,在12月18日舉辦的火山引擎Force大會上,字節推出的豆包視覺理解模型也宣布進行降價。aSw28資訊網——每日最新資訊28at.com

  “大模型的不斷降價,無疑有利于吸引更多企業使用新的技術,為大模型創業公司提供了更大的市場。同時,這也對大模型創業公司構成了挑戰。‘獨角獸’僅僅做到提升大模型能力還不夠,還要不斷優化算法,快速降低模型的推理成本。只有真正做到為用戶提供更有性價比的大模型服務,才能贏得市場份額。”MiniMax副總裁劉華說。aSw28資訊網——每日最新資訊28at.com

  經過一年多來的行業競爭,中國人工智能大模型的行業格局不斷清晰,主要玩家從“百模大戰”時代不斷收斂。MiniMax與智譜AI、百川智能、月之暗面、階躍星辰、零一萬物6家行業“獨角獸”企業估值均超10億美元,被行業稱為國內“大模型六小虎”;再加上關注度較高的幻方和面壁智能,以及互聯網大廠中的字節、阿里、百度和騰訊,行業主要玩家縮減到十來家。aSw28資訊網——每日最新資訊28at.com

  API接口調用付費是大模型企業B端重要商業化實現路徑之一。不過,ToB業務中,由于互聯網大廠可以將AI功能綁定算力和云服務業務,二者疊加商業推廣效率更高。因此,在“價格戰”中,大廠因為業務復合、資金雄厚,也更有優勢。面對價格競爭,創業公司只能化壓力為動力,從加快迭代模型、不斷優化算法中尋找解法。aSw28資訊網——每日最新資訊28at.com

  “如果要拼低價和資源,創業公司肯定不如大廠。下一步,大模型創業公司可以聚焦在提供個性化服務,比如提供情感類大模型的API接口。”行業人士對記者表示。aSw28資訊網——每日最新資訊28at.com

  “獨角獸”還需差異化發展aSw28資訊網——每日最新資訊28at.com

  無疑,大模型訓練成本、推理成本的下降,將進一步加快行業場景應用落地。事實上,尋找更合適的大規模落地場景、更好的商業閉環模式,已經成為大模型企業下一階段發展的當務之急。aSw28資訊網——每日最新資訊28at.com

  在接受采訪時,多位行業人士提到,上述“大模型六小虎”開始出現分化,已有獨角獸企業出現“掉隊”勢頭,“這也說明,大模型行業發展遇到了瓶頸。”aSw28資訊網——每日最新資訊28at.com

  “從全球來看,大模型企業都面臨一定的融資壓力。大模型出現之初,大家對它的預期很高,后面又經歷了預期的回調。與此同步,行業融資熱度稍降。當然這也符合一項新技術的發展曲線。單純通過講故事已經很難找到投資人。”閆斌表示。aSw28資訊網——每日最新資訊28at.com

  從B端應用來看,Gartner的一份最新調研結果顯示,截至2024年6月,只有8%的中國企業將生成式人工智能部署在生產環境中。對此,閆斌解釋稱,目前大模型在中國企業生產場景中小規模落地已出現,但大規模企業落地仍然較為少見。“如果把最終落地應用比作一場考試,那么大模型能力、數據、工程化、產品設計將是幾門關鍵課程。根據我們觀察,國內很多大模型能力已經不錯,目前落地短板更聚焦在其他幾個方面。”aSw28資訊網——每日最新資訊28at.com

  再來看C端的落地情況。根據AI產品榜數據,目前用戶量排名靠前的應用分別為抖音的豆包、MiniMax的Talkie AI、月之暗面的Kimi智能助手、百度的文小言,全球2024年12月的月活分別為7117萬、2977萬、1669萬、1347萬,在全球主要C端產品榜單中,分別位列第2位、第4位、第15位、第20位。aSw28資訊網——每日最新資訊28at.com

  與創業“獨角獸”相比,“大廠”在C端應用推廣上,展示出了流量和資本方面的巨大優勢。字節2024年5月才推出AI對話助手“豆包”,憑借投流買量后來居上,成為過去半年增長最快的移動應用。“一些創業公司此前通過投流買量的方式迅速擴大了用戶量。但隨著‘大廠’下場,這種做法就顯得不那么劃算了。”有行業人士對記者表示。aSw28資訊網——每日最新資訊28at.com

  “目前國內大模型企業的C端產品存在‘同質化’的問題,很多企業都推出了AI對話助手類產品,功能大同小異。但是,大模型技術在不斷迭代。各家企業需要基于大模型能力的提升趨勢,去探索新的AI產品形態,去滿足客戶尚未被滿足的需要。尤其是創業公司,更是要把資源聚焦于技術和產品的創新,而不是通過投流買量進入變成‘紅海’的賽道。”劉華說。(記者 杜康 朱程)aSw28資訊網——每日最新資訊28at.com

本文鏈接:http://www.tebozhan.com/showinfo-16-127304-0.html大模型“獨角獸”亟須差異化應對價格沖擊

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 880萬架 算力產業量質齊升

下一篇: 美國5000億美元AI投資計劃引發市場爭議

標簽:
  • 熱門焦點
  • 一加Ace2 Pro真機揭曉 鈦空灰配色質感拉滿

    終于,在經過了幾波預熱之后,一加Ace2 Pro的外觀真機圖在網上出現了。還是博主數碼閑聊站曝光的,這次的外觀設計還是延續了一加11的方案,只是細節上有了調整,例如新加入了鈦空灰
  • 2023年Q2用戶偏好榜:12+256G版本成新主流

    3月份的性能榜、性價比榜和好評榜之后,就要輪到2023年的第二季度偏好榜了,上半年的新機潮已經過去,最明顯的肯定就是大內存和存儲的機型了,另外部分中端機也取消了屏幕塑料支架
  • 5月iOS設備好評榜:iPhone 14僅排第43?

    來到新的一月,安兔兔的各個榜單又重新匯總了數據,像安卓陣營的榜單都有著比較大的變動,不過iOS由于設備的更新換代并沒有那么快,所以相對來說變化并不大,特別是iOS好評榜,老款設
  • Python異步IO編程的進程/線程通信實現

    這篇文章再講3種方式,同時講4中進程間通信的方式一、 Python 中線程間通信的實現方式共享變量共享變量是多個線程可以共同訪問的變量。在Python中,可以使用threading模塊中的L
  • ESG的面子與里子

    來源 | 光子星球撰文 | 吳坤諺編輯 | 吳先之三伏大幕拉起,各地高溫預警不絕,但處于厄爾尼諾大“烤”之下的除了眾生,還有各大企業發布的ESG報告。ESG是“環境保
  • 年輕人的“職場羞恥感”,無處不在

    作者:馮曉亭 陶 淘 李 欣 張 琳 馬舒葉來源:燃次元“人在職場,應該選擇什么樣的著裝?”近日,在網絡上,一個與著裝相關的帖子引發關注,在該帖子里,一位在高級寫字樓亞洲金
  • 華為Mate60系列模具曝光:采用碩大圓形后置相機模組+拼接配色方案

    據此前多方爆料,今年華為將開始恢復一年雙旗艦戰略,除上半年推出的P60系列外,往年下半年的Mate系列也將迎來更新,有望在9-10月份帶來全新的華為Mate60
  • iQOO 11S或7月上市:搭載“雞血版”驍龍8Gen2 史上最強5G Soc

    去年底,iQOO推出了“電競旗艦”iQOO 11系列,作為一款性能強機,iQOO 11不僅全球首發2K 144Hz E6全感屏,搭載了第二代驍龍8平臺及144Hz電競屏,同時在快充
  • iQOO Neo8系列或定檔5月23日:首發天璣9200+ 安卓跑分王者

    去年10月,iQOO推出了iQOO Neo7系列機型,不僅搭載了天璣9000+,而且是同價位唯一一款天璣9000+直屏旗艦,一經上市便受到了用戶的廣泛關注。在時隔半年后,
Top