當前位置：首頁 > 元宇宙 > AI

2600 tokens s：Meta 發(fā)布 Llama API，攜手 Cerebras 打造最快 AI 推理解決方案

來源：責編：時間：2025-05-01 20:25:56 54觀看

導讀 4 月 30 日消息，在首屆 LlamaCon 大會上，Meta 公司在推出獨立 AI 應用之外，還發(fā)布了 Llama API，目前以免費預覽形式向開發(fā)者開放。援引博文，Llama API 支持開發(fā)者測試包括 Llama 4 Scout 和 Llama 4 Maverick 在內(nèi)

4 月 30 日消息，在首屆 LlamaCon 大會上，Meta 公司在推出獨立 AI 應用之外，還發(fā)布了 Llama API，目前以免費預覽形式向開發(fā)者開放。

援引博文，Llama API 支持開發(fā)者測試包括 Llama 4 Scout 和 Llama 4 Maverick 在內(nèi)的最新模型，提供一鍵 API 密鑰創(chuàng)建以及輕量級的 TypeScript 和 Python SDK。

開發(fā)者可通過一鍵創(chuàng)建 API 密鑰，快速上手使用，同時 API 還提供輕量級的 TypeScript 和 Python SDK。為了方便開發(fā)者從 OpenAI 平臺遷移應用，Llama API 完全兼容 OpenAI SDK。

Meta 還聯(lián)手 Cerebras 和 Groq，進一步優(yōu)化 Llama API 的性能。Cerebras 宣稱，其 Llama 4 Cerebras 模型的 tokens 生成速度高達 2600 tokens / s，比 NVIDIA 等傳統(tǒng) GPU 解決方案快 18 倍。

根據(jù) Artificial Analysis 基準測試數(shù)據(jù)，這一速度遠超 ChatGPT 的 130 tokens / s 和 DeepSeek 的 25 tokens / s。

Cerebras CEO 兼聯(lián)合創(chuàng)始人 Andrew Feldman 表示：“我們很自豪能讓 Llama API 成為全球最快的推理 API。開發(fā)者在構建實時應用時需要極致速度，Cerebras 的加入讓 AI 系統(tǒng)性能達到 GPU 云無法企及的高度。”

此外，Groq 提供的 Llama 4 Scout 模型速度為 460 tokens / s，雖不及 Cerebras，但仍比其他 GPU 方案快 4 倍。在Groq上，Llama 4 Scout 每百萬 tokens 輸入費用為 0.11 美元，每百萬 tokens 輸出費用為 0.34 美元；Llama 4 Maverick 每百萬 tokens 輸入費用為 0.50 美元，每百萬 tokens 輸出費用為 0.77 美元。

本文鏈接：http://www.tebozhan.com/showinfo-45-12691-0.html2600 tokens s：Meta 發(fā)布 Llama API，攜手 Cerebras 打造最快 AI 推理解決方案

聲明：本網(wǎng)頁內(nèi)容旨在傳播知識，若有侵權等問題請及時與本網(wǎng)聯(lián)系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇： Meta Llama AI 模型下載量突破 12 億，開發(fā)者貢獻數(shù)萬個衍生模型

下一篇：微軟發(fā)布 Phi-4 系列小語言 AI 推理模型，AIME 2025 跑分超滿血版 Deepseek R1

標簽：

熱門焦點

不同于傳統(tǒng)數(shù)字經(jīng)濟，元宇宙賦予商業(yè)生態(tài)更多數(shù)字資產(chǎn)價值！

作者：中科基大數(shù)據(jù)元宇宙是一個去中心化的開放平臺，而為了維護這樣的平臺，需要建立一個公平的游戲規(guī)則，確保每個元宇宙的參與者通過這個規(guī)則都可以掙到錢，他們的利益都可以得到保
刷完一場元宇宙世界杯音樂盛典，我爽了

作者|劉小土編輯|李春暉你有多久沒完整追過一場音樂盛典了？三刷都不嫌多的那種。按照慣例，每逢年底，直播、長短視頻、音樂平臺便會搶著端上來幾場音樂盛典。擱以
在數(shù)字世界再造世界杯，元宇宙體育正變得越來越豐滿

撰文/ 蔥鮪魚本屆世界杯可能不是最精彩的一屆，卻絕對是看點十足的一屆：后疫情時代的首屆世界杯、耗資2200億美元打造的“史上最貴”世界杯、足壇黃金
“任何國產(chǎn)元宇宙都是假元宇宙”

上個月，華語樂壇的優(yōu)質偶像之一，DOTA2資深玩家林俊杰，在國外元宇宙產(chǎn)品分布式大陸(Decentraland)上買了三塊虛擬地產(chǎn)，花了12.3萬美元（也就是人民幣接近80萬）。截至目
AI特效、虛擬人、數(shù)字盲盒，來看看元宇宙如何融合冬奧會！

今天是冬奧會比賽的第12天，截至目前所累計的成績，中國代表團已經(jīng)取得了冬奧歷史最佳戰(zhàn)績。全世界的人都在關注著這場盛事，為奧運健兒吶喊助威。谷愛凌、徐夢桃、
2022年最具關注的9個頭像NFT項目

什么是 PFP NFT 項目？PFP NFT （個人資料圖片NFT）是一組獨特的數(shù)字收藏品，人們用來在互聯(lián)網(wǎng)平臺上代表自己。這些數(shù)字藝術作品通常是一系列可作為頭像的角色，在 Twit
銀保監(jiān)會：打擊以“元宇宙”為名義的違法行為

今日，銀保監(jiān)會發(fā)布《關于防范以“元宇宙”名義進行非法集資的風險提示》，全文如下：近期，一些不法分子蹭熱點，以“元宇宙投資項目”“元宇宙鏈游”等名目吸收資金，涉
解決NFT流動性問題：一文了解Floor DAO

流動性是證券市場上的一個術語，流動性是指資產(chǎn)在不影響其市場價格的情況下可以轉換為現(xiàn)成現(xiàn)金的效率，流動性最強的資產(chǎn)是現(xiàn)金本身。現(xiàn)在讓我們試著從流動性的角
元宇宙平臺會是上世紀末的互聯(lián)網(wǎng)嗎？

“元宇宙”火了好幾個月，互聯(lián)網(wǎng)大廠忙于布局，資本市場熱烈追捧。然而很多人還是看不明白，更多的人覺得這是一場泡沫，一場騙局。一開始接觸這個怪里怪氣的名詞，感覺

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

首頁

元宇宙

NFT

區(qū)塊鏈

虛擬人

AR/VR

AI

元宇宙百科

2600 tokens s：Meta 發(fā)布 Llama API，攜手 Cerebras 打造最快 AI 推理解決方案

不同于傳統(tǒng)數(shù)字經(jīng)濟，元宇宙賦予商業(yè)生態(tài)更多數(shù)字資產(chǎn)價值！

刷完一場元宇宙世界杯音樂盛典，我爽了

在數(shù)字世界再造世界杯，元宇宙體育正變得越來越豐滿

“任何國產(chǎn)元宇宙都是假元宇宙”

AI特效、虛擬人、數(shù)字盲盒，來看看元宇宙如何融合冬奧會！

2022年最具關注的9個頭像NFT項目

銀保監(jiān)會：打擊以“元宇宙”為名義的違法行為

解決NFT流動性問題：一文了解Floor DAO

元宇宙平臺會是上世紀末的互聯(lián)網(wǎng)嗎？

最新推薦

拯救XR，蘋果力不從心

城市數(shù)字孿生標準化白皮書（2022版）

NFT Insider #47：YGG發(fā)布2021Q4社區(qū)報告，GameFi領域1月份獲超10億美元融資

從英式拍到荷蘭拍，看傳統(tǒng)金融拍賣玩法如何玩轉NFT市場交易

HTC Vive推出元宇宙平臺Viverse；騰訊投資小米生態(tài)鏈AR眼鏡廠商

爆發(fā)在即的Layer2賽道百花齊放，誰將是領跑者？

猜你喜歡

熱門推薦

相關資訊