當(dāng)前位置：首頁 > 科技 > 知識百科

月之暗面 Kimi 開放平臺“上下文緩存”開啟公測：首 Token 延遲降低 83%、適用于文本重復(fù)引用場景

來源：責(zé)編：時間：2024-07-02 08:15:28 1203觀看

導(dǎo)讀 7 月 1 日消息，月之暗面今日官宣 Kimi 開放平臺上下文緩存（Context Caching）功能開啟公測。官方表示，該技術(shù)在 API 價格不變的前提下，可為開發(fā)者降低最高 90% 的長文本旗艦大模型使用成本，并提升模型響應(yīng)速度。附Ki

7 月 1 日消息，月之暗面今日官宣 Kimi 開放平臺上下文緩存（Context Caching）功能開啟公測。官方表示，該技術(shù)在 API 價格不變的前提下，可為開發(fā)者降低最高 90% 的長文本旗艦大模型使用成本，并提升模型響應(yīng)速度。

附Kimi 開放平臺上下文緩存功能公測詳情如下：

技術(shù)簡介

據(jù)介紹，上下文緩存是一種數(shù)據(jù)管理技術(shù)，允許系統(tǒng)預(yù)先存儲會被頻繁請求的大量數(shù)據(jù)或信息。當(dāng)用戶請求相同信息時，系統(tǒng)可以直接從緩存中提供，無需重新計算或從原始數(shù)據(jù)源中檢索。

適用場景

上下文緩存適用于頻繁請求，重復(fù)引用大量初始上下文場景，可降低長文本模型費用，提高效率。官方表示費用最高降低 90 %，首 Token 延遲降低 83%。適用業(yè)務(wù)場景如下：

提供大量預(yù)設(shè)內(nèi)容的 QA Bot，例如 Kimi API 小助手

針對固定的文檔集合的頻繁查詢，例如上市公司信息披露問答工具

對靜態(tài)代碼庫或知識庫的周期性分析，例如各類 Copilot Agent

瞬時流量巨大的爆款 AI 應(yīng)用，例如哄哄模擬器，LLM Riddles

交互規(guī)則復(fù)雜的 Agent 類應(yīng)用等

計費說明

上下文緩存收費模式主要分為以下三個部分：

Cache 創(chuàng)建費用

調(diào)用 Cache 創(chuàng)建接口，成功創(chuàng)建 Cache 后，按照 Cache 中 Tokens 按實際量計費。24 元 / M token

Cache 存儲費用

Cache 存活時間內(nèi)，按分鐘收取 Cache 存儲費用。10 元 / M token / 分鐘

Cache 調(diào)用費用

Cache 調(diào)用增量 token 的收費：按模型原價收費

Cache 調(diào)用次數(shù)收費：Cache 存活時間內(nèi)，用戶通過 chat 接口請求已創(chuàng)建成功的 Cache，若 chat message 內(nèi)容與存活中的 Cache 匹配成功，將按調(diào)用次數(shù)收取 Cache 調(diào)用費用。0.02 元 / 次

公測時間和資格說明

公測時間：功能上線后，公測 3 個月，公測期價格可能隨時調(diào)整。

公測資格：公測期間 Context Caching 功能優(yōu)先開放給 Tier5 等級用戶，其他用戶范圍放開時間待定。

相關(guān)閱讀：

《月之暗面 Kimi 開放平臺將啟動 Context Caching 內(nèi)測：提供預(yù)設(shè)內(nèi)容 QA Bot、固定文檔集合查詢》

本文鏈接：http://www.tebozhan.com/showinfo-119-97922-0.html月之暗面 Kimi 開放平臺“上下文緩存”開啟公測：首 Token 延遲降低 83%、適用于文本重復(fù)引用場景

聲明：本網(wǎng)頁內(nèi)容旨在傳播知識，若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：微軟宣布 Microsoft 365 現(xiàn)已支持開放文檔格式 ODF 1.4

下一篇： 6 月桌面瀏覽器格局穩(wěn)固：谷歌 Chrome 仍居首位，微軟 Edge 份額創(chuàng)新高

標(biāo)簽：

熱門焦點

5月iOS設(shè)備性能榜：M1 M2依舊是榜單前五

和上個月一樣，沒有新品發(fā)布的iOS設(shè)備性能榜的上榜設(shè)備并沒有什么更替，僅僅只有跑分變化而產(chǎn)生的排名變動，剛剛開始的蘋果WWDC2023，推出的產(chǎn)品也依舊是新款Mac Pro、新款Mac Stu
iPhone賣不動了！蘋果股價創(chuàng)年內(nèi)最大日跌幅：市值一夜蒸發(fā)萬億元

8月5日消息，今天凌晨美股三大指數(shù)高開低走集體收跌，道指跌0.41%；納指跌0.36%；標(biāo)普500指數(shù)跌0.52%。熱門科技股也都變化極大，其中蘋果報181.99美元，跌4.8%，創(chuàng)
學(xué)習(xí)JavaScript的10個理由...

作者 | Simplilearn編譯 | 王瑞平當(dāng)你決心學(xué)習(xí)一門語言的時候，很難選擇到底應(yīng)該學(xué)習(xí)哪一門，常用的語言有Python、Java、JavaScript、C/CPP、PHP、Swift、C#、Ruby、Objective-
慕巖炮轟抖音，百合網(wǎng)今何在？

來源：價值研究所作者：Hernanderz“難道就因為自己的一個產(chǎn)品牛逼了，從客服到總裁，都不愿意正視自己產(chǎn)品和運營上的問題，選擇逃避了嗎？”這一番話，出自百合網(wǎng)聯(lián)合創(chuàng)
共享單車的故事講到哪了？

來源丨?？素斀?jīng)與共享充電寶相差不多，共享單車已很久沒有被國內(nèi)熱點新聞關(guān)照到了。除了一再漲價和用戶直呼用不起了。近日多家媒體再發(fā)報道稱，成都、天津、鄭州等地多個共享單
機構(gòu)稱Q2國內(nèi)智能手機銷量同比下滑4% vivo份額重回第1

7月29日消息，根據(jù)市場調(diào)查機構(gòu)Counterpoint Research公布的最新報告，2023年第2季度中國智能手機銷量同比下降4%，創(chuàng)新自2014年以來第2季度銷量新低。報
三星推出Galaxy Tab S9系列平板電腦以及Galaxy Watch6系列智能手表

2023年7月26日，三星電子正式發(fā)布了Galaxy Z Flip5與Galaxy Z Fold5。除此之外，Galaxy Tab S9系列平板電腦以及三星Galaxy Watch6系列智能手表也同期
iQOO 11S評測：行業(yè)唯一的200W標(biāo)準(zhǔn)版旗艦

【Techweb評測】去年底，iQOO推出了“電競旗艦”iQOO 11系列，作為一款性能強機，該機不僅全球首發(fā)2K 144Hz E6全感屏，搭載了第二代驍龍8平臺及144Hz電競
微軟發(fā)布Windows 11新版引入全新任務(wù)欄狀態(tài)

近日，微軟發(fā)布了Windows 11新版，而Build 22563更新主要引入了幾周前曝光的平板模式任務(wù)欄等，系統(tǒng)更流暢了。更新中，Windows 11加入了專門針對平板優(yōu)化的任務(wù)欄

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

月之暗面 Kimi 開放平臺“上下文緩存”開啟公測：首 Token 延遲降低 83%、適用于文本重復(fù)引用場景

5月iOS設(shè)備性能榜：M1 M2依舊是榜單前五

iPhone賣不動了！蘋果股價創(chuàng)年內(nèi)最大日跌幅：市值一夜蒸發(fā)萬億元

學(xué)習(xí)JavaScript的10個理由...

慕巖炮轟抖音，百合網(wǎng)今何在？

共享單車的故事講到哪了？

機構(gòu)稱Q2國內(nèi)智能手機銷量同比下滑4% vivo份額重回第1

三星推出Galaxy Tab S9系列平板電腦以及Galaxy Watch6系列智能手表

iQOO 11S評測：行業(yè)唯一的200W標(biāo)準(zhǔn)版旗艦

微軟發(fā)布Windows 11新版引入全新任務(wù)欄狀態(tài)

最新推薦

猜你喜歡

熱門推薦

相關(guān)資訊

月之暗面 Kimi 開放平臺“上下文緩存”開啟公測：首 Token 延遲降低 83%、適用于文本重復(fù)引用場景

最新推薦

猜你喜歡

熱門推薦

相關(guān)資訊

月之暗面 Kimi 開放平臺“上下文緩存”開啟公測：首 Token 延遲降低 83%、適用于文本重復(fù)引用場景