AVt天堂网 手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

當前位置:首頁 > 科技  > 軟件

大模型應用的十種架構模式

來源: 責編: 時間:2024-03-26 17:38:07 189觀看
導讀在塑造新領域的過程中,我們往往依賴于一些經(jīng)過實踐驗證的策略、方法和模式。這種觀念對于軟件工程領域的專業(yè)人士來說,已經(jīng)司空見慣,設計模式已成為程序員們的重要技能。然而,當我們轉向大模型應用和人工智能領域,情況可能

在塑造新領域的過程中,我們往往依賴于一些經(jīng)過實踐驗證的策略、方法和模式。這種觀念對于軟件工程領域的專業(yè)人士來說,已經(jīng)司空見慣,設計模式已成為程序員們的重要技能。然而,當我們轉向大模型應用和人工智能領域,情況可能會有所不同。面對新興技術,例如生成式AI,我們尚缺乏成熟的設計模式來支撐這些解決方案。gpf28資訊網(wǎng)——每日最新資訊28at.com

作為一位老碼農(nóng),我在這里整理總結了一些針對大模型應用的設計方法和架構模式,試圖應對和解決大模型應用實現(xiàn)中的一些挑戰(zhàn),如成本問題、延遲問題以及生成的不準確性等。gpf28資訊網(wǎng)——每日最新資訊28at.com

1.路由分發(fā)模式

當用戶輸入一個查詢時,該查詢會被發(fā)送到控制中心,而控制中心則扮演著對輸入進行分類的角色。gpf28資訊網(wǎng)——每日最新資訊28at.com

圖片圖片gpf28資訊網(wǎng)——每日最新資訊28at.com

如果查詢是可以識別的,那么它會被路由到小語言模型進行處理,這通常是一個更準確、響應更快且成本更低的操作。然而,如果查詢無法被識別,那么它將由大型語言模型來處理。盡管大型語言模型的運行成本較高,但它能夠成功返回更多種類型查詢的答案。通過這種方式,人工智能產(chǎn)品可以在成本、性能和用戶體驗之間實現(xiàn)平衡。gpf28資訊網(wǎng)——每日最新資訊28at.com

2.大模型代理模式

想象一個生態(tài)系統(tǒng),其中多個專門針對特定任務的生成式AI模型各自作為其領域內的專家,并行工作以處理查詢。這種多路復用模式能夠生成一系列不同的響應,然后將這些響應整合在一起,形成一個全面的答案。gpf28資訊網(wǎng)——每日最新資訊28at.com

圖片圖片gpf28資訊網(wǎng)——每日最新資訊28at.com

這樣的設置非常適合復雜的問題解決場景,在這種場景中,問題的不同方面需要不同的專業(yè)知識,就像一個由專家組成的小組,每個專家負責處理更大問題的一個方面。gpf28資訊網(wǎng)——每日最新資訊28at.com

更大的模型(如GPT-4)負責理解上下文,并將其分解為特定的任務或信息請求,這些任務或信息請求被傳遞給更小的代理。這些代理可能是較小的語言模型,它們已經(jīng)接受過特定任務的訓練,或者是具有特定功能的通用模型,如GPT、Llama、上下文提示和函數(shù)調用。gpf28資訊網(wǎng)——每日最新資訊28at.com

3.多任務微調模式

在這種架構模式中,我們對大型語言模型進行了微調,使其能夠同時處理多個任務,而非僅僅針對單個任務。這是一種跨領域知識和技能遷移學習的方法,大大增強了模型的多功能性。gpf28資訊網(wǎng)——每日最新資訊28at.com

圖片gpf28資訊網(wǎng)——每日最新資訊28at.com

這種多任務學習方法對于那些需要應對各種復雜任務的平臺來說尤其有用,例如虛擬助理或是人工智能驅動的研究工具。這極大地簡化了面向復雜領域的訓練和測試工作流程。gpf28資訊網(wǎng)——每日最新資訊28at.com

在訓練大型語言模型(LLM)時,我們可以利用一些資源和軟件包,如DeepSpeed,以及Hugging Face的Transformer庫。gpf28資訊網(wǎng)——每日最新資訊28at.com

4. 面向微調的分層緩存策略模式

我們將緩存策略和相關服務引入到大模型應用架構中,可以成功地解決成本、數(shù)據(jù)冗余以及訓練數(shù)據(jù)等組合問題。gpf28資訊網(wǎng)——每日最新資訊28at.com

圖片gpf28資訊網(wǎng)——每日最新資訊28at.com

通過儲存這些初始結果,系統(tǒng)能夠在后續(xù)查詢中迅速提供答案,從而顯著提高了效率。當我們累積了足夠的數(shù)據(jù)后,微調層級將啟動,利用早期交互的反饋,進一步完善一個更為專業(yè)化的模型。gpf28資訊網(wǎng)——每日最新資訊28at.com

專有大模型不僅簡化了操作流程,也使人工智能專業(yè)知識更好地適應特定任務,使其在需要高度精確性和適應性的環(huán)境中,如客戶服務或個性化內容創(chuàng)建,表現(xiàn)得更為高效。gpf28資訊網(wǎng)——每日最新資訊28at.com

對于剛入門的用戶,可以選擇使用預先構建的服務,如 GPTCache,或者使用常見的緩存數(shù)據(jù)庫,如 Redis、Cassandra、Memcached來運行自己的服務。在向混合服務中添加其他服務時,一定要記得監(jiān)控并測量延遲情況。gpf28資訊網(wǎng)——每日最新資訊28at.com

5.混合規(guī)則模式

許多現(xiàn)行的商業(yè)系統(tǒng)和企業(yè)應用在一定程度上仍然依賴于基于規(guī)則的架構。通過將大模型與基于規(guī)則的邏輯結合,我們能夠融合結構化的精確性,旨在創(chuàng)造出既富有創(chuàng)意又遵循規(guī)范的解決方案。gpf28資訊網(wǎng)——每日最新資訊28at.com

圖片圖片gpf28資訊網(wǎng)——每日最新資訊28at.com

對于那些必須嚴格遵守標準或法規(guī)的行業(yè)或產(chǎn)品而言,這是一個非常有效的架構模式,它確保了人工智能在保持創(chuàng)新的同時,仍能遵守既定的理想?yún)?shù)。例如,這種架構可以應用于生成電話IVR系統(tǒng)或基于規(guī)則的傳統(tǒng)(非LLM)聊天機器人的意圖和消息流。gpf28資訊網(wǎng)——每日最新資訊28at.com

6.知識圖譜模式

將知識圖譜與生成型人工智能模型結合,賦予了它們面向事實的超級能力,使得輸出不僅具有上下文情境,而且更加符合事實。gpf28資訊網(wǎng)——每日最新資訊28at.com

圖片圖片gpf28資訊網(wǎng)——每日最新資訊28at.com

對于要求內容真實性和準確性不容忽視的應用來說,這種方法至關重要,比如在教育內容創(chuàng)作、醫(yī)療咨詢或任何誤導可能帶來嚴重后果的領域。gpf28資訊網(wǎng)——每日最新資訊28at.com

知識圖譜及其本體能夠將復雜主題或問題分解成結構化格式,為大型語言模型提供深層上下文基礎。我們甚至可以借助語言模型,以JSON或RDF等格式創(chuàng)建本體。gpf28資訊網(wǎng)——每日最新資訊28at.com

可用于構建知識圖譜的圖數(shù)據(jù)庫服務包括ArangoDB、Amazon Neptune、Google Dgraph、Azure Cosmos DB以及Neo4j等。此外,更廣泛的數(shù)據(jù)集和服務也能用于訪問更全面的知識圖譜,包括開源的企業(yè)知識圖譜API、PyKEEN數(shù)據(jù)集以及Wikidata等等。gpf28資訊網(wǎng)——每日最新資訊28at.com

7. 智能體蜂巢模式

智能體蜂巢架構模式運用了大量AI Agent,這些代理共同協(xié)作以解決一個問題,每個代理都從各自獨特的視角出發(fā)進行貢獻。gpf28資訊網(wǎng)——每日最新資訊28at.com

圖片圖片gpf28資訊網(wǎng)——每日最新資訊28at.com

由此產(chǎn)生的綜合結果展示了一種集體智慧的體現(xiàn),其效果超越了任何一個單獨的AI個體所能達到的成果。在需要大量創(chuàng)新解決方案的場景中,或者在處理復雜的數(shù)據(jù)集時,這種模式尤其有效。gpf28資訊網(wǎng)——每日最新資訊28at.com

例如,我們可以利用多個AI Agent來共同審查一篇研究論文,整合他們的所有數(shù)據(jù)和觀點。對于處理能力要求較高的蜂巢系統(tǒng),我們可以考慮部署消息隊列服務,比如Apache Kafka,以便更好地處理代理和服務間的消息傳遞。gpf28資訊網(wǎng)——每日最新資訊28at.com

8. 智能體組合模式

該架構模式強調了靈活性,通過模塊化的人工智能系統(tǒng),能自我重新配置以優(yōu)化任務性能。這就像一個多功能工具,可以根據(jù)需求選擇和激活不同的功能模塊,對于需要為各種客戶需求或產(chǎn)品需求定制解決方案的企業(yè)來說,這是非常有效的。gpf28資訊網(wǎng)——每日最新資訊28at.com

圖片圖片gpf28資訊網(wǎng)——每日最新資訊28at.com

我們可以通過使用各種自主代理框架和體系結構來開發(fā)每個Agent及其工具,例如CrewAI、Langchain、LLamaIndex、Microsoft Autogen和superAGI等。gpf28資訊網(wǎng)——每日最新資訊28at.com

通過組合不同的模塊,例如一個Agent可以專注于預測,另一個處理預約查詢,還有一個專注于生成消息,最后一個Agent來更新數(shù)據(jù)庫。將來,隨著專業(yè)AI公司提供的特定服務的增多,我們可以將一個模塊替換為外部或第三方服務,以處理特定的任務或領域的問題。gpf28資訊網(wǎng)——每日最新資訊28at.com

9.記憶認知模式

這種架構為人工智能引入了類似于人類記憶的元素,允許模型回憶并基于過去的交互進行學習,從而產(chǎn)生更細膩的反應。gpf28資訊網(wǎng)——每日最新資訊28at.com

圖片圖片gpf28資訊網(wǎng)——每日最新資訊28at.com

這對于正在進行的對話或學習場景非常有用,因為隨著時間的推移,人工智能會形成更深的理解,就像一個專業(yè)的個人助理或者在線機器學習平臺。隨著時間推移,記憶認知模式能夠將關鍵事件總結并儲存到一個向量數(shù)據(jù)庫中,進一步豐富RAG系統(tǒng)。gpf28資訊網(wǎng)——每日最新資訊28at.com

為了保持匯總計算量的合理性,我們可以通過使用更小的自然語言處理庫來進行匯總和摘要。所使用的是向量數(shù)據(jù)庫,并在提示階段進行檢索,以檢查短期記憶,并通過最近鄰搜索來定位關鍵的“事實”。有一個遵循這種模式的開源解決方案是MemGPT。gpf28資訊網(wǎng)——每日最新資訊28at.com

10. 雙重安全模式

圍繞大型語言模型(LLM)的核心安全性至少包含兩個關鍵組件:一是用戶組件,我們將其稱為用戶Proxy代理;二是防火墻,它為模型提供了保護層。gpf28資訊網(wǎng)——每日最新資訊28at.com

圖片圖片gpf28資訊網(wǎng)——每日最新資訊28at.com

用戶proxy代理在查詢發(fā)出和返回的過程中對用戶的query進行攔截。該代理負責清除個人身份信息(pII)和知識產(chǎn)權(IP)信息,記錄查詢的內容,并優(yōu)化成本。gpf28資訊網(wǎng)——每日最新資訊28at.com

防火墻則保護模型及其所使用的基礎設施。盡管我們對人們如何操縱模型以揭示其潛在的訓練數(shù)據(jù)、潛在功能以及當今惡意行為知之甚少,但我們知道這些強大的模型是脆弱的。gpf28資訊網(wǎng)——每日最新資訊28at.com

在安全性相關的技術棧中,可能還存在其他安全層,但對于用戶的查詢路徑來說,Proxy代理和防火墻是最關鍵的。gpf28資訊網(wǎng)——每日最新資訊28at.com

沒有結束

老碼農(nóng)認為,這些大模型應用的架構模式不僅僅是一種范式,很可能成為未來智能系統(tǒng)賴以成長的框架。隨著我們們繼續(xù)探索和創(chuàng)新,還會涌現(xiàn)出很多新的架構模式,而且這里的10個架構模式以及新涌現(xiàn)的架構模式可能成為人工智能服務的表現(xiàn)形態(tài)。gpf28資訊網(wǎng)——每日最新資訊28at.com

本文鏈接:http://www.tebozhan.com/showinfo-26-79444-0.html大模型應用的十種架構模式

聲明:本網(wǎng)頁內容旨在傳播知識,若有侵權等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 三星 The Wall IWB 系列客戶品鑒會北京站舉行,助力企業(yè)邁入智能美好的數(shù)字化時代

下一篇: Netty 編程看上去懵懵的...

標簽:
  • 熱門焦點
  • 7月安卓手機性價比榜:努比亞+紅魔兩款新機入榜

    7月登場的新機有努比亞Z50S Pro和紅魔8S Pro,除了三星之外目前唯二的兩款搭載超頻版驍龍8Gen2處理器的產(chǎn)品,而且努比亞和紅魔也一貫有著不錯的性價比,所以在本次的性價比榜單
  • 一文掌握 Golang 模糊測試(Fuzz Testing)

    模糊測試(Fuzz Testing)模糊測試(Fuzz Testing)是通過向目標系統(tǒng)提供非預期的輸入并監(jiān)視異常結果來發(fā)現(xiàn)軟件漏洞的方法。可以用來發(fā)現(xiàn)應用程序、操作系統(tǒng)和網(wǎng)絡協(xié)議等中的漏洞或
  • 零售大模型“干中學”,攀爬數(shù)字化珠峰

    文/侯煜編輯/cc來源/華爾街科技眼對于絕大多數(shù)登山愛好者而言,攀爬珠穆朗瑪峰可謂終極目標。攀登珠峰的商業(yè)路線有兩條,一是尼泊爾境內的南坡路線,一是中國境內的北坡路線。相
  • 阿里大調整

    來源:產(chǎn)品劉有媒體報道稱,近期淘寶天貓集團啟動了近年來最大的人力制度改革,涉及員工績效、層級體系等多個核心事項,目前已形成一個初步的“征求意見版”:1、取消P序列
  • 東方甄選單飛:有些鳥注定是關不住的

    作者:彭寬鴻來源:華爾街科技眼‍‍‍‍‍‍‍‍‍‍東方甄選創(chuàng)始人俞敏洪帶隊的“7天甘肅行”直播活動已在近日順利收官。成立后一
  • iQOO 11S屏幕細節(jié)公布:首發(fā)三星2K E6全感屏 安卓最好的直屏手機

    日前iQOO手機官方宣布,新一代電競旗艦iQOO 11S將會在7月4日19:00正式與大家見面。隨著發(fā)布時間的日益臨近,官方關于該機的預熱也更加密集,截至目前已
  • 蘋果140W USB-C充電器:采用氮化鎵技術

    據(jù)10 月 30 日 9to5 Mac 消息報道,當蘋果推出新的 MacBook Pro 2021 時,該公司還推出了新的 140W USB-C 充電器,附贈在 MacBook Pro 16 英寸機型的盒子里,也支
  • 與兆芯合作 聯(lián)想推出全新旗艦版筆記本電腦開天N7系列

    聯(lián)想與兆芯合作推出全新聯(lián)想旗艦版筆記本電腦開天 N7系列。這個系列采用兆芯KX-6640MA處理器平臺,KX-6640MA 處理器是采用了陸家嘴架構,16nm 工藝,4 核 4 線
  • 親歷馬斯克血洗Twitter,硅谷的苦日子在后頭

    文/劉哲銘  編輯/李薇  馬斯克再次揮下裁員大刀。  美國時間11月14日,Twitter約4400名外包員工遭解雇,此次被解雇的員工的主要工作為內容審核等。此前,T
Top