1. LLM作為知識(shí)寶庫(kù):LLM基于海量的互聯(lián)網(wǎng)數(shù)據(jù)進(jìn)行訓(xùn)練,并定期更新(即GPT-3、GPT-3.5、GPT-4、GPT-4o等)。
2. 涌現(xiàn)能力:隨著LLM的發(fā)展,它們展現(xiàn)出小型模型中不具備的能力。
這是否意味著我們已經(jīng)達(dá)到了人類(lèi)水平的智能,即我們所說(shuō)的AGI?Gartner將AGI定義為一種能夠在廣泛的任務(wù)和領(lǐng)域中理解、學(xué)習(xí)和應(yīng)用知識(shí)的AI形式。通往AGI的道路還很漫長(zhǎng),其中一個(gè)關(guān)鍵障礙是LLM訓(xùn)練的自回歸性質(zhì),這種性質(zhì)基于過(guò)去的序列來(lái)預(yù)測(cè)單詞。作為AI研究的先驅(qū)之一,Yann LeCun指出,由于自回歸性質(zhì),LLM可能會(huì)偏離準(zhǔn)確答案,因此,LLM存在幾個(gè)局限性:
• 知識(shí)有限:盡管訓(xùn)練數(shù)據(jù)龐大,但LLM缺乏最新的世界知識(shí)。
• 推理能力有限:LLM的推理能力有限,如Subbarao Kambhampati所指,LLM是優(yōu)秀的知識(shí)檢索者,但不是優(yōu)秀的推理者。
• 缺乏動(dòng)態(tài)性:LLM是靜態(tài)的,無(wú)法訪(fǎng)問(wèn)實(shí)時(shí)信息。
為了克服LLM的挑戰(zhàn),需要一種更先進(jìn)的方法,這就是智能體變得至關(guān)重要的地方。
智能體來(lái)救場(chǎng)
AI中智能體的概念已經(jīng)發(fā)展了二十多年,其實(shí)施方式也隨時(shí)間而變化。如今,人們?cè)贚LM的語(yǔ)境下討論智能體。簡(jiǎn)而言之,智能體就像是應(yīng)對(duì)LLM挑戰(zhàn)的瑞士軍刀:它可以幫助我們進(jìn)行推理,提供從互聯(lián)網(wǎng)獲取最新信息的手段(解決LLM的動(dòng)態(tài)性問(wèn)題),并且可以自主地完成任務(wù)。以L(fǎng)LM為支柱,智能體正式包含工具、記憶、推理(或規(guī)劃)和行動(dòng)組件。
AI智能體的組件
• 工具使智能體能夠訪(fǎng)問(wèn)外部信息,無(wú)論是來(lái)自互聯(lián)網(wǎng)、數(shù)據(jù)庫(kù)還是API,從而收集必要的數(shù)據(jù)。
• 記憶可以是短期的或長(zhǎng)期的。智能體使用暫存記憶來(lái)暫時(shí)保存來(lái)自各種來(lái)源的結(jié)果,而聊天歷史則是長(zhǎng)期記憶的一個(gè)例子。
• 推理器使智能體能夠有條不紊地思考,將復(fù)雜任務(wù)分解為可管理的子任務(wù),以便有效處理。
• 行動(dòng):智能體根據(jù)其環(huán)境和推理結(jié)果采取行動(dòng),通過(guò)反饋迭代地適應(yīng)和解決問(wèn)題。ReAct是迭代執(zhí)行推理和行動(dòng)的常用方法之一。
智能體擅長(zhǎng)什么?
智能體在處理復(fù)雜任務(wù)時(shí)表現(xiàn)出色,尤其是在角色扮演模式下,能夠利用LLM增強(qiáng)的性能。例如,在撰寫(xiě)博客時(shí),一個(gè)智能體可能專(zhuān)注于研究,而另一個(gè)則負(fù)責(zé)寫(xiě)作——每個(gè)智能體都處理一個(gè)特定的子目標(biāo),這種多智能體方法適用于許多現(xiàn)實(shí)問(wèn)題。
角色扮演有助于智能體專(zhuān)注于特定任務(wù)以實(shí)現(xiàn)更大的目標(biāo),通過(guò)明確定義提示的各個(gè)部分(如角色、指令和上下文)來(lái)減少幻覺(jué)。由于LLM的性能取決于結(jié)構(gòu)良好的提示,因此各種框架都將這一過(guò)程形式化。接下來(lái)我們將討論這樣一個(gè)框架——CrewAI,它提供了一種結(jié)構(gòu)化的方法來(lái)定義角色扮演。
多智能體與單智能體
以使用單智能體的檢索增強(qiáng)生成(RAG)為例,這是一種有效的方法,通過(guò)利用索引文檔中的信息來(lái)增強(qiáng)LLM處理特定領(lǐng)域查詢(xún)的能力,然而,單智能體RAG也有其自身的局限性,如檢索性能或文檔排名。多智能體RAG通過(guò)為文檔理解、檢索和排名部署專(zhuān)用智能體來(lái)克服這些局限性。
在多智能體場(chǎng)景中,智能體以不同的方式協(xié)作,類(lèi)似于分布式計(jì)算模式:順序、集中、分散或共享消息池。CrewAI、Autogen和langGraph+langChain等框架支持通過(guò)多智能體方法解決復(fù)雜問(wèn)題。在本文中,我使用CrewAI作為參考框架來(lái)探索自主工作流管理。
工作流管理:多智能體系統(tǒng)的一個(gè)用例
大多數(shù)工業(yè)流程都涉及工作流管理,無(wú)論是貸款處理、營(yíng)銷(xiāo)活動(dòng)管理還是DevOps。實(shí)現(xiàn)特定目標(biāo)需要順序或循環(huán)的步驟。在傳統(tǒng)方法中,每個(gè)步驟(例如貸款申請(qǐng)驗(yàn)證)都需要人工來(lái)執(zhí)行繁瑣且單調(diào)的任務(wù),即手動(dòng)處理每個(gè)申請(qǐng)并進(jìn)行驗(yàn)證,然后再進(jìn)入下一步。
每個(gè)步驟都需要該領(lǐng)域?qū)<业妮斎?。在使用CrewAI的多智能體設(shè)置中,每個(gè)步驟都由一個(gè)由多個(gè)智能體組成的團(tuán)隊(duì)來(lái)處理。例如,在貸款申請(qǐng)驗(yàn)證中,一個(gè)智能體可能通過(guò)背景檢查(如駕駛證等文件)來(lái)驗(yàn)證用戶(hù)的身份,而另一個(gè)智能體則驗(yàn)證用戶(hù)的財(cái)務(wù)信息。
這就引出了一個(gè)問(wèn)題:一個(gè)團(tuán)隊(duì)(包含多個(gè)順序或?qū)蛹?jí)結(jié)構(gòu)的智能體)能否處理所有貸款處理步驟?雖然理論上可行,但這會(huì)使團(tuán)隊(duì)變得復(fù)雜,需要大量的臨時(shí)記憶,并增加目標(biāo)偏離和幻覺(jué)的風(fēng)險(xiǎn)。一種更有效的方法是將每個(gè)貸款處理步驟視為一個(gè)獨(dú)立的團(tuán)隊(duì),將整個(gè)工作流視為一個(gè)團(tuán)隊(duì)節(jié)點(diǎn)圖(使用langGraph等工具)順序或循環(huán)運(yùn)行。
由于LLM仍處于智能發(fā)展的早期階段,因此無(wú)法完全自主地管理整個(gè)工作流。在關(guān)鍵階段需要人工參與進(jìn)行最終用戶(hù)驗(yàn)證。例如,在團(tuán)隊(duì)完成貸款申請(qǐng)驗(yàn)證步驟后,需要人工監(jiān)督來(lái)驗(yàn)證結(jié)果。隨著時(shí)間的推移,隨著對(duì)AI的信任增加,某些步驟可能會(huì)變得完全自主。目前,基于A(yíng)I的工作流管理起著輔助作用,簡(jiǎn)化了繁瑣的任務(wù)并減少了整體處理時(shí)間。
生產(chǎn)挑戰(zhàn)
將多智能體解決方案投入生產(chǎn)可能會(huì)面臨幾個(gè)挑戰(zhàn)。
• 規(guī)模:隨著智能體數(shù)量的增加,協(xié)作和管理變得具有挑戰(zhàn)性。各種框架提供了可擴(kuò)展的解決方案——例如,Llamaindex采用事件驅(qū)動(dòng)的工作流來(lái)大規(guī)模管理多智能體。
• 延遲:由于任務(wù)迭代執(zhí)行,需要多次調(diào)用LLM,因此智能體性能往往會(huì)產(chǎn)生延遲。受管理的LLM(如GPT-4o)由于隱式護(hù)欄和網(wǎng)絡(luò)延遲而速度較慢。自托管的LLM(具有GPU控制)在解決延遲問(wèn)題方面非常有用。
• 性能和幻覺(jué)問(wèn)題:由于LLM的概率性質(zhì),智能體的性能可能會(huì)因每次執(zhí)行而異。像輸出模板化(例如JSON格式)和在提示中提供充足示例等技術(shù)有助于減少響應(yīng)的可變性。通過(guò)訓(xùn)練智能體可以進(jìn)一步減少幻覺(jué)問(wèn)題。
最后的思考
正如Andrew Ng所指出的,智能體是AI的未來(lái),并將與LLM一起不斷發(fā)展。多智能體系統(tǒng)將在處理多模態(tài)數(shù)據(jù)(文本、圖像、視頻、音頻)和應(yīng)對(duì)日益復(fù)雜的任務(wù)方面取得進(jìn)展。雖然AGI和完全自主的系統(tǒng)仍在未來(lái),但多智能體將填補(bǔ)LLM和AGI之間的當(dāng)前空白。
企業(yè)網(wǎng)D1net(r5u5c.cn):
國(guó)內(nèi)主流的to B IT門(mén)戶(hù),旗下運(yùn)營(yíng)國(guó)內(nèi)最大的甲方CIO專(zhuān)家?guī)旌椭橇敵黾吧缃黄脚_(tái)-信眾智(www.cioall.com)。旗下運(yùn)營(yíng)19個(gè)IT行業(yè)公眾號(hào)(微信搜索D1net即可關(guān)注)。
版權(quán)聲明:本文為企業(yè)網(wǎng)D1Net編譯,轉(zhuǎn)載需在文章開(kāi)頭注明出處為:企業(yè)網(wǎng)D1Net,如果不注明出處,企業(yè)網(wǎng)D1Net將保留追究其法律責(zé)任的權(quán)利。