一般而言,AIGC指的是一類(lèi)ML技術(shù),可以創(chuàng)建與人類(lèi)創(chuàng)造的內(nèi)容非常相似的圖像、音樂(lè)和文本等內(nèi)容。另一方面,LLMs是具有數(shù)十億個(gè)參數(shù)的神經(jīng)網(wǎng)絡(luò),這些參數(shù)已經(jīng)在大量文本數(shù)據(jù)上進(jìn)行了訓(xùn)練,這使它們能夠理解、處理和生成類(lèi)似人類(lèi)的語(yǔ)言。
總而言之,這些技術(shù)提供了一系列不同的應(yīng)用,這些應(yīng)用具有重塑不同行業(yè)的潛力,并提高了人與機(jī)器之間交互的效能。通過(guò)探索這些應(yīng)用,企業(yè)領(lǐng)導(dǎo)者和決策者可以獲得寶貴的靈感,推動(dòng)業(yè)務(wù)加速增長(zhǎng),并通過(guò)快速原型制作實(shí)現(xiàn)明顯改善的業(yè)務(wù)成果。AIGC的額外優(yōu)勢(shì)是,這些應(yīng)用程序中的大多數(shù)只需要最低限度的專(zhuān)業(yè)知識(shí),不需要進(jìn)一步的模型培訓(xùn)。
快速聲明:人們通常傾向于將第二代AI與ChatGPT聯(lián)系在一起,但也有許多其他供應(yīng)商的產(chǎn)品可供選擇,如谷歌的T5、Meta的Llama、TII的Falcon和Anthropic的Claude。雖然本文中討論的大多數(shù)應(yīng)用程序都使用了OpenAI的ChatGPT,但你可以很容易地調(diào)整和切換底層LLMs,以與你特定的預(yù)算、延遲(你需要模型生成完成的速度——較小的模型允許更快的加載并減少推理延遲)和下游任務(wù)保持一致。
1.將LLMs連接到外部數(shù)據(jù)
?在許多開(kāi)箱即用的任務(wù)中表現(xiàn)出令人印象深刻的能力,例如翻譯和匯總LLMs,而不需要進(jìn)行初始定制。他們之所以如此擅長(zhǎng)這些通用任務(wù),是因?yàn)榈讓踊A(chǔ)模型已經(jīng)在大型但通用的數(shù)據(jù)集上進(jìn)行了培訓(xùn)。然而,這種能力可能不會(huì)無(wú)縫地?cái)U(kuò)展到特定于領(lǐng)域的任務(wù),例如,提供有關(guān)公司年度報(bào)告的答案。這就是檢索增強(qiáng)生成(RAG)的用武之地。
RAG是一個(gè)框架,用于構(gòu)建使用外部數(shù)據(jù)源的基于LLMs的系統(tǒng)。RAG使LLMs能夠訪(fǎng)問(wèn)它在預(yù)培訓(xùn)期間不會(huì)看到的數(shù)據(jù),但這對(duì)于正確提供相關(guān)和準(zhǔn)確的響應(yīng)是必要的。RAG通過(guò)將NLP能力與外部知識(shí)相結(jié)合,使語(yǔ)言模型(如ChatGPT)能夠?yàn)樘囟I(lǐng)域的問(wèn)題提供更好的答案,從而減少產(chǎn)生不準(zhǔn)確信息或“幻覺(jué)”的情況。它通過(guò)以下方式實(shí)現(xiàn)這一點(diǎn):
•從外部知識(shí)來(lái)源檢索相關(guān)信息,如大規(guī)模文獻(xiàn)收藏、數(shù)據(jù)庫(kù)或互聯(lián)網(wǎng)。相關(guān)性基于對(duì)用戶(hù)問(wèn)題的語(yǔ)義相似度(例如,使用余弦相似度來(lái)衡量)。
•將檢索到的信息增加到提示中的原始問(wèn)題(為回答問(wèn)題提供有用的上下文),并將其傳遞給LLMs,以便它可以產(chǎn)生更知情、與上下文相關(guān)和更準(zhǔn)確的回答。
這種方法使LLMs在不同的領(lǐng)域和應(yīng)用程序中更加通用和有用,包括問(wèn)題回答、內(nèi)容創(chuàng)建和訪(fǎng)問(wèn)實(shí)時(shí)數(shù)據(jù)的交互式對(duì)話(huà)。播客應(yīng)用Podurama也利用類(lèi)似的技術(shù)來(lái)構(gòu)建其AI支持的推薦聊天機(jī)器人。這些機(jī)器人熟練地根據(jù)用戶(hù)的提問(wèn)推薦相關(guān)節(jié)目,從播客文字記錄中汲取見(jiàn)解來(lái)完善他們的推薦。
這種方法在危機(jī)管理中也很有價(jià)值。SaaS事件響應(yīng)平臺(tái)PagerDuty使用LLMs來(lái)使用標(biāo)題、嚴(yán)重性或其他因素等基本數(shù)據(jù)生成事件摘要,并使用內(nèi)部Slack Data?對(duì)其進(jìn)行增強(qiáng),響應(yīng)者可以在LLMs中討論細(xì)節(jié)并共享故障排除更新,以提高摘要的質(zhì)量。
雖然RAG可能看起來(lái)很復(fù)雜,但LangChain庫(kù)為開(kāi)發(fā)人員提供了實(shí)現(xiàn)RAG和構(gòu)建復(fù)雜問(wèn)答系統(tǒng)所需的工具。(在許多情況下,你只需要一行代碼即可開(kāi)始)。LangChain是一個(gè)強(qiáng)大的庫(kù),可以通過(guò)提供對(duì)外部數(shù)據(jù)源的訪(fǎng)問(wèn)或連接到其他應(yīng)用程序的現(xiàn)有API來(lái)增強(qiáng)和增強(qiáng)LLMs在運(yùn)行時(shí)的性能。
當(dāng)與開(kāi)源LLMs(如Llama 2或Bloom)結(jié)合使用時(shí),RAG成為處理機(jī)密文檔的一種非常強(qiáng)大的架構(gòu)。特別有趣的是,LangChain擁有120多個(gè)集成(在撰寫(xiě)本文時(shí)),支持與SQL、PDF、代碼片段甚至YouTube視頻的無(wú)縫集成。
2.將LLMs連接到外部應(yīng)用程序
與利用外部數(shù)據(jù)源非常相似,LLMs可以與為特定任務(wù)量身定做的外部應(yīng)用程序建立連接。當(dāng)模型偶爾會(huì)因?yàn)檫^(guò)時(shí)的信息而產(chǎn)生不準(zhǔn)確時(shí),這一點(diǎn)尤為重要。例如,在詢(xún)問(wèn)英國(guó)現(xiàn)任首相時(shí),ChatGPT可能會(huì)繼續(xù)提到鮑里斯·約翰遜,盡管他已于2022年底離任。這一限制的產(chǎn)生是因?yàn)槟P偷闹R(shí)是固定在其培訓(xùn)前階段,并不包括培訓(xùn)后事件,如Rishi Sunak的任命。
為了應(yīng)對(duì)這些挑戰(zhàn),可以通過(guò)代理將LLMs與外部世界相結(jié)合來(lái)增強(qiáng)它們。這些代理用于緩解LLMs固有的互聯(lián)網(wǎng)接入不足,允許它們使用天氣API(用于實(shí)時(shí)天氣數(shù)據(jù))或SerpAPI(用于網(wǎng)絡(luò)搜索)等工具。Expedia的聊天機(jī)器人就是一個(gè)明顯的例子,它可以引導(dǎo)用戶(hù)發(fā)現(xiàn)和預(yù)訂酒店,回答有關(guān)住宿的問(wèn)題,并提供個(gè)性化的旅行建議。
另一個(gè)引人入勝的應(yīng)用涉及自動(dòng)實(shí)時(shí)標(biāo)記帶有特定屬性的推文,如情緒、攻擊性和語(yǔ)言。從營(yíng)銷(xiāo)和廣告的角度來(lái)看,連接到電子商務(wù)工具的代理商可以幫助LLMs根據(jù)用戶(hù)興趣和內(nèi)容推薦產(chǎn)品或套餐。
3.鏈接LLMs
對(duì)于大多數(shù)應(yīng)用程序,LLMs通常是單獨(dú)使用的。然而,最近LLMs鏈接在復(fù)雜應(yīng)用中獲得了吸引力。它涉及按順序鏈接多個(gè)LLMs以執(zhí)行更復(fù)雜的任務(wù)。每個(gè)LLMs在一個(gè)特定的方面都有專(zhuān)長(zhǎng),他們相互協(xié)作,以產(chǎn)生全面和精細(xì)化的產(chǎn)出。
這種方法已經(jīng)被應(yīng)用于語(yǔ)言翻譯中,其中連續(xù)使用LLMs將文本從一種語(yǔ)言轉(zhuǎn)換成另一種語(yǔ)言。像微軟這樣的公司已經(jīng)提議在低資源語(yǔ)言的情況下為翻譯服務(wù)提供LLMs鏈,從而實(shí)現(xiàn)對(duì)罕見(jiàn)單詞的更準(zhǔn)確和上下文感知的翻譯。
這種方法還可以在其他領(lǐng)域提供幾個(gè)有價(jià)值的用例。對(duì)于面向消費(fèi)者的公司,LLMs鏈接可以創(chuàng)建動(dòng)態(tài)的客戶(hù)支持體驗(yàn),從而增強(qiáng)客戶(hù)互動(dòng)、服務(wù)質(zhì)量和運(yùn)營(yíng)效率。
例如,第一個(gè)LLMs可以對(duì)客戶(hù)查詢(xún)進(jìn)行分類(lèi)并將其分類(lèi),將它們傳遞給專(zhuān)門(mén)的LLMs以獲得更準(zhǔn)確的響應(yīng)。在制造業(yè)中,物流鏈可以通過(guò)鏈接專(zhuān)門(mén)的物流鏈來(lái)優(yōu)化端到端的供應(yīng)鏈流程,以進(jìn)行需求預(yù)測(cè)、庫(kù)存管理、供應(yīng)商選擇和風(fēng)險(xiǎn)評(píng)估。
4.使用LLMs提取實(shí)體
在LLMs出現(xiàn)之前,實(shí)體提取依賴(lài)于涉及數(shù)據(jù)收集、標(biāo)記和復(fù)雜模型訓(xùn)練的勞動(dòng)密集型ML方法。這一過(guò)程既繁瑣又耗費(fèi)資源。然而,隨著LLMs的出現(xiàn),這種模式發(fā)生了變化?,F(xiàn)在,實(shí)體提取被簡(jiǎn)化為僅僅是提示,用戶(hù)可以毫不費(fèi)力地查詢(xún)模型以從文本中提取實(shí)體。更有趣的是,當(dāng)從PDF之類(lèi)的非結(jié)構(gòu)化文本中提取實(shí)體時(shí),你甚至可以在提示符中定義感興趣的架構(gòu)和屬性。
潛在的例子包括金融機(jī)構(gòu)可以利用LLMs從新聞文章中提取關(guān)鍵的金融實(shí)體,如公司名稱(chēng)、股票代碼和金融數(shù)字,從而實(shí)現(xiàn)及時(shí)和準(zhǔn)確的市場(chǎng)分析。同樣,廣告/營(yíng)銷(xiāo)機(jī)構(gòu)可以使用它來(lái)管理其數(shù)字資產(chǎn),方法是采用LLMs驅(qū)動(dòng)的實(shí)體提取來(lái)對(duì)廣告劇本、演員、位置和日期進(jìn)行分類(lèi),從而促進(jìn)高效的內(nèi)容索引和資產(chǎn)重用。
5.通過(guò)反應(yīng)提示提高LLMs的透明度
雖然收到LLMs的直接回復(fù)無(wú)疑是有價(jià)值的,但黑匣子方法的不透明經(jīng)常引起用戶(hù)的猶豫。此外,當(dāng)面對(duì)對(duì)復(fù)雜查詢(xún)的不準(zhǔn)確響應(yīng)時(shí),準(zhǔn)確地確定失敗的步驟變得具有挑戰(zhàn)性。系統(tǒng)地分解這一過(guò)程可以極大地幫助調(diào)試過(guò)程。這正是原因和行動(dòng)(Reaction)框架發(fā)揮作用的地方,為這些挑戰(zhàn)提供了解決方案。
Reaction強(qiáng)調(diào)一步一步的推理,讓LLMs像人類(lèi)一樣生成解決方案。目標(biāo)是讓模型像人類(lèi)一樣思考任務(wù),并使用語(yǔ)言解釋其推理。人們可以很容易地操作這種方法,因?yàn)樯煞磻?yīng)提示是一項(xiàng)簡(jiǎn)單的任務(wù),涉及人類(lèi)注釋員用自然語(yǔ)言表達(dá)他們的想法,以及他們執(zhí)行的相應(yīng)操作。只有少數(shù)幾個(gè)這樣的例子,該模型學(xué)會(huì)了很好地對(duì)新任務(wù)進(jìn)行泛化。
受這一框架的啟發(fā),許多教育技術(shù)公司正在試行工具,為學(xué)習(xí)者提供個(gè)性化的課程作業(yè)和作業(yè)幫助,以及教師AI支持的課程計(jì)劃。為此,可汗學(xué)院開(kāi)發(fā)了KhanMico,這是一個(gè)聊天機(jī)器人,旨在指導(dǎo)學(xué)生完成數(shù)學(xué)問(wèn)題和編程練習(xí)。Khanmio不只是根據(jù)要求提供答案,而是通過(guò)引導(dǎo)學(xué)生完成推理過(guò)程來(lái)鼓勵(lì)深思熟慮的問(wèn)題解決。這種方法不僅有助于防止抄襲,而且使學(xué)生能夠獨(dú)立掌握概念。
結(jié)論
雖然關(guān)于A(yíng)I取代人類(lèi)的潛力或最終實(shí)現(xiàn)技術(shù)奇點(diǎn)的辯論可能仍在進(jìn)行中(正如AI教父杰弗里·辛頓所預(yù)測(cè)的那樣),但有一件事是肯定的:LLMs無(wú)疑將在加快一系列領(lǐng)域中各種任務(wù)的完成方面發(fā)揮關(guān)鍵作用。它們有能力提高效率、培養(yǎng)創(chuàng)造力和改進(jìn)決策過(guò)程,同時(shí)簡(jiǎn)化復(fù)雜的任務(wù)。
對(duì)于擔(dān)任各種技術(shù)角色的專(zhuān)業(yè)人士,如數(shù)據(jù)科學(xué)家、軟件開(kāi)發(fā)人員和產(chǎn)品所有者,LLMs可以提供寶貴的工具來(lái)簡(jiǎn)化工作流程、收集見(jiàn)解并釋放新的可能性。
關(guān)于企業(yè)網(wǎng)D1net(r5u5c.cn):
國(guó)內(nèi)主流的to B IT門(mén)戶(hù),同時(shí)在運(yùn)營(yíng)國(guó)內(nèi)最大的甲方CIO專(zhuān)家?guī)旌椭橇敵黾吧缃黄脚_(tái)-信眾智(www.cioall.com)。同時(shí)運(yùn)營(yíng)19個(gè)IT行業(yè)公眾號(hào)(微信搜索D1net即可關(guān)注)。
版權(quán)聲明:本文為企業(yè)網(wǎng)D1Net編譯,轉(zhuǎn)載需在文章開(kāi)頭注明出處為:企業(yè)網(wǎng)D1Net,如果不注明出處,企業(yè)網(wǎng)D1Net將保留追究其法律責(zé)任的權(quán)利。