自然語言處理將徹底改變企業(yè)的業(yè)務

責任編輯:cres

作者:Mary Branscombe

2020-07-23 10:17:43

來源:企業(yè)網(wǎng)D1Net

原創(chuàng)

從支持面向客戶的聊天機器人,到跟蹤合同承諾,再到充分利用會議記錄,自然語言處理具有巨大的潛力來改變企業(yè)的業(yè)務。

從支持面向客戶的聊天機器人,到跟蹤合同承諾,再到充分利用會議記錄,自然語言處理具有巨大的潛力來改變企業(yè)的業(yè)務。
 
自然語言處理 (NLP) 的最新改進正在通過語音和文本功能來支持主流技術,無論是使用聽起來更加自然的聲音來大聲朗讀電子郵件,還是使用Excel輸入有關電子表格數(shù)據(jù)并以自動生成圖表和數(shù)據(jù)透視表的形式來獲得答案。
 
隨著NLP變得更加精確和更廣泛可用,它有可能從為客戶支持聊天機器人提供預置主題轉(zhuǎn)向能夠處理定性、半結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)。最后,實現(xiàn)知識挖掘的承諾還將可以釋放關于公司流程、資產(chǎn)和負債的信息,從而創(chuàng)建更好的工作流和更實時的組織視圖。
 
“NLP能夠?qū)卧~分解成最簡單的形式,并識別出它們之間的模式、規(guī)則和關系,”apexanalytix的應用和先進技術高級副總裁Walt Kristick解釋道。“它會使用計算機算法來解析和解釋書面和口頭的自然語言,使系統(tǒng)能夠?qū)W習和理解人類語言。”
 
NLP的應用范圍可以從翻譯和語言生成(用于總結(jié)、注釋甚至是解釋其他機器學習模型),再到分類和聚類、情緒分析和其他信息的提取。Kristick指出,NLP最簡單的形式已經(jīng)被廣泛使用:拼寫檢查、電子郵件中的建議和消息響應以及Siri等虛擬助手都在使用NLP,聊天機器人也是如此。
 
“對文本和非相關數(shù)據(jù)源的分析和提取的需求已經(jīng)越來越大,特別是在醫(yī)療保健和生命科學領域,”Kristick指出。
 
下面是NLP的現(xiàn)狀以及它可能適合你組織的地方。
 
NLP服務占主導地位
 
雖然有許多算法可以與Python NLTK、Sanford CoreNLP和Apache OpenNLP等框架一起構(gòu)建自己的NLP任務,但最有效的模型往往非常龐大。在撰寫本文時,Microsoft的170億參數(shù)的圖靈自然語言生成模型是有史以來最大的,BERT和GPT-2也有數(shù)十億個參數(shù)。
 
“對于一些公司需要做的復雜事情來說,僅僅把這些模型從貨架上拿下來是行不通的,”Microsoft的會話人工智能副總裁Lili Cheng警告說。“對許多公司來說,托管這些大型模型、管理它們并完成所有這些工作將是非常具有挑戰(zhàn)性的。有些人想這樣做,但我們相信更多的客戶只是想定制和添加他們自己的信息,”Cheng說,并指出,這對于許多組織所聘用的NLP專家來說也會是一個挑戰(zhàn)。
 
不僅僅是零售和其他面向客戶的行業(yè)才可以從NLP中受益,IBM研究員、人工智能首席架構(gòu)師Dakshi Agrawal說。任何與客戶打交道的公司都可以利用NLP來從他們的互動中獲得深刻的見解,Agrawal說,“許多公司在處理外部客戶和合作伙伴事務的同時,也會在內(nèi)部員工和一般人力資源事務中使用該技術。”
 
例如,主題聚類就使用了像句子嵌入這樣的NLP技術,而不僅僅是關鍵字提取,這使得在對客戶可能使用不同術語報告的問題進行分組時能夠更加準確。在儀表板中突出顯示這些集群將有助于揭示趨勢或重復出現(xiàn)的問題。
 
Signoi試圖通過展示常用詞、突出正面和負面詞匯并按人口群體的匯總來處理調(diào)查中的開放式評論。獨立的英國交通用戶監(jiān)督機構(gòu)transport Focus利用Signoi調(diào)查了各種火車服務上通勤者和休閑乘客所最關心的問題。商務旅客對一條線路的過度擁擠感到憤怒;那些乘坐火車休閑的人則想要更好的停車場,更多的空間以放置行李和自行車。
 
NLP也可以用來生成解釋結(jié)果的語言。Microsoft的Power BI商業(yè)分析服務和Salesforce.com的Tableau都提供了一些功能,用戶可以輸入有關數(shù)據(jù)的問題,然后得到圖表或自動分析。
 
了解企業(yè)所知道的
 
NLP有很大的潛力來幫助提取一個組織不知道它已經(jīng)知道的東西。
 
專業(yè)的人工智能工具,如ABBY的Text Analytics for Contracts、Exient的Contract Management Solution或是Seal的Contract Discovery and Analytics,都可以從合同中提取條款和期限,幫助組織理解他們的承諾。Docugami是XML的共同發(fā)明人Jean Paoli所創(chuàng)辦的一家新公司,它的目標就是為結(jié)構(gòu)化程度較低的文檔實現(xiàn)這種功能。
 
“企業(yè)中只有15%的數(shù)據(jù)存儲在數(shù)據(jù)庫中。我們使用文本、電子郵件和文件進行交流。真相并不在那些可愛的結(jié)構(gòu)化數(shù)據(jù)庫當中。真相在文件里,”Paoli告訴我們。
 
“拿一個非常文件密集型的企業(yè)來說,比如商業(yè)地產(chǎn)。一線業(yè)務用戶每周都會花時間創(chuàng)建15個租賃協(xié)議,每個星期一,他們的經(jīng)理都會問:你做了什么?截止日期是什么時候?你談過停車問題了嗎?他們想不想讓我們保留這塊土地?一旦你簽署了一份文件,這些就是公司所必須履行的條款,但這些信息都被埋在文件里了,” Paoli說。
 
解鎖這些“暗數(shù)據(jù)”可以取代每周一早上的狀態(tài)會議,并提高業(yè)務靈活性;Paoli指出,無論是房東被星巴克要求重新談判租賃協(xié)議,還是餐廳需要了解保險單的內(nèi)容,這都會比以往任何時候都來的更加重要。
 
“在這一點上,使用NLP來分析業(yè)務文檔將變得更為重要,因為企業(yè)正在重新思考其業(yè)務模式。他們可能不得不重新談判一切,他們需要了解他們的義務和風險是什么。專業(yè)服務公司埃森哲就是這么做的,它利用自己的NLP分析了100多萬份合同,以了解自己的承諾和責任。
 
Paoli表示,對于那些沒有自己內(nèi)部NLP專業(yè)知識的組織,Docugami的SaaS產(chǎn)品也有30個示例文檔可以使用,它可以從一個業(yè)務文檔文件夾中自行選擇這些文檔,還可以向創(chuàng)建文檔的業(yè)務用戶提供30分鐘的反饋,以訓練模型。
 
然后,Docugami可以將這些信息輸入數(shù)據(jù)庫,以幫助創(chuàng)建一個在瀏覽器中可以看到的儀表板,或是與Excel或Tableau集成在一起。“我們可以說,看,這是到期了的,或者所有這些文件都有這個特定的條款,除了那一個,”Paoli說。
 
打開會議的隱藏力量
 
從會議和對話中提取有用的信息是一個費力的手工過程。一些公司的電話已經(jīng)被轉(zhuǎn)錄,但很少有人對它們進行分析。從會議上的發(fā)言中,企業(yè)能對項目的進展或即將到來的截止日期了解多少呢?
 
Otter的首席執(zhí)行官Sam Liang指出,由于企業(yè)員工通常會在會議上花費30%或更多的時間,因此從這些會議中獲取的很多信息并不像其他業(yè)務數(shù)據(jù)那樣有意義。
 
“人們將如何保持一致意見,尤其是在你連續(xù)召開了Zoom會議的情況下?”Liang說。
 
像Otter這樣的轉(zhuǎn)錄工具將可以幫助到你。PowerPoint演示文稿和團隊會議中的實時字幕,或者是Azure Streams廣播平臺中可搜索的實時會議轉(zhuǎn)錄,都可以有效地提供后續(xù)對話的文本,而無需人工來做筆記。
 
Microsoft的Cheng建議,在未來,平臺將使用轉(zhuǎn)錄和文檔分析以及圖像識別來提取“會議的集體智慧”,這樣在會議結(jié)束后繼續(xù)工作時,就可以很容易地訪問這些信息了。“你可以記錄下更多正在發(fā)生的事情,然后方便地與你的團隊分享,”她說。
 
例如,Bridgewater Associates記錄了過去15年的所有內(nèi)部會議,任何員工都可以觀看這些錄音。但由于很難搜索,他們很少會被瀏覽,公司現(xiàn)在正在使用Otter來提取舊的會議內(nèi)容。
 
類似地,支持Azure Media Services live meeting轉(zhuǎn)錄的Azure Cognitive Services speech to text API也將很快能夠轉(zhuǎn)錄上傳到OneDrive的音頻文件。開發(fā)人員已經(jīng)可以使用這些API來構(gòu)建轉(zhuǎn)錄應用程序,但是將這些功能直接構(gòu)建到平臺中將使其更廣泛地被使用。
 
數(shù)據(jù)分析和準確性
 
完整的轉(zhuǎn)錄并不總是應用NLP最有用的結(jié)果,盡管它們可以提供一個時間線,讓你通過上下文搜索找到Cheng所說的“有趣的金塊”。
 
Otter提取了標記作為自動摘要,以指示文本中所包含的內(nèi)容。IBM Watson的自然語言理解和Otter也在研究類似的工具,但是你仍然要記得查閱文字記錄。2018年,Microsoft為團隊展示了一個原型系統(tǒng),該系統(tǒng)可以根據(jù)會議記錄創(chuàng)建和分配行動項目,并向與會者分發(fā)會議記錄。
 
從長遠來看,NLP還可以為會議提供數(shù)據(jù)分析:同樣的話題是否不斷被提出,同樣的截止日期是否不斷地被推遲,某些員工是否比其他人說得更多,還是在討論其他人。
 
所有這些的價值取決于轉(zhuǎn)錄的準確性,而對于NLP來說,準確度是一件復雜的事情。許多NLP系統(tǒng)在正式的基準上實現(xiàn)了與人類相同的性能,但它們大多是基于對話的,可能無法給你一個與你想要做的事情的準確比較。仍然沒有一個單一有效的衡量標準,Cheng指出。
 
“我們看到人們將各種能力融合到了多模式的系統(tǒng)中。你可能會發(fā)現(xiàn)你的對話系統(tǒng)真的很棒,但它在搜索或混合系統(tǒng)方面就做得不太好了,在混合系統(tǒng)中,你可能會想要把說話、語言、視覺和文檔結(jié)合在一起,”她說。
 
轉(zhuǎn)錄的準確性隨錄音質(zhì)量、背景噪音、說話者的口音和人們所談論的內(nèi)容而有所變化。對于一個在安靜環(huán)境中以英語為母語的人來說,Otter的Liang表示,它的準確率已經(jīng)超過了95%。在實踐中,你會得到一些有用的轉(zhuǎn)錄,但還不夠完美。
 
無論你使用何種NLP工具,你都應該準備好投入時間來定制與你的業(yè)務相關的概念和相聯(lián)系的詞匯表,例如你所在行業(yè)的技術術語或你自己的產(chǎn)品名稱,以及員工名稱,以便能夠正確的識別它們。
 
在使用NLP之前,組織需要知道什么是他們可以接受的錯誤水平,而不僅僅是為了捷徑或探索,但是Cheng建議將重點放在端到端的體驗上。
 
“你是如何把這些東西組合在一起,讓人們真正使用,并能夠幫助你的公司或客戶更有效地完成某些事情的,”她問道。
 
“你不能承諾太多;人工智能不是魔法,雖然自然語言工具的確可以改進很多東西。你的公司現(xiàn)在所面臨的最大問題可能是如何組織你的信息,從你所擁有的文件中獲得更多價值,并讓有專業(yè)知識的人來進行指導。”Cheng說。“我們現(xiàn)在有很多遠程工作的經(jīng)驗,或許我們可以使用人工智能來做得更好。”
 
版權(quán)聲明:本文為企業(yè)網(wǎng)D1Net編譯,轉(zhuǎn)載需注明出處為:企業(yè)網(wǎng)D1Net,如果不注明出處,企業(yè)網(wǎng)D1Net將保留追究其法律責任的權(quán)利。

鏈接已復制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號-6京公網(wǎng)安備 11010502049343號