企業(yè)需要了解圖像識(shí)別、語(yǔ)音識(shí)別、聊天機(jī)器人、自然語(yǔ)言生成、情感分析如何改變其業(yè)務(wù)的運(yùn)營(yíng)方式。
人工智能技術(shù)正在將其自身融入業(yè)務(wù)的各個(gè)方面。重要的一些人工智能技術(shù)包括圖像識(shí)別、語(yǔ)音識(shí)別、聊天機(jī)器人、自然語(yǔ)言生成和情感分析。
需要明確的是,每種類型的人工智能技術(shù)都代表廣泛的類別,通常包括數(shù)十個(gè)甚至數(shù)百個(gè)基礎(chǔ)組件。反過(guò)來(lái),通常將這些組件重組為更復(fù)雜的應(yīng)用程序,為企業(yè)創(chuàng)造價(jià)值。
例如,百貨商店人工智能機(jī)器人可以在工作中使用圖像識(shí)別、視頻和語(yǔ)音識(shí)別技術(shù)。圖像識(shí)別軟件將使其能夠檢查貨架上庫(kù)存的位置、價(jià)格和數(shù)量;視頻將幫助其避免遇到任何障礙,并確定其在商店中的位置;語(yǔ)音識(shí)別組件將使其能夠引導(dǎo)和娛樂(lè)客戶。
為了取得這種成就,這些業(yè)務(wù)中的人工智能技術(shù)通常結(jié)合了針對(duì)整個(gè)任務(wù)的特定部分量身定制的各種算法和技術(shù)。它們包括符號(hào)處理、統(tǒng)計(jì)分析、神經(jīng)網(wǎng)絡(luò)等等。
以下是對(duì)五種人工智能技術(shù)的深入闡述,這些技術(shù)隨著時(shí)間的推移而發(fā)展,從而極大地改變了企業(yè)處理、分析和生成數(shù)據(jù)的方式。
1.圖像識(shí)別
企業(yè)使用圖像識(shí)別的各種方式包括:在工廠生產(chǎn)線上進(jìn)行自動(dòng)檢查,在保險(xiǎn)中生成損壞估計(jì),在圖像中識(shí)別物體,對(duì)人員進(jìn)行計(jì)數(shù),控制制造過(guò)程,檢測(cè)諸如顧客進(jìn)入商店等事件以及生成真實(shí)世界的模型。
人工智能技術(shù)必須找到一種方法,采用各種人工智能算法可以處理的數(shù)字來(lái)描述世界。在視覺(jué)方面,研究人員發(fā)現(xiàn)了如何將一張圖片劃分成一個(gè)像素網(wǎng)格,這樣每個(gè)像素都可以表示為一個(gè)數(shù)字。在早期,采用一個(gè)數(shù)字來(lái)描述每個(gè)像素的亮度。后來(lái),人們發(fā)現(xiàn)可以用三個(gè)或更多的數(shù)字來(lái)描述每個(gè)像素中不同顏色的亮度。
20世紀(jì)60年代,研究人員開(kāi)始探索如何使用原始形式的光學(xué)字符識(shí)別(OCR)技術(shù)的軟件圖像識(shí)別功能來(lái)識(shí)別數(shù)字文檔中的字符。其他研究人員開(kāi)始探索基于圖像的場(chǎng)景解釋技術(shù),試圖從二維圖像重建三維圖像。多年來(lái),這些技術(shù)已成為機(jī)器視覺(jué)行業(yè)工具包的一部分。
后來(lái),研究人員發(fā)現(xiàn)可以將圖像識(shí)別組織為一個(gè)分層過(guò)程,以使其更易于解釋日益復(fù)雜的現(xiàn)象。例如,黑色和白色像素可能被識(shí)別為線條和曲線,而線條和波浪形又被識(shí)別為數(shù)字的一部分。訓(xùn)練算法來(lái)學(xué)習(xí)基于這些曲線圖案而不是每個(gè)像素的亮度來(lái)解釋字符的方法要容易得多。類似地,更容易根據(jù)圖像是否包含兩只眼睛和適當(dāng)形狀的耳朵來(lái)確定圖像是否是貓,而不是根據(jù)每個(gè)像素中顏色的原始亮度來(lái)確定。
這種處理方式有望推進(jìn)圖像識(shí)別領(lǐng)域。然而直到2012年左右,隨著AlexNet(一種設(shè)計(jì)用于支持圖像識(shí)別的八層卷積神經(jīng)網(wǎng)絡(luò))的發(fā)展,研究人員才發(fā)現(xiàn)如何擴(kuò)大這個(gè)過(guò)程以識(shí)別成千上萬(wàn)種不同類型的物體。
諸如AlexNet之類的深度學(xué)習(xí)技術(shù)的優(yōu)點(diǎn)在于,該模型可以自動(dòng)學(xué)習(xí)以不需要人類以編程方式指定每個(gè)步驟的方式來(lái)執(zhí)行各種圖像識(shí)別任務(wù)。研究人員指出了如何將神經(jīng)網(wǎng)絡(luò)應(yīng)用于不同類型的問(wèn)題,該功能也促進(jìn)了深度學(xué)習(xí)在其他類型的應(yīng)用程序中的使用。
如今,圖像識(shí)別用于識(shí)別貨架上的產(chǎn)品、圖片或視頻中的人物,生產(chǎn)流水線上的缺陷以及自動(dòng)駕駛汽車(chē)在街道上遇到的物體。隨著冠狀病毒疫情的出現(xiàn),很多企業(yè)正在開(kāi)發(fā)應(yīng)用程序以監(jiān)視社交距離的規(guī)則。
對(duì)于企業(yè)領(lǐng)導(dǎo)者來(lái)說(shuō),一個(gè)關(guān)鍵的見(jiàn)解是,通常有可能通過(guò)在應(yīng)用程序中使用多種類型的圖像識(shí)別來(lái)創(chuàng)造更多的價(jià)值。例如,智能文檔處理和文檔智能結(jié)合了一組人工智能技術(shù),其中包括自然語(yǔ)言處理和機(jī)器學(xué)習(xí),以捕獲難以識(shí)別的格式中的數(shù)據(jù)并將其分類。與光學(xué)字符識(shí)別(OCR)結(jié)合使用,智能文檔處理可以分析文檔的視覺(jué)布局,以確定哪個(gè)部分代表產(chǎn)品、發(fā)票金額或銷售條款,并將該信息提供給其他業(yè)務(wù)應(yīng)用程序。
值得注意的是,企業(yè)中大多數(shù)圖像識(shí)別應(yīng)用程序都是高度場(chǎng)景相關(guān)的。供應(yīng)商和研究人員經(jīng)常宣傳新的圖像識(shí)別改進(jìn),例如在識(shí)別腫瘤方面擊敗了醫(yī)學(xué)專家的軟件。但是在實(shí)踐中,僅當(dāng)圖像以正確的角度捕獲時(shí),人工智能才可以使用一組特定的設(shè)備來(lái)處理這些放射線圖像,而人類則善于分析從許多不同角度捕獲的各種圖像。
研究人員還發(fā)現(xiàn),在這些圖像識(shí)別應(yīng)用程序的一些實(shí)現(xiàn)中也潛藏著偏見(jiàn)。為了減少偏見(jiàn),專家建議對(duì)這些應(yīng)用程序進(jìn)行數(shù)據(jù)訓(xùn)練,這些數(shù)據(jù)代表將要處理的特定類型的圖像。
2.語(yǔ)音識(shí)別
需要多種算法將語(yǔ)音轉(zhuǎn)換為文本并準(zhǔn)備進(jìn)行數(shù)字處理。盡管語(yǔ)音識(shí)別系統(tǒng)變得越來(lái)越好,但是即使是當(dāng)今最好的語(yǔ)音識(shí)別系統(tǒng)也仍然容易出錯(cuò),因此在安全關(guān)鍵型應(yīng)用(例如醫(yī)療數(shù)據(jù)捕獲)中需要進(jìn)行一些驗(yàn)證。
貝爾實(shí)驗(yàn)室的研究人員于1952年開(kāi)發(fā)了首個(gè)用于識(shí)別單個(gè)數(shù)字的語(yǔ)音識(shí)別系統(tǒng)。到1962年,IBM公司推出了Shoebox機(jī)器,該機(jī)器可以理解16個(gè)單詞。到1980年代中期,研究人員開(kāi)始使用統(tǒng)計(jì)技術(shù)(例如隱馬爾可夫模型)來(lái)開(kāi)發(fā)可以理解2萬(wàn)個(gè)單詞的應(yīng)用程序,但其單詞之間會(huì)有停頓。第一款消費(fèi)者聽(tīng)寫(xiě)產(chǎn)品Dragon Dictate于1990年發(fā)布,可以根據(jù)語(yǔ)音自動(dòng)鍵入文字。然后,AT&T公司推出了一種語(yǔ)音識(shí)別應(yīng)用程序,該程序無(wú)需人工即可路由呼叫。這些早期的系統(tǒng)或者具有適合特定環(huán)境的小型詞匯表,需要由單個(gè)聲音進(jìn)行大量訓(xùn)練。
研究人員從2010年開(kāi)始發(fā)現(xiàn)了將深度神經(jīng)網(wǎng)絡(luò)應(yīng)用于語(yǔ)音識(shí)別的方法。這一增長(zhǎng)的主要推動(dòng)力之一是需要找到更好的方法來(lái)代表不同類型智能音箱的聲音特征。這要求探索出更好的方法,將原始音頻數(shù)據(jù)轉(zhuǎn)換為人類習(xí)慣于收聽(tīng)的獨(dú)特聲音(稱為音素)(例如,“汽車(chē)”一詞中的“c”)。
研究人員還將基本的語(yǔ)音識(shí)別結(jié)果與更好的場(chǎng)景結(jié)合起來(lái),以區(qū)分同音異義詞(bear/bare)。云計(jì)算服務(wù)現(xiàn)在提供了各種核心的語(yǔ)音轉(zhuǎn)文本服務(wù),開(kāi)發(fā)人員隨后將其融入各種企業(yè)工作流程中。
基本的語(yǔ)音識(shí)別功能通過(guò)云計(jì)算服務(wù)(如微軟Cortana、谷歌Now和蘋(píng)果Siri)嵌入到現(xiàn)代智能手機(jī)和電腦中。亞馬遜公司利用語(yǔ)音識(shí)別技術(shù)推出了一種新的方式,通過(guò)Alexa語(yǔ)音服務(wù)在智能手機(jī)之外連接互聯(lián)網(wǎng)。這些服務(wù)通常在云平臺(tái)中完成繁重的工作。最近,谷歌公司通過(guò)開(kāi)發(fā)更有效的算法來(lái)提高標(biāo)準(zhǔn),這些算法可以在其Pixel手機(jī)上本地運(yùn)行語(yǔ)音識(shí)別應(yīng)用程序。
語(yǔ)音識(shí)別技術(shù)在企業(yè)中的使用正在增加。一些供應(yīng)商還開(kāi)始開(kāi)發(fā)用于自動(dòng)記錄電話會(huì)議和現(xiàn)場(chǎng)會(huì)議的應(yīng)用程序,以達(dá)到合規(guī)目的或更好地記錄決策過(guò)程。自動(dòng)化語(yǔ)音識(shí)別還可以幫助監(jiān)視呼叫中心的活動(dòng),以確保工作人員遵循正確的程序,從而使管理人員不必聽(tīng)到每個(gè)呼叫。語(yǔ)音識(shí)別應(yīng)用程序也正用于為國(guó)際旅行者自動(dòng)進(jìn)行語(yǔ)言翻譯。這項(xiàng)人工智能技術(shù)的其他商業(yè)應(yīng)用包括家庭自動(dòng)化、視頻游戲交互以及將視頻編入索引的自動(dòng)隱藏式字幕。
3.聊天機(jī)器人
對(duì)話式人工智能技術(shù)允許應(yīng)用程序以自然的方式與人類交互。第一個(gè)聊天機(jī)器人Eliza于1964~1966年在MIT人工智能實(shí)驗(yàn)室開(kāi)發(fā)。最早的聊天機(jī)器人在詞匯量和可以允許的交互類型方面受到限制。這些應(yīng)用程序使用決策樹(shù),該決策樹(shù)根據(jù)查詢或用戶對(duì)問(wèn)題的答案沿各種路徑進(jìn)行操作。在20世紀(jì)80年代到90年代,這些技術(shù)擴(kuò)展到了自動(dòng)電話應(yīng)用程序,在其中,通過(guò)使用IVR技術(shù)的撥號(hào)音響應(yīng)或簡(jiǎn)單詞匯來(lái)控制交互。
最近,由于用于解釋和響應(yīng)文本查詢的更好的自然語(yǔ)言處理技術(shù),以及與其他服務(wù)的更好集成,使得企業(yè)能夠更容易地自動(dòng)設(shè)置能夠響應(yīng)常見(jiàn)問(wèn)題的聊天機(jī)器人,聊天機(jī)器人的應(yīng)用程序激增,接受命令或自定義對(duì)給定用戶的響應(yīng)。最近聊天機(jī)器人可應(yīng)用程序的一個(gè)關(guān)鍵見(jiàn)解是開(kāi)發(fā)用于表示用戶意圖和適當(dāng)響應(yīng)的應(yīng)用程序編程框架。
面向外部的聊天機(jī)器人可以幫助實(shí)現(xiàn)客戶交互的許多方面的自動(dòng)化。它們還允許企業(yè)以一種更具吸引力的方式跨各種社交媒體渠道(例如Facebook)進(jìn)行推廣。
企業(yè)的應(yīng)用程序開(kāi)發(fā)和部署方面已經(jīng)看到了使用聊天機(jī)器人技術(shù)的爆炸式增長(zhǎng),該技術(shù)將聊天機(jī)器人與可自動(dòng)配置應(yīng)用程序和基礎(chǔ)設(shè)施并生成報(bào)告的操作工具結(jié)合在一起。聊天機(jī)器人集成使團(tuán)隊(duì)可以記錄其流程,從而更輕松地應(yīng)對(duì)重復(fù)出現(xiàn)的問(wèn)題,或者確定過(guò)去特定流程的執(zhí)行方式。
聊天機(jī)器人工具開(kāi)始進(jìn)入業(yè)務(wù)的其他方面,以幫助記錄部門(mén)??內(nèi)部或部門(mén)之間的各種通信,特別是隨著越來(lái)越多的公司采用Slack和Microsoft Teams等消息傳遞應(yīng)用程序。財(cái)務(wù)部門(mén)可以使用聊天機(jī)器人來(lái)生成和跟蹤重要業(yè)務(wù)指標(biāo)的狀態(tài)。銷售團(tuán)隊(duì)可以使用聊天機(jī)器人收集有關(guān)關(guān)鍵客戶的數(shù)據(jù)。
聊天機(jī)器人還可以幫助促進(jìn)其他類型的內(nèi)部交互。例如,員工可能會(huì)詢問(wèn)人力資源聊天機(jī)器人,以詢問(wèn)有關(guān)其福利狀態(tài)的問(wèn)題或要求休假。企業(yè)還使用聊天機(jī)器人來(lái)自動(dòng)化與IT系統(tǒng)管理的交互,以處理簡(jiǎn)單問(wèn)題或自動(dòng)分類更復(fù)雜的問(wèn)題。
4.自然語(yǔ)言的產(chǎn)生
隨著數(shù)據(jù)量的增長(zhǎng),可能很難為員工或客戶確定正確的信息優(yōu)先級(jí)。自然語(yǔ)言生成(NLG)應(yīng)用程序可以幫助查找、組織和總結(jié)給定用戶的最適當(dāng)見(jiàn)解。
根據(jù)業(yè)務(wù)用例的不同,這種人工智能技術(shù)有不同的風(fēng)格。自然語(yǔ)言生成開(kāi)始作為商業(yè)智能和分析應(yīng)用程序的前端添加,作為Gartner公司創(chuàng)造的一個(gè)新的應(yīng)用程序類別的一部分。這些技術(shù)結(jié)合了解釋純文本查詢和生成純英語(yǔ)分析的適當(dāng)摘要的能力。例如,美國(guó)航空航天局(USAA)構(gòu)建了一個(gè)自然語(yǔ)言生成(NLG)應(yīng)用程序,以改進(jìn)它向商業(yè)用戶提供的關(guān)于不同保險(xiǎn)產(chǎn)品銷售情況的答案。
這種人工智能技術(shù)的另一個(gè)特點(diǎn)是改進(jìn)了向用戶展示產(chǎn)品信息的方式。在這些類型的應(yīng)用程序中,自然語(yǔ)言生成引擎可以根據(jù)用戶的偏好自定義產(chǎn)品的描述。例如,可能會(huì)向更多的技術(shù)用戶深入介紹諸如新手機(jī)耳機(jī)之類的產(chǎn)品的技術(shù)特性,而會(huì)向注重時(shí)尚的買(mǎi)家提供有關(guān)其外觀和感覺(jué)的審美描述。自然語(yǔ)言生成(NLG)還可以幫助改善將內(nèi)容翻譯到新市場(chǎng)的方式。
Trulia公司正在使用自然語(yǔ)言生成(NLG)自動(dòng)生成用于房地產(chǎn)列表的社區(qū)描述。自然語(yǔ)言生成(NLG)還被用于為美聯(lián)社制作基本的新聞文章。Esquire Singapore公司甚至精心制作了一本特刊,里面刊載了人工智能應(yīng)用的故事。然而,這項(xiàng)人工智能技術(shù)還處于起步階段,專家提醒企業(yè)和醫(yī)療等關(guān)鍵任務(wù)應(yīng)用需要新型的質(zhì)量控制。
盡管如此,企業(yè)仍可能會(huì)受益于自然語(yǔ)言處理框架的各種最新改進(jìn)。新的自然語(yǔ)言處理指標(biāo)正在出現(xiàn),以幫助企業(yè)評(píng)估給定框架的效用并改善自然語(yǔ)言生成(NLG)應(yīng)用程序的這些實(shí)現(xiàn)。
5.情緒分析
人們?cè)谧珜?xiě)有關(guān)事件、品牌、政客和其他事物的文章時(shí),通常會(huì)表達(dá)出不同的情感類型和強(qiáng)度。情緒分析領(lǐng)域始于20世紀(jì)50年代,當(dāng)時(shí)市場(chǎng)營(yíng)銷人員分析了書(shū)面文件的語(yǔ)氣。但這是一個(gè)非常人工的過(guò)程。不過(guò),現(xiàn)在幾乎每個(gè)人都在社交媒體、博客、新聞評(píng)論、評(píng)論、支持論壇和與公司的通信中留下了情感的數(shù)字痕跡。
包括自然語(yǔ)言處理、機(jī)器學(xué)習(xí)和統(tǒng)計(jì)在內(nèi)的各種人工智能技術(shù)都用于分析這些數(shù)字足跡的情感基調(diào)。這些工具有助于跟蹤產(chǎn)品或服務(wù)的更改如何影響客戶,而無(wú)需直接詢問(wèn)人們。它也有助于密切關(guān)注競(jìng)爭(zhēng)對(duì)手的產(chǎn)品和活動(dòng)。
情緒分析的另一個(gè)用例可以識(shí)別所謂的品牌影響者,從而使企業(yè)與個(gè)人建立更牢固的關(guān)系,他們可以就如何改善服務(wù)或產(chǎn)品提供更好的建議。
情緒分析還可以幫助確定有關(guān)客戶或潛在客戶可能感興趣的事物的重要趨勢(shì),以便企業(yè)可以改善其當(dāng)前產(chǎn)品或創(chuàng)建新產(chǎn)品以滿足這些需求。企業(yè)還可以使用情緒分析來(lái)確定其品牌可能受損的特定原因,例如等待時(shí)間長(zhǎng)、質(zhì)量差或構(gòu)思不佳。
企業(yè)在內(nèi)部也在業(yè)務(wù)中使用這項(xiàng)人工智能技術(shù)來(lái)幫助理解和提高員工的士氣和福利。在這個(gè)用例中,情緒分析可以分析員工的職位,以幫助理解重要的問(wèn)題或管理人員的變化可能對(duì)他們產(chǎn)生的影響。
更復(fù)雜的情感分析應(yīng)用程序使用人工智能來(lái)理解聲音和面部表情所傳達(dá)的情感。該分析可以幫助識(shí)別支持電話期間的情緒變化,或評(píng)估顧客對(duì)商店貨架上新產(chǎn)品的看法。Netflix甚至嘗試使用面部表情情感分析來(lái)改進(jìn)電影預(yù)告片。然而,一些研究人員警告說(shuō),情緒分析的這些應(yīng)用可能會(huì)受到可靠性、特異性和概括性問(wèn)題的影響。
版權(quán)聲明:本文為企業(yè)網(wǎng)D1Net編譯,轉(zhuǎn)載需注明出處為:企業(yè)網(wǎng)D1Net,如果不注明出處,企業(yè)網(wǎng)D1Net將保留追究其法律責(zé)任的權(quán)利。