非結(jié)構(gòu)化數(shù)據(jù)對人工智能系統(tǒng)的發(fā)展至關(guān)重要。人工智能系統(tǒng)與用戶的溝通越好,就越能自主學(xué)習(xí),因此,它的效率也就越高。這一點(diǎn)很重要,因?yàn)槿绻粋€(gè)人工智能系統(tǒng)只要求用戶以結(jié)構(gòu)化的格式進(jìn)行交互,那么它的組件將受到極大的限制。為了讓人工智能成功,它必須理解雜亂的信息。
在這種情況下,需要深入了解非結(jié)構(gòu)化數(shù)據(jù)是如何發(fā)揮作用的。
非結(jié)構(gòu)化數(shù)據(jù)的挑戰(zhàn)
在人類的世界里,當(dāng)人們進(jìn)行對話時(shí),如果不按禮儀說話。可能任何東西都會出現(xiàn)在我們的腦海中,以某種可能遵循或可能不遵循慣例的配置。人們可能使用俚語,諷刺和開玩笑。人們把日常語言和希望傳達(dá)的信息組織成整齊的列和行是不自然的。語言本身就是非結(jié)構(gòu)化的。
如果人們曾經(jīng)與亞馬遜公司的Alexa進(jìn)行過互動(dòng),那么就會知道雖然Echo系統(tǒng)通常非常熟練地理解自由格式命令,但缺乏定義的協(xié)議有時(shí)會導(dǎo)致問題,或者至少在Alexa嘗試回答時(shí)會產(chǎn)生幽默的回應(yīng)查詢不適合模具。亞馬遜公司已投入大量資源和數(shù)百萬美元用于創(chuàng)建和永久性地改進(jìn)算法,使這種類似人類的語音能夠響應(yīng)命令,但正如Echo熟練解讀自由流動(dòng)語言一樣,Alexa仍然存在缺陷。
Alexa示例強(qiáng)調(diào)了一種非結(jié)構(gòu)化數(shù)據(jù)的復(fù)雜性。人工智能系統(tǒng)處理和創(chuàng)建與文本等效的數(shù)字的能力也是一項(xiàng)很高的要求,特別是當(dāng)企業(yè)考慮細(xì)微差別和場景的重要性時(shí)。想象一臺機(jī)器試圖“理解”家庭度假中那張照片中發(fā)生的事情,或者是一部關(guān)于印象派的藝術(shù)史教科書中的圖像。
與處理非結(jié)構(gòu)化數(shù)據(jù)相關(guān)的復(fù)雜性可能是企業(yè)中人工智能的最大障礙。然而,它們并不是不可逾越的。
專業(yè)知識的重要性
非結(jié)構(gòu)化數(shù)據(jù)本身就是噪聲。因此,它需要大量的專業(yè)知識來突破、梳理和檢測模式,然后開發(fā)識別這些模式的模型。數(shù)據(jù)科學(xué)家正在積極推動(dòng)人工智能系統(tǒng)的改進(jìn),最大的成功表明人類的本能和經(jīng)驗(yàn)是必需的。這通常發(fā)生在團(tuán)隊(duì)專注于非常狹窄的人工智能應(yīng)用時(shí)。
以工作人員的賠償索賠程序?yàn)槔?,對聲明有深入了解的?shù)據(jù)科學(xué)家團(tuán)隊(duì)可以根據(jù)他們發(fā)現(xiàn)的關(guān)鍵指標(biāo)創(chuàng)建預(yù)測模型。它們包含非結(jié)構(gòu)化數(shù)據(jù),如診斷、藥物信息、索賠記錄等。這樣做,人工智能系統(tǒng)評估早期指標(biāo),并確定某個(gè)索賠可能被拒絕。然后它可以向用戶提供警報(bào)。索賠代表可以找出如何干預(yù)和給予特定索賠更小心,以防止索賠人的律師參與(通常被拒絕的索賠最終涉及律師,這會變得非常昂貴,需要很長時(shí)間才能解決)。
在這種情況下,很容易看出人工智能系統(tǒng)是如何為用戶提供幫助的,而且當(dāng)合并非結(jié)構(gòu)化數(shù)據(jù)時(shí),與單獨(dú)依賴結(jié)構(gòu)化數(shù)據(jù)相比,還大大提高了準(zhǔn)確性。在非結(jié)構(gòu)化數(shù)據(jù)(例如,關(guān)于共病的信息)中,有一個(gè)信息和洞察力的金礦,它無法一致地找到進(jìn)入結(jié)構(gòu)化數(shù)據(jù)的方法。每增加一條信息,人工智能系統(tǒng)就會變得更智能,結(jié)果也會得到改善。這將提高效率并降低索賠成本。
這只是將非結(jié)構(gòu)化數(shù)據(jù)合并到企業(yè)人工智能系統(tǒng)中的一個(gè)好處示例。破解代碼需要時(shí)間和努力,但回報(bào)正在獲得前所未有的洞察力——與幾天或幾周相比,只需幾分鐘或幾小時(shí)就可以獲得。
非結(jié)構(gòu)化數(shù)據(jù)是關(guān)鍵
展望未來,很明顯每個(gè)人工智能系統(tǒng)都需要以自然的方式與用戶交互。各組織必須對此高度重視。事實(shí)上,如果非結(jié)構(gòu)化數(shù)據(jù)分析不是路線圖的一部分,那么公司的產(chǎn)品存在巨大的差距。
盡管非結(jié)構(gòu)化數(shù)據(jù)具有挑戰(zhàn)性,但亞馬遜、谷歌、蘋果和其他公司為人工智能應(yīng)用提供了許多機(jī)會。人們可以利用這些進(jìn)步,并將它們應(yīng)用到企業(yè)應(yīng)用程序中,在這些應(yīng)用程序中它們具有巨大的業(yè)務(wù)影響。
通過花時(shí)間應(yīng)用專業(yè)知識和聲音數(shù)據(jù)科學(xué),人們可以取得重大突破。人們不僅要通過非結(jié)構(gòu)化數(shù)據(jù)提高數(shù)據(jù)分析的準(zhǔn)確性,還要在未來實(shí)現(xiàn)基本的新思維、溝通和利用信息的方式。