隨著數(shù)據(jù)科學(xué)的普及,過(guò)去需要花費(fèi)幾個(gè)月準(zhǔn)備的數(shù)據(jù),可能很快就會(huì)被數(shù)據(jù)敏銳的商業(yè)用戶利用幾天時(shí)間整理出來(lái)。
想要深化機(jī)器學(xué)習(xí)的公司開始把關(guān)注點(diǎn)轉(zhuǎn)向一個(gè)看似不可能但卻十分熟悉的領(lǐng)域——商業(yè)智能系統(tǒng)中。很大程度上,BI是一個(gè)能夠分析過(guò)去性能的領(lǐng)域,它正在對(duì)人工智能進(jìn)行改造,并將預(yù)測(cè)功能引入到它們的財(cái)務(wù)報(bào)告中去。
Symphony Post Acute網(wǎng)絡(luò)就是這樣一個(gè)組織。在伊利諾斯州、印第安納州和威斯康辛州的28個(gè)醫(yī)療保健機(jī)構(gòu)中,醫(yī)療保健公司擁有5000張床位,他們希望利用人工智能和機(jī)器學(xué)習(xí)來(lái)改善每年關(guān)于8萬(wàn)名患者的護(hù)理,讓這些病人從膝蓋手術(shù)或接受透析治療的過(guò)程中恢復(fù)過(guò)來(lái)。例如,深埋在患者數(shù)據(jù)中的醫(yī)療核心可能表明患者將會(huì)面臨危險(xiǎn)的跌倒風(fēng)險(xiǎn),因此需要額外的預(yù)防措施。找到這些可以是單個(gè)數(shù)據(jù)點(diǎn)或數(shù)據(jù)的細(xì)微模式的指標(biāo),是機(jī)器學(xué)習(xí)的一個(gè)完美的用例。但是建立模型并不是一件簡(jiǎn)單的工作。
“我被有關(guān)預(yù)測(cè)的問(wèn)題瘋狂轟炸,”Symphony的數(shù)據(jù)科學(xué)和分析主管Nathan Patrick Taylor表示。“即使我利用所有清醒的時(shí)間全花在構(gòu)建機(jī)器學(xué)習(xí)模型上,我也不可能做到這些。”于是公司又雇傭了兩位數(shù)據(jù)科學(xué)家。“而且他們都不便宜。” Taylor說(shuō)。但我們沒(méi)有得到我們應(yīng)得的回報(bào)。畢竟這是非常困難和昂貴的。
因此,兩年前,Symphony就已經(jīng)開始關(guān)注商業(yè)替代品,而那些已經(jīng)擁有機(jī)器學(xué)習(xí)模型的供應(yīng)商已經(jīng)準(zhǔn)備好了。現(xiàn)在,該公司將已經(jīng)收集到的數(shù)據(jù)存儲(chǔ)在數(shù)據(jù)倉(cāng)庫(kù)中,并將數(shù)據(jù)通過(guò)來(lái)自供應(yīng)商DataRobot的基于云計(jì)算的AI引擎發(fā)送,結(jié)果每四個(gè)小時(shí)就會(huì)傳回公司的Microsoft PowerBI儀表盤。Taylor說(shuō):“我馬上就收到了,我的首席信息官也拿到了,就在一瞬間,它看起來(lái)就很神奇。”
今天,240名醫(yī)生和護(hù)士在他們的PowerBI儀表盤上獲得了預(yù)測(cè)和推薦,他們可以通過(guò)平板電腦和智能手機(jī)訪問(wèn)。因此,例如,高危患者會(huì)被自動(dòng)標(biāo)記為樓梯圖標(biāo)。高危患者再入院時(shí)被標(biāo)記為救護(hù)車圖標(biāo)。
將AI注入BI
Taylor說(shuō),重新入學(xué)率對(duì)Symphony Post Acute而言是件大事。醫(yī)院和保險(xiǎn)公司考慮的是重新調(diào)整的費(fèi)率,每一次重新調(diào)整的費(fèi)用會(huì)使公司損失13500美元。這并不是一筆小錢。
為了弄清楚DataRobot的預(yù)測(cè)是否有用,Symphony最初推出DataRobot的一些設(shè)備,并進(jìn)行了為期6個(gè)月的研究,以查看是否有不同的重新閱讀率。他說(shuō):“如果你能移動(dòng)1%,你就做得很好了。”Taylor說(shuō),這一比率確實(shí)有所改善,從21%上升到18.8%。“這是一個(gè)顯著的進(jìn)步,”他說(shuō)。“這也贏得了我們的CEO的認(rèn)可。”
如今,該公司開始采用同樣的方法來(lái)看待與保險(xiǎn)公司簽訂的合同。他說(shuō):“如果我們不能正確地為服務(wù)付費(fèi),我們就退還資金。”
最初的安裝花費(fèi)了大約20個(gè)小時(shí),涉及到連接數(shù)據(jù)提要和建立學(xué)習(xí)模型。現(xiàn)在,如果有人想要新的預(yù)測(cè),一個(gè)全新的學(xué)習(xí)模式需要6到8個(gè)小時(shí)的時(shí)間來(lái)建立,這將在三個(gè)工作日內(nèi)傳播。
此外,他說(shuō),現(xiàn)有的模型可以在任何時(shí)候進(jìn)行再培訓(xùn)。例如,法規(guī)可能改變,或者醫(yī)務(wù)人員可以開始使用新的程序。此外,模型可能隨著時(shí)間推移而改善。Taylor每三個(gè)月重新培訓(xùn)一次模型,或者每當(dāng)有重大的政策轉(zhuǎn)變的時(shí)候進(jìn)行改善。如果有很大的變化,學(xué)習(xí)模式可能只需要在新政策生效后的數(shù)據(jù)上進(jìn)行培訓(xùn)。
他說(shuō),管理這個(gè)系統(tǒng)不再需要一個(gè)受過(guò)高度訓(xùn)練的數(shù)據(jù)科學(xué)家,但它確實(shí)是需要具備統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)的人。在Symphony,公司還使用R代碼建立模型。
DataRobot也支持Python的退出。DataRobot的產(chǎn)品營(yíng)銷總監(jiān)Colin Priest說(shuō),使用其他語(yǔ)言的客戶也可以使用任何Rest API感知的語(yǔ)言來(lái)調(diào)用DataRobot Rest API,包括Java、c#、SAS、JavaScript和Visual Basic。
人工智能的下一步是自助服務(wù)
“人工智能已經(jīng)實(shí)現(xiàn)了民主化,”弗雷斯特研究公司(Forrester Research)副總裁兼首席分析師Boris Evelson表示。直到最近,它還需要一個(gè)數(shù)據(jù)科學(xué)家來(lái)編寫代碼。今天,有了這些商業(yè)智能系統(tǒng),我只需點(diǎn)擊幾個(gè)數(shù)據(jù)點(diǎn),選擇我想預(yù)測(cè)的變量——就像客戶購(gòu)買的傾向——這些預(yù)測(cè)模型就會(huì)自動(dòng)生成。
Boris Evelson說(shuō),過(guò)去需要一個(gè)數(shù)據(jù)科學(xué)專業(yè)的幾個(gè)月來(lái)組裝的東西,現(xiàn)在可以由一個(gè)能夠理解數(shù)據(jù)和使用Excel工作的人在幾天內(nèi)拼湊起來(lái)。市場(chǎng)營(yíng)銷人員將會(huì)利用這一點(diǎn)來(lái)預(yù)測(cè)和處理客戶行為,業(yè)務(wù)經(jīng)理們用它來(lái)觀察和預(yù)測(cè)風(fēng)險(xiǎn),供應(yīng)鏈人員也可以利用它來(lái)觀察和優(yōu)化物流。
根據(jù)Forrester最近對(duì)全球決策者的調(diào)查,改進(jìn)數(shù)據(jù)、分析或洞察平臺(tái)是人工智能技術(shù)的三大用例之一。所有主要的BI供應(yīng)商,包括IBM、Oracle和Microsoft,都在這方面努力工作。
如果8個(gè)小時(shí)聽起來(lái)太長(zhǎng),無(wú)法建立一個(gè)新的機(jī)器學(xué)習(xí)模型,那么就會(huì)有更容易的選擇。很快,用戶將能夠得到最常見類型的自動(dòng)預(yù)測(cè)并得到建議,內(nèi)置的圖像識(shí)別和自然語(yǔ)言處理。Gartner預(yù)測(cè),自然語(yǔ)言生成和人工智能將90%的現(xiàn)代商業(yè)智能平臺(tái)的一個(gè)標(biāo)準(zhǔn)特性將會(huì)出現(xiàn)在未來(lái)兩年。
為文本和視覺分析配備BI
springboard的首席執(zhí)行官Bruce Molloy說(shuō)“自然語(yǔ)言處理可以讓用戶在需要信息的時(shí)候問(wèn)一些簡(jiǎn)單的英語(yǔ)問(wèn)題。我認(rèn)為這是自然進(jìn)化。”
Bruce Molloy表示,領(lǐng)域越窄,平臺(tái)獲得的相關(guān)數(shù)據(jù)越多,供應(yīng)商就越容易添加人工智能功能。會(huì)計(jì)平臺(tái),或者Salesforce這樣的客戶關(guān)系管理系統(tǒng),已經(jīng)擁有了他們需要的數(shù)據(jù),并且有一些用戶最可能會(huì)問(wèn)的問(wèn)題。Bruce Molloy說(shuō):“有了Salesforce,看看他們做什么會(huì)很有意思。”它已經(jīng)受到限制,而且工作已經(jīng)部分完成了。他們已經(jīng)確定這些觀點(diǎn)是重要的,而且他們可以將AI的能力放在首位。
對(duì)人工智能的推動(dòng)是由更強(qiáng)大的處理能力、更智能的算法、云計(jì)算和標(biāo)準(zhǔn)接口驅(qū)動(dòng)的。例如,DataRobot利用了云計(jì)算和標(biāo)準(zhǔn)Rest api,允許它支持Trifacta、Alteryx和Domino數(shù)據(jù)實(shí)驗(yàn)室業(yè)務(wù)智能系統(tǒng),除了PowerBI、Tableau、Qlik、Excel、R和其他許多儀表板工具。
人工智能的商業(yè)智能儀表板也可以處理比以前更廣泛的各種數(shù)據(jù)。例如,Symphony Post Acute不僅僅是看病人記錄中的硬數(shù)字,也看醫(yī)生和護(hù)士的病歷。
咨詢廣告公司的全球數(shù)據(jù)和人工智能Josh Sutton表示,在非結(jié)構(gòu)化格式中存儲(chǔ)了大量信息,這些信息可能會(huì)導(dǎo)致有用的見解或預(yù)測(cè),而不局限于文本。
“非結(jié)構(gòu)化數(shù)據(jù)的最大來(lái)源之一是視覺圖像,”Sutton說(shuō)。例如,營(yíng)銷部門可以通過(guò)分析用戶在社交媒體上分享的照片,來(lái)分析他們的客戶是如何與產(chǎn)品互動(dòng)的。
超越的描述性分析
國(guó)際數(shù)據(jù)的認(rèn)知和人工智能系統(tǒng)研究主管David Schubmehl說(shuō),預(yù)測(cè)和洞察力只是人工智能增加商業(yè)智能儀表板的第一步。ai驅(qū)動(dòng)的儀表板還可以提供建議或建議用戶下一步應(yīng)該做的具體操作,甚至可以為用戶提供這些操作。他表示:“如果小部件(銷售)數(shù)量下降,它可能會(huì)說(shuō)這對(duì)未來(lái)意味著什么,以及你現(xiàn)在應(yīng)該怎么做。”這使得BI更有價(jià)值。
David Schubmehl說(shuō):“我認(rèn)為這就是為什么這么多人都在采用這類工具的原因。”例如,Salesforce剛剛發(fā)布了一項(xiàng)重大聲明,即關(guān)于它的預(yù)測(cè)最近已經(jīng)超過(guò)了10億次預(yù)測(cè),這是一種以規(guī)范的方式幫助人們關(guān)閉新業(yè)務(wù),識(shí)別新線索,創(chuàng)造面向行動(dòng)的能力。我認(rèn)為這是一個(gè)指標(biāo),人們想要的不僅僅是描述性的商業(yè)分析。
他說(shuō),我們還處在早期階段。“在未來(lái)兩三年內(nèi),我們可能會(huì)達(dá)到完全成熟。”人們才剛剛開始了解人工智能和機(jī)器學(xué)習(xí)的可能性。
他說(shuō),我們還處在早期階段。在未來(lái)兩三年內(nèi),我們可能會(huì)達(dá)到完全成熟,人們開始剛剛了解人工智能和機(jī)器學(xué)習(xí)的可能性
Accenture負(fù)責(zé)人工智能的高級(jí)主管、全球主管Rumman Chowdhury表示,盡管如此,人工智能仍然缺乏常識(shí)。她說(shuō):“我們生活在一個(gè)狹窄的人工智能世界里。”即使一個(gè)特定的平臺(tái)有內(nèi)置的人工智能模型,用戶仍然需要了解正在使用的數(shù)據(jù),以及它與當(dāng)前問(wèn)題的相關(guān)性。“你必須確保你認(rèn)為自己得到的產(chǎn)出是合適的。”“我不知道我們是否會(huì)在某些方面完全取代人類的判斷。”我不知道我們是否能夠完全自動(dòng)化的做出真正的決策——即使我們應(yīng)該這樣做。