機(jī)器學(xué)習(xí)(ML)和數(shù)據(jù)科學(xué)經(jīng)常被同時(shí)提及,這有著充分理由。這兩種技術(shù)相輔相成,但是了解它們?nèi)绾喂ぷ饕约叭绾螀f(xié)同工作很重要。
機(jī)器學(xué)習(xí)是人工智能(AI)的一個(gè)分支,它使計(jì)算機(jī)能夠通過(guò)數(shù)據(jù)進(jìn)行自我學(xué)習(xí),并且無(wú)需人工干預(yù)即可應(yīng)用這種學(xué)習(xí)。
業(yè)務(wù)轉(zhuǎn)型和外包咨詢服務(wù)商Pace Harmon公司的主管JP Baritugo說(shuō),“從本質(zhì)上講,數(shù)據(jù)科學(xué)是一種實(shí)踐領(lǐng)域,而機(jī)器學(xué)習(xí)是一組工具和方法論。數(shù)據(jù)科學(xué)使用廣泛的專業(yè)知識(shí)、業(yè)務(wù)知識(shí)、工具和方法來(lái)處理大數(shù)據(jù),以產(chǎn)生有意義的見(jiàn)解,從而推動(dòng)行動(dòng)并實(shí)現(xiàn)有意義的業(yè)務(wù)成果。”
為什么機(jī)器學(xué)習(xí)需要數(shù)據(jù)科學(xué)
有效的機(jī)器學(xué)習(xí)需要良好的數(shù)據(jù)科學(xué)。Baritugo說(shuō):“企業(yè)需要數(shù)據(jù)科學(xué)家的專業(yè)知識(shí)來(lái)確保正確使用和部署機(jī)器學(xué)習(xí)。”數(shù)據(jù)科學(xué)家可以確保為模型提供經(jīng)過(guò)清理和規(guī)范化的數(shù)據(jù)集以進(jìn)行訓(xùn)練,并確保根據(jù)數(shù)據(jù)集和要解決的業(yè)務(wù)問(wèn)題使用正確的算法。
數(shù)據(jù)科學(xué)平臺(tái)RapidMiner公司創(chuàng)始人兼總裁Ingo Mierswa說(shuō),“數(shù)據(jù)科學(xué)可以在機(jī)器學(xué)習(xí)領(lǐng)域之外應(yīng)用。數(shù)據(jù)科學(xué)是人工智能、機(jī)器學(xué)習(xí)和深度學(xué)習(xí),以及數(shù)據(jù)準(zhǔn)備在商業(yè)環(huán)境中的實(shí)際應(yīng)用。數(shù)據(jù)科學(xué)的目標(biāo)是從數(shù)據(jù)中獲取見(jiàn)解,預(yù)測(cè)未來(lái)發(fā)展并提出行動(dòng)(有時(shí)甚至自動(dòng)執(zhí)行這些行動(dòng)),這是通過(guò)人工智能和機(jī)器學(xué)習(xí)之類的工具來(lái)實(shí)現(xiàn)的。”
從根本上說(shuō),數(shù)據(jù)科學(xué)家從多個(gè)來(lái)源收集并準(zhǔn)備數(shù)據(jù)集,然后應(yīng)用某種功能從中提取見(jiàn)解。在某些情況下,他們可能會(huì)涉足機(jī)器學(xué)習(xí)。在其他情況下,可能需要進(jìn)行更基本的分析。 ISG公司自動(dòng)化和創(chuàng)新總監(jiān)Wayne Butterfield說(shuō),“至少在我看來(lái),數(shù)據(jù)科學(xué)只是對(duì)數(shù)據(jù)的操縱。”
何時(shí)使用機(jī)器學(xué)習(xí)
當(dāng)面對(duì)解決方案隱藏在大量數(shù)據(jù)中的情況時(shí),機(jī)器學(xué)習(xí)將成為得力的工具。Mierswa說(shuō):“機(jī)器學(xué)習(xí)擅長(zhǎng)處理該數(shù)據(jù),只需花費(fèi)工作人員一小部分的時(shí)間就可以從中提取模式,并獲得其他方面無(wú)法獲得的見(jiàn)解。”
例如,機(jī)器學(xué)習(xí)(由數(shù)據(jù)科學(xué)提供信息)為金融服務(wù)中的風(fēng)險(xiǎn)分析、欺詐檢測(cè)和資產(chǎn)組合管理、基于GPS的旅行預(yù)測(cè),以及針對(duì)亞馬遜和Netflix的產(chǎn)品和內(nèi)容的推薦提供支持。
Butterfield說(shuō),“機(jī)器學(xué)習(xí)適合于已經(jīng)存在大量標(biāo)注良好的歷史數(shù)據(jù)或者可以非常快速地模擬數(shù)據(jù)的問(wèn)題。如果企業(yè)沒(méi)有足夠的數(shù)據(jù)可以進(jìn)行訓(xùn)練,那么使用機(jī)器學(xué)習(xí)就會(huì)花費(fèi)很多時(shí)間。”
密歇根理工大學(xué)計(jì)算機(jī)學(xué)院的計(jì)算機(jī)系統(tǒng)副教授、計(jì)算機(jī)與網(wǎng)絡(luò)系統(tǒng)研究所所長(zhǎng)Timothy Havens說(shuō),“機(jī)器學(xué)習(xí)模型只與他們學(xué)習(xí)的數(shù)據(jù)質(zhì)量一樣好,而現(xiàn)在存在許多類型的問(wèn)題,其中存在大量數(shù)據(jù)。”
Butterfield解釋說(shuō),“某些問(wèn)題非常適合機(jī)器學(xué)習(xí)。例如,數(shù)據(jù)科學(xué)(不包括機(jī)器學(xué)習(xí))多年來(lái)已被應(yīng)用到預(yù)測(cè)和計(jì)劃中,但準(zhǔn)確性有限。由于現(xiàn)在企業(yè)可以構(gòu)建可以考慮多個(gè)數(shù)據(jù)源的復(fù)雜算法,例如天氣、歷史疾病模式、外部事件、過(guò)去的需求,因此企業(yè)可以獲得更加準(zhǔn)確的預(yù)測(cè),而且不僅僅是每天一次,也可能是每小時(shí)一次。”
在金融服務(wù)中,機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)可以為保險(xiǎn)和防止欺詐提供強(qiáng)大的解決方案。在IT應(yīng)用中,可以改善網(wǎng)絡(luò)管理。醫(yī)療保健組織可以應(yīng)用機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)來(lái)提高診斷準(zhǔn)確性,確定最佳價(jià)格和數(shù)量組合或預(yù)測(cè)患者結(jié)果。在客戶體驗(yàn)管理中,他們一起改善客戶互動(dòng),預(yù)測(cè)客戶生命周期價(jià)值,并估計(jì)客戶流失。零售商可以利用它們來(lái)預(yù)測(cè)需求。優(yōu)化定價(jià)并細(xì)分客戶。在制造業(yè)中,數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)可用于使供應(yīng)鏈自動(dòng)化并改善計(jì)劃。
當(dāng)數(shù)據(jù)科學(xué)足夠的時(shí)候
圍繞著人工智能的技術(shù)應(yīng)用,每個(gè)業(yè)務(wù)問(wèn)題都開(kāi)始看起來(lái)像是一個(gè)向它投入一些機(jī)器學(xué)習(xí)的機(jī)會(huì)。但是在許多情況下,機(jī)器學(xué)習(xí)可能無(wú)法正常工作,或可能會(huì)造成更大的破壞。
Everest Group副總裁Anil Vijayan說(shuō),“有時(shí)采用數(shù)據(jù)科學(xué)就足夠了。由于界限模糊,很難將數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)明確區(qū)分。最終,大多數(shù)算法都使用統(tǒng)計(jì)技術(shù)。并不是每個(gè)問(wèn)題都需要人工智能來(lái)解決。在許多情況下,使用傳統(tǒng)數(shù)據(jù)科學(xué)可能不僅足夠,而且效率更高。”
Vijayan說(shuō),傳統(tǒng)的數(shù)據(jù)科學(xué)技術(shù)(不需要采用機(jī)器學(xué)習(xí))在輸出依賴于相對(duì)較少的參數(shù)的情況下可能更有效,而且這些參數(shù)不會(huì)隨時(shí)間發(fā)生太大的變化。此外,當(dāng)輸出和參數(shù)之間的關(guān)系被很好地理解并且不太可能改變時(shí),只采用數(shù)據(jù)科學(xué)就足夠了。
版權(quán)聲明:本文為企業(yè)網(wǎng)D1Net編譯,轉(zhuǎn)載需注明出處為:企業(yè)網(wǎng)D1Net,如果不注明出處,企業(yè)網(wǎng)D1Net將保留追究其法律責(zé)任的權(quán)利。