機(jī)器學(xué)習(xí)(ML)是人工智能的一個分支,它涉及創(chuàng)建計(jì)算機(jī)系統(tǒng),可以在沒有明確編程的情況下學(xué)習(xí),其應(yīng)用將越來越廣泛。德勤公司在其對2018年的技術(shù)、媒體和電信預(yù)測中表示:“2018年,大中型企業(yè)將加大對機(jī)器學(xué)習(xí)的使用力度,該技術(shù)的實(shí)施和試點(diǎn)項(xiàng)目數(shù)量將比2017年翻一番,到2020年將會再次翻番。”
同樣,在IDC公司最新的預(yù)測中,包括機(jī)器學(xué)習(xí)(ML)解決方案在內(nèi)的認(rèn)知和人工智能系統(tǒng)的支出將在2021年達(dá)到50.1%的復(fù)合年均增長率(CAGR),市場規(guī)模將達(dá)到576億美元。
IDC認(rèn)知/人工智能系統(tǒng)研究總監(jiān)David Schubmehl表示:“組織正在開發(fā)基于機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的下一代智能應(yīng)用項(xiàng)目,以及其他認(rèn)知/人工智能技術(shù)。隨著企業(yè)競相將預(yù)測性和規(guī)范性功能嵌入其應(yīng)用程序組合,人工智能成為企業(yè)和商業(yè)發(fā)展迅速擴(kuò)大的領(lǐng)域。”
此外,據(jù)埃文斯數(shù)據(jù)公司最近的調(diào)查顯示,650萬技術(shù)開發(fā)人員正在使用某種形式的人工智能或機(jī)器學(xué)習(xí),另有580萬開發(fā)人員計(jì)劃在六個月內(nèi)開始使用人工智能或機(jī)器學(xué)習(xí)。鑒于全球有超過2200萬的開發(fā)人員,這意味著大多數(shù)(大約56%)的人已經(jīng)在使用這些技術(shù),或者很快就會這樣做。
而人工智能或機(jī)器學(xué)習(xí)的許多開發(fā)項(xiàng)目正在云端進(jìn)行。Evans Data補(bǔ)充道:“那些正在使用人工智能或機(jī)器學(xué)習(xí)的開發(fā)人員中,有59%的人使用基于云計(jì)算的后端進(jìn)行人工智能或機(jī)器學(xué)習(xí)的開發(fā),因此我們估計(jì)大約有380萬開發(fā)人員在做這個事情。”
那么開發(fā)人員使用云計(jì)算機(jī)器學(xué)習(xí)工具構(gòu)建的應(yīng)用程序有哪些?為什么有些開發(fā)人員選擇基于云計(jì)算的工具而不是其他類型的軟件?
云計(jì)算機(jī)學(xué)習(xí)用例
基于云計(jì)算的機(jī)器學(xué)習(xí)的用例與其他類型的機(jī)器學(xué)習(xí)的用例非常相似。一般來說,MLaaS平臺非常適合需要分析大量數(shù)據(jù)的應(yīng)用程序。如果這些數(shù)據(jù)已經(jīng)存儲在云端,MLaaS平臺可能會更具吸引力。
例如,IDC公司曾表示,零售和金融服務(wù)行業(yè)將成為機(jī)器學(xué)習(xí)技術(shù)的最大嘗試者之一。對于這兩類公司而言,欺詐檢測是一個關(guān)鍵問題。而且,如果他們的交易數(shù)據(jù)已經(jīng)駐留在公共云中,那么使用由同一供應(yīng)商提供的MLaaS平臺是有意義的。對于在線開展業(yè)務(wù)的零售公司來說,基于云計(jì)算機(jī)器學(xué)習(xí)平臺的推薦引擎可能有助于增加銷售。其他用于云計(jì)算機(jī)學(xué)習(xí)的良好用例可能包括商業(yè)智能、風(fēng)險分析、IT安全、金融交易等。
另一方面,數(shù)據(jù)駐留在網(wǎng)絡(luò)邊緣的應(yīng)用可能不是采用云計(jì)算機(jī)學(xué)習(xí)的一個好選擇。最明顯的例子是自動駕駛汽車。由于延遲問題,自動駕駛汽車將花費(fèi)一定時間將數(shù)據(jù)傳輸?shù)皆贫诉M(jìn)行分析,然后在做出行駛決策之前再返回指令,顯然云計(jì)算不能滿足這樣的實(shí)時要求。
同樣,物聯(lián)網(wǎng)(IoT)和醫(yī)療保健診斷也不是適合采用基于云計(jì)算的機(jī)器學(xué)習(xí)的行業(yè)領(lǐng)域,因?yàn)樗鼈兛赡苓€需要大量的數(shù)據(jù)傳輸。但專家們表示,在某些情況下,采用云計(jì)算可能還是有意義的。一般來說,他們建議在仔細(xì)權(quán)衡可用選項(xiàng)的優(yōu)缺點(diǎn)后選擇機(jī)器學(xué)習(xí)平臺。
基于云計(jì)算的機(jī)器學(xué)習(xí)的好處
云計(jì)算機(jī)學(xué)習(xí)相對于其他類型的機(jī)器學(xué)習(xí)解決方案的最大優(yōu)點(diǎn)之一是,它可以使組織能夠訪問高性能的基礎(chǔ)設(shè)施,而這些基礎(chǔ)設(shè)施本身可能無法承受。機(jī)器學(xué)習(xí)應(yīng)用需要大量的處理能力,而提供這種功率級別的系統(tǒng)在傳統(tǒng)上非常昂貴。如今,許多組織使用依賴圖形處理單元(GPU)來處理機(jī)器學(xué)習(xí)工作負(fù)載的系統(tǒng),在云端租用這些系統(tǒng)通常比直接購買這些系統(tǒng)更加經(jīng)濟(jì)實(shí)惠。
但是值得人們注意的是,在不久的將來,支持機(jī)器學(xué)習(xí)的基礎(chǔ)設(shè)施可能會變得更加實(shí)惠。德勤公司的報告指出,開發(fā)新型芯片可以使機(jī)器學(xué)習(xí)成本降低10倍到100倍,甚至1000倍。
云計(jì)算機(jī)學(xué)習(xí)的另一個與成本相關(guān)的好處是可以輕松獲得經(jīng)濟(jì)實(shí)惠的數(shù)據(jù)存儲。隨著數(shù)據(jù)量的不斷增長,許多企業(yè)發(fā)現(xiàn),將冷數(shù)據(jù)轉(zhuǎn)移到公共云系統(tǒng)比繼續(xù)將其存儲在自己的數(shù)據(jù)中心上成本要低很多。如果數(shù)據(jù)已經(jīng)存儲在公共云中,那么使用基于云計(jì)算的機(jī)器學(xué)習(xí)服務(wù)通常也是有意義的。將大量數(shù)據(jù)從一個地方遷移到另一個地方可能會花費(fèi)大量的時間,并為項(xiàng)目增加大量費(fèi)用。但是,如果一個組織可以輕松地將機(jī)器學(xué)習(xí)工具應(yīng)用于云端而不用遷移數(shù)據(jù)的話,那么這可能是使用MLaaS的強(qiáng)有力的理由。
基于云計(jì)算的機(jī)器學(xué)習(xí)的最后一個主要好處是由MLaaS或其他機(jī)器學(xué)習(xí)的自動化供應(yīng)商提供的開發(fā)工具可以簡化在應(yīng)用程序中嵌入機(jī)器學(xué)習(xí)的過程。應(yīng)用程序開發(fā)人員和數(shù)據(jù)科學(xué)家與機(jī)器學(xué)習(xí)專業(yè)知識的競爭非常激烈,這需要企業(yè)提高人員的薪金。很多組織負(fù)擔(dān)不起甚至找不到工作人員來創(chuàng)建和使用機(jī)器學(xué)習(xí)應(yīng)用程序。
MLaaS產(chǎn)品推出了讓民眾成為數(shù)據(jù)科學(xué)家的承諾,讓沒有編碼專業(yè)知識或高級學(xué)位的商業(yè)專業(yè)人員使用機(jī)器學(xué)習(xí)。例如,谷歌公司最近宣布了AutoML,它表示將“使人工智能可以訪問所有業(yè)務(wù)”。
許多機(jī)器學(xué)習(xí)廠商表示,他們的客戶能夠快速獲得基于云計(jì)算的機(jī)器學(xué)習(xí)解決方案。機(jī)器學(xué)習(xí)廠商DataRobot公司副總裁兼銀行總經(jīng)理Greg Michaelson表示:“大規(guī)模部署機(jī)器學(xué)習(xí)可能是一個復(fù)雜的過程。但是,像AWS公司這樣的云計(jì)算服務(wù)和自動化機(jī)器學(xué)習(xí)的結(jié)合使得組織能夠在幾分鐘內(nèi)啟動并運(yùn)行,這使得他們的團(tuán)隊(duì)能夠快速構(gòu)建世界級的預(yù)測模型,從數(shù)據(jù)中獲得關(guān)鍵的洞察力。”
基于云計(jì)算機(jī)器學(xué)習(xí)面臨的挑戰(zhàn)
盡管云計(jì)算機(jī)器學(xué)習(xí)平臺有很多好處,組織仍然需要克服一些挑戰(zhàn)才能使用它們。這些挑戰(zhàn)中最大的問題是缺乏熟練的工作人員。
谷歌公司在其AutoML公告中指出,目前,世界上只有少數(shù)企業(yè)才能夠獲得所需的人才和預(yù)算,以充分了解機(jī)器學(xué)習(xí)和人工智能的發(fā)展。并且能夠創(chuàng)建高級機(jī)器學(xué)習(xí)模型的人數(shù)非常有限。如果是可以使用機(jī)器學(xué)習(xí)和人工智能工程師的公司之一,那么仍然需要管理構(gòu)建自己的自定義機(jī)器學(xué)習(xí)模型的時間密集型和復(fù)雜的過程。雖然谷歌公司通過執(zhí)行特定任務(wù)的API提供了預(yù)訓(xùn)練的機(jī)器學(xué)習(xí)模型,但是如果想要把人工智能引入每個公司,那么還有很長的路要走。
而MLaaS平臺使機(jī)器學(xué)習(xí)更容易,但它們?nèi)匀徊蝗菀讘?yīng)用。
人工智能的風(fēng)險投資基金機(jī)構(gòu)DCVC公司的創(chuàng)始合伙人Bradford Cross曾經(jīng)在博客中表示,MLaaS產(chǎn)品將會遭遇失敗,因?yàn)?ldquo;知道自己在做什么的人只是使用開源,而不會使用任何東西工作的人,甚至是使用API??。”
時間會告訴人們,云計(jì)算機(jī)器學(xué)習(xí)產(chǎn)品是否能夠?qū)崿F(xiàn)機(jī)器學(xué)習(xí)的民主化目標(biāo),但他們面臨著一個艱難的挑戰(zhàn)。
云計(jì)算機(jī)器學(xué)習(xí)平臺的另一個大問題是所有公共云所共有的問題:供應(yīng)商鎖定。組織擔(dān)心,如果他們開始使用太多的單個供應(yīng)商提供的服務(wù),而其采用另一個供應(yīng)商提供的服務(wù)將變得非常困難。而這反過來又可能使它們?nèi)菀资艿皆朴?jì)算服務(wù)提供商的價格上漲的影響。
整合來自不同數(shù)據(jù)源的數(shù)據(jù)也會造成障礙。許多機(jī)器學(xué)習(xí)項(xiàng)目都依賴于來自許多不同地方的數(shù)據(jù)。無論組織是使用云計(jì)算機(jī)器學(xué)習(xí)平臺還是其他類型的機(jī)器學(xué)習(xí)解決方案,收集這些數(shù)據(jù)并將其轉(zhuǎn)換為可用的數(shù)據(jù)都是一項(xiàng)艱巨的任務(wù)。
這給所有機(jī)器學(xué)習(xí)項(xiàng)目帶來了另一個挑戰(zhàn)——臟數(shù)據(jù)。當(dāng)Kaggle公司對數(shù)據(jù)科學(xué)工作者的最大障礙進(jìn)行調(diào)查時,49.4%的受訪者選擇的第一個反應(yīng)是骯臟的數(shù)據(jù)。如果依賴于不良信息,世界上最好的機(jī)器學(xué)習(xí)工具將不會有效,并且使數(shù)據(jù)進(jìn)入可用狀態(tài),繼續(xù)為數(shù)據(jù)科學(xué)專業(yè)人士消耗大量時間和精力。
云計(jì)算機(jī)器學(xué)習(xí)的替代品
組織有很多其他MLaaS平臺的替代品。如前所述,許多專業(yè)數(shù)據(jù)科學(xué)家選擇使用開源機(jī)器學(xué)習(xí)工具,如TensorFlow,Apache Spark的MLlib或Caffe。此外,許多企業(yè)選擇從Alpine Data,Dataiku,DataRobot,Domino Data Lab,F(xiàn)ICO,H2O.ai,RapidMiner,SAS和Statistica等廠商購買預(yù)測分析和機(jī)器學(xué)習(xí)解決方案。許多這樣的軟件(無論是專有的還是開源的)都可以部署在內(nèi)部部署數(shù)據(jù)中心或云端。
此外,許多其他類型的企業(yè)軟件也具備一些機(jī)器學(xué)習(xí)功能。一些組織發(fā)現(xiàn),他們已經(jīng)使用或正在考慮購買的商業(yè)智能、CRM、營銷情報、安全情報、電子商務(wù)或其他類型的解決方案具有他們所需的機(jī)器學(xué)習(xí)功能。因此,一些組織可能不需要建立自己的機(jī)器學(xué)習(xí)應(yīng)用程序。
流行的云計(jì)算機(jī)器學(xué)習(xí)服務(wù)
即使有了所有這些替代方案,隨著組織增加使用機(jī)器學(xué)習(xí),云計(jì)算機(jī)器學(xué)習(xí)平臺仍然越來越受歡迎。以下的圖表提供了一些最著名的云機(jī)器學(xué)習(xí)工具的概述:
版權(quán)聲明:本文為企業(yè)網(wǎng)D1Net編譯,轉(zhuǎn)載需注明出處為:企業(yè)網(wǎng)D1Net,如果不注明出處,企業(yè)網(wǎng)D1Net將保留追究其法律責(zé)任的權(quán)利。