人工智能熱熱鬧鬧吵了一整年,IaaS玩家們坐不住了。
近一個月內(nèi),國外三大IaaS提供商AWS、Azure、谷歌云紛紛宣布以人工智能API為核心增值服務(wù)。國內(nèi)市場,阿里云在AI領(lǐng)域早有布局,12月的云棲大會上更是提出“為制造業(yè)提供人工智能ET”。
既然IaaS提供商們不約而同的將AI-aaS(AI as a Service)視為未來幾年的主要戰(zhàn)場,那么這場從IaaS到AI的蛻變,究竟是決勝未來的自我進化,還是不得已的被動競爭呢?
自我進化:市場需求決定的商業(yè)行為以及技術(shù)發(fā)展的必然結(jié)果
如果從自我進化的角度來分析IaaS提供商涉足人工智能領(lǐng)域這一現(xiàn)象,可以看到兩個方面的。
1、市場需求集中爆發(fā),IaaS提供商的自我迭代是為了滿足B端用戶的AI欲望。
2016被稱為人工智能元年,AlphaGo代表AI戰(zhàn)勝李世石,更是讓人工智能獲得了前所未有的關(guān)注,整個B端市場的欲火瞬間被AI技術(shù)所點燃,幾乎所有行業(yè)都在思考同一個問題:咱這事兒能交給機器人做嗎?
11月的AWS re:invent大會上,AWS產(chǎn)品戰(zhàn)略總經(jīng)理Matt Wood表示,在過去5-6年間出現(xiàn)了對機器學習的大量需求。在算法方面,雖然今天的算法與20年前相比沒有太多變化,但它們開始變得越來越復(fù)雜并結(jié)合了人工智能的算法。
阿里云方面,在其推出的阿里云ET算法插槽上集成的智能語音識別、智能機器人客服、圖像識別、人臉識別等AI技術(shù)基本都是從阿里內(nèi)部的技術(shù)服務(wù)團隊(最開始只服務(wù)于阿里的電商體系)孵化而來。當對人工智能技術(shù)的需求大量的出現(xiàn)在外部市場,阿里云把上述AI技術(shù)從兜里掏了出來,通過算法插槽集成在阿里云上對外開放,成為了其提供給B端用戶的人工智能產(chǎn)品或服務(wù),阿里云的用戶因此獲得了為自己的用戶提供人工智能服務(wù)的能力。
市場對人工智能需求的集中爆發(fā),讓早幾年還只是出現(xiàn)在科幻大片中的AI成為了互聯(lián)網(wǎng)未來發(fā)展的標配技術(shù)。如此一來,本就是提供互聯(lián)網(wǎng)基礎(chǔ)設(shè)施的IaaS提供商便不得不去思考與人工智能結(jié)合的途徑。
事實上,IaaS提供商在涉足AI領(lǐng)域后的許多表現(xiàn)都透露出,其實他們也不是特別清楚人工智能未來究竟會走向何處,只是先為客戶提供一些人工智能的基礎(chǔ)能力。好在像阿里云這樣的IaaS提供商有著為大阿里體系做技術(shù)支持的多年積累,真要他們拿點AI技術(shù)出來,也不算是什么難事。
2、氧氣和氫氣被點燃化合成了水,與其說主動,其實挺被動。
解釋這個話題之前先科普幾個名詞解釋:云計算、大數(shù)據(jù)、人工智能都是做什么的?
云計算:提供基礎(chǔ)計算、存儲和網(wǎng)絡(luò),提供多終端彈性可定制服務(wù);
大數(shù)據(jù):提供分布式計算和存儲等數(shù)據(jù)工程方面的支持;
人工智能:提供概率圖模型、深度學習等數(shù)據(jù)算法方面的支持。
這樣一解釋,基本就清楚了:某種意義上來說,云計算和大數(shù)據(jù)是人工智能的基礎(chǔ)。從DT時代到AI時代,如果人工智能是AI,那么DT其實就是云計算和大數(shù)據(jù),即要做人工智能,則必須要有云計算和大數(shù)據(jù)的支持。打個比方,云計算是氧氣,大數(shù)據(jù)是氫氣,二者混在一起被點燃,化合反應(yīng)生成了水,這水就是人工智能。
有數(shù)據(jù)顯示,AWS、阿里云、Azure、谷歌云幾家IaaS提供商一共占據(jù)了全球80%以上的公有云市場份額,云計算和大數(shù)據(jù)基本已經(jīng)被他們承包了。就像一個容器里既裝著氧氣又裝著氫氣,如果被點燃一定是會化合反應(yīng)成水的。
掌握著大數(shù)據(jù)和超強云計算能力的IaaS服務(wù)商,如果沒有碰AI,只能說明一個問題,市場的熱度還不足以把他們“點燃”。
在從IaaS到AI的過程中,唯一主動的工作其實是“點燃”,而這又并非IaaS提供商所主導(dǎo),而源自市場需求,或者說是火熱的人工智能市場加速了IaaS提供商擁抱AI的進程。IaaS提供商與其說是主動跑向AI,不如說是在控制了DT時代的基礎(chǔ)設(shè)施之后,自然而然的對AI時代基礎(chǔ)設(shè)施伸出了手。
IaaS服務(wù)商進入AI領(lǐng)域,這意味著,終端企業(yè)用戶通過公有云即可直接獲得語音識別、圖像識別等通用AI功能,而無需自行投資基礎(chǔ)設(shè)施、開發(fā)訓練算法。比如,阿里云提出為制造業(yè)提供人工智能ET,并與上汽、吉利、比亞迪等汽車廠商的合作,其實就是為它的B端用戶提供基礎(chǔ)的人工智能能力。
被動競爭:IaaS服務(wù)商在人工智能領(lǐng)域的競爭聚焦于AI技術(shù)入口方面
亞馬遜AWS是海外公有云市場當之無愧的霸主,根據(jù)市場研究公司Synergy Research Group的季度數(shù)據(jù)顯示,AWS云服務(wù)占全球IaaS(基礎(chǔ)設(shè)施服務(wù))公開市場45%的份額,高于微軟Azure、谷歌云和IBM的份額總和。與之相似,在國內(nèi)公有云市場,阿里云則一騎絕塵,根據(jù)摩根士丹利發(fā)布的報告顯示,2016年中國公共云市場份額約20億美元,其中阿里云獨占約50%。
業(yè)內(nèi)普遍認為,未來全球公有云領(lǐng)域的競爭其實就是亞馬遜AWS、阿里云、微軟Azure,3A之間的競爭。但隨著阿里云不斷在海外市場擴張,建立了美國西部、美國東部、歐洲、中東、澳大利亞、新加坡、香港、日本等13個數(shù)據(jù)中心,以及今年8月AWS在中國市場正式轉(zhuǎn)正,未來的IaaS行業(yè),AWS和阿里云很可能將直接展開對話。在AI-aaS時代來臨的大背景下,AWS和阿里云之間也將不得不在人工智能領(lǐng)域展開競爭。
AWS進入人工智能市場以其11月底舉辦的AWS re:invent大會為重要標志,會上AWS正式推出了自己的AI產(chǎn)品線,吳寧川老師之前為此寫過一篇非常詳細的報道(《AWS殺入人工智能,亞馬遜讓機器學習無處不在》),梳理如下。
AWS的首批AI產(chǎn)品包括支持24種語言47種聲音的文本到語音轉(zhuǎn)換服務(wù)Amazon Polly、基于深度學習的圖像和人臉識別服務(wù)Amazon Rekognition以及可編寫自然人機交互的Amazon Lex。其中,Amazon Lex使用了同樣用于Amazon Alexa的自動語言識別和自然語言理解技術(shù)。由于與AWS編程環(huán)境Lamda集成在一起,開發(fā)者可以輕松使用Lex開發(fā)各種聊天機器人和服務(wù)機器人,并把這些機器人用于網(wǎng)絡(luò)應(yīng)用、即時通信工具,或為手機及物聯(lián)網(wǎng)設(shè)備添加自然語言交互功能。
阿里云從2015年開始在人工智能領(lǐng)域的布局,今年阿里巴巴有意提高AI產(chǎn)品在大阿里體系內(nèi)的權(quán)重,施行“阿里云搭臺,人工智能唱戲”的策略。在8月、10月和12月的三次云棲大會上阿里云ET(阿里云的人工智能產(chǎn)品)集中曝光。
8月,在北京云棲大會上阿里云正式推出擁有智能語音識別、圖像或視頻識別、情感分析等技術(shù)的ET,并將其戲稱為“20年后馬云的接班人”。10月,阿里云在杭州云棲大會曝光了正在進行上線測試的“城市大腦”,即采用阿里云ET人工智能技術(shù),對城市進行全局實時分析,實現(xiàn)自動調(diào)配公共資源,修正城市運行中的Bug;12月,廣東云棲大會,阿里云表示將“為機器裝上ET大腦”,即為制造業(yè)提供人工智能ET,讓廠房里的制造機器以及制造出來的產(chǎn)品也具備ET大腦;同時,宣布在新一屆“天池大賽”上脫穎而出的人工智能算法(針對航空業(yè)客流量預(yù)測和停機位分配)將會被植入阿里云ET算法插槽,向社會開放,這些成果很快會被利用于廣州白云機場的調(diào)度。
通過上述對比,我們發(fā)現(xiàn)AWS和阿里云介入AI領(lǐng)域不約而同的聚焦于智能語音交互應(yīng)用、智能視覺應(yīng)用、數(shù)據(jù)智能應(yīng)用三個方面。顯然,它們都是AI技術(shù)的入口。
1、智能語音交互應(yīng)用
智能語音交互(Intelligent Speech Interaction)涵蓋語音識別、語音合成、自然語言理解等技術(shù),一直都被認為是人工智能最重要的入口之一,其難點在于不但要讓機器能聽會說,還要讓它能夠“懂你”。
根據(jù)AWS的官方介紹,Amazon Polly共擁有47種男性或女性的發(fā)音,支持24種語言,能夠快速實現(xiàn)從文本到語音的轉(zhuǎn)換,以及按照語境對同形異義詞的發(fā)音進行區(qū)分。
同樣,阿里云ET也基本實現(xiàn)了“能聽、會說、懂你”式的智能人機交互體驗,即識別人類的語言,并理解語境下的意思,然后做出回答。在語音合成方面,阿里云ET在今年8月的北京云棲大會上曾模仿馬云說話,這說明阿里云也已經(jīng)掌握了語音合成中的模型自適應(yīng)技術(shù)。
智能語音交互應(yīng)用的難點在于如何讓機器人和人類流暢的進行多輪對話,原因是,能夠聯(lián)系上下文的自然語言理解相比語音識別要復(fù)雜很多。關(guān)于這一技術(shù),阿里云內(nèi)部目前做得很多的是知識庫,通過后臺的知識圖譜,來完成機器人技術(shù)架構(gòu)的問答和人機交互。
2、機器視覺應(yīng)用
機器視覺應(yīng)用簡單說就是用機器人替代人眼,涵蓋了很多技術(shù)領(lǐng)域,比如視頻、圖像的分析、切割(人臉識別);視頻的結(jié)構(gòu)化;目標的檢測;物體的檢測、跟蹤;視覺搜索,等等,它背后需要有非常強的視覺算法能力支持。
AWS在機器視覺方面推出的是Amazon Rekognition,其能夠識別照片中的人臉、辨別表情,并對照片中的物體進行標記,比如識別圖像中狗的品種??陀^來說,Rekognition的能力并不突出,Google和微軟亦能夠達到同等水平。AWS對Rekognition執(zhí)行了免費政策,將其API開放給所有AWS的用戶,不過暫時僅限在美國的北維吉尼亞州、俄勒岡州和愛爾蘭提供。
阿里人工智能在機器視覺應(yīng)用上所做的工作要比AWS更多(除圖像以外,已涉及到視頻分析)并已經(jīng)實現(xiàn)了落地。比如圖像搜索技術(shù)已經(jīng)應(yīng)用在淘寶、天貓的APP上:通過拍攝任意一樣物品,然后檢索出來類似的商品。在視頻分析方面,阿里云ET在給杭州做城市大腦時,便應(yīng)用了交通行業(yè)里機器視覺的解決方案,能夠?qū)崟r準確記錄杭州所有的交通卡口,路面上的所有車流、人流、交通、車牌、車型等所有的數(shù)據(jù),并實時理解分析。相似的技術(shù)也被阿里云應(yīng)用在廣州,通過機器視覺檢測交通,判別交通流量以及路口左轉(zhuǎn)、右轉(zhuǎn)的排隊的狀況,對信號燈進行實時的檢測和調(diào)整,做紅綠燈的實時調(diào)配。從這一點來看,阿里云走在了AWS的前面。
3、數(shù)據(jù)智能應(yīng)用
對IaaS服務(wù)商來說,安身立命之本就是數(shù)據(jù)的處理和分析能力,數(shù)據(jù)智能其實是人工智能的基礎(chǔ)。在數(shù)據(jù)智能應(yīng)用方面,AWS和阿里云的發(fā)力點不盡相同。
AWS方面將亞馬遜的人工智能助手Alexa的內(nèi)核單獨了拿出來,命名為Amazon Lex,主要用來幫助用戶建立可以進行多重步驟的會話應(yīng)用,比如開發(fā)各種聊天機器人和服務(wù)機器人,并把這些機器人用于網(wǎng)絡(luò)應(yīng)用、即時通信工具,或為手機及物聯(lián)網(wǎng)設(shè)備添加自然語言交互功能。
整體來看,整個Amazon Lex與阿里云ET有部分功能的重疊,但顯然ET能做的事情要更多。此外在數(shù)據(jù)智能方面,阿里云提供了一種快速、完全托管的TB/PB級數(shù)據(jù)倉庫解決方案(Max Compute),它為阿里云ET提供了完善的數(shù)據(jù)導(dǎo)入方案以及多種經(jīng)典的分布式計算模型,讓阿里云ET能夠更快速的解決海量數(shù)據(jù)計算問題,并降低了每一次運算的成本,它也是將圖像、語音等各種人工智能應(yīng)用進行綜合的一個基礎(chǔ),阿里云在娛樂節(jié)目上做的許多預(yù)測類的“小把戲”便得益于它。
寫在最后
顯然,以AWS、阿里云為代表的IaaS玩家在DT時代是當之無愧的佼佼者,在新的AI生態(tài)布局中,他們?nèi)栽谠噲D將數(shù)據(jù)的價值最大化,同時不斷加強全球化的云計算基礎(chǔ)設(shè)施擴張。
當IaaS提供商進入AI領(lǐng)域,無論是主動迭代也好還被動競爭也罷,他們的套路是解決人工智能領(lǐng)域目前已經(jīng)出現(xiàn)的痛點和需求,這相比其他科技公司要更加務(wù)實??傊?,在AI-aaS時代來臨之時,IaaS提供商仍想繼續(xù)占據(jù)入口,始終成為時代進化的“基礎(chǔ)設(shè)施”,繼續(xù)如同“發(fā)電廠”般的存在著。