昨天亞馬遜在 re:Invent 開發(fā)者大會(huì)上宣布,AWS云計(jì)算平臺(tái)直接提供AI SaaS服務(wù),意味著這方面的創(chuàng)業(yè)機(jī)會(huì)基本消失。人工智能已經(jīng)成為云計(jì)算幾大平臺(tái)之戰(zhàn)的下一大競(jìng)爭(zhēng)點(diǎn)。本文深入分析智能時(shí)代云計(jì)算兩大巨頭亞馬遜和谷歌的競(jìng)爭(zhēng)態(tài)勢(shì),同時(shí)具體介紹“亞馬遜AI” 新服務(wù)的圖像分析、文本及語(yǔ)音轉(zhuǎn)換和自然語(yǔ)言處理功能。
亞馬遜一直在其零售業(yè)務(wù)中使用深度學(xué)習(xí)和人工智能來(lái)提高客戶體驗(yàn)。該公司聲稱,它有數(shù)千名工程師專門從事人工智能相關(guān)開發(fā),以改善搜索、物流、產(chǎn)品推薦和庫(kù)存管理。亞馬遜現(xiàn)在正在將相同的專業(yè)知識(shí)帶給云,展示了開發(fā)人員可以用來(lái)構(gòu)建智能應(yīng)用程序的API。被稱為 “亞馬遜AI”的新服務(wù)提供了強(qiáng)大的AI功能,如圖像分析,文本到語(yǔ)音轉(zhuǎn)換和自然語(yǔ)言處理。
直接提供AI Saas服務(wù),亞馬遜與谷歌的云之戰(zhàn)
云計(jì)算是企業(yè)計(jì)算的未來(lái),而云計(jì)算的巨人是一家從未有人想到過(guò)的公司——亞馬遜。
那還是在谷歌和微軟為了辦公軟件彼此掐架的那一年,亞馬遜推出了 Amazon Web Services(AWS),AWS 體現(xiàn)出了亞馬遜這家公司的本身:它具有很強(qiáng)的可擴(kuò)展性和清晰定義的強(qiáng)化接口。用戶——首先是亞馬遜自己,然后是世界各地其他公司——可以使用“原語(yǔ)”(primitives)并將其混搭,從而構(gòu)建一個(gè)更高效、可擴(kuò)展并且安全的后端,這是幾乎任何一家公司靠自己都無(wú)法建立的。
AWS 的產(chǎn)品現(xiàn)在已經(jīng)遠(yuǎn)遠(yuǎn)不止(虛擬)處理器、硬盤驅(qū)動(dòng)器和數(shù)據(jù)庫(kù)等基礎(chǔ)架構(gòu),其成功的基礎(chǔ)是亞馬遜“純平臺(tái)的方法”:它們?yōu)槠髽I(yè)提供了幾乎任何企業(yè)想要的東西。
另一方面,谷歌則是一家產(chǎn)品公司;實(shí)際上,谷歌常常被作為蘋果的對(duì)手——區(qū)別是前者提供的是服務(wù),后者提供的是產(chǎn)品——沒(méi)有人把谷歌真正視為一家平臺(tái)公司。但是,當(dāng)你把產(chǎn)品定義為“為終端用戶提供的最終解決方案”時(shí),你就會(huì)發(fā)現(xiàn)亞馬遜跟谷歌實(shí)際上十分相似。
產(chǎn)品公司和平臺(tái)公司的區(qū)別是很大的,前者無(wú)論是提供智能手機(jī)還是搜索引擎,都需要擁有極高的用戶體驗(yàn)和設(shè)計(jì),其后端工程理論上是不為終端用戶所見的。
但是,亞馬遜還有微軟這兩家 IT 時(shí)代的卓越平臺(tái)公司,采取的恰好是與此相反的模式:沒(méi)有集成多個(gè)部件交付最終產(chǎn)品,AWS 將構(gòu)建后端服務(wù)的所有部件分解為完全模塊化的部件;在這方面微軟對(duì)其 Win32 API 的做法也一樣。是的,這意味著在設(shè)計(jì)上 Windows 的最終用戶體驗(yàn)比 Mac OS 更糟糕,但 Windows 更強(qiáng)大、更具可擴(kuò)展性,就靠這一個(gè)方法,Windows 擁有數(shù)以百萬(wàn)計(jì)的商用App,甚至在今天也仍然處于操作系統(tǒng)的中心。AWS 為后端服務(wù)做了與此完全相同的事情,AWS 的靈活性和模塊化是它擊敗谷歌 2008 年推出的最初的云產(chǎn)品 Google App Engine的主要原因。使用Google App Engine,你必須接受大量谷歌代你做出的決定;而使用 AWS 讓你能構(gòu)建自己真正所需要的東西。
現(xiàn)在,機(jī)器學(xué)習(xí)將越來(lái)越多地被云服務(wù)所主導(dǎo):兩者都涉及處理可擴(kuò)展的和大量的數(shù)據(jù),只有極少數(shù)的巨頭才擁有巨額資金,不僅建立所需要的基礎(chǔ)設(shè)施,并且雇用世界上最好的機(jī)器學(xué)習(xí)工程師。這就意味著,對(duì)于大多數(shù)企業(yè)來(lái)說(shuō),機(jī)器學(xué)習(xí)所產(chǎn)生的差異,首先取決于他們的數(shù)據(jù)是否在云中(當(dāng)然也會(huì)有內(nèi)部部署的解決方案,但預(yù)計(jì)隨著時(shí)間的推移,內(nèi)部部署會(huì)越來(lái)越落后),其次就是它們選擇哪家云服務(wù)供應(yīng)商。
優(yōu)秀的機(jī)器學(xué)習(xí)產(chǎn)品不僅可以作為一項(xiàng)差異化,而且是可持續(xù)的:更好的機(jī)器學(xué)習(xí)將吸引更多的客戶,從而獲得更多的數(shù)據(jù),而數(shù)據(jù)是機(jī)器學(xué)習(xí)不斷改進(jìn)的燃料。正因如此,擁有海量數(shù)據(jù)的谷歌是AWS在云計(jì)算中的最大威脅。
谷歌的巨大優(yōu)勢(shì)是,這家公司在近二十年的時(shí)間里已經(jīng)使用了大量的數(shù)據(jù),并在過(guò)去幾年開發(fā)了功能強(qiáng)大的機(jī)器學(xué)習(xí)算法。盡管如此,數(shù)據(jù)仍然是最重要的,最好的證據(jù)是去年,谷歌開源了TensorFlow——谷歌意愿與世人分享它的方法和知識(shí)產(chǎn)權(quán),從側(cè)面表明谷歌擁有優(yōu)越的數(shù)據(jù)和信息處理基礎(chǔ)設(shè)施,而這些都是可持續(xù)的優(yōu)勢(shì)。
就在感恩節(jié)之前,谷歌發(fā)布了一系列產(chǎn)品公告,明確利用其數(shù)據(jù)優(yōu)勢(shì):
Cloud Natural Language API,能夠使用機(jī)器學(xué)習(xí)分析文本
Cloud Translation API 的高級(jí)版本,使用機(jī)器學(xué)習(xí),大幅提高了 8 種語(yǔ)言翻譯的準(zhǔn)確性(相比支持超過(guò)100種語(yǔ)言的標(biāo)準(zhǔn)版本性能要高級(jí)很多)
使用機(jī)器學(xué)習(xí)分析圖像的 Cloud Vision API 大幅降價(jià)
新的Cloud Jobs API,使用機(jī)器學(xué)習(xí)將職位與潛在員工匹配起來(lái)
谷歌花了很多年的時(shí)間磨煉其算法,因此在將這些算法應(yīng)用于企業(yè)數(shù)據(jù)集時(shí),其結(jié)果非??赡艿玫礁玫慕Y(jié)果,或者至少遠(yuǎn)遠(yuǎn)低于訓(xùn)練時(shí)的漏洞。我認(rèn)為這一優(yōu)勢(shì)將持續(xù)下去,并且影響巨大。
盡管如此,谷歌仍然需要做更多的工作,這也是為什么谷歌要挖來(lái)李飛飛和李佳,讓她們帶領(lǐng)新成立的云端機(jī)器學(xué)習(xí)小組:這個(gè)小組將負(fù)責(zé)開發(fā)新的商用機(jī)器學(xué)習(xí)API。換句話說(shuō),其任務(wù)是將谷歌的機(jī)器學(xué)習(xí)功能產(chǎn)品化。
這一點(diǎn)顯示了谷歌在戰(zhàn)略上的精明:谷歌在第一波云計(jì)算時(shí)顯然落后于亞馬遜,因?yàn)楫?dāng)時(shí)成功取決于哪家公司有最好的平臺(tái);通過(guò)開源Kubernetes,谷歌正在試圖將競(jìng)爭(zhēng)平面轉(zhuǎn)向產(chǎn)品。畢竟,改變競(jìng)爭(zhēng)規(guī)則通常比改變公司的根本性質(zhì)更容易。
谷歌的成功并不確定:該公司不得不面對(duì)“銷售vs廣告”的新業(yè)務(wù)模式,并建立一個(gè)不僅對(duì)銷售,而且對(duì)整個(gè)企業(yè)的支持必不可少的組織。這些都是亞馬遜占優(yōu)勢(shì)的領(lǐng)域,亞馬遜還有一個(gè)相當(dāng)規(guī)模的的合作伙伴生態(tài)系統(tǒng)和更大的特征集。
當(dāng)然,AWS 還有自己的機(jī)器學(xué)習(xí) API,類似 IBM 和微軟。微軟可能在這方面更強(qiáng):不僅公司內(nèi)已經(jīng)在這方面有了多年的研究,而且也有產(chǎn)品化的經(jīng)驗(yàn)。谷歌長(zhǎng)期以來(lái)的“消費(fèi)者焦點(diǎn)”有時(shí)也會(huì)是障礙,而且谷歌也還不使用自家產(chǎn)品。
不過(guò),谷歌將是強(qiáng)大的競(jìng)爭(zhēng)對(duì)手:其戰(zhàn)略相當(dāng)合理,而且更重要的是,其開發(fā)新業(yè)務(wù)的想法相比10年前更顯急切。最重要的是,云計(jì)算仍處于剛開始的階段,雖然亞馬遜似乎已經(jīng)走出了挺遠(yuǎn),但未來(lái)仍然是未來(lái)。谷歌將如何改變未來(lái)的規(guī)則,讓我們拭目以待。
亞馬遜三大人工智能產(chǎn)品
這個(gè)新平臺(tái)將把亞馬遜多年來(lái)在其內(nèi)部開發(fā)的許多機(jī)器學(xué)習(xí)應(yīng)用開放給外部開發(fā)者。當(dāng)前,該服務(wù)提供了三種工具,但未來(lái)還將增加更多工具。
亞馬遜公司 CEO Andy Jassy 強(qiáng)調(diào)說(shuō),亞馬遜本身在機(jī)器學(xué)習(xí)方面已經(jīng)深耕多年,“我們公司內(nèi)已經(jīng)做了很多 AI 的研究,”他說(shuō):“我們上千名專注于 AI 的研發(fā)者。”
亞馬遜 AI 平臺(tái)推出的這些新服務(wù)中的第一個(gè)是名為“Rekognition”的圖像識(shí)別服務(wù)。該服務(wù)類似于谷歌、微軟等公司的同類服務(wù),能夠識(shí)別圖像中的物體和場(chǎng)景。亞馬遜強(qiáng)調(diào)它的系統(tǒng)非常智能,例如能夠識(shí)別圖像中狗的品種。雖然很厲害,但其他競(jìng)爭(zhēng)對(duì)手公司也能做到。Jassy 說(shuō)這項(xiàng)服務(wù)很有成本效益,但他沒(méi)有公布價(jià)格。
第二個(gè)是名為“Amazon Polly”的語(yǔ)音合成服務(wù),該服務(wù)同樣使用了機(jī)器學(xué)習(xí)技術(shù)。Jassy 指出,Polly 能合成非常生活化的語(yǔ)言,說(shuō)“Polly 專門為語(yǔ)音合成中的非常具有挑戰(zhàn)性的方面而設(shè)計(jì),例如,‘I live in Seattle’和‘Live from New York’,這兩句話中‘live’雖然拼寫相同,但發(fā)音不同,而 Polly 能理解這些并正確發(fā)音。”Polly 支持24種語(yǔ)言,有47種聲音,包括男聲和女聲。
第三個(gè)新服務(wù),也是最重要的一個(gè),名為“Lex”。Jassy 說(shuō),Lex 本來(lái)是支持亞馬遜自己的 Alexa 服務(wù)的技術(shù),能用于構(gòu)建具有多步對(duì)話功能的聊天應(yīng)用。開發(fā)者可以在 Lex Console 上設(shè)計(jì)對(duì)話,僅用幾個(gè)對(duì)話樣本即能訓(xùn)練聊天機(jī)器人。
Lex 與 Lambda 以及其他 AWS 的服務(wù)深度集成,而且也有與其他一些企業(yè)服務(wù)的接口。此外,它還與 Facebook Messenger、Slack 和 Twilio 集成,使得它不局限于亞馬遜自己的設(shè)備,能夠嵌入其他任何設(shè)備中。
亞馬遜在今天的發(fā)布中說(shuō):“Amazon Lex 可以用來(lái)構(gòu)建聊天機(jī)器人(chatbots)以及其他形式的網(wǎng)頁(yè)/移動(dòng)應(yīng)用,支持非常生動(dòng)的、生活化的互動(dòng)。”“建成的聊天機(jī)器人能夠?yàn)橛脩籼峁┵Y訊、管理應(yīng)用程序、簡(jiǎn)化工作、甚至能作為機(jī)器人、無(wú)人機(jī)、玩具等的控制程序。”
投資MXNet
亞馬遜還投資了MXNet,這是一個(gè)可在各種環(huán)境中運(yùn)行的深度學(xué)習(xí)框架。除此之外,亞馬遜還在優(yōu)化EC2圖像,以運(yùn)行流行的深度學(xué)習(xí)框架,包括CNTK,TensorFlow 和 Theano。
關(guān)于這件事,MXNet的創(chuàng)建成員之一李沐不久前在知乎上寫道:能夠讓AWS放棄自己造的輪子,并且明確的表示會(huì)支持一個(gè)主要由開源社區(qū)開發(fā)的系統(tǒng),其實(shí)非常不容易。對(duì)于AWS來(lái)說(shuō),最關(guān)心的是用戶體驗(yàn),然后是買資源賺錢。這里最保險(xiǎn)的是支持所有流行的DL框架。但AWS能夠強(qiáng)調(diào)說(shuō)未來(lái)會(huì)大力投入MXNet,主要是對(duì)框架的發(fā)展前景和小伙伴們工作的肯定。
MXNet最早就是幾個(gè)人抱著純粹對(duì)技術(shù)和開發(fā)的熱情做起來(lái)的興趣項(xiàng)目,既沒(méi)有指望靠它畢業(yè),也沒(méi)想著用它賺錢。能夠一步一步慢慢的擴(kuò)大,我覺(jué)得最重要的是每個(gè)小伙伴對(duì)這個(gè)事情的投入,和抱著降低深度學(xué)習(xí)門檻的使命。也是讓大家只需要關(guān)心“數(shù)據(jù)量和運(yùn)算量”,而不是如何有效實(shí)現(xiàn)利用硬件;只需要“數(shù)學(xué)公式寫好,根本就不想知道你支持哪些layer,分別是干什么的”,不用管自動(dòng)求導(dǎo)如何訓(xùn)練;只需要“把手上的數(shù)據(jù)交出去給云即可,然后花錢租算力”,而不是云上如何管理如何優(yōu)化。