雖然沒有谷歌、微軟、Facebook在AI上的名氣那么大,但亞馬遜的AI方面積累很深厚,一直在默默投入。到底亞馬遜在AI方面做了哪些事情,他們是如何與現(xiàn)有的業(yè)務,如云、電商相結合的呢?外媒siliconAngle對亞馬遜AWS的AI負責人Swami Subramanian進行了專訪,雷鋒網(wǎng)將文章編譯如下。
亞馬遜通常不會和谷歌、微軟、Facebook以及IBM一同出現(xiàn)在人工智能領導者的名單上。不過這種情況即將發(fā)生變化。
亞馬遜首席執(zhí)行官杰夫·貝佐斯(Jeff Bezos)最近在他每年致股東的公開信中透露,他很看重機器學習技術,這項AI的分支技術能夠教會電腦在不需要明確的編程情況下即可完成學習,這是公司未來成敗的關鍵。
像今天的其他AI領導者一樣,亞馬遜專注于深度學習神經(jīng)網(wǎng)絡,旨在以原始方式模仿大腦學習的方式。在過去幾年中,深度學習技術促使語音和圖像識別取得了巨大的進步,使亞馬遜的Alexa語音助手和Google的無人駕駛汽車都變?yōu)楝F(xiàn)實。
Bezos指出,亞馬遜的一些工作是顯而易見的,例如Alexa,Prime Air快遞無人機以及使用機器學習來收費的Amazon Go商店。其他機器學習工作主要在幕后,供電需求預測,產(chǎn)品建議等等,而Bezos希望它能夠產(chǎn)生最大的影響。
關注領域
下一階段是使用Amazon Web Services云服務向開發(fā)者群體推廣機器學習,降低使用成本,提高易用性。亞馬遜去年秋天開始通過云服務,推出新的服務,例如Lex,Alexa,使得機器學習技術能夠配合開發(fā)人員進行工作??梢杂脕韯?chuàng)建會話界面,如機器人,以及文本轉(zhuǎn)語音的Polly和圖像分析及相關任務的Rekognition。
“客戶已經(jīng)開發(fā)出強大的系統(tǒng),應用領域從早期的疾病檢測到農(nóng)作物增產(chǎn)。”貝佐斯說。“看著這個領域。還有更多的事情會發(fā)生。”
機器學習服務對于幫助亞馬遜在逐漸加劇的云計算戰(zhàn)爭中戰(zhàn)勝競爭對手具有重要意義,谷歌和微軟都希望在與這家西雅圖線上零售巨頭的較量中獲得成功。事實上,很明顯,亞馬遜想要成為未來智能應用時代的主要技術供應商。
“亞馬遜的下一個支柱可能是AI,”與其Prime會員免費送貨服務和AWS本身一樣重要,CB Insights在新的報道中說。“亞馬遜比以往任何時候都有希望成為一家平臺公司。”
通過比較其他公司,如Gartner,它有一個辦法在云機器學習產(chǎn)品方面趕上微軟和谷歌。過去一周在舊金山舉行的AWS Summit峰會上,該公司宣布了新的更新和功能,旨在開始補救這種情況。
亞馬遜AI副總裁Swami Sivasubramanian
為了更深入地了解亞馬遜的機器學習計劃, silliconangel對負責Amazon Web Services(AWS)的亞馬遜AI副總裁Swami Sivasubramanian,在開發(fā)者會議上進行了采訪。以下是對話的文字編輯版本:
問:請闡述亞馬遜在機器學習中所涉及的工作范圍。
答:有三層。頂層的應用程序,如Lex,Polly和Rekognition是預先訓練的深度學習模型,提供應用程序編程接口,適合于不想了解任何有關深度學習的應用程序開發(fā)人員,但希望構建可以聽,說或看的智能應用程序。
下一層是像亞馬遜機器學習這樣的API平臺服務,還有EMR [Elastic MapReduce,用于分析大量數(shù)據(jù)]等各個部分,適合那些想要建立自己的機器學習模型,基于Redshift的數(shù)據(jù)之上[ AWS數(shù)據(jù)倉庫]或關系數(shù)據(jù)庫。而我的團隊努力的下一個層面就是深度學習框架和機器學習算法。
我的團隊的一大堆科學家正在研究核心深度學習框架。在AWS,我們非常開放,支持所有深度學習框架,如從Apache MXNet到TensorFlow到Caffe到Theano等等。
問:廣義而言,你想在這里達到什么目標?
答:我們的目標是基本上將人工智能AI技術民主化,使每個開發(fā)人員都可以使用AI。在很大程度上,即使在今天建立人工智能,在許多情況下需要在機器學習領域做得很好的博士研究人員。
我們希望能夠構建新的智能應用程序,實際上可以做人類能夠做的事情,例如能看、能聽或能說或能理解。而且我們使企業(yè)能夠根據(jù)自己存儲在AWS中的數(shù)據(jù)做出明智的決策。
問:我們在哪里可以看到相關的行動?
答:Netflix已經(jīng)建立了一個使用深度學習的推薦引擎來向客戶展示他們應該看的內(nèi)容。 Pinterest已經(jīng)做了圖像識別。我們使用Amazon內(nèi)的機器學習實現(xiàn)物流自動化,所以當您單擊訂單購買某物時,機器人將使用計算機視覺和深度學習來選擇和發(fā)送貨物。我們還使用它來增強現(xiàn)有產(chǎn)品,例如X-Ray,這是一款酷炫的亞馬遜即時視頻功能軟件,它使用計算機視覺和深度學習,因此當你暫停視頻時,它會告訴你頁面中所有演員是誰。
我們也在使用它來創(chuàng)建新的產(chǎn)品系列。大家現(xiàn)在都知道Alexa。我使用了兩年Alexa,它像是家里的真人一樣。而與亞馬遜Go一起,這項技術為部分無結帳體驗提供支持,實際上我們可以看到誰正在走過去拿起一些東西或放下它。
問:亞馬遜最近在談論AI,但Google,微軟,F(xiàn)acebook等公司獲得了更多關注,亞馬遜希望改變這一點不?
答:在亞馬遜,我們傾向于更加專注于和客戶相關的事項。以亞馬遜Go為例,我們說:“這是一個無結賬的零售體驗,可以幫助客戶更快地購物。”我們不會說,“嘿看這個,這是一個很棒的深度學習應用,順便提一下它非常有用。”Alexa也是一樣。我覺得我是一個科學家,但我更喜歡這個是因為我的家人喜歡和Alexa交談。
也就是說,亞馬遜多年來一直在機器學習和人工智能方面投入巨資,我們在科學界一直非常公開,做出了我們的貢獻,并且相當開放。我們今年提交的多篇文章,研究論文等。在MXNet中,我們在代碼提交方面貢獻了35%。
問:什么改變使得有大約20年歷史的深度學習算法如今變得好很多?
答:三件事。
一、現(xiàn)在,我們有能力以便宜的方式存儲所有這些數(shù)據(jù),而無需為這些存儲供應商支付大量資金。
二,使用專業(yè)計算設備。 GPU [圖形處理單元]和FPGA[現(xiàn)場可編程門陣列]芯片已經(jīng)解鎖并用于這些應用。
最后一個方面是一旦建立和訓練了這些東西,我們就可以通過預配置的模板輕松地將分布式培訓基礎架構擴展到數(shù)百個GPU。多虧了云計算,現(xiàn)在編程工作變得非常簡單。
下一步是什么
問:亞馬遜多大程度會專注于應用現(xiàn)有技術,而不是提出新的算法或技術?
答:我們在許多領域進行基礎創(chuàng)新研究 - 語言識別,自然語言理解,視覺理解。如果退回到十年之前,我們必須推動深度學習技術的進步,使其交到客戶手中后能夠正常使用。像Alexa,既便如此受歡迎,我們還是需要發(fā)明新的算法,以獲得我們想要的客戶體驗。對于Amazon Go,我們必須大幅度提高深度學習和計算機視覺領域的技術水平。
我們也在這里的核心引擎進行基礎研究,如深度學習框架。我們有一個在深度學習引擎上工作的團隊,繼續(xù)努力擴展系統(tǒng)。我們的客戶有他們想要處理的PB級別的大量數(shù)據(jù) - 圖像,視頻等。隨著需要處理的數(shù)據(jù)量不斷增加,可擴展性將成為未來幾年的主要區(qū)別之一。
問:您的機器學習模型是否也可以在云服務網(wǎng)絡的邊緣工作,例如等不及從中央云回復的無人駕駛汽車?
答:我們認為,為云構建的模型也可以在邊緣運行。我們構建的深度學習模型可以在傳統(tǒng)的計算機環(huán)境中運行,也可以運行在EC2 [AWS的彈性計算云服務]或Lambda [AWS的自組織計算服務]中。Greengrass [允許離線操作和數(shù)據(jù)的本地處理的軟件,無需云服務]是在邊緣設備中運行的良好環(huán)境。我的團隊移植了一個MXNet深度學習模型,可以識別表中的對象,他們可以在Raspberry Pi相機上運行[內(nèi)置一個小巧便宜的電腦]。
目標是要有一個混合體,一些深度學習模型將在邊緣運行,用于快速使用情況,一些在云中可用于更復雜的用例。這是Alexa工作的方式。這就是為什么我們看到這種新的混合模式的部署,可能在未來更有趣。
問:機器學習的下一步是什么?
答:我的女兒已經(jīng)兩歲了,她看到兩只西紅柿后,就能認出西紅柿是什么樣子的。她不需要觀察一千個西紅柿。這就是為什么我認為深度學習還處于起步階段。實際上,今天存在的技術可以用非常有限的數(shù)據(jù)來提高深度學習模型的準確性。
我們一直在嘗試這些東西。有時人們不需要絕對的準確性。即使像視覺搜索這樣的東西,人們只要能夠獲得更好的覆蓋面,就愿意向更低的精度妥協(xié)。
所以接下來還有更多的事情會發(fā)生。如果這是在亞馬遜公司的機器學習領域工作的第一天,那我們則是剛剛醒來,甚至都沒有喝一杯咖啡。