沈向洋無懼BAT逼宮:微軟培養(yǎng)了中國很多IT公司CTO

責(zé)任編輯:editor006

2017-05-12 17:47:08

摘自:新智元

沈向洋博士:說到人工智能,大家今天激動得不得了,我自己也覺得有些東西是真的已經(jīng)在發(fā)生了。沈向洋博士:我剛才提到在一些感知方面,從計(jì)算機(jī)視覺到計(jì)算機(jī)語音,我自己是覺得我們都是領(lǐng)先的。

(原標(biāo)題:沈向洋無懼BAT逼宮:微軟培養(yǎng)了中國幾乎所有 IT 公司的CTO,5000人撐起AI四大方向)

沈向洋無懼BAT逼宮:微軟培養(yǎng)了中國很多IT公司CTO

2017年05月10日,微軟全球執(zhí)行副總裁、微軟人工智能及微軟研究事業(yè)部負(fù)責(zé)人沈向洋博士(Harry Shum)在微軟全球開發(fā)者大會(Build)發(fā)表主旨演講后,接受了包括新智元在內(nèi)的幾家受邀媒體的采訪。

采訪中,沈向洋博士認(rèn)為Cortana代表了AI的未來,他多次提到Conversational AI,也即對話式AI。在他看來,智能語音市場遠(yuǎn)遠(yuǎn)沒有飽和,各大巨頭都在做智能語音助理,正表明這是一個正確的方向,而在亞馬遜Alexa/Echo,谷歌Google Home等先入產(chǎn)品面前,微軟的機(jī)會仍然有很多。微軟將利用小娜、小冰的優(yōu)勢,從語音方面發(fā)力。

所不同的是,沈向洋提到,他認(rèn)為“AI對人類情感的理解將會是非常了不起的一件事”,“大多數(shù)的人還沒有認(rèn)識到能夠不斷聊下去這件事情的重要性”。而在這一點(diǎn)上,微軟的小冰遙遙領(lǐng)先于其他智能語音助理,平均多輪對話次數(shù)是目前業(yè)界最高的23次。不過,沈向洋也表示,微軟的Conversational AI會“兩條腿走路”,既要發(fā)揮Cortana的商務(wù)助理優(yōu)勢,也要充分挖掘小冰在情感聊天方面的優(yōu)勢。

當(dāng)被新智元問及去年微軟組建的5000人規(guī)模AI團(tuán)隊(duì)的具體組織架構(gòu)時,沈向洋并沒有直接回答。但他表示,搜索引擎、以Cortana為代表的智能語音助理、用AI幫助微軟現(xiàn)有產(chǎn)品轉(zhuǎn)型,以及用AI開發(fā)全新的產(chǎn)品線,是當(dāng)前微軟AI團(tuán)隊(duì)主要發(fā)力的4個方向。尤其是最后一點(diǎn),沈向洋堅(jiān)信,AI將顛覆所有的商業(yè)應(yīng)用,那么在這其中,決定去做什么、不去做什么,是微軟AI當(dāng)前最重要的事情。

至于關(guān)注度很高的微軟AI人才流失,沈向洋似乎對此并不是太擔(dān)心,他告訴新智元:“我覺得人才流動非常正常,一個大公司培養(yǎng)了很多的人才,最重要的是一個公司你要知道你存在的價值和理念,這體現(xiàn)在優(yōu)秀的員工為什么會選擇留在你這里,不光是你到外面挖人,你給在這里員工提供什么樣非常了不起的環(huán)境,讓他在這里面有非常好的發(fā)展。”對于其他公司來微軟“挖角”,沈向洋反而感到非常自豪,認(rèn)為體現(xiàn)了微軟為中國AI乃至整個IT行業(yè)培養(yǎng)了優(yōu)秀的人才。

沈向洋還表示,在去年微軟重組構(gòu)建5000人規(guī)模AI團(tuán)隊(duì)后,他就成立了一個“微軟人工智能學(xué)院”,培養(yǎng)相當(dāng)一批微軟內(nèi)部人才,“我們希望通過這樣的方式,可以吸引更多外面的人才來微軟。這么做,并不是我們擔(dān)心又有人挖我們AI的人才,更重要的是,要把我們的人才培養(yǎng)成‘AI capable’。”

接下來,在回答其他媒體記者提問時,沈向洋表示,未來10年左右,計(jì)算機(jī)視覺可以識別一切。他認(rèn)為未來3到5年,垂直領(lǐng)域AI將有所發(fā)展,看好toB的業(yè)務(wù),而未來5到10年,他認(rèn)為“可解釋的AI”是一個非常值得研究的方向,這方面肯定會有重要突破。此外,沈向洋還表示,認(rèn)知計(jì)算將成為Azure的“重中之重”,看來在智能云(Intelligent Cloud)方面,谷歌與微軟也勢必有精彩的角逐。

采訪中,沈向洋提到他非常享受做研究的過程,可惜他“后來被鮑爾默趕出來去做產(chǎn)品”。此外,沈向洋認(rèn)為“可以從安卓興起的過程當(dāng)中學(xué)習(xí)很多東西,深度學(xué)習(xí)下一波浪潮當(dāng)中怎么樣可以做的更好,我不覺得微軟一家公司可以把這些東西都做出來。”

如何回應(yīng)騰訊等公司爭搶微軟AI人才?

新智元:有一個問題,微軟怎么應(yīng)對人才流失?說實(shí)話,像騰訊已經(jīng)把研究院開到西雅圖了。

沈向洋博士:上次我跟馬化騰講,我說你太不像話了,把研究院開到我們門口了。小馬哥還有點(diǎn)不好意思,還有點(diǎn)靦腆。我覺得人才流動非常正常,一個大公司培養(yǎng)了很多的人才,最重要的還是說任何一個公司你要知道你存在的價值和理念,這體現(xiàn)到優(yōu)秀的員工為什么會選擇留在你這里,不光是你到外面挖人,你給在這里的員工提供什么樣非常了不起的環(huán)境,讓他在這里面有非常好的發(fā)展。你去問問騰訊,騰訊的人才也在不斷流失,騰訊以前沒有AI的人才,所以他必須就要去挖人,去百度挖也好,去別的地方挖也好,都很正常。大家到西雅圖開研究院,對西雅圖本地經(jīng)濟(jì)太好了。在中國還出去招商,把人拉過來,像微軟、亞馬遜或者到其他的大公司,我們也有責(zé)任把西雅圖本地經(jīng)濟(jì)帶動起來。

新智元:就像您剛才說的一樣,如何要留住AI人才,就是這個公司的實(shí)力了。不過,從現(xiàn)在的新聞來看,從微軟研究院出去的人很多。

沈向洋博士:對,我上次在烏鎮(zhèn),跟劉云山書記報告的時候,跟大家說微軟公司在中國,為中國IT產(chǎn)業(yè)培養(yǎng)了無數(shù)的優(yōu)秀人才,我說你不僅要看到中國幾乎所有IT公司的CTO都是我培養(yǎng)的,從聯(lián)想到海爾到小公司,我說你更加要看到微軟研究院在過去18年,培養(yǎng)了5000個學(xué)生,那些才是真正了不起的,新一代的創(chuàng)業(yè)公司出來——現(xiàn)在可能不會是這樣的情況——當(dāng)時計(jì)算機(jī)視覺、AI公司剛起來的時候,那些投資人來問我一些情況,我說你不要跟我講,在中國開計(jì)算機(jī)視覺的公司,要么是我的學(xué)生開的,要么是我的學(xué)生的學(xué)生開的,這都非常光榮的事情?;剡^頭來看,微軟研究院、微軟公司對中國的IT發(fā)展,很多方面都起了巨大的正面作用,特別是為中國培養(yǎng)了非常多的一流人才。

新智元:那您現(xiàn)在也覺得微軟繼續(xù)對外輸出人才也是很自豪的?

沈向洋博士:我們一直覺得非常自豪,微軟研究院一直覺得非常自豪。我們培養(yǎng)了李開復(fù),我們培養(yǎng)了張亞勤,我們培養(yǎng)了趙峰、我們培養(yǎng)了芮勇,芮勇還是我學(xué)弟,這些都非常好,我們都覺得非常光榮。

新智元:接下來繼續(xù)有高級的研究員離職的話,你們?nèi)匀挥X得很光榮?

沈向洋博士:你具體應(yīng)該去問問那些離開的人,他們是不是還是研究員,你聽懂我的意思啊?你問問他們最近研究了什么,叫他寫個算法給你看一看。

我再補(bǔ)充一下,微軟最近在做一件非常重要的事情,就是人才方面的。6個月前我率領(lǐng)的AI這個部門組建后不久,我就成立了一個“微軟人工智能學(xué)院”,培養(yǎng)相當(dāng)一批微軟內(nèi)部人才,我們希望通過這樣的方式,可以吸引更多外面的人才來微軟。這么做,并不是我們擔(dān)心又有人挖我們AI的人才,更重要的是,要把我們的人才培養(yǎng)成“AI capable”,所以我們就有一字頭的課、二字頭的課、三字頭的課,一直到六字頭的課,類似研究生這樣的課。我最近剛剛做完一期AI 611這門課,專門做hands-on project,深度學(xué)習(xí)具體項(xiàng)目。有10個項(xiàng)目,非常了不起,他們這門課結(jié)束的時候,我專門用了2小時去聽了他們的報告,非常好!所以,我們現(xiàn)在就是在不斷培養(yǎng)AI的人才,既包括內(nèi)部的人才培養(yǎng),也包括吸引外面的人才參加。

在LinkedIn發(fā)布的全球和中國科技企業(yè)最佳雇主的排名上,微軟在全球排名第二,僅次于谷歌。但是在中國,微軟超越了谷歌,成為最佳雇主。詳細(xì)情況參見新智元公眾號的二條報道:《LinkedIn 技術(shù)VP王迪專訪 | 全球AI人才聚集,Top10中美公司排行榜》。

微軟5000人AI軍團(tuán):發(fā)力搜索、Cortana等四大方向

新智元:微軟去年做了重組,您率領(lǐng)一個5000人規(guī)模的AI團(tuán)隊(duì),但是對具體的組織架構(gòu),我們一直都沒有太多的了解,希望您能在這方面介紹一下,這5000人的團(tuán)隊(duì)具體的側(cè)重點(diǎn)、方向、人事架構(gòu)是怎么樣的。我相信5000人還是分布在世界各地吧,這時候你們采取怎樣的聯(lián)系方式?

沈向洋博士:我們通常都不會對外部講具體的架構(gòu)和人事,內(nèi)部當(dāng)然任何一個單位都有一個組織架構(gòu)。不過,我可以簡單跟你講一下,微軟發(fā)展AI主要還是在4個方面。

第一,搜索引擎方面。你可以同意,也可以不同意我的意見,那就是今天世界上最大的人工智能可能還是搜索引擎,微軟Bing這么多年下來做了知識圖譜,超過25億的實(shí)體(entities)。這里面就有很多的知識,搜索引擎本身不僅僅是一個業(yè)務(wù)——當(dāng)然現(xiàn)在Bing也很賺錢,我們在美國占22.6%的搜索市場份額,再加上雅虎的11%(后臺技術(shù)是微軟做的),所以我們在美國有1/3的搜索份額,在英國最近漲到16.5%。從AI的角度來講,搜索引擎主要就是World Knowledge——對世界知識的積累。

第二,非常非常重要的一件事情就是Cortana,這是一個私人的智能數(shù)字助理,我覺得Cortana代表了AI的未來,對人的了解。要做好AI需要三個方面的知識,一個是你對世界的理解,一個是你對工作的了解,一個是你對用戶的了解,這三件事情在一起的話,才可以做得非常好。我覺得小娜在朝著這個方向走,要去做這個事情當(dāng)然要有很大的投入在里面。

第三,其他的公司和微軟一起合作,怎么樣令A(yù)I 幫助微軟(所有產(chǎn)品的)轉(zhuǎn)型。我剛才提到Office,也提到Cloud,也提到Windows,我們一起做。同時,我們把這樣的一些技術(shù)拿出來給其他所有Microsoft開發(fā)者去做,比如認(rèn)知服務(wù)(Cognitive Service),這也是我在演講的重點(diǎn)。認(rèn)知服務(wù)這么多年一直都是我們AI部門在做,其中有很多的技術(shù)是從微軟研究院做出來的。

第四,也是我自己覺得非常激動的一點(diǎn),我在主旨演講的最后稍微提了一下,沒有機(jī)會展開講,那就是Every Business App is going to be Disrupted by AI——“所有的商業(yè)應(yīng)用都會被AI顛覆”。所以,我們微軟正在這里面選擇哪些方向,哪些商業(yè)的AI機(jī)會我們會去挖掘,希望能夠在不久的將來有機(jī)會跟大家再分享這邊的進(jìn)展。

新智元:目前這些方向還是在探討階段中嗎?

沈向洋博士:我們已經(jīng)做了很多的產(chǎn)品原型,甚至很多的產(chǎn)品和服務(wù)已經(jīng)有很多人在用了。我在我的演講中也提到,從銷售到市場到售后,這些我們都有在做。

對話式AI:微軟有一些不同看法

新智元:現(xiàn)在有很多公司都將Conversation AI作為一個入口,但也有人認(rèn)為對話是一個偽需求。從剛才您的介紹當(dāng)中,我是否可以這樣理解,微軟跟其他公司所不同的,是微軟的對話平臺是從情感這個角度去切入?

沈向洋博士:微軟不僅從幫助你完成任務(wù)的角度,微軟同時也非常關(guān)注情感方面的研發(fā),我覺得我們是兩條路同時在走,我們小娜是幫助你,你有什么事情,我?guī)椭阏业叫枰膯栴},同時我們小冰更加是從情感的角度,陪你聊天,試圖理解你,跟你不斷對話。這里面大家的設(shè)計(jì)理念是非常的不一樣,比如你要幫人完成任務(wù),你希望越快越好,你要陪人聊天的話,你要能夠聊越久越好,這兩件事情從產(chǎn)品和設(shè)計(jì)上是非常不一樣的。

大多數(shù)的人還沒有認(rèn)識到能夠不斷聊下去這件事情的重要性,我給你講一個數(shù)字,大家都不見得知道。一個人一天講幾句話?事實(shí)上,人一天可以講6000句以上,你可能都沒有認(rèn)識到這一點(diǎn)。為什么人要不斷講話,這絕對不會是因?yàn)橐瓿梢患虑椋侨祟愖陨韺W(xué)習(xí)的過程,通過對話、通過交流,跟不同的人學(xué)到不一樣的東西,這一點(diǎn)是微軟做AI,特別是對話式的AI,非常注重的一點(diǎn),其他的公司不見得都很注重。

沈向洋無懼BAT逼宮:微軟培養(yǎng)了中國很多IT公司CTO

  當(dāng)前微軟AI最重要的事情:決定做什么和不做什么

以下是專訪現(xiàn)場沈向洋博士回答其他記者提問的實(shí)錄。

問:微軟全力投入AI,您的部門會繼續(xù)擴(kuò)編嗎?

沈向洋博士:你這個問題要問我們CEO(笑),我覺得一定會的。

問:接下來的首要任務(wù)是什么,有沒有一個發(fā)展的進(jìn)程,比如短期和長期的規(guī)劃?

沈向洋博士:是有的。任何一個企業(yè),一個單位,特別是大了以后,一定要去想短期的目標(biāo)是什么,中期的希望是什么,長期的愿景是什么,一定要從這個角度去想。我的部門比較特別的地方就是,我除了 AI 以外,還管研究院。在研究院我們有1000多位科學(xué)家,剛才新智元的同事也問道,我覺得最重要的就是,要不斷培養(yǎng)一代一代新的了不起的研究員,去做更了不起的技術(shù)。

例如我剛才提到,人工智能(更多在離散的空間做符號處理)和腦科學(xué)(更多在Neural神經(jīng)元做連續(xù)處理)這兩個空間的融合。符號可解釋的空間和連續(xù)的腦空間之間的關(guān)系,三五年前基本上沒有什么人研究這些方向。我認(rèn)為更重要的就是應(yīng)該培養(yǎng)新一代,看到這樣的問題。如深度學(xué)習(xí),要去解釋它。

回到您剛才問的,微軟有些什么樣的目標(biāo)?我覺得看得蠻清楚的,短期的話AI還是要看到短期業(yè)務(wù),哪里有真正的商業(yè)價值。就是我們可以掙一些錢,定個小目標(biāo),這都非常重要。但是,更重要的事情是 AI 這個部門成立之后,我們要想清楚如果我們真的覺得AI會顛覆更多的行業(yè)應(yīng)用,在顛覆的過程當(dāng)中,我們的機(jī)會在哪。

主要是兩個方面:一個是在現(xiàn)有的產(chǎn)品,比如Office等跟AI結(jié)合,將會有哪些顛覆性的內(nèi)容產(chǎn)生,有什么新的產(chǎn)品出來,有什么新的功能出來,這邊的話我們進(jìn)展得非常好;另外一個你要去想,新的產(chǎn)品線在哪里,你有沒有一條新的產(chǎn)品線出來,三五年以后可以做到十億美元的生意。要思考,你有沒有這樣的業(yè)務(wù),五到十年可以做到一百億美元的生意。如果有,當(dāng)然要放馬去追求這樣的機(jī)會。所以我們現(xiàn)在整個AI部門最重要的事情,就是決定要做什么,決定不做什么。

未來10年左右,計(jì)算機(jī)視覺可以識別一切;未來5到10年,可解釋的AI是一個值得研究的方向,肯定會有重要突破

問:Harry你好,您之前提到的人工智能研究方向大致可以分為感知和認(rèn)知兩方面。我想請您以更加技術(shù)的語言來說明一下兩者的趨勢,可以舉個例子講一講。

沈向洋博士:說到人工智能,大家今天激動得不得了,我自己也覺得有些東西是真的已經(jīng)在發(fā)生了。首先,你要回過頭來看,為什么會有“人工智能”這個詞,“人工智能”實(shí)際上是對應(yīng)于“人類智能”提出來的,就是human intelligence。

為什么覺得人有智能,人的智能基本上分成兩部分,一部分是感知,另一部分是認(rèn)知。感知是里面最了不起的,而其中最大的一部分就是視覺的感知。以前有人做過這樣的研究,一個人大概91%的信息是從視覺收集過來的,我忘記了他用什么樣的方法算出來這個數(shù)字,但是我想大家基本上會同意,人絕大多數(shù)感知都來自于視覺。然后是聽覺,然后才是其他的感知,比如觸覺。

我覺得這邊的進(jìn)展非常大,過去這一年我都在講,計(jì)算機(jī)語音識別的突破最多是5年的事情,也就是說5年之內(nèi)計(jì)算機(jī)語音,不管你怎么去講它都能識別,而且肯定會比人類強(qiáng)。然后,接下來10年左右的時間,計(jì)算機(jī)視覺也會達(dá)到這一點(diǎn),今天視覺很多東西已經(jīng)超過人,具體來講比如人臉識別。但我講的是一個很general的,anything is recognizable,到一個新地方,AI看到一個新東西能夠聯(lián)想到其他東西,這些我認(rèn)為大概十年左右的時間可以實(shí)現(xiàn)。

但是在認(rèn)知方面,今天我們遠(yuǎn)遠(yuǎn)沒有獲得突破,都談不上跟人類相比的地步。首先是自然語言處理的問題,然后就是知識獲取的問題。越來越多的人更應(yīng)該去做這方面的工作。自然語言處理,我剛才也提到機(jī)器閱讀,語言這個問題,相對來講的確是比較復(fù)雜。用今天現(xiàn)有的方法,包括深度學(xué)習(xí)的方法,解出來的效果還不是足夠好,當(dāng)然用深度學(xué)習(xí)已經(jīng)可以幫助到我們很多東西,比如像翻譯也用了很多自然語言的東西。

更重要的,今天大家對整個“認(rèn)知”這樣的一件事情的定義,還在一個比較初級的階段,什么叫做常識(Common Sense)?你怎么知道見到這個人以后,為什么會對他很有一種親近的感覺?這些我們還不是很理解,而這是一個很大的問題。稍微岔開一點(diǎn)講,很重要的問題,今天我們個人工智能做的這些東西,和腦科學(xué)的結(jié)合不夠,理解也不夠。很主要的原因就是對“智能”的很多東西,只有人腦這樣一個范本,但人腦結(jié)構(gòu)很特別,今天我們還不夠理解。腦科學(xué)作為一門科學(xué),今天也還處在一個早期的階段,我們還不能做太多的實(shí)驗(yàn),也不能隨時把一個人的腦袋打開塞一些東西進(jìn)去。

這個是一個長期的問題,現(xiàn)在越來越多的人也在想這樣的問題。連接人工智能和腦科學(xué),今天有一個方向我們覺得是很激動人心,現(xiàn)在在微軟研究院很多的人在做這方面的事情,我也跟很多大學(xué)有一些合作,就是所謂的“可解釋的AI”(Explainable AI)。我認(rèn)為,Explainable AI在接下來5到10年,肯定可以做出非常了不起的成果。今天我如果有研究生的話,我就會讓他們做這個方向的工作,原因非常簡單,因?yàn)榻裉霢I最大的突破就是深度學(xué)習(xí),但是深度學(xué)習(xí)的一個最大的問題就是,出來的結(jié)果非常好,但是你沒法解釋。

我自己看到的,這方面寫得最好的一篇文章,是最近在《紐約客》的一篇有關(guān)醫(yī)療AI的。為什么看同一張圖,醫(yī)生會跟你講,你沒問題,原因是一、二、三。但今天AI還做不到這點(diǎn),深度學(xué)習(xí)做不到這點(diǎn),很大的問題是大家解問題的空間不一樣,醫(yī)生是在一個所謂的neural,腦的這樣一個連續(xù)的空間在解,而AI很多的理解是在符號的離散的空間上去做。

所以,如何把這些東西連起來,從技術(shù)上有講有很多有待突破的地方,也是我們現(xiàn)在研究院很認(rèn)真在做科研的一個方面。

問:微軟現(xiàn)有的一些成果或者說優(yōu)勢都有哪方面?

沈向洋博士:我剛才提到在一些感知方面,從計(jì)算機(jī)視覺到計(jì)算機(jī)語音,我自己是覺得我們都是領(lǐng)先的。

問:有沒有這方面的數(shù)據(jù),或者特別強(qiáng)有力的案例?

沈向洋博士:我們是第一個做到語音識別達(dá)到人類水準(zhǔn),特別是在最難的數(shù)據(jù)級switch bot data set,在我演講里面提到,6個月之前我們已經(jīng)做到這一點(diǎn)。在計(jì)算機(jī)視覺方面,我們兩年前第一次做到物體識別(Object Recognition)跟人一樣的準(zhǔn)確率。接下來,我希望我們在自然語言理解方面也能有所突破。翻譯也是這樣,翻譯的質(zhì)量特別是Spoken Language(口語語言),我們肯定也是世界領(lǐng)先的水平。但是有那么多的語言要去做,還有很多工程方面的問題要去解決,今天微軟也只提供60種語言而已,世界上有6500多種語言,怎么樣把人工智能普及化,也是我們要考慮的。

微軟亞洲研究院不是公益組織,研究員對公司是有責(zé)任的,要把技術(shù)轉(zhuǎn)化為產(chǎn)品

問:怎么樣把研究院里研究實(shí)際去產(chǎn)品化和商業(yè)化。您在成立這個團(tuán)隊(duì)的時候,從研究到產(chǎn)品的流程有什么變化嗎?另外一個是開發(fā)新的產(chǎn)品,比如大會第一天上的Demo,幫助患帕金森癥的設(shè)計(jì)人員重新執(zhí)行作畫,怎么樣把這樣的研究個案去擴(kuò)展開來?

沈向洋博士:這是一個非常好的問題,不知道在座有多少人做過研究,科研是很不一樣的東西,很多人不明白,說這么多人做科研,怎么還沒有產(chǎn)品化??蒲芯褪且粋€很長期的東西,你要么就不要說自己做科研,要做科研就要有耐心。比如今天大家談的熱火朝天的量子計(jì)算,具體哪天量子計(jì)算機(jī)可以做出來,沒有人知道。有人知道還得了,VC會像狼一樣撲出去了(笑)。在這一點(diǎn)上,美國的這套系統(tǒng)還是值得我們學(xué)習(xí)。從大學(xué)開始,到研究所,再到工業(yè)界。以前的AT&T和IBM,再到現(xiàn)在的微軟,很多公司愿意花很多的錢出來做長期的科研,而絕大多數(shù)的科研成果不僅僅屬于本公司,只是自己的公司有可能得到利益。這一點(diǎn)我們蓋茨講得非常清楚,比如蘋果和微軟早期的成功,很重要的就是圖形用戶界面,而 graphic interface 最早是施樂做出來的,我們跟他們學(xué)習(xí)。同樣,今天微軟做了很多了不起的事,但是可能其他一些公司,甚至一些初創(chuàng)公司還會做得更好,這都是很正常的。

而且,做科研是非常愉快的一件事情,做科研最愉快的事情就是根本不用擔(dān)心別人在想什么,你自己拍拍腦袋想想就可以,要有一個了不起的想法——我以前是多么的享受做科研,后來被鮑爾默趕出來去做產(chǎn)品。

最近我跟微軟亞洲研究院同事交流,其實(shí)我們能夠提供最了不起的東西是一個環(huán)境,這個環(huán)境里面不光是大家的待遇還不錯,更重要的是邊上有比自己更聰明的人,你可以向他們學(xué)習(xí)。第二,在微軟研究院我們提供一個自由的空間,從來沒有要求你一定要做什么,研究員你自己想做什么,你覺得應(yīng)該做什么,就去做什么。因?yàn)槟阋呀?jīng)是最聰明的人之一了,才進(jìn)得了微軟研究院。有幾個人選擇要走了,出去做VC啊,換一家公司啊,這都很正常,我們就不斷再培養(yǎng)下一代的人,重要的就是你要有一個能夠不斷培養(yǎng)人才的環(huán)境。

當(dāng)然,因?yàn)槟悴皇且粋€公益的研究院,當(dāng)然對公司是有責(zé)任的,包括最重要的一件事情,就是從技術(shù)到產(chǎn)品的轉(zhuǎn)化。目前,AI本身今天很多的東西還在研究階段,所以今天微軟重組,把AI和研究院放在同一個部門——我覺得非常榮幸能夠領(lǐng)導(dǎo)這樣的部門——我們看到了非常多的機(jī)會。怎么從技術(shù)到產(chǎn)品轉(zhuǎn)化這個問題,可能今天最好的例子就是認(rèn)知服務(wù),其中大概2/3的技術(shù)是原來微軟研究院做的,而且做了很多年,以前我們不是很清楚,一些計(jì)算機(jī)視覺的技術(shù)怎么轉(zhuǎn)化成產(chǎn)品。但是因?yàn)橛蠥zure,有認(rèn)知服務(wù)這樣的機(jī)會,很多很多的微軟研究院的技術(shù),都已經(jīng)通過認(rèn)知服務(wù)轉(zhuǎn)化成為產(chǎn)品。

我再給你舉兩個例子,今年7月份在夏威夷,我會去計(jì)算機(jī)視覺最大的國際會議CVPR,今年他們請我做主題演講,我演講的題目就是“Commercialize Computer Vision – Success Stories and Lessons Learned”。這里面我會舉三個例子,一個是認(rèn)知服務(wù),另外一個例子是我們最近推出了一款很了不起的相機(jī)iOS App,叫Microsoft Pix,大家有機(jī)會可以試一試。第一版出來的時候,里面就有12篇以前的論文做基礎(chǔ)。當(dāng)然有很多其他的公司相機(jī)應(yīng)用做的非常好,包括iPhone本身的camera做的也相當(dāng)好。

第三個例子是我最喜歡的HoloLens,它研發(fā)的過程是“研和發(fā),研和發(fā)”不斷循環(huán)的過程。HoloLens這幫人之前就是做Kinect,Kinect做出來微軟研究院就做了Kinect Fusion,又做了一個項(xiàng)目叫Holodesk,如果是三維的東西,你怎么樣加一些三維的虛擬物體進(jìn)去。后來微軟有一批非常了不起的做產(chǎn)品和設(shè)計(jì)的工程師,他們想到要在此基礎(chǔ)上做成HoloLens,在這個過程當(dāng)中,里面很多計(jì)算機(jī)視覺、語音的技術(shù)都是微軟研究院一起做的,是一個共同研發(fā)的過程。

到最后你還是要有產(chǎn)品,因?yàn)閷ζ樟_大眾來講,他不會去看論文,也不知道你的論文有多了不起。你要跟人解釋,最容易解釋的方法就是你給人看看你的產(chǎn)品,HoloLens馬上就會被人看到,我們希望有機(jī)會做一些更了不起的產(chǎn)品,不光是對消費(fèi)者,更多是針對企業(yè)用戶的產(chǎn)品。我個人認(rèn)為,三五年內(nèi),對AI而言最大的機(jī)會還是在企業(yè)市場中。

微軟的Cortana與谷歌Home和亞馬遜Echo有何不同

問:您剛才把微軟的Cortana還有Google、亞馬遜的相關(guān)產(chǎn)品對比,講到各家service都是很不同的,您能不能給我講個例子展開一下。此外,國內(nèi)AI公司有一個觀點(diǎn),認(rèn)為如果做純2B的開發(fā)者的生意,如果提供工具,本身可能不是一個在國內(nèi)環(huán)境下很好的商業(yè)模式,覺得很苦不賺錢。但您對Cortana 的定義就是一款2B的工具。我比較好奇您怎么看?

沈向洋博士:第一個問題比較簡單,我想強(qiáng)調(diào)一下,其他公司在做digital assistance都做得很好,但都非常難做。最近有個人在網(wǎng)上做了一些調(diào)查,好像75%的時候,如果你問Alexa問題,她會說“我沒有答案”(I don’t have an answer)。實(shí)際上,今天語音這個東西,不會是因?yàn)橛幸患乙呀?jīng)做了怎么樣,其他人就不用做了,[市場還]遠(yuǎn)遠(yuǎn)沒有[飽和]到這個地步,谷歌也在做,亞馬遜也在做,蘋果也在做,微軟也在做,國內(nèi)很多公司也在做,非常好,這個方向至少大家都看得很清楚。就像無人駕駛車一樣,大家都在做無人駕駛車,已經(jīng)沒有人討論這件事會不會發(fā)生。

在這樣一個設(shè)計(jì)的過程當(dāng)中,因?yàn)樗旧砭徒衐igital assistant,幫助你把事情做好。大家想的都是怎么樣盡快找到你需要的東西,盡快幫你完成這樣的工作,在這樣的設(shè)計(jì)過程當(dāng)中,完成任務(wù)的時間越短越好。另外一條思路,很特別的地方,我覺得還沒有太多的人做的是從聊天機(jī)器人:我是你的同伴,我是陪伴你的,我不幫你解決任何問題。從微軟研究院來說,我們是在兩條腿走路,這肯定是我們最不一樣的地方。

剛才新智元的記者也問到,微軟是不是只做情感方面?不是這樣的,我們是兩條腿走路。這里面就像我剛才講的有world knowledge、work knowledge、user knowledge,能夠幫助你解決問題。另外一個怎么樣可以得到你的信任,怎么樣可以跟你繼續(xù)做朋友,怎么樣跟你繼續(xù)聊下去,在這個過程當(dāng)中不斷積累知識。我們用的產(chǎn)品設(shè)計(jì)metrics,你能夠和你這個Agent可以聊多少個來回。Cortana也好、Siri也好,Google Now大概就是三個來回,相當(dāng)于對話一個半來回。你問Siri,西雅圖的天氣怎么樣?它說,還是下雨,你就沒什么問題問了。但小冰就不一樣,小冰我們今天的最高對話次數(shù)是23個來回,你不斷有這樣的機(jī)會可以和它交流,在交流當(dāng)中再去學(xué)習(xí)。我想強(qiáng)調(diào)的,并不是我們只做一個不做另外一個,就是助理(服務(wù))和情感(陪伴)我們兩邊都要做。

第二就是你講的2B的問題,我也聽很多人講,對于一個提供商用AI服務(wù)的初創(chuàng)公司來講,面對像微軟這樣能稿提供很好的AI服務(wù)的公司,小公司有沒有這樣的一些商業(yè)的機(jī)會繼續(xù)活下去?這個問題我自己是這么看:今天提供這樣所謂的API,我也覺得一般小公司可能比較難做,因?yàn)橛泻艽蟮耐度耄召M(fèi)的方式各方面還要跟很多大公司競爭。

我認(rèn)為很重要的一件事,接下來商業(yè)的機(jī)會還是在于所謂的business AI。因?yàn)樗恳粋€vertical都必須要用AI,要去做這樣的東西,你得一定要真的深入到某一個垂直行業(yè)中,必須要有很特別的data,你必須要有這樣的用戶,能夠用到AI的應(yīng)用部署出去,這樣你可以做反饋。大多數(shù)的AI今天的技術(shù)不可能做到100%,甚至都不可能做到90%,它里面有很多的錯誤。比如Alexa、Siri、Cortana,今天來講,很多時候它都沒有真正回答你的問題。但是你需要有足夠多的用戶,他愿意繼續(xù)用你這樣的AI應(yīng)用,給你提供反饋,給你提供數(shù)據(jù)。我自己是很看好垂直行業(yè)的。

認(rèn)知計(jì)算會成為Azure重中之重;深度學(xué)習(xí)可以從安卓如何崛起中借鑒

問:您剛才的演講里面主要是兩大塊,一塊是AI怎么幫助開發(fā)者更好的去開發(fā)更c(diǎn)ustomize應(yīng)用場景,另外一塊說重新定義(redefine)。我想問一下,微軟通過人工智能對產(chǎn)品重新定義具體怎么做,有什么樣的規(guī)劃?

沈向洋博士:這個問題非常好,我今天講的主要是三個方面。AI的三大方面,第一,你要有非常強(qiáng)大的運(yùn)算能力;第二,你要有非常了不起的算法;第三,你一定要有自己的數(shù)據(jù)。

我用微軟的例子來介紹一下,在微軟,我們當(dāng)然相信,微軟所有的產(chǎn)品都必須要AI化,重新去定義這樣的產(chǎn)品。我們現(xiàn)在很注重的地方是兩個方面,一個是在所有的Office產(chǎn)品,在主旨演講中我給大家看了 PowerPoint一個功能,就是翻譯(translate)。其實(shí)PowerPoint他們還做了另外一個,我自己非常喜歡的,所謂的圖說生成(image caption):來一張照片,PowerPoint圖說生成可以自動給你出圖片說明,這個我們已經(jīng)做得相當(dāng)好了。

PowerPoint很多人用。這樣的數(shù)據(jù)可以幫助我們不斷改善一些算法。前不久我們也發(fā)布Word,Word里面使用AI技術(shù),這也非常非常重要。

這里面還有很多AI的技術(shù)都才剛剛開始,我自己覺得Office最激動人心的技術(shù)就是所謂的機(jī)器閱讀。前不久微軟買了一個加拿大的初創(chuàng)公司叫做Maluuba ,主要就是做這方面的工作,用自然語言、深度學(xué)習(xí)的方法來做這個東西。深度學(xué)習(xí)里面一個很重要的問題,就是回答問題。我覺得對Office的影響會非常巨大,所以我們AI部門的同事和Office的同事一起在做。

另外一個就是在云這里,大家合作非常多,你到Azure.com主頁的產(chǎn)品里面,Cognitive Services的內(nèi)容放置最顯著的位置上,這是Scott和我,跟我們產(chǎn)品團(tuán)隊(duì)的同事review了以后決定,Cognitive Services會變成Azure的重中之重。Windows還有很多AI,像HoloLens還有很多AI的技術(shù),計(jì)算機(jī)視覺、計(jì)算機(jī)語音方面。

陸奇去了百度,你們會跟他們合作嗎

問:您剛才講到微軟在vertical領(lǐng)域跟一些服務(wù)商、應(yīng)用商之間的合作,在平臺方面,像谷歌、亞馬遜、百度這方面的合作,怎樣去解決社會責(zé)任和公司商業(yè)利益方面?另外,陸博士去了百度之后,百度和微軟在中國人工智能的會有什么合作嗎?

沈向洋博士:你這幾個問題都問的非常好,微軟比較特別,我們有一個微軟研究院,研究院本身是非常開放的,所有科研的東西每年我們都發(fā)很多論文,幾乎所有的公司都沒法跟我們比,到今天為止,過去這20多年下來,在所有的計(jì)算機(jī)領(lǐng)域最一流的位置上,最佳論文獎獲得者,微軟研究院遙遙領(lǐng)先全球第一。我們今天微軟對社會仍然有這樣的責(zé)任,繼續(xù)做最了不起的計(jì)算機(jī)科研,包括AI這方面,并且以開放的方法去做。

從一個商業(yè)公司的角度來講,我們還是有兩個方面,你看的很準(zhǔn)確,第一我們提供一個平臺和工具,大家都可以用的,包括科研人員、大學(xué)的老師、學(xué)生都可以用。我們公司也做垂直行業(yè),office AI會越做越好,比如講云里面的應(yīng)用,比如database,這些東西我們都可以繼續(xù)做。你作為一個商業(yè)的話,跟其他產(chǎn)品競爭很正常。這些大的公司之間,大家可以怎么合作,可能有幾個不同的層面。

在工具層面,我舉個例子,比如講TensorsFlow,有一些新的工具出來,像深度學(xué)習(xí)做到這樣的地步,大家都覺得有道理,它就自然會出現(xiàn)一些工具出來。在TensorFlow出現(xiàn)的同時,至少有4、5個工具,比如講亞馬遜最近收了公司去做MXNet,大家各有所長。TensorFlow谷歌推的比較早,推的比較猛,用戶很多。很重要的一點(diǎn),我們作為一個community,大家應(yīng)該把一些力量聚集起來。

我覺得大家可以從安卓興起的過程當(dāng)中學(xué)習(xí)很多東西,在深度學(xué)習(xí)下一波浪潮當(dāng)中怎樣才可以做得更好,我不覺得微軟一家公司可以把這些東西都做出來。

國內(nèi)公司你提到,我們就是跟國內(nèi)的公司非常開放的,你剛才提到陸博士,我剛才提到很多其他的同事去其他的公司,大家的關(guān)系都非常好。大家可能知道去年11月的時候,我回去微軟亞洲研究院成立了一個院友會,亞勤、我、洪小文,我們一起組織其他人一起過來,大家這么多年是很好的朋友,即使大家不在同一個公司一起工作的話,我覺得最重要的是大家還在一個行業(yè),大家應(yīng)該互相幫助,我當(dāng)然是希望每一個同事在微軟都做的很好,希望以前的同事可以繼續(xù)做的很好。

問:微軟會不會越來越多的考慮Open Source的工具?

沈向洋博士:肯定,微軟其實(shí)現(xiàn)在已經(jīng)非常開源了,你看我們CNTK現(xiàn)在完全是開源的。開源是一種文化,有不同的方法可以做開源。我自己是覺得開源對這個世界的科技發(fā)展產(chǎn)生了巨大的深遠(yuǎn)影響。微軟發(fā)展很迅速,我們完全是擁抱開源。

沈向洋無懼BAT逼宮:微軟培養(yǎng)了中國很多IT公司CTO

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號-6京公網(wǎng)安備 11010502049343號