“不論是人工智能還是其他前沿技術(shù),都離不開(kāi)高質(zhì)量的數(shù)據(jù)、強(qiáng)大的計(jì)算平臺(tái)和高效的算法平臺(tái)。”阿里巴巴集團(tuán)CTO張建鋒在西雅圖表示,“只有這三件事放在一起,才能真正在機(jī)器學(xué)習(xí)和人工智能領(lǐng)域取得突破。”
8月6號(hào),阿里巴巴在西雅圖舉辦技術(shù)論壇,有近400名當(dāng)?shù)氐募夹g(shù)人才參加,除了有架構(gòu)、中間件、搜索等技術(shù)負(fù)責(zé)人到場(chǎng)介紹干貨,阿里CTO張建鋒也第一次在美國(guó)分享阿里的技術(shù)戰(zhàn)略。
張建鋒花名行癲,加入阿里12年,親歷了淘寶、天貓、聚劃算組成的中國(guó)零售平臺(tái)一路發(fā)展成全球最大的電商平臺(tái)。曾帶領(lǐng)過(guò)多個(gè)技術(shù)團(tuán)隊(duì),也擔(dān)任過(guò)中國(guó)零售平臺(tái)事業(yè)群的總裁,今年4月被任命為集團(tuán)CTO。阿里CEO張勇曾表示,張建鋒是“為數(shù)不多的兼具技術(shù)和商業(yè)背景和經(jīng)驗(yàn)的領(lǐng)導(dǎo)者”。
經(jīng)過(guò)4個(gè)月的思考,張建鋒選擇這個(gè)場(chǎng)合,首次圍繞數(shù)據(jù)、計(jì)算和算法三個(gè)核心,系統(tǒng)闡述了阿里的技術(shù)布局。
為什么阿里是一家大數(shù)據(jù)公司
阿里巴巴之所以將自己定位成大數(shù)據(jù)公司,是因?yàn)閾碛蟹浅6嗟母哔|(zhì)量數(shù)據(jù)。“今天大數(shù)據(jù)做的最好的,都是平臺(tái)性的企業(yè),比如Facebook和Google,因?yàn)樗麄冇泻A康母哔|(zhì)量的數(shù)據(jù),”張建鋒表示,“與之相比,阿里的數(shù)據(jù)不但種類(lèi)豐富,而且含金量特別高。”
阿里的數(shù)據(jù)有三個(gè)明顯的特征:首先阿里的數(shù)據(jù)是用戶(hù)通過(guò)購(gòu)買(mǎi)行為投票產(chǎn)生的,和搜索等場(chǎng)景相比,更加真實(shí);其次相較于社交等數(shù)據(jù),阿里的數(shù)據(jù)高度結(jié)構(gòu)化,例如淘寶上的商品描述就高達(dá)一百多個(gè)緯度;第三非常密集而且實(shí)時(shí),不管在無(wú)線還是PC端,阿里日常都有超過(guò)1億用戶(hù)在訪問(wèn)。
這幾點(diǎn)再加上整個(gè)阿里生態(tài)整合的多場(chǎng)景數(shù)據(jù),對(duì)大數(shù)據(jù)的發(fā)展,可謂得天獨(dú)厚。
計(jì)算平臺(tái)需要大規(guī)模數(shù)據(jù)訓(xùn)練
在計(jì)算平臺(tái)的構(gòu)建方面,得益于大規(guī)模數(shù)據(jù)訓(xùn)練的優(yōu)勢(shì),阿里巴巴做了大量的技術(shù)創(chuàng)新。除了圍繞開(kāi)源計(jì)算平臺(tái)Hadoop生態(tài)所做的各項(xiàng)工作,如流計(jì)算和批處理,阿里還有兩個(gè)非常高效的自研計(jì)算平臺(tái):離線計(jì)算平臺(tái)MaxCompute和實(shí)時(shí)計(jì)算平臺(tái)Galaxy,不但承載阿里日常的海量計(jì)算工作,而且通過(guò)阿里云對(duì)外提供服務(wù)。
“在大量的實(shí)踐中才能發(fā)現(xiàn)更多改進(jìn)方向,所以阿里有機(jī)會(huì)真正改變計(jì)算平臺(tái)的效率。”張建鋒表示。
張建鋒還談到為什么阿里巴巴能夠在7年之前就洞察到云計(jì)算的未來(lái),“阿里一直做平臺(tái)化業(yè)務(wù),交易平臺(tái)既然可以共享,計(jì)算能力為什么不能?所以我們比大多數(shù)公司更早意識(shí)到,計(jì)算可以變成水電煤一樣的公共服務(wù)。”張建鋒回憶到。
如今阿里云已經(jīng)成為中國(guó)最大云計(jì)算平臺(tái),提供包括IaaS、PaaS、SaaS在內(nèi)的完整服務(wù)。
高效的算法挖掘更大數(shù)據(jù)價(jià)值
對(duì)于算法,張建鋒認(rèn)為,算法必須和行業(yè)場(chǎng)景進(jìn)行高度的結(jié)合,在實(shí)驗(yàn)室中并不能研究出真正高效的算法,而阿里巴巴最大的優(yōu)勢(shì)就是能夠提供多樣化的、極其豐富的場(chǎng)景。數(shù)據(jù)、計(jì)算平臺(tái)和算法的結(jié)合,是未來(lái)非常重要的趨勢(shì)。
強(qiáng)大的計(jì)算平臺(tái)加上高效算法,能夠進(jìn)一步挖掘數(shù)據(jù)價(jià)值,最大化數(shù)據(jù)效率,形成正向循環(huán)。而云計(jì)算則能加速數(shù)據(jù)融合,例如孤立的看氣象數(shù)據(jù)價(jià)值有限,但和農(nóng)業(yè)或商業(yè)結(jié)合,就會(huì)產(chǎn)生巨大化學(xué)反應(yīng)。而傳統(tǒng)制造業(yè)如果能充分利用大數(shù)據(jù),也將有助于大幅提升良品率。
目前阿里正積極推進(jìn)與交通部門(mén)、氣象部門(mén)、制造業(yè)等多個(gè)行業(yè)的合作,讓數(shù)據(jù)產(chǎn)生更大價(jià)值。“我們堅(jiān)信大數(shù)據(jù)總有一天會(huì)改變所有行業(yè),所以阿里目前在各個(gè)領(lǐng)域都有新的探索。”張建鋒表示。
阿里未來(lái)技術(shù)布局
展望未來(lái)技術(shù)布局時(shí),張建鋒重點(diǎn)談到VR/AR、人工智能和物聯(lián)網(wǎng)。在他看來(lái),當(dāng)前的世界變化之大超越了人們的想象,不斷涌現(xiàn)各種新技術(shù),但未來(lái)究竟是怎樣的,所有人都在探索,并無(wú)定論。
“從PC到無(wú)線,迭代周期非常短,很多公司還沒(méi)有反應(yīng)過(guò)來(lái),已經(jīng)進(jìn)入無(wú)線時(shí)代,很多企業(yè)就沒(méi)有了。”張建鋒談到大熱的VR/AR時(shí)以此類(lèi)比。VR/AR技術(shù)代表著從二維空間到三維空間的趨勢(shì),讓我們對(duì)世界的理解更深入。
目前人工智能的技術(shù)方向很多,爆發(fā)性的出口還沒(méi)有明確答案,在張建鋒看來(lái),最有可能獲得成功的,是對(duì)消費(fèi)的趨勢(shì)、對(duì)數(shù)據(jù)和場(chǎng)景規(guī)?;醒芯康娜耍⒗飳⒃谶@方面投入更多的資源。
張建鋒指出,物聯(lián)網(wǎng)經(jīng)過(guò)長(zhǎng)期發(fā)展,目前解決了很多核心的問(wèn)題,第一,感知能力,目前傳感技術(shù)的發(fā)展非常迅速;第二,聯(lián)網(wǎng)技術(shù),NB-IoT協(xié)議推動(dòng)廣域網(wǎng)組網(wǎng),為物聯(lián)網(wǎng)打開(kāi)了一扇窗。當(dāng)這兩個(gè)問(wèn)題解決后,互聯(lián)網(wǎng)將迎來(lái)新一輪的爆發(fā)。
張建鋒強(qiáng)調(diào),有了感知互聯(lián)之后,才能真正擁有大數(shù)據(jù),才可能實(shí)現(xiàn)人工智能,從而使得整個(gè)平臺(tái)更加智能化和人性化。據(jù)悉,阿里巴巴6年前開(kāi)始研發(fā)的YunOS操作系統(tǒng),目前已成為全球第三大操作系統(tǒng)。阿里將在操作系統(tǒng)、物聯(lián)網(wǎng)、云計(jì)算等方面持續(xù)投入資源。
阿里巴巴從電商做起,規(guī)?;藬?shù)據(jù),并極大地拓展了場(chǎng)景。正如美國(guó)媒體的報(bào)道所稱(chēng),“阿里巴巴不論是業(yè)務(wù)還是技術(shù)都布局深遠(yuǎn),已經(jīng)遠(yuǎn)超電商的范疇。”