大數(shù)據(jù)作為網(wǎng)絡(luò)時(shí)代的一種客觀存在,是網(wǎng)絡(luò)時(shí)代人類社會(huì)的重要資產(chǎn),盡管目前對(duì)于大數(shù)據(jù)的認(rèn)知存在挑戰(zhàn),但聚類將會(huì)成為大數(shù)據(jù)認(rèn)知的突破口。
大數(shù)據(jù)聚類將成行業(yè)核心競爭力
大數(shù)據(jù)標(biāo)志著一個(gè)新時(shí)代的到來,這個(gè)時(shí)代的特征不只是追求豐富的物質(zhì)資源,也不只是無所不在的互聯(lián)網(wǎng)帶來的方便的多樣化信息服務(wù),同時(shí)還包含區(qū)別于物質(zhì)的數(shù)據(jù)資源的價(jià)值發(fā)現(xiàn)和價(jià)值轉(zhuǎn)換,以及由大數(shù)據(jù)帶來的精神和文化方面的嶄新現(xiàn)象。
大數(shù)據(jù)來源于人類的測量、記錄和分析世界的渴望和無盡的追求。隨著信息技術(shù),尤其是傳感器、通信、計(jì)算機(jī)和互聯(lián)網(wǎng)技術(shù)的迅猛發(fā)展和廣泛應(yīng)用,人類獲取數(shù)據(jù)的手段越來越多,速度大大加快、成本急劇降低,層次和尺度更為精細(xì),揭示自然現(xiàn)象和社會(huì)現(xiàn)象更加深刻,人聯(lián)網(wǎng)和物聯(lián)網(wǎng)又使得人人物物都成為數(shù)據(jù)源,這樣一來,大數(shù)據(jù)成為網(wǎng)絡(luò)時(shí)代人類社會(huì)的重要資產(chǎn)。
大數(shù)據(jù)本身既不是科學(xué),也不是技術(shù)。它反映的是網(wǎng)絡(luò)時(shí)代的一種客觀存在,各行各業(yè)的大數(shù)據(jù),規(guī)模從TB到PB到EB到ZB,都是以三個(gè)數(shù)量級(jí)的階梯迅速增長,是用傳統(tǒng)工具難以認(rèn)知的,具有更大挑戰(zhàn)。
“物以類聚,人以群分”,這是人類幾千年來認(rèn)識(shí)世界和社會(huì)的基本能力,是從大數(shù)據(jù)中發(fā)現(xiàn)價(jià)值必須面對(duì)的一個(gè)普遍性、基礎(chǔ)性問題,是認(rèn)知科學(xué)作為“學(xué)科的學(xué)科”要解決的首要問題。無論是政治、經(jīng)濟(jì)、文學(xué)、歷史、社會(huì)、文化、還是數(shù)理、化工、醫(yī)農(nóng)、交通、地理、各行各業(yè)的大數(shù)據(jù)或宏觀或微觀的任何價(jià)值發(fā)現(xiàn),無不借助于大數(shù)據(jù)聚類分析的結(jié)果,因此,數(shù)據(jù)分析和挖掘的首要問題是聚類,這種聚類是跨學(xué)科、跨領(lǐng)域、跨媒體的。大數(shù)據(jù)聚類是數(shù)據(jù)密集型科學(xué)的基礎(chǔ)性、普遍性問題。
以汽車保險(xiǎn)為例,作為一個(gè)很傳統(tǒng)的行業(yè),保險(xiǎn)是基于概念評(píng)估的生意,保險(xiǎn)公司對(duì)車險(xiǎn)客戶是這樣聚類的:A類連續(xù)兩年沒有出車禍的,B類最近一年沒有出車禍的,C類過去一年出了一次車禍的,D類過去一年出了兩此及以上車禍的,要做到這樣的聚類,保險(xiǎn)公司就要獲得客戶的相關(guān)數(shù)據(jù)。
物聯(lián)網(wǎng)時(shí)代,當(dāng)汽車成為輪式機(jī)器人,成為大數(shù)據(jù)發(fā)生器以后,就是一個(gè)大數(shù)據(jù)發(fā)生體。每一次駕駛,每一次維修,每一次行駛,甚至每一次剎車,都會(huì)記錄在案,利用大數(shù)據(jù)聚類,保險(xiǎn)公司可對(duì)一個(gè)車況好、駕駛習(xí)慣好、常走線路事故率低,不勤開車的特定客戶,給予更大的優(yōu)惠,而對(duì)風(fēng)險(xiǎn)太高的客戶報(bào)高價(jià)甚至拒絕??傊鶕?jù)大數(shù)據(jù)聚類保險(xiǎn)公司能夠給出包括保險(xiǎn)費(fèi)支付方式在內(nèi)的個(gè)性化解決方案,這就顛覆了保險(xiǎn)公司的傳統(tǒng)商業(yè)模式。我認(rèn)為將來大數(shù)據(jù)聚類成為很多行業(yè)的核心競爭力。
大數(shù)據(jù)對(duì)形式化方法的挑戰(zhàn)是非常嚴(yán)峻的,在數(shù)據(jù)密集型的網(wǎng)絡(luò)時(shí)代,任何傳統(tǒng)學(xué)科或者傳統(tǒng)的行業(yè),其公理、原理和定理組成的語境,遇到互聯(lián)網(wǎng)+的挑戰(zhàn)之后,都將成為一個(gè)大數(shù)據(jù)、小模型、小定律、交叉學(xué)科的時(shí)代,模型和程序要圍繞數(shù)據(jù)。
創(chuàng)新也會(huì)相應(yīng)的發(fā)生變化,應(yīng)該是創(chuàng)造一個(gè)新的語境、新的坐標(biāo)系,在這個(gè)坐標(biāo)系下研究大數(shù)據(jù),否則難以有新的發(fā)現(xiàn)。
實(shí)踐中的研究也要由下而上地深入,數(shù)據(jù)要?jiǎng)龠^程序,價(jià)值要?jiǎng)龠^知識(shí),關(guān)聯(lián)要?jiǎng)龠^因果,要更多地關(guān)注有意義的小眾,把這些小眾累積起來才成為大眾。
通過大數(shù)據(jù)聚類即時(shí)發(fā)現(xiàn)價(jià)值,還要充分認(rèn)識(shí)大數(shù)據(jù)中的不確定性和價(jià)值的隱蔽性。
[page]機(jī)器人是大數(shù)據(jù)認(rèn)知的典型代表
智能機(jī)器人是集新材料、新工藝、新能源、機(jī)械、電子、移動(dòng)通信、全球定位導(dǎo)航、移動(dòng)互聯(lián)網(wǎng)、云計(jì)算、大數(shù)據(jù)、自動(dòng)化、人工智能、認(rèn)知科學(xué)乃至人文藝術(shù)等多個(gè)學(xué)科、多種技術(shù)于一身的人造精靈,是人聯(lián)網(wǎng)、物聯(lián)網(wǎng)不可或缺的端設(shè)備,是人類社會(huì)走向智慧生活的重要伴侶。
機(jī)器人既是使用大數(shù)據(jù)也產(chǎn)生大數(shù)據(jù),既是大數(shù)據(jù)的產(chǎn)物也是大數(shù)據(jù)的推動(dòng)者,機(jī)器人是大數(shù)據(jù)的認(rèn)知的典型代表。而在目前,無論是搬運(yùn)、碼垛、研磨、拋光、挖掘等灰頭土臉的工業(yè)機(jī)器人還是微電子產(chǎn)品生產(chǎn)線上精細(xì)靈巧大的機(jī)器人,機(jī)器人在我們的生產(chǎn)生活中已經(jīng)隨處可見。
機(jī)器人革命是世界性的、時(shí)代性的,機(jī)器人替換的首先不是理發(fā)師之類的勞動(dòng)者,而可能是產(chǎn)業(yè)工人、文秘人員、醫(yī)生、服務(wù)員、甚至士兵,他們將升級(jí)轉(zhuǎn)型成為機(jī)器人的創(chuàng)造者和使用者,成為懂得集成、維修、管理機(jī)器人的專業(yè)人才??缃鐫B透和跨界創(chuàng)新誕生的智能制造也將是我國抓住歷史機(jī)遇的又一次崛起。
此外,機(jī)器人還將進(jìn)一步刮起“穿戴風(fēng)”。蘋果推出了自己的手表,并發(fā)表了5個(gè)有關(guān)醫(yī)療的App,啟動(dòng)全新醫(yī)療應(yīng)用。試想如果有一天手機(jī)或手表將會(huì)成為醫(yī)療診斷的工具,用于慢性管理的醫(yī)患視頻互動(dòng)平臺(tái),醫(yī)療互聯(lián)網(wǎng)個(gè)人健康與醫(yī)療的數(shù)據(jù)發(fā)生器,這將是遠(yuǎn)程診療的開始,并繼而成為某種流行病的社會(huì)調(diào)查,成為病友社交網(wǎng)絡(luò),甚至?xí)嵏矀鹘y(tǒng)看病模式,顛覆傳統(tǒng)醫(yī)學(xué)研究。
同時(shí)我們也可以期待未來的生物機(jī)器人,如果器官移植越來越發(fā)達(dá),那么“移花接木”就屢見不鮮。改造人類胚胎DNA,會(huì)不會(huì)避免遺傳性疾病?如果將人的思維移植到機(jī)器人,那么思想是不是不朽的呢……
人腦是很復(fù)雜的,科學(xué)界現(xiàn)在正把腦科學(xué)和認(rèn)知科學(xué)作為當(dāng)前的重大研究領(lǐng)域,我們也在熱切期待生物腦的出現(xiàn)。
當(dāng)然認(rèn)知科學(xué)不僅是研究生物腦的自然屬性,社會(huì)屬性研究也很重要。我們各種高端生物都會(huì)有語言、文字,有了文字,才會(huì)有文明。因此我們要研究腦認(rèn)知的后天屬性,研究腦發(fā)育、可塑性與自然環(huán)境的關(guān)系,認(rèn)知也是后天學(xué)習(xí)和積累的結(jié)果,是與社會(huì)環(huán)境、社會(huì)實(shí)踐、群體交互等密切相關(guān)的,要建立人腦認(rèn)知的成長機(jī)制:如何創(chuàng)建神經(jīng)元之間新的連接和新的認(rèn)知。
人的智能除了記憶之外,在學(xué)習(xí)和思維上,概括地說有兩點(diǎn):一個(gè)是邏輯思維,一個(gè)是形象思維,形象思維最主要的是類比和聯(lián)想。
從我的技術(shù)觀點(diǎn)來看,如果人腦的認(rèn)知能力不能夠全部、完整、統(tǒng)一地形式化,那么我們可以在特定的情境下使認(rèn)知能力局部形式化,如算術(shù)運(yùn)算、簡單游戲、博弈、定點(diǎn)開車等。
在未來,我還想做一個(gè)機(jī)器駕駛腦,這個(gè)駕駛腦主要涵蓋了人腦關(guān)于駕駛行為的主要功能,長期記憶、短期記憶,還有瞬間記憶,就是感覺記憶,從感知到認(rèn)知,到行動(dòng)。
目前,中國腦計(jì)劃馬上要啟動(dòng)了,我個(gè)人認(rèn)為是要將各項(xiàng)研究同步進(jìn)行,用大數(shù)據(jù)來認(rèn)識(shí)腦袋、保護(hù)腦、模擬腦。