企業(yè)網(wǎng)D1Net 11月15日訊
英特爾給人的傳統(tǒng)印象,是一家非常有名的芯片制造商,按照最為傳統(tǒng)的分法,屬于“硬件”廠商。但其實,它早已涉足軟件業(yè)務(wù),其軟件部門已經(jīng)有了十多年的歷史,位于中國的研究院一直都進(jìn)行開源軟件的研究。援引英特爾高級副總裁Boyd Davis的話來說,”英特爾不只是硬件制造商,而是一家開源的軟件公司。“
談到英特爾在開源軟件方面的進(jìn)展,今年2月英特爾推出的Hadoop發(fā)行版,是無法繞過的話題。Hadoop是目前最為流行的大數(shù)據(jù)開源工具,Hadoop的發(fā)行版本則是指基于Hadoop架構(gòu)而改造的商業(yè)解決方案。本文就將從英特爾數(shù)據(jù)中心軟件部CTO苗凱翔的視角,聊聊英特爾與大數(shù)據(jù)的不解之緣。
英特爾數(shù)據(jù)中心軟件部CTO苗凱翔在全球云計算大會Cloud Connect上接受記者采訪
緣起
“英特爾從09年就開始研究大數(shù)據(jù),在業(yè)內(nèi)起步是比較早的。Hadoop發(fā)行版完全由中國團(tuán)隊研發(fā),這也是因為國內(nèi)客戶對大數(shù)據(jù)最早有需求,電信運營商是我們最早切入的行業(yè)。”苗凱翔表示。
隨著3G的普及,手機(jī)用戶產(chǎn)生巨額流量費用而引發(fā)的投訴和訴訟屢見不鮮,由于手機(jī)流量詳單無法查詢,費用產(chǎn)生的原因難以知曉,用戶不滿,運營商為此也感到頭疼。
“中國聯(lián)通用戶每日的上網(wǎng)記錄從幾萬到數(shù)十萬不等,全國每日新增約10TB數(shù)據(jù),每月近萬億條記錄,存放6個月的話,需要2PB。現(xiàn)有系統(tǒng)難以支撐如此海量數(shù)據(jù)的查詢。通過采用英特爾Hadoop 發(fā)行版和硬件平臺,中國聯(lián)通搭建了全國最大的HBase集群 ,實現(xiàn)用戶上網(wǎng)記錄的快速查詢服務(wù),從而解決了3G業(yè)務(wù)的清單查詢難題 。”
“現(xiàn)如今,英特爾Hadoop發(fā)行版在醫(yī)療、金融、智慧城市等各個領(lǐng)域有了部署和應(yīng)用。以智能交通為例,“國內(nèi)第一個利用Hadoop分布式系統(tǒng)構(gòu)建實時交通信息系統(tǒng),就是通過英特爾的解決方案。”
“傳統(tǒng)的方案無法滿足數(shù)據(jù)處理要求,而英特爾的Hadoop方案通過跨數(shù)據(jù)中心的分布部署以及線性擴(kuò)展,極好地了適應(yīng)業(yè)務(wù)要求。”
“在傳統(tǒng)方案下,過車查詢至少需要30秒,套牌分析至少要1小時,碰撞分析大于八小時,每PB的數(shù)據(jù)庫成本高達(dá)6000萬元。采用Hadoop方案,過車查詢小于1秒鐘,套牌分析低于20秒,碰撞分析最多只要2分鐘。數(shù)據(jù)庫成本降低至1000萬元/PB。”
優(yōu)勢
除了英特爾之外,大數(shù)據(jù)初創(chuàng)企業(yè)Cloudera,傳統(tǒng)的IT巨頭EMC、IBM等也擁有自己的Hadoop發(fā)行版。
“英特爾的優(yōu)勢是對硬件較為深刻的理解,英特爾硬件工廠從設(shè)計到生產(chǎn)的能力可能是世界最強(qiáng)的了,這使得英特爾Hadoop方案可以具備很強(qiáng)的硬件能力,比如硬件的加密解密,性能是軟件方式的20倍。”
“英特爾在大數(shù)據(jù)領(lǐng)域起步較早,積累的應(yīng)用場景經(jīng)驗豐富,團(tuán)隊的能力強(qiáng),對Hadoop技術(shù)的理解比較深刻。這些也都是英特爾的強(qiáng)項。”
英特爾的Hadoop發(fā)行版
“目前,戴爾已經(jīng)推出了基于英特爾Hadoop發(fā)行版的大數(shù)據(jù)一體機(jī)解決方案。英特爾還與SAP建立了戰(zhàn)略合作關(guān)系。SAP的HANA在結(jié)構(gòu)化數(shù)據(jù)的實時處理能力非常強(qiáng),而Hadoop擅長非結(jié)構(gòu)化化數(shù)據(jù)。不久后,‘Hadoop +HANA’的解決方案就將推出。“
未來
Hadoop是大數(shù)據(jù)的重要架構(gòu)之一,但Hadoop并不等同于大數(shù)據(jù)。大數(shù)據(jù)所涵蓋的范圍更廣泛。英特爾在大數(shù)據(jù)的布局自然也不只是Hadoop。苗凱翔指出英特爾在大數(shù)據(jù)領(lǐng)域的五個戰(zhàn)略方向分別為:
1、邊緣傳感器/設(shè)備的分布式分析需要基于標(biāo)準(zhǔn)、互聯(lián)、托管、安全的端到端架構(gòu)。
2、通過更快速、更高效的CPU、存儲、I/O 和網(wǎng)絡(luò)架構(gòu)加快大數(shù)據(jù)分析。
3、通過提供優(yōu)化的軟件堆棧和服務(wù)推動大數(shù)據(jù)應(yīng)用的創(chuàng)新與發(fā)展
4、通過合作伙伴協(xié)作推動大數(shù)據(jù)增長,注重實用模式示例和參考部署架構(gòu)
5、投資解決方案研究和學(xué)術(shù)協(xié)作
其中,第一個戰(zhàn)略方向格外引人注目,令人聯(lián)想到英特爾近日新成立的物聯(lián)網(wǎng)解決方案部門。眾所周知,傳感器是物聯(lián)網(wǎng)的底層基礎(chǔ),而大數(shù)據(jù)的運用對于物聯(lián)網(wǎng)的發(fā)展極為重要,可以說以大數(shù)據(jù)為核心驅(qū)動力的產(chǎn)業(yè)。目前,國內(nèi)的物聯(lián)網(wǎng)產(chǎn)業(yè)尚未成熟,仍是一片混亂的藍(lán)海。既具備芯片設(shè)計制造能力的”硬“實力,也具有大數(shù)據(jù)“ 軟” 實力的英特爾會在大海中掀起怎樣的風(fēng)浪,著實令人期待。