嘿嘿连裁app,无码久久中文字幕

因應(yīng)大數(shù)據(jù)時代，電腦架構(gòu)也要大改造

責(zé)任編輯：editor005

2015-06-02 14:05:50

摘自：中國大數(shù)據(jù)

幾乎所有的人對沃森電腦的印象，都停留在「危險邊緣」節(jié)目上看到的畫面：冷冰冰、深紫色系的電腦螢?zāi)唬Q立在另外兩位人類參賽者中間，會發(fā)出詭異的電腦語音。

完整的沃森電腦，當(dāng)然不只是電視螢?zāi)簧峡吹降哪菢樱绻袡C會前往紐約參觀IBM全球研發(fā)中心位於約克城高地的實驗室，你就會看到原汁原味的沃森電腦，不但能夠理解為什麼沃森電腦能在「危險邊緣」中勝出，也會同意為什麼非得用顛覆傳統(tǒng)的方式，才能設(shè)計出新世代的認(rèn)知運算電腦了。

沃森電腦放置在約克城高地實驗室二樓的數(shù)據(jù)中心，由九十二臺伺服器組成，堆滿整整兩排冰箱大小的金屬框架。這兩排金屬框架之間的走道盡頭，有一道門，形同把沃森電腦所在的房間，再隔出一個小房間。走進(jìn)這個小房間，你會聽到室內(nèi)空調(diào)的風(fēng)扇跟伺服器本身的小風(fēng)扇一起嗡嗡作響，震耳欲聾，可見沃森電腦微處理器散發(fā)的熱量非常可觀。這可不是一件好消息。

固然，在「危險邊緣」比賽的時候，沃森電腦微處理器運作的速度，比世上第二快的一般電腦的運作速度，還要再快上以數(shù)據(jù)為中心的電腦一倍;但是代價就是，沃森電腦會散發(fā)龐大的熱量、以及散熱風(fēng)扇會發(fā)出不小的噪音。這顯示了耗能問題非常嚴(yán)重：沃森電腦全速運轉(zhuǎn)時的耗電量，高達(dá)八萬五千瓦，足以提供一座小鎮(zhèn)的照明所需;相較之下，人腦只需要消耗二十瓦的能量而已。

除非我們可以用連跳好幾個數(shù)量級的方式，來提升電腦的運作效率，否則未來認(rèn)知運算電腦的成本，將高到很難成為我們廣泛運用的好幫手。IBM全球研發(fā)中心的科學(xué)家認(rèn)為，如果要在大數(shù)據(jù)時代設(shè)計出符合環(huán)境永續(xù)概念的電腦，我們一定要能設(shè)計出新型態(tài)的電腦──以數(shù)據(jù)為中心的電腦。

新電腦必須大幅減少傳輸數(shù)據(jù)的動作

傳統(tǒng)電腦以處理器為核心，由微處理器扮演馮諾伊曼架構(gòu)里中央處理器的角色，這自然也是電腦執(zhí)行最多動作的地方。微處理器搭載作業(yè)系統(tǒng)後，會向電腦的其他組件發(fā)出指令，像是要求記憶體、硬碟傳輸數(shù)據(jù)等。而如果是大型網(wǎng)路中的一臺電腦，則有可能需要用遠(yuǎn)端傳輸?shù)姆绞?，才有辦法取得其他電腦儲存的數(shù)據(jù)。

新世代的電腦一定要能大幅減少傳輸數(shù)據(jù)的動作，也就是以數(shù)據(jù)、而不是處理器做為運作核心。按照IBM先進(jìn)系統(tǒng)設(shè)計部門主管達(dá)華里(Bijan Davari)的說法，新的設(shè)計架構(gòu)將可以把許多任務(wù)畢其功於一役，不但可以增加電腦運作的速度，大幅提升省電效果，更重要的是促成充分利用大數(shù)據(jù)的可能性。

電腦的運算能力自從1970年代，工程師開始在單晶片里塞進(jìn)愈來愈多的電晶體後，獲得了迅速提升，專業(yè)術(shù)語叫做堆棧(scaling)，意指在相同面積上堆放更多資源的能力，好比說是更緊密的電路布局、或是更多的記憶容量。而在單晶片完成更多堆棧的過程，就叫做微縮(scaling down)。

不論是企業(yè)界或是政府單位的電腦，經(jīng)過多年使用之後，都需要更優(yōu)秀的運算能力，因此電腦業(yè)者開始推出伺服器，專門處理大量、復(fù)雜的工作，主要的做法有兩種，其中一種是在一臺伺服器內(nèi)，裝上運算能力更強的零組件與其他資源，通稱為升級(scaling up)，IBM的大型主機即采取這種做法;另一種做法是擴充(scaling out)，是把多臺伺服器串連、視同一臺大型伺服器般使用，這也是超級電腦跟Google數(shù)據(jù)中心伺服器大軍的做法。

IBM的科學(xué)家相信，未來以數(shù)據(jù)為中心的電腦將具備一種基本特徵：電腦工程師會設(shè)法把記憶體跟邏輯線路，整合在一以數(shù)據(jù)為中心的電腦顆緊致的立體晶片中，采用斂合(scaling in)的新堆棧方法。

新玩意：混合記憶體模塊

現(xiàn)今的記憶體只是把一層矽晶跟數(shù)不清的數(shù)據(jù)存取線路，整合成一顆電子元件，主要做為數(shù)據(jù)暫存區(qū)之用，并依照微處理器的需求傳輸數(shù)據(jù)。

記憶體在電腦內(nèi)占有一定空間，數(shù)據(jù)傳送也是個負(fù)擔(dān)沉重的工作;如果把記憶體晶片像一層層烤餅堆疊在一起呢?那不但可以大幅縮減體積，同時也能減少數(shù)據(jù)傳送的負(fù)擔(dān)。這種新概念的產(chǎn)物，就是IBM與其他電腦大廠正在研發(fā)的混合記憶體模塊(hybrid memory cube)。

混合記憶體模塊是個奇特的小玩意兒，可以在一個立方體內(nèi)把好幾層記憶體堆疊在一起，在垂直貫穿模塊的一個小通道內(nèi)配置線路，用銅線把所有物件串連在一起，讓最底層的邏輯線路可以直接連結(jié)到其他各層的記憶體，只把萃取過的減量數(shù)據(jù)傳送給微處理器統(tǒng)合使用。這種新設(shè)計可以縮減現(xiàn)有記憶體百分之九十的體積，減少百分之七十的耗能。

未來，記憶體模塊渴望再內(nèi)建微處理器，逐步走向記憶體與處理器合而為一的境地，打破馮諾伊曼瓶頸的限制。

這項新科技會對未來的電腦帶來重大影響，譬如用於原油探鉆、汽車撞擊測試的大型超級電腦，體積會變得更小、更省電，下一代使用混合記憶體模塊的伺服器數(shù)據(jù)中心，也不再需要在龐大的室內(nèi)空間耗掉可觀的散熱電力。這項技術(shù)繼續(xù)發(fā)展的話，未來即便是智慧型手機、平板電腦、或是其他行動裝置，也都可以將運算能力提升到一個難以想像的境界。

新概念：微處理器分散架構(gòu)

以數(shù)據(jù)為中心的電腦具備的第二種基本特徵是：電腦內(nèi)部的分散式配置方式。

今日的電腦，有微處理器擔(dān)任神經(jīng)中樞的角色，負(fù)責(zé)處理所有或大部分的運算工作，因此運算時派得上用場的數(shù)據(jù)，都要在原本存放的位置與微處理器之間不斷往返傳遞，用跑馬拉松來形容也不為過。未來以數(shù)據(jù)為中心的電腦，會把微處理器分散在系統(tǒng)的不同位置，大大降低數(shù)據(jù)搬動的必要性。

微處理器分散架構(gòu)的概念，已經(jīng)在某些專門用於分析龐大數(shù)據(jù)數(shù)據(jù)的特用電腦上進(jìn)行測試。紐約州立大學(xué)水牛城分校神經(jīng)科學(xué)教授拉曼納森，即參與了其中某一項測試計畫。

多發(fā)性硬化癥會讓人痛苦異常，患者的免疫系統(tǒng)會主動攻擊自身的大腦與脊髓，導(dǎo)致病患失去行動能力，并造成認(rèn)知失調(diào)問題。這種疾病多半會在年輕成年人的身上發(fā)病，目前病因成謎，也無法醫(yī)治。拉曼納森的研究主題，是找出基因和環(huán)境因素與多發(fā)性硬化癥的相關(guān)性，進(jìn)而找到醫(yī)治的方法，或是起碼找到能夠預(yù)先防治的方法。拉曼納森研究工作最大的挑戰(zhàn)，在於人類基因可能導(dǎo)致多發(fā)性硬化癥的組合方式實在太多了，如果再加上飲食作息、抽菸喝酒等環(huán)境因素的影響，則多發(fā)性硬化癥潛在病因的可能組合，將呈現(xiàn)指數(shù)般的爆炸性成長。

換句話說，拉曼納森的研究重點在於克服龐大數(shù)據(jù)帶來的技術(shù)障礙，而傳統(tǒng)超級電腦欠缺大量平行運算的能力，因此也沒辦法有效處理拉曼納森所面對的問題──亦即所謂數(shù)據(jù)密集(data-intensive)的問題。拉曼納森需要一臺可以把研究主題切割成許多分段、送交好幾千顆微處理器進(jìn)行平行運算後，再從平行運算的結(jié)果推導(dǎo)出最後答案的電腦。如果要有效解決拉曼納森面臨的難題，勢必要采用平行運算搭配以數(shù)據(jù)為中心的微處理器架構(gòu)。

於是，拉曼納森的研究團(tuán)隊設(shè)計一臺專門用於數(shù)據(jù)密集分析的電腦，這臺冰箱大小的專用電腦采用特制的微處理器「現(xiàn)場可程式閘陣列」(field programmable gate array, FPGA)，在數(shù)據(jù)儲存區(qū)先行過濾數(shù)據(jù)，之後再把有用的部分傳給中央處理器，進(jìn)行後續(xù)的數(shù)據(jù)分析。這套微處理器可以程式化設(shè)定需要搜尋的數(shù)據(jù)，因此可以有效過濾高達(dá)九成的數(shù)據(jù)量，讓中央處理器僅針對篩選過的數(shù)據(jù)進(jìn)行分析即可，不用照單全收;就形式上而言，如同傳統(tǒng)電腦只在記憶體進(jìn)行存取，省去讀取硬碟的步驟。如此一來，這臺專用電腦可以減少數(shù)據(jù)搬動，連帶達(dá)到省電效果，并提升電腦中樞的運算速度與效率。

接下來，我們用拉曼納森研究團(tuán)隊實際取得的績效，說明這臺新電腦的效率高到什麼程度。研究團(tuán)隊完成安裝後不久，把十萬種基因組合與包含各種環(huán)境因素在內(nèi)的數(shù)據(jù)，統(tǒng)統(tǒng)輸入電腦進(jìn)行運算──相當(dāng)於有五十億種「雙變數(shù)」的組合、或是一百兆種「三變數(shù)」的組合需要進(jìn)行推算。

結(jié)果，新電腦只花了十一分鐘，就把傳統(tǒng)電腦需要花二十七小時計算的答案，給算出來了。坐在紐約州立大學(xué)辦公桌前的拉曼納森，收到一封運算結(jié)果摘要報告的電子郵件，他說：「這個結(jié)果讓我感到興奮莫名，有如在眼前開啟了一扇機會之窗。我們，終於有機會解決以往難以處理的問題了?！?/p>

以光子技術(shù)傳輸數(shù)據(jù)

無論在電腦系統(tǒng)的哪個地方處理數(shù)據(jù)，用更快、更有效率的方式搬動數(shù)據(jù)，當(dāng)然還是基本功。這就是以數(shù)據(jù)為中心的電腦，必須具備的第三種基本特徵。

一般公認(rèn)，借助光子學(xué)(photonics)的原理，將可更迅速的搬動數(shù)據(jù)，也就是用光波來制造訊號、傳送訊號、處理訊號。電話公司和寬頻網(wǎng)路業(yè)者已經(jīng)在光纖電纜內(nèi)，用脈沖光束的方式加速數(shù)據(jù)傳送的速度，以便和遠(yuǎn)端進(jìn)行語音交談或是分享電影、電視等多媒體內(nèi)容;大樓內(nèi)部和數(shù)據(jù)中心的電腦之間，也可以用光纖傳輸數(shù)據(jù)。未來，光子學(xué)技術(shù)可望運用在伺服器內(nèi)部、甚至是電路板上的數(shù)據(jù)傳送，最終也不排除在晶片內(nèi)以光子技術(shù)傳輸數(shù)據(jù)的可能。

IBM全球研發(fā)中心有一群科學(xué)家，利用十年的研究計畫取得奈米光子技術(shù)的重大進(jìn)展。他們在單一矽晶片上，整合了傳統(tǒng)電子元件與光學(xué)元件，稱為CMOS整合奈米光子(CMOSintegrated nanophotonics)技術(shù)，這將有助於大幅度提升各種電腦的效能。目前，先進(jìn)電腦仍舊用不同的晶片處理光學(xué)元件，就成本與效能而言都還有改善空間。這項CMOS整合奈米光子新技術(shù)，不但把光、電元件整合在單一晶片上，還可以讓晶片制造業(yè)者沿用現(xiàn)有生產(chǎn)設(shè)備，盡快達(dá)成量產(chǎn)的目標(biāo)。

搬動一個位元的成本是多少?

「電腦運作的時候，搬動一個位元的成本是多少?」顯然這是一個不值得花時間回答的問題。因為在當(dāng)前資訊科技的環(huán)境里，這個成本是微乎其微。

問題是，電腦科學(xué)家已經(jīng)注意到進(jìn)入大數(shù)據(jù)時代後，遠(yuǎn)距離搬動大數(shù)據(jù)的成本會有爆炸性成長，即便在短距離來回多次搬動數(shù)據(jù)，成本亦會暴增。

這就是IBM主管「百萬兆級運算」(exascale computing)的副總裁特瑞克(David Turek)，在2011年向共聚一堂的IBM電腦系統(tǒng)專家提出這個問題的源由。特瑞克說：「還好這些專家愿意正面看待我所提出的笨問題。進(jìn)入大數(shù)據(jù)時代後，我的笨問題會開始變成大問題，所以必須找出能夠真正量化數(shù)據(jù)移動成本的方法?！?/p>

特瑞克的簡單問題，促使IBM啟動一項從根本改變電腦架構(gòu)的研究計畫：代號DC2的「以數(shù)據(jù)為中心的深度運算計畫」(Data Centric Deep Computing)。這是IBM自1960年代初發(fā)表360系列大型主機之後，最能徹底檢討、反思該如何設(shè)計電腦的一次顛覆性創(chuàng)舉。這項研究計畫促成新的創(chuàng)新文化，以及下定決心拋棄舊觀點、一切重頭來過的特性，都值得大書特書。

負(fù)責(zé)主導(dǎo)DC2研究計畫(并且要能夠回答特瑞克的成本問題)的科學(xué)家是名列IBM院士之一的卡爾(Jim Kahle)?？栐谶^去三十多年，曾帶領(lǐng)數(shù)個研究團(tuán)隊完成不少最先進(jìn)的晶片設(shè)計，包括索尼PlayStation游戲機上專用的Cell處理器、超級電腦「走鵑」(Roadrunner)、以及其他先進(jìn)的數(shù)位電視晶片組等。其中比較可惜的是Cell處理器，并未如卡爾預(yù)期般的在所有運算設(shè)備中大放異彩，因此卡爾希望DC2計畫能夠帶動電腦革命性的新設(shè)計，以前所未見的高效能，實現(xiàn)當(dāng)初Cell處理器沒有達(dá)成的目標(biāo)。

卡爾很能跟各有所長的專業(yè)人士溝通，讓各種新想法都有浮上臺面參與討論的機會，這些都是推動DC2研究計畫不可或缺的重要經(jīng)驗。

DC2研究計畫啟動後的前幾個月，卡爾廣泛召集不同背景的專家，一起描繪十年以後的電腦會有哪些新用途、新功能，討論研究團(tuán)隊?wèi)?yīng)該提前做出哪些準(zhǔn)備。這些專家的背景包括半導(dǎo)體工程、光子學(xué)技術(shù)、記憶體模組開發(fā)、系統(tǒng)架構(gòu)、電腦軟體以及數(shù)學(xué)家、統(tǒng)計分析師等，他們的觀點讓認(rèn)知運算時代該有的電腦架構(gòu)逐漸在卡爾腦海中成形，并開始擬定完成計畫目標(biāo)的執(zhí)行步驟。

卡爾說：「我們必須先重新自我組織工作團(tuán)隊。打破本位主義可不是一件簡單的事，但是我們必須改弦易轍，朝新方向前進(jìn)?！?/p>

讓中央處理器走出深宮內(nèi)院

DC2計畫截至目前為止還在進(jìn)行中，距離最終成果發(fā)表的階段還很遙遠(yuǎn)，不過研究團(tuán)隊已經(jīng)確立許多有助於他們完成目標(biāo)的基本原則：他們相信，研究成果必須奠定在把原本以處理器為核心的想法轉(zhuǎn)型成以數(shù)據(jù)為中心的想法上。

卡爾記得，以數(shù)據(jù)為中心的想法是在2011年的年底，才突然成為研究計畫的重心，當(dāng)天他和十幾位研究人員在約克城高地實驗室的36-002會議室(這是DC2研究計畫的戰(zhàn)情數(shù)據(jù)室)里，每個人都覺得前途茫茫。盡管大家對於新科技的突破都有不錯的想法，但是卻一直欠缺一以貫之的大方向。

此時，其中一位遲到的成員內(nèi)爾(Ravi Nair)，推開會議室大門走進(jìn)來，把手上那張草圖傳給其他同事瀏覽。草圖左邊是傳統(tǒng)電腦在各層級儲存系統(tǒng)移動數(shù)據(jù)的過程──從硬碟進(jìn)入記憶體，最終再到處理器的過程;右邊則是直接在每一層級處理數(shù)據(jù)、以及分散式架構(gòu)的省電效果。這張圖讓卡爾靈光乍現(xiàn)：研究方向應(yīng)該是讓傳統(tǒng)電腦的處理器走出深宮內(nèi)院才對!未來電腦將不會再有唯一的中央處理系統(tǒng)，處理器會分散在電腦系統(tǒng)的不同位置，數(shù)據(jù)為主、處理器為輔。

這個石破天驚的見解，跟設(shè)計新的電腦架構(gòu)有什麼關(guān)系?

這就要回到幾星期前，特瑞克提出的那個最根本的問題了：搬動一個位元的成本到底是多少?下班回家後的卡爾，好好想了一個值得參考的比較基準(zhǔn)。簡單來講，把該位元搬動到網(wǎng)路上的成本介於800到6,000兆分之一美元，視真正的移動距離而定;如果該位元只在一臺電腦內(nèi)部移動的話，成本只介於6到27兆分之一美元而已;換句話說，長距離移動數(shù)據(jù)再行處理的成本，比直接在數(shù)據(jù)旁邊進(jìn)行處理的成本，高上大約兩百到一千倍。

未來愿景：桌上型超級電腦

在不同狀況下，搬動數(shù)據(jù)的成本變化頗大。卡爾所率領(lǐng)的研究團(tuán)隊精確估算過每一種狀況下的成本效益分析，因而得到一些非常實用的結(jié)論，例如讓電腦系統(tǒng)里某些特制的處理器，專門解決特定的工作項目。

卡爾的研究團(tuán)隊也會采取分流處理的做法：有時候是讓記憶體、硬碟旁邊的處理器，或是把守數(shù)據(jù)匯流進(jìn)入系統(tǒng)的處理器，就近發(fā)揮功效，以達(dá)到最佳化效果;有時候(依工作性質(zhì)不同)則是讓中央處理器，直接存取大多數(shù)的數(shù)據(jù)。

目前卡爾的研究團(tuán)隊兵分兩路，一部分開始著手打造新電腦所需要的硬體零組件，另一部分則致力於開發(fā)運作新電腦所需要的軟體架構(gòu)。這兩者缺一不可。打造以數(shù)據(jù)為中心的電腦可能要花上好幾年時間，無論如何，研究團(tuán)隊希望未來的電腦可以辨別被指派的工作項目，自動安排系統(tǒng)內(nèi)部不同的處理器分工合作，就好像交響樂作曲家，安排不同樂器演奏不同的音符、發(fā)出不同聲響的效果一樣。

針對大數(shù)據(jù)時代設(shè)計新型電腦，絕對是一份吃重的工作，但是新型電腦潛在的發(fā)揮空間，會讓這一切的努力付出，值回票價?；蛟S十年後，就可以看見當(dāng)前運算速度最快的超級電腦居然可以精簡成辦公桌上的一個盒子了，更何況未來運算速度最快的電腦究竟能完成哪些工作，恐怕也已經(jīng)不是現(xiàn)在的我們可以想像的了。

馮諾伊曼數(shù)據(jù)傳送