AMD公布功率改進(jìn)目標(biāo)

責(zé)任編輯:editor006

2014-06-24 17:57:30

摘自:ZDNetserver頻道

換句話來(lái)說(shuō),當(dāng)談到能源效率改進(jìn)時(shí),僅僅縮小芯片的制程工藝已經(jīng)無(wú)法滿足現(xiàn)實(shí)世界對(duì)于提升幅度的渴求了。順帶一提,在談到能源效率的時(shí)候,Naffziger指的是由美國(guó)環(huán)境保護(hù)總署創(chuàng)建的能源之星志愿計(jì)劃所規(guī)定的“典型使用”效率。

AMD已經(jīng)公布了一項(xiàng)野心勃勃的目標(biāo),即到2020年使其APU——也就是該公司打造的加速處理單元,包括集成在CPU、GPU、視頻加速乃至其它任何類似芯片之上的方案——在能源效率方面實(shí)現(xiàn)25倍的改進(jìn)。

盡管AMD方面一直致力于這項(xiàng)目標(biāo)的實(shí)現(xiàn),但其達(dá)成難度堪稱一座難以逾越的高峰。能源效率的提升已經(jīng)不可能再像過(guò)去那樣隨著產(chǎn)品換代而自動(dòng)實(shí)現(xiàn),因?yàn)橐揽靠s小芯片尺寸來(lái)獲得能效改善的道路已經(jīng)走到了盡頭。

“能源效率的正常提升態(tài)勢(shì)已經(jīng)開(kāi)始衰退,單靠物理層面的換代已經(jīng)無(wú)法支撐進(jìn)一步優(yōu)化,”AMD公司研究員Sam Naffziger在上周五接受采訪時(shí)解釋道。“我們已經(jīng)在某些方面將晶體管尺寸壓縮至最低,而電壓也穩(wěn)定在1伏左右。”

在1974年發(fā)布的一篇堪稱里程碑的論文當(dāng)中,Robert Dennard為處理規(guī)模劃定了指導(dǎo)方針,但這一切如今已經(jīng)無(wú)以為繼,Naffziger指出。“根據(jù)Dennard給出的思路,在理想狀況下我們可以在三維空間內(nèi)實(shí)現(xiàn)設(shè)備規(guī)模縮減并借此實(shí)現(xiàn)高達(dá)四倍的能源效率提升,沒(méi)錯(cuò),這就是最后一招王牌。我們?nèi)匀荒軌蜻M(jìn)一步改善能源效率——每代產(chǎn)品也許提升30%、也許提升50%,這當(dāng)然已經(jīng)非常出色,不過(guò)如此幅度已經(jīng)沒(méi)辦法跟當(dāng)初相提并論了。”

換句話來(lái)說(shuō),當(dāng)談到能源效率改進(jìn)時(shí),僅僅縮小芯片的制程工藝已經(jīng)無(wú)法滿足現(xiàn)實(shí)世界對(duì)于提升幅度的渴求了。信息與通信技術(shù)產(chǎn)業(yè)的要求越來(lái)越高,芯片制造商可以選擇的方案卻幾盡枯竭。

這種渴求已經(jīng)達(dá)到近乎貪婪的程度。根據(jù)斯坦福大學(xué)Jonathan Koomey得出的研究結(jié)果,信息與通信技術(shù)所需要的能源總量正快速增長(zhǎng)。隨著聯(lián)網(wǎng)設(shè)備數(shù)量的爆炸式膨脹與互聯(lián)網(wǎng)用戶規(guī)模的持續(xù)攀升,數(shù)字化內(nèi)容的消耗量也以驚人之勢(shì)迅猛擴(kuò)張,這就要求我們擁有足夠的數(shù)據(jù)中心對(duì)其加以處理——到2020年,數(shù)據(jù)中心消耗的電力將占全球總體電力產(chǎn)出的14%,而這一數(shù)字大約占到全球碳排放能源總量的2%左右。

AMD公布積極的功率改進(jìn)目標(biāo):到2020年,功耗優(yōu)化效果將達(dá)到目前的25倍

很明顯,是時(shí)候作出變革了——而且越快越好

“我們的目標(biāo)是,”Naffziger指出“通過(guò)智能化能源管理以及貫穿整個(gè)架構(gòu)與軟件體系的優(yōu)化手段降低能源消耗的整體增長(zhǎng)速度,從而抵消芯片能源利用效率與過(guò)去相比所出現(xiàn)的增幅下滑。”

順帶一提,在談到能源效率的時(shí)候,Naffziger指的是由美國(guó)環(huán)境保護(hù)總署創(chuàng)建的能源之星志愿計(jì)劃所規(guī)定的“典型使用”效率。“能源之星設(shè)立的規(guī)范為其下達(dá)了準(zhǔn)確的定義——能源效率是指在典型使用情況下、由能源消耗計(jì)算出的設(shè)備能耗狀態(tài)加權(quán)總值,”他解釋道。“我們目前的工作正是對(duì)于這類典型使用場(chǎng)景進(jìn)行性能優(yōu)化。”

根據(jù)Naffziger的說(shuō)法,AMD在過(guò)去六年當(dāng)中已經(jīng)將典型使用情況下的能源效率提升了約10倍——是指從2008年的“Puma”到2014年的“Kaveri”芯片,二者針對(duì)的都是筆記本設(shè)備。

AMD公布積極的功率改進(jìn)目標(biāo):到2020年,功耗優(yōu)化效果將達(dá)到目前的25倍AMD在過(guò)去六年中已經(jīng)取得了令人矚目的進(jìn)展,而現(xiàn)在他們計(jì)劃將能源效率優(yōu)化節(jié)奏提高一倍

這樣的成績(jī)還不錯(cuò),但仍然無(wú)法令其滿意,Naffziger坦言。芯片尺寸壓縮所帶來(lái)的效率改善一直遵循但卻落后于Dennard所提出的準(zhǔn)則,他表示,在理想情況下效率提升幅度應(yīng)該達(dá)到14倍。

“我們需要取得效果更好、更進(jìn)一步的科研成果,”他指出,而AMD也確實(shí)制定了一套關(guān)于如何在本個(gè)十年結(jié)束之前達(dá)成25倍能效提升成果的詳盡路線圖——該公司把這個(gè)項(xiàng)目命名為“25 X 20”。

目前AMD及其它芯片廠商確實(shí)已經(jīng)在這一領(lǐng)域取得了一定程度的良好成果。能源管理在最近幾年中變得更為智能且更加細(xì)化,而就趨勢(shì)來(lái)看在同一塊處理器上納入更多計(jì)算核心與其它組件也確實(shí)能夠減少多路跨越傳輸所帶來(lái)的能源空耗。

在此基礎(chǔ)上,AMD還積極在其產(chǎn)品線當(dāng)中引入 了異構(gòu)式系統(tǒng)架構(gòu)(簡(jiǎn)稱HSA)。通過(guò)異構(gòu)式統(tǒng)一內(nèi)存訪問(wèn)(簡(jiǎn)稱hUMA)與異構(gòu)式隊(duì)列(簡(jiǎn)稱hQ)機(jī)制,CPU與GPU核心能夠共同使用同一套系統(tǒng)內(nèi)存。由于CPU無(wú)需再額外為GPU提供所要處理的數(shù)據(jù),因此這種方案在執(zhí)行效率上提升明顯——GPU會(huì)以智能化方式自行提取數(shù)據(jù)內(nèi)容。除此之外,利用GPU作為計(jì)算核心的APU還能在某些合適的處理任務(wù)中為CPU分擔(dān)工作負(fù)載,從而大大降低后者的運(yùn)轉(zhuǎn)強(qiáng)度。

現(xiàn)在真正的工作才剛剛開(kāi)始

但還將有更多計(jì)劃相繼出現(xiàn),Naffziger告訴我們。舉例來(lái)說(shuō),盡管內(nèi)置在芯片當(dāng)中的能源管理機(jī)制在過(guò)去幾年中正變得愈發(fā)智能,但其中仍然存在著尚有潛力可挖的效率提升可能。

就目前來(lái)看,AMD APU擁有三大主要電壓輸送平臺(tái)——各個(gè)區(qū)域通過(guò)自己的電力來(lái)源獲得必要的運(yùn)作動(dòng)力。電壓平臺(tái)越多,控制手段也就更細(xì)化,對(duì)能耗的控制自然越具體。

舉例來(lái)說(shuō),Naffziger表示,GPU與北橋芯片——也就是內(nèi)存接口——共享同一套電壓平臺(tái)。“在大多數(shù)情況下,GPU其實(shí)根本無(wú)事可做,”他指出。“但北橋芯片卻始終需要為CPU提供數(shù)據(jù),因此系統(tǒng)就得為二者的電壓平臺(tái)準(zhǔn)備充足的能源。”

GPU由芯片上的開(kāi)關(guān)機(jī)制控制其能源供給,他解釋道,但這套開(kāi)關(guān)機(jī)制“并不完美——它們切實(shí)生效的情況僅占約10%——而且在很多情況下我們壓根無(wú)法使用這種能源供給控制功能。”解決方案是:將GPU、北橋芯片、CPU、緩存以及其它各類組件分別指派給彼此獨(dú)立的電壓平臺(tái)。控制手段越多,能源效率自然也就越高,因?yàn)樾酒系拿恳徊糠侄紝⒛軌蚯∪缙浞值孬@得不多不少的能源供給。

“就目前來(lái)看,這項(xiàng)工作可以說(shuō)是看起來(lái)容易做起來(lái)難,”Naffziger表示。芯片的智能化演變需要以透徹掌握具體處理實(shí)例所需要的精確能源供給為前提——雖然困難重重,但將芯片細(xì)分為多個(gè)電壓平臺(tái)已經(jīng)是解決問(wèn)題的良好開(kāi)端。

“一旦我們對(duì)電壓平臺(tái)進(jìn)行細(xì)分,”他解釋道,“接下來(lái)就可以實(shí)現(xiàn)對(duì)每一種平臺(tái)的具體優(yōu)化——我們將在這里使用大量自適應(yīng)技術(shù)。我們已經(jīng)部署過(guò)其中一部分,但大多數(shù)實(shí)現(xiàn)這類實(shí)時(shí)自適應(yīng)效果的必要技術(shù)尚處于開(kāi)發(fā)過(guò)程中。”

正如我們?cè)诒驹略缧r(shí)候?qū)MD的Kaveri芯片進(jìn)行剖析時(shí)所解釋,該芯片模板當(dāng)中排列有數(shù)千個(gè)監(jiān)控單元,有些用于追蹤芯片溫度、還有一大部分在時(shí)刻關(guān)注處理活動(dòng)與能源使用情況。來(lái)自這些監(jiān)控單元的信息將被用于強(qiáng)化、削弱、關(guān)閉或者保持某些模塊元素,其目的只有一個(gè)——保持芯片始終擁有最為高效的執(zhí)行狀態(tài)。

AMD公布積極的功率改進(jìn)目標(biāo):到2020年,功耗優(yōu)化效果將達(dá)到目前的25倍

芯片上的微控制器專門負(fù)責(zé)管理來(lái)自數(shù)千個(gè)傳感器的數(shù)據(jù)

盡管這聽(tīng)起來(lái)非常簡(jiǎn)單,但利用這些監(jiān)測(cè)數(shù)據(jù)來(lái)實(shí)時(shí)進(jìn)行芯片調(diào)整、進(jìn)而實(shí)現(xiàn)運(yùn)行狀態(tài)優(yōu)化實(shí)際上非常困難。舉個(gè)例子,盡管溫度傳感器所提供的有價(jià)值反饋能夠被用于調(diào)節(jié)功率,但另有一個(gè)內(nèi)置的熱延遲溫度傳感裝置,而這種延遲狀況無(wú)法被納入單純報(bào)告活動(dòng)或者當(dāng)前功耗情況的監(jiān)控單元的考量范圍。

為了解決這一溝通難題,Naffziger表示,目前的方案之一在于利用與功耗及執(zhí)行活動(dòng)相關(guān)的數(shù)據(jù)預(yù)先為即將到來(lái)的溫度變更作好準(zhǔn)備——舉例來(lái)說(shuō),提高風(fēng)扇轉(zhuǎn)速或者將處理任務(wù)由即將發(fā)熱的計(jì)算核心轉(zhuǎn)移到另一個(gè)溫度較低、能夠充分利用的核心。

“這還只是我們?cè)缙趧?chuàng)新工作階段中的一個(gè)例子,”他指出。“還有很多機(jī)會(huì)允許我們以實(shí)時(shí)方式處理這類調(diào)整任務(wù)。”

Neffziger還談到了“爭(zhēng)取閑置”這一概念——這并不是什么新鮮思路,但卻能切實(shí)通過(guò)在短時(shí)間內(nèi)提高功率來(lái)獲得更高的處理性能,從而在短時(shí)間內(nèi)完成任務(wù)運(yùn)算、并在隨后的時(shí)間內(nèi)持續(xù)保持閑置狀態(tài)。很明顯,這樣的作法要比讓核心拖拖拉拉慢慢處理計(jì)算任務(wù)更能節(jié)約能源。

作為例子,他提到了“幀間能源選通”方案,也就是說(shuō)對(duì)某一視頻幀進(jìn)行快速渲染、然后在下一幀到來(lái)之前讓渲染器保持關(guān)閉并將內(nèi)存調(diào)整至低功耗甚至是休眠狀態(tài)。這聽(tīng)起來(lái)似乎是種反直覺(jué)的處理方式,畢竟視頻幀對(duì)于我們來(lái)說(shuō)似乎更像是一種連續(xù)的處理過(guò)程——但從處理器的角度看,根據(jù)幀率的不同、整個(gè)處理過(guò)程肯定是分段進(jìn)行的。

“兩幀之間的時(shí)間間隔是33毫秒,”他解釋稱,“但大家可以將其擴(kuò)大到一整天來(lái)理解。如果對(duì)單一視頻幀的渲染需要5到10毫秒時(shí)間,那么余下的20多毫秒完全可以用于休息、恢復(fù)精力。”

AMD公布積極的功率改進(jìn)目標(biāo):到2020年,功耗優(yōu)化效果將達(dá)到目前的25倍

聽(tīng)起來(lái)可能有點(diǎn)怪異,但通過(guò)這種方式、大家確實(shí)能夠感受到總功耗的顯著降低

更重要的是,不同的視頻在處理時(shí)需要的性能也不盡相同,因此并不是每幀內(nèi)容都要花費(fèi)同樣的渲染時(shí)長(zhǎng)。APU的視頻硬件有能力完成要求最為苛刻的處理任務(wù),因此它可以說(shuō)是一套過(guò)度配置的方案,Nafziger告訴我們。對(duì)于大多數(shù)視頻來(lái)說(shuō),根本用不到芯片的全部處理能力,因此在每幀之間進(jìn)行休眠能夠節(jié)約大量能源。
每一項(xiàng)優(yōu)化機(jī)制都需要軟件與硬件團(tuán)隊(duì)之間的緊密配合,而且研發(fā)過(guò)程也很可能極為緩慢。“大家可能會(huì)驚訝于這項(xiàng)工作需要花費(fèi)的時(shí)間。我們首先需要推出原型方案,然后處理其中存在的漏洞。一般來(lái)講,其開(kāi)發(fā)周期長(zhǎng)達(dá)三年,”他表示。

“如果我們不徹底完成這項(xiàng)耗時(shí)多年的知識(shí)產(chǎn)權(quán)內(nèi)容的開(kāi)發(fā)工作,公司絕不會(huì)冒然公布那些令人難以置信的能源效率提升目標(biāo),”這位“信心滿滿”的技術(shù)人員這樣評(píng)論AMD放出的六年能效提升25倍這一遠(yuǎn)景方案,甚至甘于承受芯片本身可榨取空間已經(jīng)越來(lái)越少的風(fēng)險(xiǎn)。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號(hào)-6京公網(wǎng)安備 11010502049343號(hào)