現(xiàn)在,挑戰(zhàn)即將來(lái)臨,AMD準(zhǔn)備祭出的Zen架構(gòu)貌似具有巨幅的性能提升,加上AMD原本具有的圖形性能優(yōu)勢(shì),Intel不可避免感受到新一輪大戰(zhàn)來(lái)臨的氣息。同時(shí),無(wú)論是蘋(píng)果還是聯(lián)想、HP、戴爾這些PC廠商,它們的產(chǎn)品線都到了更新?lián)Q代的關(guān)口。Intel第七代Core架構(gòu)“KabyLake”也因此備受矚目,它也是我們接下來(lái)要分析的對(duì)象。
Kaby Lake的14納米工藝
我們知道,Intel的Tick-Tock工藝、架構(gòu)兩步走策略已經(jīng)實(shí)施很多年了,過(guò)去按照第一年更新架構(gòu),次年就同架構(gòu)升級(jí)制造工藝,接下來(lái)一年再更新架構(gòu),如此交替穩(wěn)步進(jìn)行。這種方式很穩(wěn)妥,保證了工藝良率,產(chǎn)品性能也能夠持續(xù)地提升。
14納米的Kaby Lake晶圓
Kaby Lake的芯片核心布局圖,集成了CPU、圖形核心、內(nèi)存控制器以及I/O功能
14納米工藝:更好的晶體管性能
但是到了14納米階段,Tick-Tock模式就出現(xiàn)問(wèn)題了,本來(lái)在今年,Intel就應(yīng)該切換到10納米階段,這個(gè)過(guò)程顯然不太順利。Intel仍然需要依靠成熟的14納米工藝來(lái)解決問(wèn)題,為此,Intel將產(chǎn)品線更新?lián)Q代分為工藝、架構(gòu)、優(yōu)化三步走的方案,更新周期從過(guò)去的24個(gè)月延長(zhǎng)到36個(gè)月,這就意味著性能提升的腳步不可避免變得更慢,Intel也必須在優(yōu)化工作上下更多的工夫。
CPU架構(gòu)部分,Kaby Lake繼承了Sky Lake核心、也就是第六代Core架構(gòu),所以光從IC設(shè)計(jì)角度來(lái)看,Kabylake的CPU性能實(shí)際上是止步不前的。唯一不同之處在于,Intel對(duì)14納米工藝進(jìn)行改良升級(jí)、號(hào)稱(chēng)14納米,新工藝擁有更好的晶體管性能。Kaby Lake的晶體管性能比前代產(chǎn)品提升了將近12%,這給它帶來(lái)了更出色的能效表現(xiàn)。
Kaby Lake與前幾代Core架構(gòu)的能耗對(duì)比
再來(lái)看看Intel給出的對(duì)比表,如果以2010年的第一代Core架構(gòu)為參照物,當(dāng)時(shí)能耗最低的移動(dòng)處理器功耗為18瓦,到了第四代架構(gòu)時(shí),功耗降低到11.5瓦,能效提升高3.5倍;而到第六代Core,能耗進(jìn)一步降低到4.5瓦,能效提高了整整八倍!那到了現(xiàn)在的kaby lake,雖然最低能耗保持在4.5瓦,但性能提升顯著,能效比的提升幅度達(dá)到了10倍!也就是相對(duì)于現(xiàn)在的第六代Core,Kaby lake的能源效率提升了20%。
增強(qiáng)的Speed Shift技術(shù):加快響應(yīng)速度
在第六代Core架構(gòu)中,Intel引入了一項(xiàng)名為“Speed Shift”的電源管理技術(shù),它主要改進(jìn)了系統(tǒng)的突發(fā)響應(yīng)時(shí)間。Intel過(guò)去一直采用SpeedStep移動(dòng)電源管理技術(shù),配合操作系統(tǒng),可以根據(jù)工作負(fù)載的不同、動(dòng)態(tài)地調(diào)節(jié)處理器的工作頻率和能耗,從而達(dá)到節(jié)能的目的。但這項(xiàng)技術(shù)的缺點(diǎn)是必須經(jīng)過(guò)操作系統(tǒng),頻率的切換速度較慢、最快也得30毫秒。Speed Shift技術(shù)很好地解決了這個(gè)問(wèn)題,它繞過(guò)了操作系統(tǒng)、讓處理器能夠直接與電源控制單元溝通,并將所有電源狀態(tài)都開(kāi)放給操作系統(tǒng),三者配合之下,SpeedShift平臺(tái)最快可以在1毫秒的時(shí)間內(nèi)完成狀態(tài)切換。
Speed Shift帶來(lái)更快的頻率切換響應(yīng)
不過(guò),第六代Core架構(gòu)的SpeedShift只針對(duì)原先的節(jié)能機(jī)制,Intel還有一項(xiàng)睿頻(turbo boost )技術(shù),它的邏輯剛好與SpeedStep相反——睿頻可以在CPU面對(duì)高負(fù)載應(yīng)用下將運(yùn)行頻率提高數(shù)百個(gè)MHz,達(dá)到加速運(yùn)行的目的。不過(guò)第六代Core的睿頻切換延遲需要接近100毫秒,而現(xiàn)在Kaby Lake平臺(tái)也對(duì)此作出改進(jìn),新一代SpeedShift技術(shù)可以讓睿頻狀態(tài)的加速延遲降低到5毫秒。
要說(shuō)明的是,是否開(kāi)啟Speed Shift,CPU的性能基準(zhǔn)都是一樣的,它的功能在于能夠大大提高不同負(fù)載的切換速度,從而將性能效率提升最多20%。
更高頻率帶來(lái)顯著性能提升
體現(xiàn)在最終產(chǎn)品上,就是Kaby Lake可以在同等功耗時(shí)工作在更高的頻率上,比如同樣為15W功耗,Kaby Lake核心的Core i7 7500U的頻率為2.7GHz,睿頻最高到3.5GHz;而現(xiàn)有的Core i7 6500U頻率只有2.5GHz,睿頻最高只有3.1GHz,差距還是比較明顯的。在體現(xiàn)商用性能的Sysmark 2014評(píng)測(cè)軟件中,7500U的性能比6500U高出12%左右;在Web性能的WebXPRT 2015的評(píng)測(cè)軟件中,7500u的性能提升達(dá)19%。不過(guò)最大幅度的提升還是WinRAR壓縮解壓應(yīng)用,7500U的優(yōu)勢(shì)擴(kuò)大到28%,這主要得益于睿頻時(shí)額外增加的400MHz頻率提升。
Kaby Lake 核心的Core i7 7500U與上一代6500U的性能對(duì)比
Kaby Lake的GPU部分
kaby Lake的GPU核心同樣繼承上一代產(chǎn)品,在Intel的體系中仍屬于第九代架構(gòu),圖形核心依然由EU單元構(gòu)成,內(nèi)部設(shè)計(jì)沒(méi)有什么變動(dòng)。根據(jù)處理器版本不同,Kaby Lake的GPU也分為GT2、GT4等多種配置,性能最高的GT4包括72個(gè)EU執(zhí)行單元,GT2為24個(gè)執(zhí)行單元,數(shù)量與第六代Core相同,不同的地方在于Intel提升了eDRAM 四級(jí)緩存的配置——比如最高性能版本可以集成256MB的eDRAM四級(jí)緩存,而現(xiàn)有第六代核心最高只能到128MB。
在沒(méi)有明顯改動(dòng)EU單元內(nèi)部設(shè)計(jì)、提高EU數(shù)量的情況下,指望Kaby Lake的圖形性能有大幅度提升是不現(xiàn)實(shí)的,這對(duì)于用戶來(lái)說(shuō)多少會(huì)有些遺憾。但I(xiàn)ntel的問(wèn)題在于,如果AMD的Zen架構(gòu)能夠按期在2017年發(fā)布,那么Zen架構(gòu)有望在處理器性能方面趕上Intel,而圖形性能又是AMD的強(qiáng)項(xiàng)。所以對(duì)Intel來(lái)說(shuō),Kaby Lake一如既往的圖形性能會(huì)有一些麻煩,至少用戶對(duì)它們會(huì)很不感冒。
值得慶幸的是,Kaby Lake在視頻性能方面獲得大幅度的增強(qiáng),Intel為它加入了增強(qiáng)的視頻引擎,它包括MFX(Multi-Format Codex ,多媒體解碼器)和VQE(Video Quality Engine ,視頻質(zhì)量引擎)兩個(gè)部分。
MFX單元與VQE引擎
MFX是一個(gè)增強(qiáng)的解碼器單元,它增加了10bit HEVC和8/10bit VP9格式的編碼器和解碼器。其中,HEVC是一套先進(jìn)的視頻格式標(biāo)準(zhǔn),它可以讓1080P視頻內(nèi)容的壓縮效率提高50%左右。這項(xiàng)優(yōu)勢(shì)讓它被認(rèn)為是H.264、MPEG-4的最佳代替者,能夠滿足4K、8K視頻時(shí)代的內(nèi)容壓縮要求。不過(guò),HEVC也因此具備更高的算法復(fù)雜度,對(duì)硬件要求要比H.264高得多,之前Intel的核顯只提供到8bit的HEVC硬加密能力,面對(duì)10bit HEVC內(nèi)容時(shí)仍只能依靠CPU低效地完成。而在Kaby Lake架構(gòu)中,新加入的MFX單元將讓觀看4K HEVC高清內(nèi)容變得輕松自如。
VP9則是Google開(kāi)發(fā)的視頻格式,它是一套開(kāi)放的壓縮標(biāo)準(zhǔn),可以提供比H.264更好的圖像質(zhì)量、同時(shí)碼率卻只有它的一半左右。這次Kaby Lake納入了VP9的編解碼功能,支持8bit的硬編碼和8bit/10bit的解碼,可以讓Kaby Lake平臺(tái)在在線視頻應(yīng)用中具有顯著的性能提升。
除了這兩項(xiàng)重要改進(jìn)外,Kaby Lake的MFX單元還改善了無(wú)線顯示時(shí)的畫(huà)面質(zhì)量,也提升了現(xiàn)行H.264/MPEG-4 AVC編解碼的性能。
MFX、VQE的詳細(xì)改進(jìn)點(diǎn)
VQE引擎則在第四代Core架構(gòu)時(shí)開(kāi)始引入,現(xiàn)在它有了新功能:具有更寬的色域,并且在高動(dòng)態(tài)范圍和標(biāo)準(zhǔn)動(dòng)態(tài)范圍下都能獲得應(yīng)用。為了實(shí)現(xiàn)這一點(diǎn),Intel對(duì)VQE引擎作了進(jìn)一步改進(jìn),包括反交錯(cuò)、降低噪音、色彩增強(qiáng)、色彩校正等等。同時(shí),新一代VQE還擁有更好的能效表現(xiàn):在實(shí)現(xiàn)寬色域和HDR支持時(shí),它只需要消耗40-50毫瓦的能源,讓它在播放4K內(nèi)容時(shí),能夠提供更好的畫(huà)面觀賞效果,同時(shí)不需擔(dān)心設(shè)備發(fā)熱會(huì)顯著上升。
Kaby Lake獲得增強(qiáng)的MFX/VQE媒體引擎
實(shí)際性能增強(qiáng)
KabyLake的上述改進(jìn),讓它得以勝任4K時(shí)代的現(xiàn)實(shí)需求。用數(shù)據(jù)能更直觀地看出這一點(diǎn)。
KabyLake平臺(tái),可以支持最多8組4Kp/30(4K逐行、30幀速率)的超高清視頻同時(shí)播放;或者是流暢地播放4Kp/60(4K逐行、60幀速率)的高質(zhì)量視頻,此時(shí)視頻的流速達(dá)到120Mbps,這意味著Kaby Lake的媒體引擎要在一秒內(nèi)完成120Mbit數(shù)據(jù)的實(shí)時(shí)解碼,運(yùn)算力相當(dāng)強(qiáng)大。而它的能源效率也非??捎^:功耗只有4.5W的Y系列處理器,就可以完成HEVC格式的4Kp/30視頻的實(shí)時(shí)編碼,也就是像Macbook這樣的超輕薄小本,都可以很好完成這類(lèi)繁重的視頻創(chuàng)建任務(wù)。
那么對(duì)終端用戶來(lái)說(shuō),換用新平臺(tái)和沿用現(xiàn)行的第六代平臺(tái),又能帶來(lái)多少實(shí)際的好處呢?首先一個(gè)最明顯的好處就是降低了能耗。Intel采用《鋼鐵之淚(Tears of Steel)》的開(kāi)源電影短片來(lái)展示兩代平臺(tái)的差異,視頻基于10bit HEVC格式、4K清晰度,在現(xiàn)行的Core i7-6500U平臺(tái)中,視頻播放是依靠GPU和CPU一起混合解碼的,此時(shí)CPU占用率要達(dá)到50%左右,而CPU/GPU的整體能耗達(dá)到10.2瓦。另一套Kaby Lake架構(gòu)的對(duì)比平臺(tái)則采用對(duì)應(yīng)的Core i7-7500U處理器,由于它可以完全由CPU進(jìn)行硬解碼,CPU/GPU的功耗只有驚人的0.5瓦—這也意味著足足具有20倍的能源效率提升,而播放本地4K視頻時(shí)的電池續(xù)航時(shí)間也因此可以提升2.6倍之多!
在4K HEVC 10bit內(nèi)容解碼時(shí),Kaby Lake平臺(tái)展現(xiàn)出強(qiáng)大的能耗優(yōu)勢(shì)
如果應(yīng)用的對(duì)象換為在線視頻、結(jié)果會(huì)如何呢?對(duì)比的上述兩個(gè)平臺(tái)都用Chrome瀏覽器來(lái)播放Youtube上的4K VP9格式視頻,其中Core i7-6500U在CPU/GPU部分用了5.8瓦能源,而Core i7-7500U只用了0.8瓦,能耗降低了7倍!
換算過(guò)來(lái),在播放Youtube的4K視頻時(shí),KabyLake平臺(tái)可以獲得1.75倍的額外電池續(xù)航時(shí)間。目前基于Corei7-6500U的筆記本電腦,在播放這類(lèi)4K視頻時(shí)一般具有4小時(shí)左右的續(xù)航力,那么按此推算、Core i7-7500U平臺(tái)就能達(dá)到7小時(shí)左右。
不僅如此,Kaby Lake提供的性能冗余也讓它為未來(lái)做好了準(zhǔn)備,比如它可以勝任360度的4K內(nèi)容、也就是沉浸式的4K VR應(yīng)用,而當(dāng)前的第六代Core平臺(tái)無(wú)法滿足這一點(diǎn)。
Kaby Lake與第六代Core架構(gòu)在視頻方面的功能對(duì)比
Kaby Lake的產(chǎn)品線分布
與前次升級(jí)一樣,KabyLake擁有一個(gè)完備的產(chǎn)品線,包括S系列、H系列、U系列和Y系列,跨越從高性能桌面、工作站到超輕薄筆記本的廣闊市場(chǎng),具體到產(chǎn)品型號(hào)上還是劃分為i7、i5、i3三個(gè)不同等級(jí)。
面向主流市場(chǎng)的仍然會(huì)是i3、i5和i7三個(gè)系列
針對(duì)桌面和工作站:S系列
S系列面向的是高性能市場(chǎng),它包含許多不同的型號(hào),主要以鎖頻與否、功耗和GPU配置作為區(qū)分。其中性能最高的是K開(kāi)頭的型號(hào),它擁有四個(gè)處理器核心,搭載GT2級(jí)別的常規(guī)圖形核心,最大的特點(diǎn)是不鎖倍頻、允許大家自由超頻,功耗達(dá)91瓦。這個(gè)系列將在2017年初發(fā)布。
Kaby Lake S系列平臺(tái)架構(gòu)
面向主流桌面的四核處理器則鎖了倍頻,功耗在35瓦到65瓦之間,它搭載了性能更高的GT4圖形核心,內(nèi)部集成了64MB的四級(jí)緩存,它的發(fā)布時(shí)間比不鎖頻的K系列稍遲一些。
而針對(duì)服務(wù)器和工作站的Xeon系列四核處理器,沒(méi)有整合圖形核心的有80瓦、54瓦和25瓦三種能耗配置,主要面向需要與GPU加速卡配合的高性能計(jì)算平臺(tái)。而帶GT2圖形核心的有25-80瓦能耗配置,主要面向Web服務(wù)器、文件服務(wù)器、FTP服務(wù)器這類(lèi)常規(guī)的商業(yè)云環(huán)境。
S系列的芯片平臺(tái)采用“處理器PCH”的組合方案。處理器部分,S系列支持雙通道DDR3L-1600和DDR4-2400兩種方案,OEM廠商可以自行決定要采用哪種內(nèi)存。此外,它還包括一條PCI Express 3.0X16規(guī)格的圖形總線、用于外接顯卡,接口的帶寬達(dá)到32GB/s。另外,它還支持三路數(shù)字顯示接口輸出,以及一個(gè)eDP嵌入式接口。
PCH方面,Kaby Lake可以兼容第六代Core的100系列芯片組,不過(guò)它配套的應(yīng)該是改進(jìn)后的200系列產(chǎn)品,除了USB 3.1支持、HDA高清音頻、SATA硬盤(pán)總線外,200系列芯片將原本的20路PCIExpress 3.0總線提升到24路,總計(jì)提供48GB/s的雙向帶寬,可以支持Intel的Optane硬盤(pán)。它實(shí)際上是Intel的3D XPoint閃存技術(shù)的正式名稱(chēng),介于傳統(tǒng)內(nèi)存、固態(tài)硬盤(pán)之間,可以提供極高的性能和極低的延遲。
針對(duì)高性能筆記本電腦:H系列
H系列是Kaby Lake的移動(dòng)高性能版,它采用BGA1440封裝、TDP功耗在35-45瓦范圍內(nèi)。H系列都擁有四個(gè)CPU核心,35瓦功耗版搭載標(biāo)準(zhǔn)版的GT2圖形核心,面向主流高性能市場(chǎng)。不過(guò),Intel還為頂級(jí)玩家準(zhǔn)備了45瓦功耗的頂級(jí)型號(hào),它將搭載GT4圖形核心,并內(nèi)建了128MB的eDRAML4高速緩存。不過(guò)它還不是最快的,Kaby Lake H家族還包含一款高達(dá)256MB L4緩存的頂級(jí)型號(hào),沒(méi)有例外的話,它也將成為Kaby Lake家族中圖形性能最出色的處理器。
H系列同樣采用處理器PCH的解決方案,功能強(qiáng)大、但需要較大尺寸的主板才能容納。
針對(duì)超極本:15/28瓦的U系列
U系列是Kaby Lake的移動(dòng)低功耗版本,主要針對(duì)的是超極本市場(chǎng)。U系列采用BGA1356封裝,功耗最低的版本TDP為15瓦,最高的型號(hào)是28瓦。U系列都包括兩個(gè)CPU核心,圖形部分有GT2、GT3兩個(gè)版本,兩者的區(qū)別主要是內(nèi)建的eDRAM四級(jí)緩存——GT2版本并不包含、只能共享內(nèi)存作為顯存,而GT3內(nèi)建了64MB的eDRAM,性能會(huì)更出色一些。
U系列有一個(gè)很重要的特點(diǎn)就是內(nèi)建了SOC功能,也就是將PCH芯片與KabyLake CPU芯片集成在一起,這樣就在一個(gè)處理器封裝模塊上同時(shí)實(shí)現(xiàn)包括CPU、圖形核心、芯片組等所有的功能,主板的設(shè)計(jì)尺寸因此可以被大幅度縮小??梢砸?jiàn)到,當(dāng)前搭載第六代Core架構(gòu)U系列處理器的超極本都可以做到驚人的輕薄尺度,原因也是處理器封裝里包括PCH芯片。
kaby Lake U系列處理器,處理器和PCH芯片集成在一起
Kaby Lake U系列的邏輯架構(gòu),采用雙芯片、單模塊的SOC集成設(shè)計(jì)
內(nèi)存支持方面。U系列也是雙通道DDR3L和DDR4,不過(guò)它在I/O方面的功能久相對(duì)弱一些,比如只支持兩路數(shù)字顯示輸出和一個(gè)嵌入式eDP顯示接口,更遺憾的是只能支持到USB 3.0,未免有些落伍。此外,對(duì)于SSD它準(zhǔn)備了SATA和PCIExpress兩種接口,可以很好地滿足現(xiàn)實(shí)需要。
針對(duì)平板電腦:4.5瓦的Y系列
Y系列其實(shí)就是之前的Core M產(chǎn)品,面向的是平板電腦以及追求極致輕薄的超便攜機(jī)型。Y系列采用BGA1515封裝,它的主要訴求是低至4.5瓦的超低功耗水平,這讓它可以保持無(wú)風(fēng)扇運(yùn)行。Y系列都整合了GT2圖形核心、不帶eDRAM高速緩存。由于Y系列面向尺寸更小的計(jì)算市場(chǎng),處理器封裝也采用SOC設(shè)計(jì)、同樣集成了PCH芯片。I/O功能與U系列完全相同,它也沒(méi)法原生支持USB 3.1。
同樣雙芯片、更為緊湊的Y系列
需要換Kaby Lake平臺(tái)么?
如果你已經(jīng)在用六代平臺(tái)或者四五代平臺(tái),純粹因?yàn)樾阅艿年P(guān)系升級(jí)到七代平臺(tái),我們認(rèn)為你或多或少會(huì)覺(jué)得失望,Kaby Lake平臺(tái)的性能固然得到提升,視頻方面的能力也非常強(qiáng)大,但它更多是一種漸進(jìn)式的改進(jìn)。
Intel也深知這一點(diǎn),它采用五年前的PC平臺(tái)作為參照物加以說(shuō)明。對(duì)比五年前的平臺(tái),Kaby Lake在商務(wù)應(yīng)用中可以獲得1.7倍的性能提升;此外,Kaby Lake可以很好地勝任4K視頻創(chuàng)次建和播放的需要。通俗一點(diǎn)說(shuō),我們認(rèn)為五年前的PC也能夠完成大多數(shù)日常任務(wù),但如果升級(jí)到Kaby lake平臺(tái),大家可以直觀地感受到運(yùn)行速度更快、CPU占用率更低、平臺(tái)的發(fā)熱量更小、風(fēng)扇更加安靜。假如你要在電腦中運(yùn)行多個(gè)虛擬機(jī),那么就會(huì)恨不得榨取每一分的性能,Kaby Lake平臺(tái)在這些方面就有明顯優(yōu)勢(shì)。從這些人性化體驗(yàn)的角度來(lái)看,我們認(rèn)為升級(jí)到新一代平臺(tái)還是有著明顯的好處。
AMD ZEN處理器的各種“泄漏”,相信也給了Intel一定的壓力和動(dòng)力
只不過(guò),Intel還需要面對(duì)的一個(gè)潛在問(wèn)題,就是AMD的Zen架構(gòu)能具有什么樣的表現(xiàn),假如Zen在處理器性能和效率上趕上Intel的步伐,那么Intel將重新經(jīng)歷久違的市場(chǎng)競(jìng)爭(zhēng)——畢竟AMD在圖形領(lǐng)域具有不對(duì)稱(chēng)的優(yōu)勢(shì),它所欠缺的其實(shí)就是一個(gè)強(qiáng)有力的CPU平臺(tái)。我相信消費(fèi)者樂(lè)見(jiàn)于此,沒(méi)有競(jìng)爭(zhēng),市場(chǎng)只會(huì)一潭死水、廠商缺乏前進(jìn)的動(dòng)力,我們也無(wú)法看到IT技術(shù)所應(yīng)有的高速演進(jìn)。