為了降低運(yùn)營(yíng)數(shù)據(jù)中心的費(fèi)用和服務(wù)器成本,企業(yè)經(jīng)常會(huì)花錢進(jìn)行節(jié)能減支。
企業(yè)有一些節(jié)約成本的想法,例如不需要通過(guò)花錢就能降低成本。但是通過(guò)預(yù)測(cè)分析,獲得更有效的設(shè)備或簡(jiǎn)化管理,這些都需要進(jìn)行前期的投資,而這些投資可以帶來(lái)長(zhǎng)期降低成本的回效。
網(wǎng)絡(luò)、儲(chǔ)存和服務(wù)器的成本
效率永遠(yuǎn)是節(jié)省成本的重要一環(huán)。提高效率的目標(biāo)是以穩(wěn)定的工作負(fù)載吞吐量同時(shí)最大限度提高系統(tǒng)利用率為基礎(chǔ)。提高系統(tǒng)效率可以從跨計(jì)算、存儲(chǔ)和網(wǎng)絡(luò)化優(yōu)化,從而提高系統(tǒng)效率。
更高的利用率降低了服務(wù)器的總成本。數(shù)據(jù)中心團(tuán)隊(duì)可以通過(guò)購(gòu)買較少的服務(wù)器和相關(guān)的外圍設(shè)備,均衡利用率而降低能耗;同樣的也可以降低冷卻成本。同時(shí)服務(wù)器的軟件成本也有所下降,因?yàn)檐浖S可通常由CPU數(shù)量來(lái)決定。虛擬化的普及也大大提高了硬件的利用率。
處理器的選擇
降低服務(wù)器成本的另一種方法是在系統(tǒng)上運(yùn)行最適合執(zhí)行的工作負(fù)載。這幾年來(lái)一直遵循系統(tǒng)設(shè)計(jì)的管理人員也清楚知道,CPU的物理設(shè)計(jì)限制在大約5GHz范圍。供應(yīng)商正在采取其他措施,以提高服務(wù)器性能。一些服務(wù)器使用重新設(shè)計(jì)的I/O總線或CPU和主板芯片的直連總線,如IBM的CAPI接口。另一方面,通過(guò)分類不同類型的運(yùn)算數(shù)據(jù)選擇不同的運(yùn)算單元,如傳統(tǒng)的CPU并行處理并不是強(qiáng)項(xiàng),通過(guò)GPU的特點(diǎn)進(jìn)行并行運(yùn)算和分布式計(jì)算處理數(shù)據(jù)能提高效率。多處理器加速系統(tǒng)能夠處理工作負(fù)載遠(yuǎn)快于傳統(tǒng)的系統(tǒng)設(shè)計(jì)。數(shù)據(jù)的工作負(fù)載處理更有效地意味著能使用更少的硬件設(shè)備完成數(shù)據(jù)運(yùn)算。
數(shù)據(jù)中心的運(yùn)營(yíng)成本
在世界各地,多達(dá)50%的數(shù)據(jù)中心成本來(lái)自管理系統(tǒng)、外圍設(shè)備、應(yīng)用程序和數(shù)據(jù)庫(kù)。節(jié)省運(yùn)營(yíng)成本的方法是簡(jiǎn)化。通過(guò)改變不良的或過(guò)時(shí)的方法來(lái)改進(jìn),并通過(guò)購(gòu)買新的管理軟件,以加快診斷、故障隔離和維修。
在許多數(shù)據(jù)中心,大型機(jī)用于處理海量交易數(shù)據(jù),有用的數(shù)據(jù)常駐留在主機(jī)。然而,許多企業(yè)總是只考慮并行處理的大型機(jī)而沒(méi)有兼顧到一個(gè)高性能分析服務(wù)器的重要性,用于分離主機(jī)數(shù)據(jù)與其他數(shù)據(jù)的服務(wù)器處理。要處理數(shù)據(jù),必須先從大型數(shù)據(jù)庫(kù)中提取出來(lái),轉(zhuǎn)化為普通數(shù)據(jù)服務(wù)器可用的格式和加載到單獨(dú)的存儲(chǔ),再經(jīng)過(guò)提取、轉(zhuǎn)換和加載(ETL)的過(guò)程。通常,兩個(gè)或以上的數(shù)據(jù)備份會(huì)通過(guò)ETL的處理并恢復(fù)至目標(biāo)。
數(shù)據(jù)中心可以通過(guò)優(yōu)化大型機(jī)主機(jī)級(jí)的數(shù)據(jù),降低服務(wù)器和運(yùn)營(yíng)管理成本。當(dāng)前一代主機(jī)服務(wù)器處理分析工作負(fù)載都是實(shí)時(shí)處理。而通過(guò)優(yōu)化的ETL過(guò)程可以每年節(jié)省數(shù)以百萬(wàn)計(jì)的美元。
與流行的看法相反,遷移數(shù)據(jù)并不是免費(fèi)的。把數(shù)據(jù)從大型機(jī)遷移到其他服務(wù)器,要花費(fèi)相當(dāng)于遷移至MIPS架構(gòu)服務(wù)器的成本;這其中有儲(chǔ)存系統(tǒng)的加載和管理數(shù)據(jù)的成本,包括數(shù)據(jù)系統(tǒng)的采購(gòu)和相關(guān)的存儲(chǔ)、網(wǎng)絡(luò)設(shè)備;網(wǎng)絡(luò)傳輸成本和管理服務(wù)器、存儲(chǔ)的成本。
人力資源成本
人力資源成本是數(shù)據(jù)中心的最大運(yùn)營(yíng)成本之一。根據(jù)技能和技術(shù)定位,系統(tǒng)、存儲(chǔ)、網(wǎng)絡(luò)、數(shù)據(jù)庫(kù)和應(yīng)用程序管理員的年薪為75000美元左右,有的甚至超過(guò)125000美元。如果企業(yè)并不需要那么多的技術(shù)人員來(lái)管理、調(diào)整和故障診斷系統(tǒng),這方面可以節(jié)省許多成本。
預(yù)測(cè)分析技術(shù)屬于系統(tǒng)管理,是一個(gè)主要的新發(fā)展。系統(tǒng)可自行學(xué)習(xí)分析,并自動(dòng)采取糾正措施。在故障發(fā)生或者即將發(fā)生的時(shí)候(未知故障的預(yù)測(cè)被稱為預(yù)測(cè)分析)自動(dòng)通知技術(shù)人員。如IBM的認(rèn)知環(huán)境結(jié)合分析產(chǎn)品(Watson cognitive environment)在數(shù)據(jù)中心里已經(jīng)是行業(yè)的領(lǐng)先技術(shù),包括日志分析提供預(yù)測(cè)分析。利用IBM的業(yè)務(wù)分析,通過(guò)對(duì)異常大數(shù)據(jù)日志文件的搜索,然后系統(tǒng)采取自動(dòng)化腳本或簡(jiǎn)化的通知進(jìn)行處理。其他數(shù)據(jù)中心的供應(yīng)商也應(yīng)該將這種自動(dòng)分析和管理工具集推廣開(kāi)來(lái)。系統(tǒng)越自動(dòng)化認(rèn)知分析并處理問(wèn)題,數(shù)據(jù)中心的人為管理也越相應(yīng)減少。
IBM的zAware可以監(jiān)控主機(jī)環(huán)境,記錄主機(jī)在什么時(shí)候運(yùn)行最佳。如果出現(xiàn)了故障,zAware會(huì)將出故障的主機(jī)隔離。并清晰的指明主機(jī)的故障定位,相信在不久的將來(lái),分布式服務(wù)器世界中也會(huì)有同樣的類型的軟件。
企業(yè)應(yīng)考慮采用新一代采用認(rèn)知分析為導(dǎo)向的管理軟件,以降低運(yùn)營(yíng)成本。