當下,大數(shù)據(jù)挖掘與分析、云計算、移動和社交技術(shù)正在改變企業(yè)業(yè)務(wù)模式。據(jù)統(tǒng)計,近75%的企業(yè)決策者認為大數(shù)據(jù)分析、云計算、移動和社交技術(shù)對企業(yè)具有重要的戰(zhàn)略意義,在技術(shù)采用上,有70%的企業(yè)正在應(yīng)用這些技術(shù)。
大數(shù)據(jù)分析與云計算等趨勢不斷沖擊著各個行業(yè),包括企業(yè)內(nèi)部基礎(chǔ)架構(gòu)。為此,企業(yè)急需一個快速靈活的基礎(chǔ)架構(gòu)以滿足數(shù)據(jù)爆炸式增長的數(shù)據(jù)分析管理與云中業(yè)務(wù)的動態(tài)調(diào)整。
開放Power8系統(tǒng) 擁抱云計算、大數(shù)據(jù)時代
在這樣背景下,IBM整體業(yè)務(wù)正緊緊依托著云計算、移動、大數(shù)據(jù)三個領(lǐng)域展開,而IBM Power8正是藍色巨人的代表產(chǎn)品之一。
Power 8的推出,旨在處理海量數(shù)據(jù)來幫助企業(yè)更好的管理新興社交和移動計算的需求。IBM一直倡導、參與和支持Linux和開源軟件,并將開源技術(shù)融入Power平臺,并針對Power Systems服務(wù)器投入大量資金用以研發(fā)最新的Linux和其它開源技術(shù)。
在支持Linux和開源之后,更加智能的橫向擴展不再只是x86的優(yōu)勢,Power在大數(shù)據(jù)挖掘與分析、云計算部署方面將發(fā)揮更大的性能,更好的體現(xiàn)為云計算設(shè)計、為大數(shù)據(jù)而生的預置能力,基于Power 8技術(shù)的IBM Power Systems服務(wù)器在大數(shù)據(jù)分析速度上比最新的x86系統(tǒng)快82倍。
而在云計算方面,Power 8提供了更低的云基礎(chǔ)架構(gòu)成本。據(jù)IBM測算,34臺2插槽Power服務(wù)器可完成100臺運行等效的虛擬化容量的2插槽x86服務(wù)器的工作,與VMware+Ivy Bridge的組合相比,PowerVM+Power 8的虛擬化組合總體硬件采購成本要降低58%,系統(tǒng)和核心數(shù)量減少66%。
總的來說,IBM Power 8能夠幫助客戶管理日益復雜和數(shù)據(jù)密集的工作負載,使基礎(chǔ)架構(gòu)更好地應(yīng)對云計算和移動計算挑戰(zhàn),正是依靠其動態(tài)并行多線程、Power 8Linux KVM分核技術(shù)和芯片級控制器加強電源管理能力。并且,Power 8針對大數(shù)據(jù)優(yōu)化內(nèi)存帶寬、PCIe、SMT、虛擬尋址和硬件管理的緩存的一致性有著優(yōu)異的表現(xiàn)。
開發(fā)者論道Power 8大數(shù)據(jù)分析實戰(zhàn)
為了讓開發(fā)者了解和充分利用Power 8的優(yōu)勢,最大限度提升大數(shù)據(jù)和分析、移動、社交應(yīng)用的性能和并發(fā)訪問能力。去年9月份,IBM與CSDN聯(lián)合舉行Power 8極限性能挑戰(zhàn)賽,以云計算的方式為開發(fā)者提供了Power 8開發(fā)環(huán)境,開發(fā)者將充分利用Power 8的特性,基于不同場景進行應(yīng)用開發(fā)。
到目前為止,已有數(shù)百名開發(fā)者報名并參加了此次大賽,大賽評委們一致認為無論是參賽作品的數(shù)量、完成質(zhì)量和時間上,都已經(jīng)大大超出預期。
在第一期“博客反垃圾”比賽中,參賽者需開發(fā)系統(tǒng)從CSDN提供海量的博文數(shù)據(jù)中將垃圾博文從中抽取出來。其中,逸云計算機科技有限公司 CEO/總裁黃文超作為參賽者,運用 “中文分詞技術(shù)”、“詞頻-逆文本頻率指數(shù)(TF-IDF)”和“余弦定理文本分類方法”計算模型進行參賽,在Power 8環(huán)境里運行時間為0.26秒。
賽后,黃文超表示,在Power 8環(huán)境里運行計算模型,真正體驗到高性能并發(fā)處理的魅力,處理海量博文數(shù)據(jù)比預計用時更短。為了把Power 8平臺的計算性能發(fā)揮到極致進行大量并發(fā)測試實驗,結(jié)果顯示處理時間縮短了88.13秒。
通過此次比賽驗證,開發(fā)者利用IBM最新Power 8的并發(fā)多線程技術(shù)則可以達到響應(yīng)數(shù)倍的效率。“從大數(shù)據(jù)技術(shù)發(fā)展可以看出,并發(fā)多線程技術(shù)是大勢所趨。在未來的數(shù)據(jù)處理應(yīng)用中,并行算法、分布式計算將占據(jù)主導地位。” 軟通動力信息技術(shù)有限公司 軟件工程師侯偉婷,對于多線程及并發(fā)編程技術(shù)發(fā)展及改進,提出自己的看法。
對于IBM Power 8關(guān)注的技術(shù)要點以及未來大數(shù)據(jù)領(lǐng)域技術(shù)趨勢的看法,南京烽火通信公司研究員吳亮說:“Power 8架構(gòu)的并行算法,不僅讓我體驗到快速處理海量數(shù)據(jù)的能力,而且任務(wù)之間相互獨立,提高了計算效率。同時,我認為大數(shù)據(jù)計算的并發(fā)技術(shù),將是未來這個領(lǐng)域的趨勢。
在第二期“敏感詞大文本過濾” 比賽中,參賽選手編寫算法將從CSDN提供博客數(shù)據(jù)與敏感詞詞庫,將含有敏感詞的博客分離出來。關(guān)于算法設(shè)計思路及使用的計算模型,北京理工大學唐剛提出兩種計算方式:方法1:非監(jiān)督學習方法,規(guī)則匹配(敏感詞表*博客總數(shù)次匹配,計算出相應(yīng)敏感詞得分),計算出敏感詞表全部累計得分,最終輸出結(jié)果。方法2:借助其他詞語庫完成,運用二值分類方式輸出結(jié)果,最終唐剛比賽成績?yōu)?.14秒。
賽后,唐剛表示,一直以來十分關(guān)注多線程及并發(fā)編程技術(shù)應(yīng)用,IBM Power8的多線程計算充分發(fā)揮計算程序應(yīng)有的效率,有效降低運算線程通信時間,結(jié)果比想象中計算時間比例低很多。最初在本機運算時間大約為40秒左右,在運用Power 8平臺計算后,時間提高了幾百倍。
隨著大數(shù)據(jù)時代的發(fā)展,多線程及并發(fā)編程技術(shù)會變得越來越重要,同時,越來越多的開發(fā)者正在關(guān)注IBM Power8平臺的技術(shù)發(fā)展。“通過實際應(yīng)用體驗到IBM Power8平臺在計算性能的優(yōu)越。從我本身工作來說,希望Power 8平臺能在云上提供服務(wù),讓Web開發(fā)者有更好的選擇。”中國科學技術(shù)大學研究生孫冬冬表達了使用IBM Power8平臺的感受以及對其應(yīng)用提出了期望。。