隨著云計算的不斷落地和普及,OpenStack也跟著火起來,是當(dāng)前最受關(guān)注的云計算架構(gòu)。OpenStack最早是由NASA(美國國家航空航天局)和Rackspace合作研發(fā)并發(fā)起的,是一個旨在為公共及私有云的建設(shè)與管理提供軟件的開源項目。
在與其他平臺的競爭中OpenStack脫穎而出,已經(jīng)成為開源云平臺事實上的標(biāo)準(zhǔn),而且擁有非常好的生態(tài)環(huán)境,它的社區(qū)擁有超過550家企業(yè)及32000位開發(fā)者,這些機(jī)構(gòu)與個人都將OpenStack作為基礎(chǔ)設(shè)施即服務(wù)(IaaS)資源的通用前端。全世界各地都有很多用戶在嘗試以O(shè)penStack為基礎(chǔ)部署自己的云計算平臺。
清華大學(xué)交叉信息研究院就是這樣的一個用戶,其計算機(jī)系統(tǒng)實驗室負(fù)責(zé)人一直在做云計算方面的嘗試,想在學(xué)院內(nèi)部建立起一套云計算模式供學(xué)生及教師們使用。而與其他院校不同的是,交叉研究院本身也在做計算機(jī)系統(tǒng)架構(gòu)方面的科學(xué)研究。據(jù)介紹,清華大學(xué)交叉信息研究院是由圖靈獎獲得者姚期智創(chuàng)立,研究院主要做兩個方向的研究,一是傳統(tǒng)計算機(jī)方向,二是量子信息方向。
清華大學(xué)交叉信息研究院tenure-track助理教授,助理院長計算機(jī)系統(tǒng)實驗室負(fù)責(zé)人徐葳
傳統(tǒng)科研機(jī)構(gòu)大都是用超算來進(jìn)行科研的,為什么交叉信息研究院偏愛OpenStack云計算呢?清華大學(xué)交叉信息研究院計算機(jī)系統(tǒng)實驗室負(fù)責(zé)人在接受51CTO記者采訪時表示,傳統(tǒng)的超算系統(tǒng)有幾個重要的問題無法滿足他們的需求。第一是靈活性,傳統(tǒng)超算上的軟件應(yīng)用有一些局限性,無法做到完全靈活。第二是性能,大多數(shù)企業(yè)在性能遇到瓶頸時,可以通過降低軟件資源利用率來解決。但是交叉信息研究院大都是批處理任務(wù),對速度的要求比較高。第三是用戶環(huán)境,學(xué)校里的用戶有一個特點,學(xué)生對系統(tǒng)架構(gòu)大多是半懂不懂的狀態(tài),這其實對運(yùn)維而言是最可怕的用戶。他們一般都不看教程說明書,有時候會運(yùn)行一些比較極端的應(yīng)用,弄不好系統(tǒng)就宕機(jī)了。還有一個最大的問題是交叉信息研究院是一個實驗室,是科研系統(tǒng),這類系統(tǒng)通常是沒有專職管理人員的。像交叉信息研究院有180多臺服務(wù)器,卻只有一個人全職管理。
清華大學(xué)交叉信息研究院與OpenStack的第一次親密接觸
熟悉OpenStack的人應(yīng)該都知道,OpenStack雖然很美好,但對于普通企業(yè)和開發(fā)者而言,OpenStack比較復(fù)雜,不容易實現(xiàn),如果企業(yè)內(nèi)部沒有大量的研發(fā)人員,恐怕很難應(yīng)對。
對于只有一個全職管理人員的交叉信息研究院來說這可以說是一個巨大的挑戰(zhàn),徐教授回憶起第一次在OpenStack上的嘗試時頗顯無奈:“之前我們也跑過一段時間,不是非常成功。主要原因是管理問題。學(xué)生們遇到宕機(jī)了,全都來找我,但是OpenStack很復(fù)雜,真的很難修復(fù)。”
徐教授形容當(dāng)時的狀態(tài)是白天干教授的活兒,夜里一點以后就變成修機(jī)器的,很顯然這樣的情況是不能長久維持下去的,這就有了交叉信息研究院在OpenStack上的第二次嘗試,這次徐院長找來了更為專業(yè)的英特爾和EasyStack兩家方案提供商。
清華大學(xué)交叉信息研究院與OpenStack的第二次親密接觸
可能有一些讀者對EasyStack這家廠商還不太熟悉,EasyStack成立于2014年,創(chuàng)業(yè)團(tuán)隊的成員都是OpenStack方面資深的研發(fā)專家,具有非常強(qiáng)的技術(shù)背景,目前是OpenStack的企業(yè)會員。
EasyStack高級架構(gòu)師石奎
EasyStack高級架構(gòu)師石奎給我們做了詳細(xì)的介紹,其主打產(chǎn)品叫做ESCloud,是基于OpenStack社區(qū)版本進(jìn)行計算、存儲、網(wǎng)絡(luò)各方面的增強(qiáng),推崇極致體驗、極致可靠、極致性能、極致開放。并緊跟社區(qū),以積極開放的態(tài)度回饋社區(qū),將EasyStack做的一些東西為社區(qū)添磚加瓦。
在對徐教授的采訪中,他透露了選擇EasyStack的原因。第一是EasyStack一直和清華大學(xué)有合作,對自己的系統(tǒng)架構(gòu)比較了解。第二是EasyStack的服務(wù)保障體系非常好,學(xué)生使用機(jī)器再出現(xiàn)故障就可以直接由EasyStack提供服務(wù)。EasyStack一直秉承客戶至上和All-in的態(tài)度,所謂All-in就是盡可能將所有最優(yōu)質(zhì)的服務(wù)呈現(xiàn)給客戶,以最及時的方式幫助客戶把在服務(wù)過程中遇到的問題解決掉,然后提升用戶的體驗,為用戶創(chuàng)造價值。EasyStack四個極致的理念就包含在保障服務(wù)的理念之中。
第三點是EasyStack的解決方案基于OpenStack的開源架構(gòu),也是開源的方案,徐教授認(rèn)為對于清華大學(xué)而言非常重要的。因為交叉信息研究院本身就是做系統(tǒng)架構(gòu)研究的,如果用一個閉源的系統(tǒng),將會和科研應(yīng)用有沖突。交叉信息學(xué)院需要所有在集群上跑的應(yīng)用都是開源的。
當(dāng)然,在OpenStack的架構(gòu)中一定少不了英特爾的身影??赡芷綍r大家對英特爾了解最多的可能就是它的CPU,但其實英特爾一直都積極參與OpenStack所有的活動,而且作為OpenStack的白金會員,在中國市場上大多數(shù)的OpenStack活動都有英特爾的身影。英特爾在OpenStack社區(qū)屬于代碼貢獻(xiàn)者,致力于完善OpenStack和增強(qiáng)它的穩(wěn)定性。并且英特爾在自身公司IT部門使用OpenStack搭建了自己的私有云—— “iLab”。
而在本次清華大學(xué)交叉信息學(xué)院的項目中,英特爾也提供了不少幫助。之前交叉信息研究院實驗室中的機(jī)器大多是基于英特爾x86架構(gòu)的服務(wù)器,英特爾針對OpenStack在其硬件平臺上做了很多性能調(diào)優(yōu),如OpenStack組件中ceph的調(diào)優(yōu)、SSD的調(diào)優(yōu)等。
最終在英特爾和EasyStack的助力下,清華大學(xué)交叉信息研究院利用一周的時間成功在OpenStack上部署了125臺物理機(jī),實現(xiàn)集群資源池的部署,集群規(guī)模達(dá)到6000個Core,16TB內(nèi)存,540TB存儲,覆蓋了實驗室中大多數(shù)的物理機(jī)。現(xiàn)在整個系統(tǒng)已經(jīng)上線快2個月,無論從整個支持的力度、用戶滿意度,還是從系統(tǒng)本身的可用性上講都比原來自己做要強(qiáng)很多。
雖然當(dāng)前OpenStack在中國還處于起步階段,但隨著開源技術(shù)的不斷發(fā)展,越來越多的公司和企業(yè)正在逐漸接觸并了解OpenStack。而作為一個開源的平臺,OpenStack的發(fā)展離不開像英特爾和EasyStack這樣的開源貢獻(xiàn)者的積極支持,他們對于開源技術(shù)的不斷優(yōu)化,也使得像清華大學(xué)交叉信息研究院這樣的用戶能夠獲得定制的個性化解決方案。清華大學(xué)交叉信息研究院作為我國的最高學(xué)府的科研實驗室,為了滿足自身的云平臺需求成功部署了OpenStack,并且得到了良好的運(yùn)行效果,相信這一成功實踐可以帶給其他很多正在考慮OpenStack平臺的用戶一些啟發(fā),讓他們對OpenStack充滿更多的期望