在一般人的印象中,油田與科研之間似乎劃不上等號(hào),再把油田與1000名科研人員聯(lián)系在一起,很多人會(huì)問:這些科研人員在油田中的作用是什么?作為一名對(duì)油田不太了解的IT記者,我也有這樣的疑問。為此,ZDNet記者近日專門采訪了天津大港油田信息中心數(shù)據(jù)管理部主任范德軍。
1000這個(gè)數(shù)字,是天津大港油田科研人員的規(guī)模。在范德軍看來,與公司3、4萬名職工數(shù)相比,科研人員比例并不高,但是他們的作用卻非常大。大港油田信息中心負(fù)責(zé)整個(gè)油田信息化建設(shè),而為科研生產(chǎn)提供好的信息化支持,是超脫管理之上的重要業(yè)務(wù)職能,因?yàn)榭碧介_發(fā)永遠(yuǎn)是油田的核心任務(wù)。在當(dāng)今大數(shù)據(jù)、云計(jì)算時(shí)代,這些新技術(shù)同樣可以變?yōu)橛吞锟蒲腥藛T手中的“找油利器”,讓他們成為出色的數(shù)據(jù)科學(xué)家。因?yàn)閿?shù)據(jù)對(duì)于油田的重要性之高,超乎我們的想象;而數(shù)據(jù)科學(xué)家能夠給油田勘探、生產(chǎn)帶來的價(jià)值,可能會(huì)在很短時(shí)間內(nèi)呈現(xiàn)幾何級(jí)數(shù)增長。為了讓這一切成為現(xiàn)實(shí),天津大港油田采用IBM Platform Computing,為石油行業(yè)走出一條構(gòu)建在云管理平臺(tái)之上的大數(shù)據(jù)應(yīng)用之路進(jìn)行探索。
天津大港油田信息中心數(shù)據(jù)管理部主任范德軍
傳統(tǒng)石油勘探數(shù)據(jù)的獲取耗時(shí)耗力
對(duì)于石油行業(yè)來說,石油勘探開發(fā)中的科研工作是一項(xiàng)多學(xué)科協(xié)作的智慧集結(jié)。石油勘探開發(fā)流程包含很多步驟:第一步是地震處理,也就是收集地震波信息;第二步是地震解釋,用于了解地層底部結(jié)構(gòu);第三步是測(cè)井評(píng)價(jià)和地質(zhì)建模,也就是根據(jù)地震波了解到的地層情況構(gòu)建模型;第四步是制定數(shù)據(jù)模擬開發(fā)方案。在石油勘探開發(fā)整個(gè)過程中,有了采集到的數(shù)據(jù),只有通過石油行業(yè)專業(yè)軟件,再綜合人的經(jīng)驗(yàn)和對(duì)地層的認(rèn)識(shí),才能最終找到原油并決定在哪里打井。
天津大港油田信息中心有兩個(gè)主要機(jī)房,第一機(jī)房服務(wù)于勘探科研生產(chǎn),第二機(jī)房部署管理類系統(tǒng)。機(jī)房位于這個(gè)大樓中。
在這一整套流程中,數(shù)據(jù)的采集、獲取、建模的最終目的,是讓科研人員正確找到井位,并且還能估計(jì)出井的產(chǎn)能。但是范德軍告訴記者,有時(shí)候一個(gè)油藏描述項(xiàng)目卻要用三到四個(gè)月的時(shí)間來準(zhǔn)備數(shù)據(jù)。“以我港東油田某區(qū)塊為例,我們初步計(jì)劃先打五口井,相應(yīng)就需要研究這個(gè)油田是否滿足打井條件。這時(shí)候收集地震處理、地震檢測(cè)、測(cè)井?dāng)?shù)據(jù)以及井名、井深和井坐標(biāo)就得花費(fèi)三到四個(gè)月的時(shí)間;而如果再要把這些數(shù)據(jù)整理并錄入到軟件里,還需要一個(gè)科室人員的投入,而單單整理數(shù)據(jù)就占用了科研生產(chǎn)三分之一左右的時(shí)間。”
傳統(tǒng)的數(shù)據(jù)收集整理方法不僅僅耗時(shí)耗力,而且石油行業(yè)軟件都是大型專業(yè)軟件,架構(gòu)龐大、技術(shù)復(fù)雜,一般部署在Unix或者Linux操作系統(tǒng)上,底層采用Oracle數(shù)據(jù)庫。對(duì)于科研人員來說,學(xué)會(huì)使用這些軟件難度就非常大,日常維護(hù)管理更是難于上青天,畢竟他們不是IT人員,更不懂IT技術(shù),而且單機(jī)運(yùn)行會(huì)出現(xiàn)數(shù)據(jù)無法共享和數(shù)據(jù)丟失現(xiàn)象,迫切需要考慮一套行之有效的方法。
IBM Platform Computing提高30%科研生產(chǎn)效率
為此,天津大港油田從兩年前開始嘗試采用IBM Platform Computing搭建一個(gè)支撐油田勘探開發(fā)科研工作的云管理平臺(tái)。這個(gè)平臺(tái)是一個(gè)面向科研人員的平臺(tái),也就是真正把這些科研人員變成數(shù)據(jù)科學(xué)家,讓他們通過這個(gè)平臺(tái)尋找和定位井位。
Platform一如它的名字——平臺(tái),核心任務(wù)是負(fù)責(zé)對(duì)資源進(jìn)行整合、調(diào)度,確保上層應(yīng)用能夠訪問底層資源。作為一個(gè)平臺(tái),Platform Computing實(shí)際上跨越了好幾個(gè)環(huán)節(jié),包括數(shù)據(jù)的整理、數(shù)據(jù)的存儲(chǔ)以及在這之上的大數(shù)據(jù)運(yùn)算。在這之中,Platform Computing要充當(dāng)管理職能,為這些系統(tǒng)提供快速響應(yīng)以及合理、高效的應(yīng)用。
就Platform Computing在天津大港油田的運(yùn)用來看,據(jù)范德軍介紹,今年天津大港油田計(jì)劃通過Platform Computing收集、分析數(shù)據(jù),從而支持開采100口井,從而支持油田每年500萬噸油氣當(dāng)量的產(chǎn)能。為了支持龐大的數(shù)據(jù)管理、存儲(chǔ)和分析,其實(shí)Platform Computing構(gòu)建了一個(gè)云管理平臺(tái),云的特點(diǎn)包括靈活、可擴(kuò)展和高效,這些特點(diǎn)被Platform Computing發(fā)揮到最大。
信息中心擁有既懂信息技術(shù)又懂專業(yè)技術(shù)的專門人才,依托Platform Computing的云管理平臺(tái),把石油勘探開發(fā)的研究人員從計(jì)算、硬件、存儲(chǔ)、軟件等繁瑣并且不擅長的IT問題中解放出來,專攻科技??蒲腥藛T只要明確提出需要在哪個(gè)區(qū)塊進(jìn)行研究工作,信息中心就可以馬上為該科研人員提供工具,做到協(xié)同研究環(huán)境中的統(tǒng)一管理。這樣一組數(shù)據(jù)可能更有說服力,據(jù)范德軍介紹, Platform Computing投入生產(chǎn)運(yùn)行之后,科研生產(chǎn)效率提高30%左右;鑒于油田勘探開發(fā)生產(chǎn)涉及的專業(yè)特別多,實(shí)際上個(gè)別專業(yè)科研生產(chǎn)效率提升了10倍。
而具體到數(shù)據(jù)分析業(yè)務(wù),哈里伯頓(Halliburton Company)、斯倫貝謝(Schlumberger)等行業(yè)軟件基本上占領(lǐng)了石油行業(yè)軟件市場(chǎng),這些軟件雖然本身帶有數(shù)據(jù)分析功能,但是應(yīng)用復(fù)雜并且信息無法共享,而Platform Computing提供了一個(gè)硬件資源、軟件資源和數(shù)據(jù)資源集結(jié)的高性能計(jì)算平臺(tái),也讓石油行業(yè)的數(shù)據(jù)分析業(yè)務(wù)取得質(zhì)的飛躍。
成石油行業(yè)第一個(gè)協(xié)同研究云“嘗鮮者”
天津大港油田信息中心目前擁有500人,具體從事信息化工作的人員數(shù)量在220人左右。信息中心有兩個(gè)主要機(jī)房,第一機(jī)房服務(wù)于勘探科研生產(chǎn),第二機(jī)房部署管理類系統(tǒng)。服務(wù)器節(jié)點(diǎn)達(dá)到近500臺(tái),總存儲(chǔ)空間3個(gè)PB,機(jī)房面積在2000平米左右。單從人員數(shù)量和機(jī)房規(guī)模來看,天津大港油田信息中心并沒有“豪華”配置,但是在石油行業(yè),它卻是第一家將協(xié)同研究云用于勘探科研生產(chǎn)的單位。
天津大港油田信息中心機(jī)房服務(wù)器節(jié)點(diǎn)達(dá)到近500臺(tái),總存儲(chǔ)空間3個(gè)PB,機(jī)房面積在2000平米左右。
從2008年開始,天津大港油田著手從虛擬化開始建立云平臺(tái),目前搭載了三個(gè)云:一個(gè)是以虛擬化為基礎(chǔ)的基礎(chǔ)設(shè)施云,目前可以提供200多套業(yè)務(wù)應(yīng)用系統(tǒng);第二個(gè)是桌面云,應(yīng)用于機(jī)關(guān)部門人事、財(cái)務(wù)和黨群?jiǎn)T工的電腦桌面;第三個(gè)云,稱為協(xié)同研究云,其重點(diǎn)在于支撐勘探科研生產(chǎn)工作。
協(xié)同研究云的最主要目的就是勘探科研生產(chǎn)工作,通過云管理平臺(tái)的搭建,更好地把硬件資源集中起來。而勘探開發(fā)研究的專業(yè)軟件調(diào)用的數(shù)據(jù)量特別大,建立模型非常復(fù)雜,運(yùn)行速度會(huì)比較慢。云管理平臺(tái)的工作原理在于,對(duì)硬件資源進(jìn)行集中管理,根據(jù)不同業(yè)務(wù)需要來高效合理地分配資源,整個(gè)后臺(tái)是一個(gè)統(tǒng)一集群,其上的硬件資源是浮動(dòng)的,通過靈活的資源調(diào)度來支持?jǐn)U展的應(yīng)用。
提及對(duì)Platform Computing的選擇,在范德軍的介紹中記者得知,也經(jīng)歷了一個(gè)考驗(yàn)期。天津大港油田對(duì)開源產(chǎn)品一直報(bào)以非常開明的態(tài)度,在高性能計(jì)算方面,先后對(duì)Cluster Resources的Moab、Sun Grid進(jìn)行了詳細(xì)測(cè)試,而最終決定采用Platform Computing 的原因,還是基于Platform Computing作為成熟商業(yè)產(chǎn)品的優(yōu)勢(shì):開源系統(tǒng)二次開放成本會(huì)比較高,而且需要一個(gè)持續(xù)較長時(shí)間的開發(fā)周期,而天津大港油田偏向于選擇能夠即刻投入到實(shí)際工作中去的產(chǎn)品,而且不需要投入精力進(jìn)行漫長的開發(fā)。
在IBM收購Platform之后,其實(shí)已經(jīng)改變了Platform Computing單純作為一個(gè)軟件產(chǎn)品的產(chǎn)業(yè)形態(tài),IBM把Platform Computing并入硬件部門,這也就意味著Platform Computing在軟硬件優(yōu)化方面有著極大的優(yōu)勢(shì),也被賦予重大的責(zé)任。Platform Computing并不是一個(gè)單一軟件,稱其為家族產(chǎn)品可能更合適,共包括上中下三層,三層實(shí)現(xiàn)協(xié)同。下層是基礎(chǔ)設(shè)施層,由云管理平臺(tái)來統(tǒng)一管理物理機(jī)和虛擬機(jī)共存的云環(huán)境,這是Platform的優(yōu)勢(shì);中間層是應(yīng)用調(diào)用層,IBM在這里做中間件的管理,負(fù)責(zé)整個(gè)作業(yè)的派發(fā)、調(diào)度、資源管理;再上一層就是最上層的應(yīng)用層,各式各樣的應(yīng)用軟件與中間層形成一個(gè)集成,使用底層由云平臺(tái)提供的計(jì)算資源。
在記者看來,Platform Computing有三大優(yōu)勢(shì):首先,完整性,整個(gè)大數(shù)據(jù)平臺(tái)從設(shè)計(jì)開始是一套完整的系統(tǒng),是集成化的;其次,性能。IBM的大數(shù)據(jù)平臺(tái)在實(shí)時(shí)響應(yīng)、快速處理等方面有嚴(yán)苛的要求;最后,是容易被大家所忽略的,那就是整個(gè)系統(tǒng)的開放性和兼容性。Platform Computing的設(shè)計(jì)理念就是一個(gè)跨平臺(tái)的、面向不同應(yīng)用的產(chǎn)品,眾多應(yīng)用場(chǎng)景、分析軟件都跑在Platform Computing平臺(tái)上,系統(tǒng)的開放性、兼容性非常好。
結(jié)束語
其實(shí)在很多時(shí)候,IT廠商所提供的產(chǎn)品或者解決方案必須要兼顧客戶的成長,一成不變也就意味著保守和缺乏創(chuàng)新。在采訪最后范德軍表示,雖然選擇Platform Computing的原因在于其比開源產(chǎn)品更加成熟以及穩(wěn)定,但是這并不意味著開源就不好。天津大港油田IT專業(yè)人員的技術(shù)水平越來越高,而石油行業(yè)需要的支撐本行業(yè)的專業(yè)軟件也非常多。Platform Computing在開放接口方面能否更加open甚至做到開源,給予石油行業(yè)用戶更多基于Platform Computing進(jìn)行二次開發(fā)的機(jī)會(huì)?這或許是成長中的客戶,給予Platform Computing在未來的挑戰(zhàn)。