佘暉認為在大數(shù)據(jù)時代,關(guān)系型數(shù)據(jù)庫或?qū)⒈籋adoop解決方案取代。
傳統(tǒng)上,一個高端大氣的數(shù)據(jù)中心,IBM的小型機、Oracle(中文譯為甲骨文)的數(shù)據(jù)庫以及EMC存儲設(shè)備,可以說缺一不可。由這三駕馬車構(gòu)成的從軟件到硬件的企業(yè)數(shù)據(jù)庫系統(tǒng),幾乎占領(lǐng)了全球大部分企業(yè)級數(shù)據(jù)庫系統(tǒng)市場份額。
大數(shù)據(jù)時代讓IOE(IBM、Oracle、EMC)看似牢不可破的市場地位開始動搖。在星環(huán)科技總經(jīng)理佘暉看來,傳統(tǒng)數(shù)據(jù)庫對海量數(shù)據(jù)的處理性能并不理想,大數(shù)據(jù)時代需要新一代數(shù)據(jù)庫產(chǎn)品,終將有新公司取代Oracle的市場地位。
Hadoop開源架構(gòu)逐漸深入適應(yīng)企業(yè)環(huán)境,其瘋狂的發(fā)展勢頭已無法阻擋。獨立分析機構(gòu)Forrester Research公司發(fā)布的《Forrester浪潮:大數(shù)據(jù)Hadoop解決方案》報告顯示,Hadoop全新獨特的數(shù)據(jù)管理方案正在幫助企業(yè)變革大數(shù)據(jù)存儲、處理、分析及共享的方式。不久前在美國,Hadoop領(lǐng)域里代表性公司之一的Cloudera獲得F輪融資,融得9億美元,估值達到41 億美元。Cloudera之所以能夠達到高估值,是因為資本市場看到其可能會取代Oracle的市場地位。這樣的產(chǎn)業(yè)趨勢對中國也影響深遠。2013年,曾任Intel數(shù)據(jù)中心軟件部亞太區(qū)CTO的孫元浩看準(zhǔn)這個趨勢,創(chuàng)辦了星環(huán)信息科技(上海)有限公司(簡稱星環(huán)科技),專注為企業(yè)開發(fā)Hadoop發(fā)行版。2013年底,星環(huán)科技發(fā)布了國內(nèi)首個全面支持Spark和Hadoop2.0的大數(shù)據(jù)平臺軟件——Transwarp Data Hub(TDH)。Spark作為一個通用的并行計算框架,已經(jīng)成為繼Hadoop之后又一大熱門開源項目。
短短一年間,星環(huán)科技就被資本市場看中,并于今年中成功獲得近千萬美元規(guī)模的A輪融資。自此,以星環(huán)科技為代表的中國Hadoop發(fā)行版廠商真正確立,并開始形成國外以Cloudera為代表,國內(nèi)以星環(huán)科技為代表的Hadoop 發(fā)行版行業(yè)態(tài)勢。
星環(huán)科技創(chuàng)始團隊在Hadoop發(fā)行版領(lǐng)域起步早。佘暉介紹,TDH是國內(nèi)落地案例最多的Hadoop數(shù)據(jù)管理軟件,用戶在用的項目已經(jīng)超過數(shù)十個。通常來說,要挖掘大數(shù)據(jù)價值應(yīng)用到各行各業(yè),需要一個硬件供應(yīng)商提供硬件,一個軟件供應(yīng)商提供數(shù)據(jù)庫,并由數(shù)據(jù)挖掘供應(yīng)商提供算法。星環(huán)科技發(fā)布的TDH可以看做是大數(shù)據(jù)時代的新型數(shù)據(jù)庫。
由于TDH融合了Spark和Hadoop2.0兩種先進技術(shù),TDH處理數(shù)據(jù)性能并非傳統(tǒng)數(shù)據(jù)庫乃至開源Hadoop可比擬。據(jù)介紹,TDH能夠處理10GB到100PB的數(shù)據(jù),傳統(tǒng)Hadoop適用面為100TB以上(1TB=1024GB)。值得一提的是,Hadoop數(shù)據(jù)管理軟件對硬件要求低,只需要幾十臺便宜的PC Server即可。如果用戶數(shù)據(jù)增長,只需要將PC Server的數(shù)量變成幾百乃至幾萬臺。而傳統(tǒng)數(shù)據(jù)庫必須由價格不菲的小型機來支撐。
佘暉認為在大數(shù)據(jù)時代,企業(yè)對TDH具有較大需求,Oracle的數(shù)據(jù)庫已經(jīng)無法跟上大數(shù)據(jù)時代的步伐。早在2011年,星環(huán)科技創(chuàng)始團隊就在南方某運營商落地一個Hadoop項目。過去手機賬單查詢在一秒內(nèi)可以返回結(jié)果,但隨著數(shù)據(jù)業(yè)務(wù)的增加,手機賬單上不僅有電話短信明細,同時還有流量明細,使用傳統(tǒng)的關(guān)系型數(shù)據(jù)庫已經(jīng)無法做到秒級反饋??蛻粼趯ふ医鉀Q方案時采用了該團隊打造的Hadoop方案,最終以低成本獲得高性能。
在佘暉看來,數(shù)據(jù)庫產(chǎn)品比拼的就是研發(fā)實力。“有些客戶十分直接,直接給你20T的數(shù)據(jù),看你究竟要多長時間跑出來。”
佘暉認為大數(shù)據(jù)領(lǐng)域是小公司的創(chuàng)業(yè)舞臺。“企業(yè)市場將來會有天翻地覆的變化,企業(yè)數(shù)據(jù)庫都要更換成能夠適應(yīng)大數(shù)據(jù)時代的產(chǎn)品。”星環(huán)科技希望能夠把握其中的機會。
盡管市場潛力巨大,但目前Hadoop數(shù)據(jù)管理軟件還僅僅被應(yīng)用在客戶的邊緣系統(tǒng)。佘暉稱,沒有人能夠預(yù)測這個市場何時會爆發(fā),但它一定會來。一旦Hadoop數(shù)據(jù)管理軟件進入客戶的核心系統(tǒng),需求量將會劇增。
“在創(chuàng)業(yè)期,我們所要做的就是不斷將產(chǎn)品做好,然后靜待開花。” 佘暉說到。