由德同資本、IDG創(chuàng)投及博信資本聯(lián)合投資創(chuàng)立的比格達(dá)塔,專(zhuān)注于提供“大數(shù)據(jù)行業(yè)云服務(wù)解決方案”。
比格達(dá)塔聯(lián)合創(chuàng)始人兼首席專(zhuān)家杜登斌
互聯(lián)網(wǎng)信息紛繁復(fù)雜、卻又相互關(guān)聯(lián)。人們常常通過(guò)搜索引擎將互聯(lián)網(wǎng)上某一主題的信息進(jìn)行收集、整理并拼接出一幅相對(duì)完整的畫(huà)面供自己參考。而北京比格達(dá)塔信息技術(shù)股份有限公司(下稱(chēng)“比格達(dá)塔”)這家以“大數(shù)據(jù)”命名的公司目前所做的,正是幫助用戶(hù)從浩如煙海的互聯(lián)網(wǎng)信息中挖掘出有價(jià)值的信息,以此來(lái)追蹤企業(yè)的社會(huì)行為軌跡。
比格達(dá)塔是一家提供“大數(shù)據(jù)行業(yè)云服務(wù)解決方案”的公司,其名號(hào)來(lái)自英文“大數(shù)據(jù)”(big data)的音譯。比格達(dá)塔針對(duì)新三板所開(kāi)發(fā)了四套大數(shù)據(jù)平臺(tái)系統(tǒng),其中包含多套子系統(tǒng),以滿(mǎn)足新三板行業(yè)可能涉及的眾多數(shù)據(jù)挖掘需求。這四套系統(tǒng)包括券商項(xiàng)目持續(xù)督導(dǎo)系統(tǒng)、擬掛牌公司的業(yè)務(wù)咨詢(xún)系統(tǒng)、已上市公司在線(xiàn)監(jiān)測(cè)系統(tǒng)以及新三板新聞集納與線(xiàn)索發(fā)現(xiàn)系統(tǒng)等。通過(guò)這些系統(tǒng),比格達(dá)塔能夠重點(diǎn)關(guān)注企業(yè)的兼并、重組、關(guān)聯(lián)交易及輿情等企業(yè)社會(huì)行為軌跡;這些數(shù)據(jù)在企業(yè)財(cái)報(bào)上可能并未體現(xiàn),但對(duì)于投資者而言卻至關(guān)重要。其他相關(guān)信息也包括在其中,如高管異動(dòng)、司法訴訟、行政處罰、關(guān)聯(lián)擔(dān)保等。
據(jù)公開(kāi)資料顯示,比格達(dá)塔由德同資本、IDG創(chuàng)投及博信資本聯(lián)合投資創(chuàng)立。工商注冊(cè)資料顯示,比格達(dá)塔的最大股東為北京漢鼎盛世咨詢(xún)服務(wù)有限公司,認(rèn)繳出資850萬(wàn)元,占比格達(dá)塔總股本的85%;自然人股東呂紹娟認(rèn)繳出資150萬(wàn)元,占比格達(dá)塔總股本15%。
從云計(jì)算到云交易的大數(shù)據(jù)產(chǎn)業(yè)鏈條
比格達(dá)塔聯(lián)合創(chuàng)始人兼首席專(zhuān)家杜登斌對(duì)于自己在大數(shù)據(jù)行業(yè)中深耕細(xì)作十分自信:盡管“大數(shù)據(jù)行業(yè)非常熱”,但“近幾年來(lái),中國(guó)以云數(shù)據(jù)為核心做大數(shù)據(jù)行業(yè)應(yīng)用的不多。”
比格達(dá)塔究竟擁有何種特色,足以讓杜登斌針對(duì)巨頭林立的大數(shù)據(jù)行業(yè)做出這樣的表述?他解釋道:“目前大家提到的‘大數(shù)據(jù)’基本上是云計(jì)算,其中主要是硬件:建產(chǎn)業(yè)園、買(mǎi)服務(wù)器、租用帶寬,讓用戶(hù)儲(chǔ)存數(shù)據(jù)。”而比格達(dá)塔的工作重心并不在此,在杜登斌所設(shè)想的服務(wù)路徑中,“大數(shù)據(jù)應(yīng)用是一個(gè)以云數(shù)據(jù)為中心的綜合解決方案,集云計(jì)算、云數(shù)據(jù)、云服務(wù)和云交易為一體。云計(jì)算作為應(yīng)用中的重要環(huán)節(jié),它只是第一步,而大數(shù)據(jù)應(yīng)用的核心是云數(shù)據(jù),再往后是云服務(wù),最后是云交易。”
在杜登斌的字典中,所謂“云計(jì)算”指的是硬件設(shè)備及一些基礎(chǔ)的算法系統(tǒng),“云數(shù)據(jù)”主要指數(shù)據(jù)采集,“云服務(wù)”是針對(duì)特定行業(yè)的數(shù)據(jù)挖掘和服務(wù),而“云交易”則是基于數(shù)據(jù)可以買(mǎi)賣(mài)的原則,在數(shù)據(jù)市場(chǎng)中進(jìn)行交易。這些聽(tīng)來(lái)有些與眾不同的用詞傳達(dá)出了比格達(dá)塔在“大數(shù)據(jù)”應(yīng)用行業(yè)中的上下游布局。
“云計(jì)算”硬件部分主要是做互聯(lián)網(wǎng)數(shù)據(jù)中心(Internet Data Center, IDC),“主要靠存儲(chǔ)備份和算法。”杜登斌對(duì)此著墨不多,他更關(guān)心服務(wù)鏈條中的云數(shù)據(jù)和云服務(wù)部分。
在杜登斌看來(lái),大數(shù)據(jù)除了具體的技術(shù)性應(yīng)用之外,還涉及到“思維方式”:大數(shù)據(jù)強(qiáng)調(diào)關(guān)聯(lián),數(shù)據(jù)的使用者并不關(guān)心數(shù)據(jù)的具體來(lái)源,大數(shù)據(jù)服務(wù)商需要通過(guò)技術(shù)采集和挖掘,整合分散在網(wǎng)絡(luò)各處的資源,同時(shí)將數(shù)據(jù)中的關(guān)聯(lián)關(guān)系分析出來(lái),供用戶(hù)使用。“十年前,當(dāng)互聯(lián)網(wǎng)上數(shù)據(jù)量并未達(dá)到一個(gè)量級(jí)時(shí),大數(shù)據(jù)并不火熱,近年來(lái)數(shù)據(jù)量開(kāi)始膨脹,不僅考驗(yàn)大數(shù)據(jù)服務(wù)商的整合和架構(gòu)能力,也考驗(yàn)其對(duì)于中文數(shù)據(jù)的采集和挖掘能力”,杜登斌向《融資中國(guó)》記者表示。
數(shù)據(jù)采集:定向垂直,小處切入
“要做大數(shù)據(jù),有幾個(gè)技術(shù)需要實(shí)現(xiàn),其中一個(gè)就是采集技術(shù)。”杜登斌對(duì)于自己的數(shù)據(jù)采集——也就是數(shù)據(jù)服務(wù)鏈條中的“云數(shù)據(jù)”——頗為得意,其采集的內(nèi)容不僅包括“網(wǎng)絡(luò)論壇、貼吧、微博、公告年報(bào)的PDF文件”等公開(kāi)信息,也包括“專(zhuān)利、信用系統(tǒng),各省市工商稅務(wù)登記資料”等需查詢(xún)獲取的半公開(kāi)信息。“我們只采集信息公開(kāi)的部分,隱私數(shù)據(jù)我們不做”,杜登斌說(shuō)。
比格達(dá)塔的數(shù)據(jù)收集范圍與通用搜索引擎有著很大的區(qū)別,“對(duì)于百度、谷歌就像在太平洋上撒網(wǎng),一網(wǎng)下去把各種數(shù)據(jù)都收集起來(lái),而我們則通過(guò)垂直定向的方式,看準(zhǔn)一個(gè)行業(yè)猛扎下去,需要什么數(shù)據(jù)就收集什么數(shù)據(jù)。”同時(shí),杜登斌也認(rèn)為,通過(guò)垂直定向的數(shù)據(jù)收集方式,比格達(dá)塔避開(kāi)了與搜索巨頭們的直接競(jìng)爭(zhēng),“這樣才有價(jià)值,大網(wǎng)收集你拼不過(guò)巨頭們。”
杜登斌做出這樣的判斷是基于自己在人民在線(xiàn)的工作經(jīng)歷,他一直看好垂直定向的數(shù)據(jù)收集方式。杜登斌曾任人民在線(xiàn)副總裁,分管架構(gòu)、技術(shù)和銷(xiāo)售等工作。人民在線(xiàn)由人民網(wǎng)和《證券時(shí)報(bào)》合資成立,與專(zhuān)業(yè)監(jiān)測(cè)、研究和處置網(wǎng)絡(luò)輿情的人民網(wǎng)輿情監(jiān)測(cè)室是“一班人馬,兩塊牌子”。
現(xiàn)已與盤(pán)古搜索合并的人民搜索上線(xiàn)于2010年6月,據(jù)杜登斌介紹,人民搜索在與中科院計(jì)算所合作的同時(shí),也從人民在線(xiàn)抽調(diào)了部分技術(shù)骨干。杜登斌說(shuō)自己預(yù)見(jiàn)到了人民搜索的發(fā)展前景:很難成功。原因很簡(jiǎn)單,盡管人民搜索資金充裕,能夠大量購(gòu)買(mǎi)服務(wù)器資源,快速采集數(shù)據(jù),但“這些收集到的數(shù)據(jù)根本沒(méi)用,數(shù)據(jù)量太大,人民搜索不具備挖掘、清晰和分析這些數(shù)據(jù)的經(jīng)驗(yàn)和能力,特別是在系統(tǒng)應(yīng)用和架構(gòu)上沒(méi)有想清楚,所以走通用搜索根本不可能。”對(duì)于人民搜索的發(fā)力方向,杜登斌堅(jiān)持認(rèn)為“從小處切入”的行業(yè)垂直搜索會(huì)比立刻上馬通用搜索要有優(yōu)勢(shì)。
數(shù)據(jù)分析:如何從數(shù)據(jù)中“淘出金子”
比格達(dá)塔主要做社會(huì)化數(shù)據(jù)采集與挖掘,分析這些數(shù)據(jù)中所隱含的企業(yè)機(jī)構(gòu)行為,其主要內(nèi)容與萬(wàn)德、彭博等金融終端所提供的數(shù)據(jù)類(lèi)型有很大的差異,這也是比格達(dá)塔與其他競(jìng)爭(zhēng)對(duì)手的重要區(qū)隔。
當(dāng)各式數(shù)據(jù)就緒,如何能從這些數(shù)據(jù)中“淘出金子”?杜登斌說(shuō),數(shù)據(jù)很龐雜,“有結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)甚至是異構(gòu)的數(shù)據(jù)”,因此挖掘數(shù)據(jù)中所蘊(yùn)含的價(jià)值需要有一定的技術(shù)積累。杜登斌將比格達(dá)塔使用的技術(shù)命名為“分詞矩陣”、“信息元矩陣”和“規(guī)則矩陣”,針對(duì)這些技術(shù)所能夠獲得的有用信息,杜登斌向《融資中國(guó)》記者表示,“這么多年來(lái)沒(méi)有看到做得更好的。”
公開(kāi)信息的獲得沒(méi)有門(mén)檻,比格達(dá)塔如何從中保持自身的競(jìng)爭(zhēng)力?杜登斌表示,這涉及到數(shù)據(jù)的“預(yù)處理”階段:這是大數(shù)據(jù)產(chǎn)生價(jià)值的過(guò)程中最為重要的一個(gè)環(huán)節(jié)。所謂“預(yù)處理”,指的是將各種結(jié)構(gòu)化以及非結(jié)構(gòu)化的數(shù)據(jù)從外圍系統(tǒng)中導(dǎo)入到需要使用的系統(tǒng)中,統(tǒng)一數(shù)據(jù)格式和編碼并對(duì)數(shù)據(jù)進(jìn)行清洗,去除有誤和無(wú)用的信息。
大數(shù)據(jù)領(lǐng)域公司的門(mén)檻較高,一方面要有足夠的采集和挖掘能力,但僅僅有采集和挖掘能力還不夠,這樣獲得的數(shù)據(jù)常常無(wú)法直接使用,這就需要對(duì)數(shù)據(jù)進(jìn)行預(yù)處理。杜登斌表示,對(duì)數(shù)據(jù)預(yù)處理的大量人力和物力投入奠定了比格達(dá)塔在大數(shù)據(jù)領(lǐng)域的優(yōu)勢(shì)。以一條公開(kāi)信息為例,比格達(dá)塔需要對(duì)其進(jìn)行多維度分析,將非結(jié)構(gòu)化的信息分解整理到結(jié)構(gòu)化表格之中。此外,動(dòng)態(tài)數(shù)據(jù)要實(shí)現(xiàn)實(shí)時(shí)可視化,這對(duì)于可視化的能力要求很高。再往后,需要大量的存儲(chǔ)能力和實(shí)時(shí)的調(diào)取能力,“由于各種數(shù)據(jù)的類(lèi)型不同,如果分庫(kù)分錯(cuò)了,就不能滿(mǎn)足實(shí)時(shí)分析的需要。”
杜登斌笑稱(chēng),“大數(shù)據(jù)是一個(gè)環(huán),每一個(gè)環(huán)節(jié)你都需要有所投入和積累,才能成為大數(shù)據(jù)應(yīng)用的玩家。”
支撐智慧城市,深挖行業(yè)應(yīng)用
“為什么有這么多人蜂擁去做云計(jì)算、做商業(yè)智能、做輿情?因?yàn)閲?guó)內(nèi)很少有公司能夠?qū)⒋髷?shù)據(jù)所涉及的各個(gè)環(huán)節(jié)統(tǒng)統(tǒng)打通,他們大多或許只能做其中的一個(gè)環(huán)節(jié)。”這是杜登斌對(duì)于行業(yè)中競(jìng)爭(zhēng)對(duì)手的看法。而各重點(diǎn)行業(yè)和智慧城市規(guī)劃對(duì)于社會(huì)化大數(shù)據(jù)的需求,使得比格達(dá)塔面前的潛在市場(chǎng)一下子大了起來(lái)。
智慧城市作為國(guó)家支持的未來(lái)城市方向,成為各地爭(zhēng)搶的“香饃饃”。目前193個(gè)城市獲批成為試點(diǎn),但智慧城市真正落地后是什么樣子,各地都還在摸索。杜登斌認(rèn)為,在這個(gè)過(guò)程中,缺乏必要的數(shù)據(jù)支撐是智慧城市構(gòu)建面臨的重要問(wèn)題:一方面通用搜索引擎的數(shù)據(jù)過(guò)于雜亂,另一方面職能部門(mén)的數(shù)據(jù)又無(wú)法獲取,“現(xiàn)在智慧城市的云平臺(tái)很多是空的。”這就為比格達(dá)塔提供了向智慧城市提供服務(wù)的可能性。
而針對(duì)垂直行業(yè)的大數(shù)據(jù)解決方案也是比格達(dá)塔的工作重點(diǎn)。杜登斌表示,當(dāng)?shù)讓酉到y(tǒng)建構(gòu)完畢,其他針對(duì)不同領(lǐng)域的垂直應(yīng)用部分架構(gòu)起來(lái)就會(huì)非常容易。“就像建房子打地基一樣,地基已經(jīng)打好,房子的框架建成,房子簡(jiǎn)單裝修下就可以居住。”
杜登斌表示,除了能源和新三板兩個(gè)垂直行業(yè),針對(duì)銀行系統(tǒng)、證券、基金、保險(xiǎn)(放心保)等行業(yè)的云服務(wù)系統(tǒng)也正在開(kāi)發(fā)中。為方便業(yè)務(wù)開(kāi)展,在杜登斌部署的公司群組架構(gòu)中,北京中潤(rùn)普達(dá)信息技術(shù)有限公司是知識(shí)產(chǎn)權(quán)持有公司和員工持股平臺(tái),而在對(duì)應(yīng)行業(yè)則擁有不同的公司作為業(yè)務(wù)對(duì)接主體,其中比格達(dá)塔是新三板業(yè)務(wù)的對(duì)接主體。