“上調(diào)全年凈收入預(yù)期在6.28億元人民幣至6.40億元人民幣之間,預(yù)期的中位數(shù)代表同比增長約為58%”,這是在納斯達克上市的中國第一家大數(shù)據(jù)公司——國雙公司在第二季度最新財報內(nèi)容,該增速是行業(yè)平均水平的2倍,按此增速2018年國雙營收10億元左右清晰可見。創(chuàng)業(yè)13年收入規(guī)模超過10億,對于2C行業(yè)而言不算什么,但對于2B行業(yè)而言意義重大。你真的知道國雙嗎?10億為何是國雙?國雙10億后何去何從?中國萬億元大數(shù)據(jù)產(chǎn)業(yè)機會在哪?
正值2017 CCF-BDCI大數(shù)據(jù)與計算智能大賽如火如荼之際,中關(guān)村大數(shù)據(jù)產(chǎn)業(yè)聯(lián)盟副秘書長&DT大數(shù)據(jù)產(chǎn)業(yè)創(chuàng)新研究院(DTiii)院長陳新河對連續(xù)三年與DF數(shù)據(jù)競賽平臺(DataFountain,DF)進行深入合作的國雙進行了實地訪談和深度調(diào)研,并與國雙CTO劉激揚進行了深入溝通,通過這次深度專訪,希望能給出上述問題的準(zhǔn)確答案。
“國雙是干什么的,營收幾億,怎么悄悄就上市了?”“SEO公司,這個標(biāo)簽國雙帶了很多年”
2016年9月23日,國雙正式在納斯達克上市交易的當(dāng)天,陳新河的微信中收到了幾十條類似這樣的信息。這其實也反映一個情況,國雙是屬于低調(diào)做事的。
數(shù)據(jù)來源:公司財報
數(shù)據(jù)來源:招股書、公司財報
也正是這種低調(diào)的風(fēng)格,讓業(yè)界對國雙的理解并不全面。“大家有一個誤區(qū),現(xiàn)在無論是在投資界,還是在資本界,即使在我們的客戶圈中,大家還是對我們有一些誤解。說我們是SEO公司,這個標(biāo)簽國雙帶了很多年。”劉激揚略有嚴(yán)肅的表示。“國雙是一個做實業(yè)的公司,我們是一個貨真價實的大數(shù)據(jù)和產(chǎn)業(yè)智能的公司,每天都在踐行著國雙的愿景。”劉激揚如此表示。
人都有慣性思維,改變并不容易發(fā)生。國雙SEO標(biāo)簽也是有原因的。
國雙創(chuàng)立之初,在網(wǎng)絡(luò)營銷市場不斷擴大的情況下,結(jié)合一直做軟件業(yè)務(wù)積累下來的處理大數(shù)據(jù)的經(jīng)驗,將搜索引擎營銷與軟件整合到一起,做網(wǎng)絡(luò)營銷和互聯(lián)網(wǎng)用戶行為的數(shù)據(jù)分析和優(yōu)化產(chǎn)品,順理成章地成為國雙的戰(zhàn)略方向,并拿下眾多國際500強客戶。這正是國雙是“SEO公司”這一深入人心的標(biāo)簽的由來。
“你以為他最擅長SEO,他卻把自然語言處理作為獨門秘籍”
正當(dāng)更多人將國雙和SEO公司鏈接上的同時,國雙已經(jīng)練就了另外一套“正宗功法”,并將其作為轉(zhuǎn)型發(fā)展的重要支點。
得益于國雙CEO祁國晟曾在微軟亞洲研究院的實習(xí)經(jīng)歷,國雙多年前就開始積累自然語言處理技術(shù),確立了“結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)不能分而治之的路線”。這條路有一定技術(shù)困難,做行業(yè)應(yīng)用就更麻煩了,因為每個領(lǐng)域都要訓(xùn)練一個數(shù)據(jù)集,尤其是特別專業(yè)的領(lǐng)域,缺乏復(fù)合型人才,有很多問題要克服。為此,國雙一方面自己開發(fā),一方面和國內(nèi)最先進的自然語言技術(shù)的科研單位進行合作,比如“哈工大—國雙聯(lián)合自然語言處理實驗室”、“人民大學(xué)—國雙大數(shù)據(jù)科學(xué)聯(lián)合實驗室”,逐漸在中文處理上積累了非常先進的能力。
這條路線也為國雙在多領(lǐng)域的大數(shù)據(jù)解決方案奠定了技術(shù)基礎(chǔ)。
創(chuàng)業(yè)只聽聞緊“張”,他卻“馳”之有道。
國雙的發(fā)展節(jié)奏可謂是“一張一弛”,在SEO等主營業(yè)務(wù)爆發(fā)式增長時候,逐步向其他領(lǐng)域的投入和試水已經(jīng)產(chǎn)生了新的增長點,并已經(jīng)唱起了主角。
國雙的傳統(tǒng)SEO業(yè)務(wù)占比正逐年降低。盡管財報中沒有披露各項業(yè)務(wù)占比,但從搜索引擎廠商對其營收貢獻占比可以推斷,SEO業(yè)務(wù)已不再成為主要業(yè)務(wù)。。
從2011年開始,國雙拓展自己的業(yè)務(wù)線,布局新媒體、電子政務(wù)以及司法等多個行業(yè)。在這些領(lǐng)域,國雙將之前積累的數(shù)據(jù)分析能力,主要包含網(wǎng)頁分析、移動端分析、視頻、流媒體以及可視化等,與行業(yè)應(yīng)用進行了緊密結(jié)合,碩果累累。在司法領(lǐng)域的成績就是最好的佐證。
在司法領(lǐng)域,國雙與人民法院出版社合作建設(shè)“法信”平臺,以及為最高人民法院知識產(chǎn)權(quán)案例指導(dǎo)研究(北京)基地初步建成的“知識產(chǎn)權(quán)案例指導(dǎo)服務(wù)平臺”均獲得最高人民法院和其他法律界人士的高度認(rèn)可。針對知識產(chǎn)權(quán)領(lǐng)域,建立一個司法文件數(shù)據(jù)庫,幫助法院、律所及相關(guān)企業(yè)進行同類法律文件的查詢,提升審判效率。
“你們這項工作將來把它實現(xiàn)了,在司法領(lǐng)域中具有革命性創(chuàng)新。”某高層領(lǐng)導(dǎo)在看過國雙產(chǎn)品的演示時說。
除了司法領(lǐng)域,國雙在很多行業(yè)收獲滿滿。
在電子政務(wù)領(lǐng)域,國雙迄今不僅為包括中國政府網(wǎng)、國家發(fā)改委、農(nóng)業(yè)部、北京市等在內(nèi)的3000多家政府網(wǎng)站提供大數(shù)據(jù)分析服務(wù),還為國家發(fā)改委、國家林業(yè)局、稅務(wù)總局等眾多單位提供政策大數(shù)據(jù)互聯(lián)網(wǎng)分析服務(wù),同時也為旅游、政府招商引資、地方產(chǎn)業(yè)促進、電子政務(wù)等垂直領(lǐng)域提供大數(shù)據(jù)整體解決方案。
在新媒體領(lǐng)域,主要針對傳統(tǒng)廣電系統(tǒng)新媒體轉(zhuǎn)型、三網(wǎng)融合、三屏互動的需求,提供了融合媒體大數(shù)據(jù)解決方案,為新媒體運營與運維、節(jié)目創(chuàng)新、全媒體收視考核及領(lǐng)導(dǎo)決策提供即時的全媒體數(shù)據(jù)支持。
“我們希望很快能夠進入的新領(lǐng)域,即工業(yè)4.0,工業(yè)互聯(lián)網(wǎng)。”劉激揚自信中帶著無限憧憬。
如果說目前大數(shù)據(jù)的核心戰(zhàn)場是數(shù)據(jù)營銷領(lǐng)域,充其量也就是數(shù)千億元市場規(guī)模,而工業(yè)大數(shù)據(jù)則提供了數(shù)十萬億市場的腹地。
事實上,今年國雙把多年積累下來的在人工智能領(lǐng)域中的核心技術(shù),比如NLP自然語言處理、知識圖譜,可以把文本變成結(jié)構(gòu)化的數(shù)據(jù),在之上形成知識體系,結(jié)合深度學(xué)習(xí)、圖像識別、語音技術(shù),把這些技術(shù)集合在一個平臺上。這是一個人工智能的平臺,這個平臺有了一個新名字——國雙先知。這樣就形成了一個可以快速研發(fā)、交付智能應(yīng)用和解決方案的平臺。
這一定層面上奠定了劉激揚自信的基礎(chǔ)。
“想獲取更多商業(yè)價值?從拒絕客戶開始”
在國雙的客戶名單中,現(xiàn)在可以看到,國際500強商業(yè)客戶比比皆是,且均為長期客戶,分布在金融、旅游、消費品、電視臺(新媒體)、汽車、家電、互聯(lián)網(wǎng)和電商等多個行業(yè),包括上汽大眾、京東、惠普、三星等。另外一個重要的信息不能被忽略,國雙客單價正在逐年增高,2016年平均客單價超過人民幣100萬元。早期主要客戶源自于與世界頂尖軟件企業(yè),諸如Adobe、Oracle、IBM競爭獲得的國際500強客戶。
國雙CEO祁國晟表示:“2017年第二季度,國雙再度展現(xiàn)出強勁的財務(wù)和運營績效。我們的營收保持著強勁的增長軌跡,主要驅(qū)動力來自客戶群的穩(wěn)步擴張和單一用戶平均收入(ARPU)的增加。我們維持2017年客戶數(shù)量增長30%至40%的預(yù)期,且值得一提的是,我們對當(dāng)前客戶有效地實現(xiàn)了產(chǎn)品和服務(wù)的交叉銷售和增銷。”
的確,在第二季度,國雙簽下了包括思科、安達保險、海南航空、Michael Kors和中國人壽在內(nèi)的眾多客戶。公司最重要的20家客戶續(xù)約率也達到100%。
與常識相反,國雙這一成績一定程度上是通過不斷拒絕客戶來實現(xiàn)的??紤]到有些客戶來源不符合公司的長遠(yuǎn)發(fā)展理念,如網(wǎng)游等,以及自身的資源和能量是否足夠服務(wù)好客戶,國雙拒絕了大量客戶。留下的大客戶對國雙的服務(wù)能力提出更高考驗,國雙銷售人員中除了少部分直銷人員外,其余都是售前、售后等服務(wù)人員,幫助客戶配置產(chǎn)品,做好服務(wù)支持工作。
拒絕客戶也蘊含著另外一層含義,改變和優(yōu)化客戶的原始需求,和客戶共成長,實現(xiàn)共贏。國雙CTO劉激揚提到了這樣一個案例,是對這一理念的很好詮釋。2009年,國雙一直在促成歐萊雅旗下蘭蔻網(wǎng)站的改版。
因為蘭蔻起先使用總部統(tǒng)一的網(wǎng)站模板,即按照西方的市場習(xí)慣,把促銷區(qū)域和“點擊購買”按鈕放在右側(cè),左側(cè)則是各種產(chǎn)品的展示廣告。但在國內(nèi)幾乎所有的網(wǎng)站都把左側(cè)當(dāng)成用戶的第一聚焦點,因為缺乏合理的數(shù)據(jù)支持,蘭蔻本地的市場人員也無法有效說服總部針對中國用戶習(xí)慣做出改變。國雙的團隊花了很多精力幫助他們進行分析,并設(shè)計了一個類似的網(wǎng)站,做了A/B test,最后真的發(fā)現(xiàn)改版之后流量可以成倍地增加。后來就用這些數(shù)據(jù)說服了總部,中國的網(wǎng)頁做了一個改版。其實改動并不大,只是左右調(diào)換了一下,但效果卻很驚人。這次案例之后,雙方建立了很好的合作關(guān)系。從2008年起一直到今天,歐萊雅一直是國雙的客戶,國雙也不斷通過技術(shù)更新帶給對方更多回報。
拒絕客戶的更高層次是挖出客戶痛點,甚至比客戶更了解其痛點所在,從而為客戶提供有效的解決方案。劉激揚舉了一個這樣的實例:
國雙去年幫助一個大型的車企獲得了很大的成績。以前一個成功轉(zhuǎn)化需要打400次電話才可能有一個人試駕買車。國雙發(fā)現(xiàn)這是車企的一個痛點,怎么把潛客變成客戶?我們用大數(shù)據(jù)的能力,用給該車企做搜索營銷時候收集出來的數(shù)據(jù),成功的找到了客戶。比如有一個潛客去百度搜索了某一款車,通過百度到了這個車企的官網(wǎng)。這樣的潛客顯然對這款車很感興趣。通過識別這樣的客戶,在所有的潛客群中通過數(shù)據(jù)分析,線上、線下數(shù)據(jù)打通,把這些數(shù)據(jù)對接起來,把所有潛客里面具有高質(zhì)量、成交率很高的客戶識別出來,請車企先給這些人打電話,轉(zhuǎn)化率會更高。通過一個季度的嘗試,成單率從原來需要打?qū)⒔?00個電話,變成只需要打60個電話就可以成功一單。
“國雙現(xiàn)在為商業(yè)客戶提供服務(wù),成長我們的業(yè)務(wù),我們有一個路子,這個路子就是去發(fā)現(xiàn)客戶的痛點。”劉激揚道出了國雙贏得客戶的法寶——解決客戶痛點,為客戶切切實實帶來ROI。
“共建生態(tài)圈,每個人都是關(guān)鍵節(jié)點”
國雙的成長過程也是其生態(tài)圈逐漸擴大的過程。在國雙的產(chǎn)業(yè)鏈上,能夠看到SEMPO(國際搜索引擎營銷專家組織)、微軟、百度等巨頭。能夠做到這一點,是因為國雙擁有一支內(nèi)核強大的管理團隊,每個人都是構(gòu)建這個產(chǎn)業(yè)鏈的關(guān)鍵節(jié)點。
在科研與技術(shù)的合作上,國雙也抱有非常開放的態(tài)度。如與騰訊云合作,共同開拓司法大數(shù)據(jù)產(chǎn)品及業(yè)務(wù)領(lǐng)域,與哈工大、人民大學(xué)、中國傳媒大學(xué)的合作建設(shè)實驗室, 捐資設(shè)立“北京大學(xué)法學(xué)院科研與人才培養(yǎng)工作發(fā)展基金”等。
每個人都是關(guān)鍵節(jié)點,正是在這樣的理念下,國雙在人才引進上同樣不遺余力。連續(xù)三年與DF數(shù)據(jù)競賽平臺(DataFountain,DF)數(shù)據(jù)競賽平臺合作,發(fā)布賽題,培養(yǎng)新人。所選賽題均為企業(yè)實際場景中的應(yīng)用,如2015年的“判決文書中的金額項提取”、2016年的“基于視角的領(lǐng)域情感分析”。
2017 CCF-BDCI大數(shù)據(jù)與計算智能大賽賽題
“我們前年出的題和去年出的題,都是有非常明確的應(yīng)用場景,都是有實用價值的。前年有200個團隊來參加,去年有500個團隊,今年可能有上千個。所以,無論是對產(chǎn)業(yè)、對研究,還是對未來的人才,DF數(shù)據(jù)競賽平臺(DataFountain,DF)有著非常大的意義。無論是國雙的發(fā)展,還是所有從事大數(shù)據(jù)和AI領(lǐng)域企業(yè)的發(fā)展,最重要的就是人才。”“我們是從業(yè)者,覺得自己是在宇宙的中心,但是我們畢竟是大的IT生態(tài)中的一個方面。需要向DF數(shù)據(jù)競賽平臺(DataFountain,DF)這樣的平臺去做推廣宣傳,同時利用這個平臺去發(fā)現(xiàn)、培養(yǎng)、鼓勵從事大數(shù)據(jù)和人工智能研究開發(fā)的新型人才,吸引人才,培養(yǎng)人才,讓大家對這個產(chǎn)業(yè)和領(lǐng)域感興趣。科研、產(chǎn)業(yè)、學(xué)術(shù)的結(jié)合也能夠讓我們用最先進、最優(yōu)秀的技術(shù)解決最重要的問題。”劉激揚對DF數(shù)據(jù)競賽平臺(DataFountain,DF)給予了極大的認(rèn)可,也因此國雙早早就參與到DF數(shù)據(jù)競賽平臺(DataFountain,DF)大賽中并獲得價值。
“當(dāng)然,我們對于大數(shù)據(jù)、人工智能人才的特殊之處有點過分夸大了。真正對產(chǎn)業(yè)最有用、最有價值的人才,還是那些具有扎實基本功的。“劉激揚認(rèn)為通過“三好”可以體現(xiàn)出這個基本功,即態(tài)度好,具備責(zé)任感、使命感和事業(yè)感;自學(xué)能力好,有很強的解決問題的能力和學(xué)習(xí)能力;溝通好,能夠把技術(shù)和業(yè)務(wù)聯(lián)系起來、連接起來,調(diào)動團隊一起協(xié)作解決難題。
“預(yù)見,大醫(yī)治未病”
《鶡冠子》記載:魏文侯有病請扁鵲醫(yī)治,魏文侯問扁鵲:“聽說先生兄弟三人皆精通醫(yī)術(shù),不知伯仲間誰最高明?”扁鵲答曰:“大哥最高,二哥次之,臣最差。”魏文侯問:“為何先生名聞天下,而兄長籍籍無名呢?”扁鵲曰:“大哥治未病,二哥治已病,臣治病入膏肓者。故臣技雖不如兄,而名播也。”
“大醫(yī)治未病”的真諦在國雙的方方面面都得到了很好的詮釋,不論是公司的愿景、產(chǎn)品技術(shù)的布局、服務(wù)客戶的能力,還是人才的儲備甚至是公司的名字,從而成就了國雙演進為一家旗艦型的大數(shù)據(jù)企業(yè)。列舉一二,管中窺豹。
公司名字預(yù)見了大數(shù)據(jù)的未來
十二年前的公司命名邏輯,已經(jīng)預(yù)見了大數(shù)據(jù)的未來,意識到會有因數(shù)據(jù)造成的困惑需要技術(shù)來解決。同時也代表了公司創(chuàng)業(yè)時候的理念,用大數(shù)據(jù)、用技術(shù)、用智能去處理海量的數(shù)據(jù)問題,改變產(chǎn)業(yè),同時促進社會發(fā)展。
中文名“國雙”取“國士無雙”的寓意。英文名是“Gridsum”,兩個詞拼在一塊,“Grid”來自于“Grid Computing(網(wǎng)格計算)”,那時候網(wǎng)格計算其實是分布式計算的代名詞,因為他們覺得將來的大數(shù)據(jù)問題一定要分布式的計算能力才能解決,一定要在公司的名字中有一部分是代表這個。公司另一個想法就是做數(shù)據(jù)分析、利用數(shù)據(jù)創(chuàng)造價值,就用到了“sum”,“sum”可以說是一個最簡單的計算,也是一種最簡單、最基本的分析統(tǒng)計。Grid和sum這兩個名字加在一起跟中文“國雙”還有點諧音。
埋下了一顆技術(shù)信仰的種子
國雙CEO祁國晟在高中時就被搜索引擎的強大力量所震撼,并在心中埋下了一顆技術(shù)信仰的種子。進入清華大學(xué)的第二年,他在校園內(nèi)成立了“軟件產(chǎn)業(yè)研究學(xué)會”,希望通過調(diào)研來解決一直困擾自己的問題——為什么“中國沒有軟件產(chǎn)業(yè)”?他認(rèn)為自己有責(zé)任去研究行業(yè),而不僅僅是學(xué)習(xí)編程技術(shù)。
在與國內(nèi)各大行業(yè)協(xié)會合作的過程中,他發(fā)現(xiàn),國內(nèi)軟件企業(yè)絕大多數(shù)更像是“項目企業(yè)、系統(tǒng)集成企業(yè)或信息服務(wù)企業(yè),沒有多少真正的軟件產(chǎn)品企業(yè)”。即使做產(chǎn)品,也是在微軟、Oracle或SAP這些國外基礎(chǔ)軟件產(chǎn)品上搭建一個應(yīng)用,這與他心目中的軟件——操作系統(tǒng)、瀏覽器、Office有著本質(zhì)的不同。
做產(chǎn)業(yè)研究學(xué)會也開啟了祁國晟的大學(xué)創(chuàng)業(yè)生涯。因為此時他認(rèn)識了不少業(yè)內(nèi)人士,都有編程需求。于是,祁國晟就組織同學(xué)做一些外包項目,并在2005年注冊成立國雙。
“剛剛上市以后,祁國晟就在公司的內(nèi)刊上給員工寫了一段話,重新闡述了公司創(chuàng)業(yè)的理念——用技術(shù)改變產(chǎn)業(yè),去推進社會的發(fā)展,為社會發(fā)展做貢獻。而此時,是公司成立的第11個年頭。”劉激揚表示。
而在這個關(guān)鍵的時間節(jié)點上,祁國晟重新闡述了公司的理念,是否也預(yù)示著,對于國雙而言,10億元的營收近在咫尺。
過去20年,中國企業(yè)級IT有效的軟件市場在1000億美元左右。有限的池塘、分割的市場、不公平的競爭、IT標(biāo)準(zhǔn)被跨國巨頭主導(dǎo)、跨國巨頭占領(lǐng)頭部市場等多種因素造成千億美元市場被4萬多家企業(yè)一條條分割,企業(yè)營收天花板不過30~50億元而已。
互聯(lián)網(wǎng)則是另外一番天地,盡管國內(nèi)企業(yè)沒有幾家能走出去,但依然出現(xiàn)BAT等幾家營收過千億,市值達數(shù)千億億美元的世界級市值的新國家企業(yè)。數(shù)以億計的人口基數(shù)、龐大的市場、開放的競爭、放松的對內(nèi)管制、等因素造就了千億級BAT。
我國大數(shù)據(jù)的發(fā)展雖然是企業(yè)級市場,但源頭是數(shù)以億計的普通消費者,所以其發(fā)展更像是互聯(lián)網(wǎng)產(chǎn)業(yè),根據(jù)DT大數(shù)據(jù)產(chǎn)業(yè)創(chuàng)新研究院(DTiii)的測算,2015年中國大數(shù)據(jù)產(chǎn)業(yè)規(guī)模為362.4億元,電信、金融、政府是大數(shù)據(jù)支出的最大行業(yè)用戶,在50億元左右;2020年,中國大數(shù)據(jù)產(chǎn)業(yè)將增長至2343.3億元,電信行業(yè)支出將接近500億元,政府和金融行業(yè)也在300億元以上;2025年,中國大數(shù)據(jù)產(chǎn)業(yè)將成長至10527.5億元,政府、金融、電信、工業(yè)和交通等5個行業(yè)將成為支出超過1000億元的行業(yè)。
2015~2025年中國大數(shù)據(jù)產(chǎn)業(yè)增長趨勢圖
資料來源:陳新河,《贏在大數(shù)據(jù)系列叢書》之《中國大數(shù)據(jù)發(fā)展藍(lán)皮書》
國雙會是第一個突破百億元的大數(shù)據(jù)企業(yè)嗎?
數(shù)說國雙
從5人到1000人
收入增長上100倍
全年營收預(yù)期6億+
毛利率超過80%
擁有9大產(chǎn)品線
30+自主研發(fā)的數(shù)據(jù)科學(xué)產(chǎn)品
600+國內(nèi)外知名客戶
3000+家政府網(wǎng)站服務(wù)
1700+項發(fā)明專利
市值2.74億美元(截止2017年10月10日)