摘要 : 百度要做好搜索,要落地自己的大數據戰(zhàn)略,最需要政府的大數據。在技術上的積累,在網民大數據上的積累,以及互聯(lián)網入口的地位,讓百度有機會利用好政府大數據,享受這一個開放紅利。
李克強總理在兩會上明確表態(tài):政府應該盡量的公開非涉密的數據,以便利用這些數據更好的服務社會,也為政府決策和監(jiān)管服務。這已不是政府第一次關注并支持大數據。早在2012年,國務院副總理,時任廣東省委書記的汪洋,便向廣東省財政廳官員推薦了《大數據》一書,并詳細闡述了自己對大數據的理解。2013年底,“七常委”第九次集體學習之時,聽取了百度CEO李彥宏關于大數據發(fā)展的匯報講解。政府對大數據一直積極關注,這一次李克強總理在兩會上明確表態(tài),大數據正在上升到國家級戰(zhàn)略層面,政府開放大數據已是板上釘釘。
對于這一消息,最高興的應該是百度,我想百度應該一直在等待這個時間節(jié)點。2013年底李彥宏充當大數據義務宣傳員向國家高層介紹匯報大數據;2014年兩會,李彥宏在政協(xié)記者會上表示,政府應該把更多和人民生活有關的數據資料,公開的放到網絡上;2015年兩會,李彥宏的“中國大腦”提案之中同樣包括建議政府聚焦大數據這部分。在推動政府大數據開放上,百度如此積極在于,百度有能力,也有動機利用好政府大數據。政府大數據,對于百度而言是求之不得的寶貴外部資源。
百度需要政府大數據做好搜索本身
搜索為核心業(yè)務的百度,本質上是一家搜索公司,搜索做的事情,實際上是對數據的處理和信息的連接。理論上來說,百度、Google們是最具“大數據基因”的公司。搜索引擎在移動互聯(lián)網時代正在經歷一個前所未有的轉型:即搜索的內容從WEB數據,升級到所有數據;搜索引擎的功能定位則從信息與人的連接者,轉型為服務與人的連接者。
移動互聯(lián)網上,App所造成的信息孤島效應、企業(yè)服務背后的海量結構化數據、政府正在開放的高價值民生數據,對于搜索引擎而言都具有巨大價值。以政府為例,交通、健康、衛(wèi)生、環(huán)保、氣象,諸多數據其實承載的是政府的服務。百度要幫助用戶連接各種服務,自然不會少了政務服務。如何將政府開放的數據以及背后的服務集成到百度搜索,是百度面臨的新的挑戰(zhàn)。
在過去的幾年里,百度已經意識到這一趨勢并嘗試接入政府大數據。主要是通過點對點項目的方式,先后與國家知識產權局專利中心、藥監(jiān)局、北京市衛(wèi)生部門達成合作,接入其數據整合到百度搜索之中。百度還上線了政府網站搜索,整合了龐大政府信息網頁庫,幫助用戶搜索各類政府公文、政策法規(guī)等政府信息。另外在《穹頂之下》讓全民關注環(huán)保問題之時,百度還推出了“污染地圖”整合了環(huán)部門相關數據。總之,要做好搜索,滿足網民訴求,整合政府大數據,以及背后的服務,是必須要做的事情。
政府大數據給百度帶來新的業(yè)務空間
百度未來的業(yè)務版圖里面,大數據一方面為搜索服務,一方面又將誕生出新的業(yè)務板塊。
2014年一個重點業(yè)務便是百度預測。搜索解決的是從海量數據和服務中找到所求的問題;而預測則是基于大數據分析的未來趨勢變化,可被應用在氣象、人流、物流、經濟、房價諸多預測上,服務于生活和生產。統(tǒng)計局曾公布其基于百度搜索數據預測不同城市的房價變化,效果良好。旅游預測可以幫助旅游管理部門和景區(qū)做好預案規(guī)劃,交通預測有助于交通規(guī)劃部門和鐵路民航公路做好客流物流疏導,流感預測可以提供給衛(wèi)生部門做好疫情防控,大數據預測有著巨大的應用前景。
基于大數據的應用,預測只是其中一種?;诖髷祿诰虻木珳蕚€體追蹤可被應用在精準營銷上,對于政府管理有參考價值;基于大數據的規(guī)律發(fā)現(xiàn)和統(tǒng)計學應用,則可以幫助政府以及相關機構做好社會調研,比如成為統(tǒng)計局的數據源;基于大數據的百度指數、百度統(tǒng)計等已普及應用,可適用在政府輿情監(jiān)控等領域。美國政府大數據平臺DATA.GOV上除了政府開放的數據之外,還有第三方開發(fā)的各種大數據應用,中國政府大數據開放后的應用,百度同樣可以開發(fā),甚至整合到百度平臺——過去幾個案例正是這樣做的。
總之,百度需要大數據做好搜索,同時可以基于政府大數據研發(fā)更多潛在應用,這些應用要么可產生商業(yè)價值,要么將具有社會公益價值,都將給百度帶來新的業(yè)務空間。
百度憑什么享受政府大數據紅利?
我曾分析過,中國政府開放大數據,在標準化的統(tǒng)一數據開放平臺建立起來,必然也只能選擇大公司優(yōu)先的方式。這里的大公司,其實備選名單并不多。中國在大數據技術上最有作為的公司,有兩家:一家是百度,另一家是阿里。
百度在技術上有過人之處,正如前文所提及,百度一直做的事情就是處理數據,最具“大數據基因”,百度在大數據上投入力度也相對較大,成立了大數據實驗室、深度學習實驗室和人工智能實驗室,廣納海內外頂尖人才。百度大數據引擎是首個開放的大數據處理平臺,百度大腦為大數據挖掘和預測等業(yè)務提供基礎支持,深度學習是大數據產業(yè)的關鍵基礎型技術,多媒體識別、自然語言處理則是大數據的上層實踐應用。大數據這個概念是比較新,但對數據的挖掘和相關的技術積累,百度基礎扎實;而基于深度學習的大數據技術則讓百度走得稍稍快了一些。
百度是信息和服務的入口,它連接人與信息、人與服務。它具備媒體屬性,因為是信息入口;它是服務平臺,通過阿拉丁計劃百度搜索結果頁已經豐富多樣,承載了不同的服務包括政務服務。手機百度的服務風格更是愈加明顯。政務服務上網,在線政務信息和在線政務服務需要通過百度輸出,百度在這個過程中就拿到了部分政府大數據。
還有一點是百度本身便擁有政府部門所需的民間大數據,可以與政府部門形成雙贏合作。百度擁有最全最龐大的WEB數據,來自于網絡爬蟲時時刻刻的爬取解析索引;用戶搜索則是表征著網民此時此刻想什么想要什么;移動App則收集著海量用戶的位移、聲音等數據;在物聯(lián)網上的布局還可以拿到視頻數據比如景點直播。這些數據實時傳遞并存儲到云端,對于政府部門開展工作具有一定價值。百度為政府部門提供所需的大數據,還可以基于自己的數據與政府開放的數據交叉分析,讓數據產生更大價值。
因此,政府開放大數據,最開心的應該是百度。百度要做好搜索,要落地自己的大數據戰(zhàn)略,最需要政府的大數據。在技術上的積累,在網民大數據上的積累,以及互聯(lián)網入口的地位,讓百度有機會利用好政府大數據,享受這一個開放紅利。