大數(shù)據(jù)并非嚴(yán)格意義上的證據(jù),因?yàn)楸蝗f維網(wǎng)絡(luò)記錄下來的大數(shù)據(jù)是雜亂的,分散的,尚不具備作為證明案件事實(shí)的證據(jù)資格,只有在將相關(guān)數(shù)據(jù)進(jìn)行客觀完整采集的基礎(chǔ)上,運(yùn)用科學(xué)的數(shù)據(jù)處理技術(shù)進(jìn)行連接、運(yùn)算和分析,它們才能為證明案件事實(shí)提供有價值的分析結(jié)論,成為證據(jù)。大數(shù)據(jù)成為證據(jù)除了要求具有傳統(tǒng)的證據(jù)三性之外,還要具備新的標(biāo)準(zhǔn)。筆者以2012年—2014年奇虎訴騰訊濫用市場支配地位案(以下簡稱奇虎訴騰訊案)為例,對大數(shù)據(jù)成為證據(jù)所應(yīng)具備的新標(biāo)準(zhǔn)進(jìn)行闡釋。
一、數(shù)據(jù)內(nèi)容的完整性
大數(shù)據(jù)轉(zhuǎn)變?yōu)樽C據(jù)要求所依賴和利用的數(shù)據(jù)必須具有完整性,即應(yīng)采集獲取與所證明事項(xiàng)或目標(biāo)相關(guān)的完整數(shù)據(jù),唯有如此,所作出的分析結(jié)果才具有充分的證明力。在奇虎訴騰訊案中,奇虎證明相關(guān)商品市場范圍時所提供的艾瑞咨詢《中國即時通信年度檢測報告》(2010-2011年),其所依據(jù)的數(shù)據(jù)就缺乏完整性,艾瑞咨詢監(jiān)測了個人電腦端即時通信軟件的數(shù)據(jù),但未監(jiān)測統(tǒng)計手機(jī)和平板電腦等移動端即時通信軟件的數(shù)據(jù),也未將即時通信產(chǎn)品作為核心產(chǎn)品一部分的微博和SNS社交網(wǎng)站產(chǎn)品納入到相關(guān)市場商品集合中進(jìn)行數(shù)據(jù)監(jiān)測統(tǒng)計,因此不能用來有效地劃定本案相關(guān)市場的范圍。
二、數(shù)據(jù)來源的復(fù)合性
大數(shù)據(jù)不是從單一來源中形成證據(jù)的,大數(shù)據(jù)到證據(jù)的轉(zhuǎn)變需要針對具體事項(xiàng)和目標(biāo)的需要,通過對多個不同來源的數(shù)據(jù)庫或信息相互關(guān)聯(lián),從中多維分析挖掘才能夠?qū)崿F(xiàn),這是一個復(fù)雜的分析挖掘復(fù)合形成的過程。奇虎訴騰訊一案中法院多次使用了CNNIC第24次《中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計報告》和艾瑞咨詢《中國即時通信年度檢測報告》(2010-2011年),其中CNNIC擁有高效、安全、穩(wěn)定的互聯(lián)網(wǎng)基礎(chǔ)資源服務(wù)平臺,從1997年成立至今已發(fā)布了38次《中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計報告》,其統(tǒng)計報告的調(diào)查數(shù)據(jù)和分析結(jié)論就具有典型的復(fù)合性。艾瑞咨詢是擁有國內(nèi)數(shù)據(jù)累積時間最長、規(guī)模最大、最為穩(wěn)定的各類數(shù)據(jù)庫,并通過多種指標(biāo)研究幫助行業(yè)建立評估和衡量的標(biāo)準(zhǔn),至今發(fā)布了大量互聯(lián)網(wǎng)行業(yè)的數(shù)據(jù)統(tǒng)計分析報告,同樣具有典型的復(fù)合性。在奇虎訴騰訊案中,法院就是根據(jù)這兩個機(jī)構(gòu)提供的統(tǒng)計數(shù)據(jù)對既使用移動端即時通信服務(wù)又使用個人電腦端即時通信服務(wù)的網(wǎng)民數(shù)量進(jìn)行推算,結(jié)果是1.7億人,約占個人電腦端即時通信服務(wù)用戶總數(shù)的48.6%;而且法院根據(jù)艾瑞咨詢報告的預(yù)測,作出合理預(yù)見:用戶用移動端即時通信服務(wù)替代個人電腦端即時通信服務(wù)的可能性和比例將進(jìn)一步增大,這對個人電腦端即時通信服務(wù)的經(jīng)營者形成了有效的競爭約束。據(jù)此法院將移動端即時通信服務(wù)納入了本案相關(guān)商品市場范圍。
三、數(shù)據(jù)處理技術(shù)的科學(xué)性
大數(shù)據(jù)是海量的,分散的、無形的,必須借助科學(xué)有效的大數(shù)據(jù)處理技術(shù)才能從中獲取有價值的大數(shù)據(jù)證據(jù)。所謂數(shù)據(jù)處理技術(shù)的科學(xué)性是指必須采用相關(guān)技術(shù)領(lǐng)域普遍認(rèn)同的技術(shù)方法,或者可以進(jìn)行相應(yīng)驗(yàn)證的技術(shù)方法。唯有采用科學(xué)的數(shù)據(jù)處理方法,才能保證通過該方法形成的數(shù)據(jù)處理結(jié)論具有可靠性、具有證明力。在奇虎訴騰訊一案中,法院在認(rèn)定騰訊是否可以控制商品價格時,使用了CNNIC《中國即時通信用戶調(diào)研報告》(2009年度)、艾瑞咨詢《中國即時通信用戶行為研究報告》(2010-2011年)和eNet的調(diào)查結(jié)果。其中CNNIC《中國即時通信用戶調(diào)研報告》(2009年度)指出,不愿意為使用即時通信服務(wù)付費(fèi)的用戶高達(dá)60.6%。艾瑞咨詢《中國即時通信用戶行為研究報告》(2010-2011年)則表明,2010年51.2%的中國即時通信用戶從未支付任何費(fèi)用。eNet調(diào)查結(jié)果也顯示,如果騰訊QQ即時通信服務(wù)收費(fèi),只有6.69%的用戶表示將付費(fèi)并繼續(xù)使用,81.71%的用戶將轉(zhuǎn)而使用其他即時通信軟件。上述報告或結(jié)果很明顯使用的是數(shù)據(jù)處理技術(shù)中的統(tǒng)計與分析技術(shù),其主要利用分布式數(shù)據(jù)庫,或者分布式計算集群來對存儲于其內(nèi)的海量數(shù)據(jù)進(jìn)行常規(guī)的分析和分類匯總等,其方法已得到業(yè)界的普遍認(rèn)同,具有科學(xué)性。據(jù)此法院認(rèn)為,在免費(fèi)的互聯(lián)網(wǎng)基礎(chǔ)即時通信服務(wù)已經(jīng)長期存在并成為通行商業(yè)模式的情況下,用戶對即時通信服務(wù)價格的改變會有極高的敏感度,如果從免費(fèi)模式改為收費(fèi)模式,哪怕是收費(fèi)較低都會產(chǎn)生客戶大量流失的風(fēng)險,故法院認(rèn)定騰訊控制商品價格的能力較弱。
2015年8月國務(wù)院印發(fā)的《促進(jìn)大數(shù)據(jù)發(fā)展行動綱要》明確指出大數(shù)據(jù)是以容量大、類型多、存取速度快、應(yīng)用價值高為主要特征的數(shù)據(jù)集合,正快速發(fā)展為對數(shù)量巨大、來源分散、格式多樣的數(shù)據(jù)進(jìn)行采集、存儲和關(guān)聯(lián)分析,從中發(fā)現(xiàn)新知識、創(chuàng)造新價值、提升新能力的新一代信息技術(shù)和服務(wù)業(yè)態(tài)。為此,我們應(yīng)將大數(shù)據(jù)的思維和方法運(yùn)用到我國司法領(lǐng)域,將完整的數(shù)據(jù)作為證據(jù)基礎(chǔ),復(fù)合的數(shù)據(jù)庫作為證據(jù)來源,科學(xué)的數(shù)據(jù)處理技術(shù)作為證明方法,從中發(fā)現(xiàn)和獲取新的知識、創(chuàng)造新的價值,通過大數(shù)據(jù)分析結(jié)果為認(rèn)定疑難事實(shí)提供可靠有效的依據(jù)。