隨著互聯(lián)網(wǎng)的發(fā)展,大數(shù)據(jù)征信已被越來越多地運用到金融領域,互聯(lián)網(wǎng)金融平臺利用大數(shù)據(jù)判斷用戶的信用記錄是否良好,從而授予用戶相應的信貸額度。傳統(tǒng)銀行也在加緊布局大數(shù)據(jù)網(wǎng)絡,試圖與互聯(lián)網(wǎng)平臺接軌。與傳統(tǒng)信用評估模型不同的是,傳統(tǒng)的信用評估是根據(jù)一個人的借貸歷史和還款表現(xiàn),通過邏輯回歸的方式來判斷這個人的信用情況,而大數(shù)據(jù)征信的數(shù)據(jù)源則十分廣泛,電子商務、社交網(wǎng)絡和搜索行為等都產(chǎn)生了大量的數(shù)據(jù),在如此海量的數(shù)據(jù)面前,如何把控數(shù)據(jù)源的“量”與“度”是互聯(lián)網(wǎng)平臺和傳統(tǒng)金融機構(gòu)需要重視并解決的問題。
如今一切信息皆可以成為信用數(shù)據(jù),經(jīng)過分析后用于證明一個人或企業(yè)的信用狀況。大數(shù)據(jù)的“量”是指有多少個體在被分析,每一個網(wǎng)上注冊賬號的個體都可以成為被分析的對象。數(shù)據(jù)源的“度”是指被分析的個體都有哪些方面能夠成為可以參考的數(shù)據(jù)。有很多人認為數(shù)據(jù)能夠被稱為“大數(shù)據(jù)”需具備兩個因素:第一要覆蓋面廣,用戶足夠多;第二維度廣,要從一個人行為的方方面面反映個體的行為與信用的關系。但是,筆者認為事實并非如此,數(shù)據(jù)的“量”與“度”也應嚴格加以控制。
把控大數(shù)據(jù)的“量”關鍵在于從大量的數(shù)據(jù)之中篩選出“有效用戶”。無論是在傳統(tǒng)金融領域,還是互聯(lián)網(wǎng)金融領域,給客戶做信用評估的前提是必須知道這個人就是他自己。所以,如何證明“你是你”是大數(shù)據(jù)征信首先要解決的問題。然而現(xiàn)實的情況是:一個人可以同時申請多個賬號,多個人在知道賬戶信息的條件下也可以同時使用一個賬號。在這樣的情況下數(shù)據(jù)信息往往有所重疊。因此,數(shù)據(jù)的體量大并不代表數(shù)據(jù)更加可靠。
隨著越來越多的金融業(yè)務互聯(lián)網(wǎng)化,“反欺詐”面臨的挑戰(zhàn)也日益增大。“身份認證”的重要性在各項監(jiān)管文件中反復被強調(diào),而各家機構(gòu)也在不斷探索如何利用新的技術在網(wǎng)上實現(xiàn)身份的核實。金融機構(gòu)在重視數(shù)據(jù)量的同時還可運用先進的科學技術手段,如指紋、虹膜、人臉識別等一系列生物識別技術,將大量的無效信息排除在外,同時也能夠抵御數(shù)據(jù)造假所帶來的信用風險。
對數(shù)據(jù)源“度”的有效性進行控制也是金融平臺和金融機構(gòu)需要考慮的問題。社交軟件在數(shù)據(jù)量上有著非常明顯的優(yōu)勢,許多社交軟件常常從用戶行為上分析判斷一個人的信用是否良好,這就有可能出現(xiàn)“分析過度”的情況。
在一些大數(shù)據(jù)征信的文章中,一些案例是這樣分析個人行為和信用評分的關系的:經(jīng)常半夜上網(wǎng)的用戶可能被認為沒有穩(wěn)定的工作而降低信用評分,購買大件家具的用戶可能提示有固定房屋資產(chǎn)而使其信用評分較高,微博更新頻繁的用戶可能因為社交活躍而信用評分較高等等。但這些因素并不十分穩(wěn)定且準確,有些行為可能只是用戶的個人習慣,如果過度依賴這些因素將對用戶信用的判斷產(chǎn)生誤差。因此,哪些行為可以成為判斷個人信用的標準需要考量。
因此,大數(shù)據(jù)能夠成為金融機構(gòu)的征信參考標準并不一定要求數(shù)據(jù)量大、數(shù)據(jù)的維度多,數(shù)據(jù)的有效性高、數(shù)據(jù)更能反映問題才能讓征信更加全面、可靠。