大數(shù)據(jù)風(fēng)控的現(xiàn)狀、問題及優(yōu)化路徑

責(zé)任編輯:editor004

作者:巴曙松 侯暢

2016-04-11 11:10:45

摘自:互聯(lián)網(wǎng)金融mp

在互聯(lián)網(wǎng)技術(shù)和信息技術(shù)的推動下,大數(shù)據(jù)在金融行業(yè)的風(fēng)控中獲得了引人注目的進(jìn)展,但是在實(shí)際運(yùn)用中其有效性還需進(jìn)一步提高。對于金融研究者而言,可從經(jīng)濟(jì)學(xué)、數(shù)學(xué)等多個角度綜合論證大數(shù)據(jù)風(fēng)控的有效性,為大數(shù)據(jù)風(fēng)控提供理論支持。

摘要:在互聯(lián)網(wǎng)技術(shù)和信息技術(shù)的推動下,大數(shù)據(jù)在金融行業(yè)的風(fēng)控中獲得了引人注目的進(jìn)展,但是在實(shí)際運(yùn)用中其有效性還需進(jìn)一步提高。當(dāng)前大數(shù)據(jù)風(fēng)控有效性不足既有數(shù)據(jù)質(zhì)量的障礙,也有大數(shù)據(jù)風(fēng)控的理論性障礙,還有數(shù)據(jù)保護(hù)的制度障礙。消除這些障礙、提高大數(shù)據(jù)風(fēng)控的有效性,需要金融企業(yè)、金融研究部門和政府監(jiān)管部門的共同努力。

大數(shù)據(jù)已經(jīng)撼動了世界的方方面面,從商業(yè)科技到醫(yī)療、政府、教育、經(jīng)濟(jì)、人文以及社會其他各個領(lǐng)域。早在1980年,阿爾文?托夫勒(Alvin Toffler,1980)在《第三次浪潮》一書中就預(yù)言大數(shù)據(jù)將成“第三次浪潮”。奧巴馬政府將大數(shù)據(jù)定義為“未來的新石油”。凱文?凱利(Kevin Kelly,2014)認(rèn)為所有的生意都是數(shù)據(jù)生意。2013年互聯(lián)網(wǎng)金融將“大數(shù)據(jù)”推向了新的高度。金融的核心是風(fēng)險(xiǎn)控制,將風(fēng)控與大數(shù)據(jù)結(jié)合、不斷完善和優(yōu)化風(fēng)控制度和體系,對于互聯(lián)網(wǎng)金融企業(yè)和傳統(tǒng)金融企業(yè)而言都同等重要。

一.大數(shù)據(jù)風(fēng)控發(fā)展迅速,但有效性不佳

在應(yīng)用層面,金融行業(yè)利用大數(shù)據(jù)進(jìn)行風(fēng)控已經(jīng)取得了一定的成效。使用大數(shù)據(jù)進(jìn)行風(fēng)控已成為美國等發(fā)達(dá)國家互聯(lián)網(wǎng)金融企業(yè)的標(biāo)準(zhǔn)配置。

美國ZestFinance公司開發(fā)的10個基于學(xué)習(xí)機(jī)器的分析模型,對每位信貸申請人的超過1萬條原始信息數(shù)據(jù)進(jìn)行分析,并得出超過7萬個可對其行為做出測量的指標(biāo),而這一過程在5秒鐘內(nèi)就能全部完成。

為網(wǎng)上商家提供金融信貸服務(wù)的公司Kabbage主要目標(biāo)客戶是ebay、Amazon、PayPal等電商,其通過獲取這些企業(yè)網(wǎng)店店主的銷售、信用記錄、顧客流量、評論、商品價格和存貨等信息,以及他們在Facebook和Twitter上與客戶的互動信息,借助數(shù)據(jù)挖掘技術(shù),把這些店主分成不同的風(fēng)險(xiǎn)等級,以此來確定提供貸款金額數(shù)量與貸款利率水平。

中國互聯(lián)網(wǎng)金融企業(yè)對于大數(shù)據(jù)風(fēng)控的運(yùn)用也如火如荼。

阿里推出了面向社會的信用服務(wù)體系芝麻信用,芝麻信用通過分析大量的網(wǎng)絡(luò)交易及行為數(shù)據(jù),對用戶進(jìn)行信用評估,這些信用評估可以幫助互聯(lián)網(wǎng)金融企業(yè)對用戶的還款意愿及還款能力做出結(jié)論,繼而為用戶提供相關(guān)的金融和經(jīng)濟(jì)服務(wù)。

騰訊的微眾銀行推出的“微粒貸”產(chǎn)品,其風(fēng)控核心就是,通過社交大數(shù)據(jù)與央行征信等傳統(tǒng)銀行信用數(shù)據(jù)結(jié)合,運(yùn)用社交圈、行為特征、交易、基本社會特征、人行征信5個維度對客戶綜合評級,運(yùn)用大量的指標(biāo)構(gòu)建多重模型,以快速識別客戶的信用風(fēng)險(xiǎn)。

對于大數(shù)據(jù)風(fēng)控的理論研究尚處于萌芽階段,本文以“大數(shù)據(jù)風(fēng)控”為主題在CNKI數(shù)據(jù)庫進(jìn)行搜索,與此相關(guān)的文獻(xiàn)數(shù)量可以從側(cè)面反映大數(shù)據(jù)風(fēng)控的理論研究現(xiàn)狀。

CNKI數(shù)據(jù)庫中以“大數(shù)據(jù)風(fēng)控”為主題的文獻(xiàn)共46篇。在這些文獻(xiàn)中,以報(bào)道性的文章較多,重要報(bào)紙全文庫和特色期刊總共為33篇,占比72%;而理論研究的文章較少,中國學(xué)術(shù)期刊總庫為12篇,占比26%;尚沒有CSSCI2014—2015年的來源期刊(如圖1)。

  圖1 CNKI數(shù)據(jù)庫與大數(shù)據(jù)相關(guān)的文獻(xiàn)數(shù)量和分類

雖然大數(shù)據(jù)風(fēng)控在實(shí)踐上已經(jīng)有所進(jìn)展,但是其有效性也受到一些挑戰(zhàn)。

例如,以大數(shù)據(jù)風(fēng)控為基石的P2P平臺就頻頻暴露出各種各樣的問題來。對于P2P平臺來說,由于其純線上操作的特點(diǎn),大數(shù)據(jù)風(fēng)控的有效性是決定其經(jīng)營狀況的重要因素,如果大數(shù)據(jù)風(fēng)控有效性較差,則面臨的壞賬壓力較大,容易出現(xiàn)提現(xiàn)困難甚至跑路的問題。

網(wǎng)貸之家的數(shù)據(jù)顯示,2015年上半年新增問題平臺419家,是2014年同期的7.5倍,已超過2014年全年問題平臺數(shù)量。截至2015年10月底,全國問題平臺數(shù)累積已達(dá)1115家。

二.當(dāng)前大數(shù)據(jù)風(fēng)控有效性不足的原因分析

一些學(xué)者對于大數(shù)據(jù)風(fēng)控的有效性問題進(jìn)行了研究。

王強(qiáng)(2015)指出當(dāng)前個人大數(shù)據(jù)征信的問題,一是數(shù)據(jù)的真實(shí)性,二是數(shù)據(jù)收集的法律障礙,三是壞賬的不可預(yù)測性問題。

甚至有作者認(rèn)為大數(shù)據(jù)風(fēng)控是無效的,陳宇(2015)援引各種證據(jù)認(rèn)為大數(shù)據(jù)風(fēng)控是無效的。

總體而言,當(dāng)前大數(shù)據(jù)風(fēng)控有效性欠佳的原因主要有以下幾個方面:

(一)數(shù)據(jù)的質(zhì)量問題

當(dāng)前大數(shù)據(jù)風(fēng)控的有效性欠佳,其首要原因就是數(shù)據(jù)的真實(shí)性不高,包括社交數(shù)據(jù)和交易數(shù)據(jù)兩個方面。

1.社交數(shù)據(jù)的真實(shí)性問題

美國lendingclub和facebook合作獲取社交數(shù)據(jù),在中國宜信也曾大費(fèi)周折的收集借款人的社交數(shù)據(jù),最后兩者得出的結(jié)論都是社交數(shù)據(jù)根本就不能用。美國很多大數(shù)據(jù)征信公司的信息錯誤率高達(dá)50%,垃圾進(jìn)、垃圾出。

2.交易數(shù)據(jù)的真實(shí)性問題。

當(dāng)前許多電商平臺的刷單現(xiàn)象非常嚴(yán)重,這將導(dǎo)致交易數(shù)據(jù)的嚴(yán)重失真。隨著網(wǎng)購的火爆,有關(guān)電商平臺“刷單”的報(bào)道屢見報(bào)端。

電商“刷單”有兩種方式,一種是商家找所謂的消費(fèi)者進(jìn)行“刷單”。賣家買快遞單號,其收件人和寄件人與實(shí)際的買家、賣家不一致。

另一種是快遞公司發(fā)空包,但快遞公司并未完成配送,而幫助商家完成平臺上的物流信息。

(二)大數(shù)據(jù)風(fēng)控的理論有效性問題

從IT技術(shù)層面論證大數(shù)據(jù)風(fēng)控的實(shí)踐性案例已經(jīng)很多,但是在經(jīng)濟(jì)金融的理論層面,大數(shù)據(jù)風(fēng)控還面臨一些問題需要解決。

1.金融信用與社會信用的相關(guān)性不確定

目前大數(shù)據(jù)主要來源于互聯(lián)網(wǎng),而人們在網(wǎng)絡(luò)中的表現(xiàn)并不能完全反映其真實(shí)的一面。相同的人群在不同場合呈現(xiàn)的特征是不一樣的,尤其是目前人們在線上、線下割裂的狀態(tài),其行為方式往往會出現(xiàn)強(qiáng)烈的反差。

例如有些人不善交際,卻將自己做的美食展示在微博上,吸引大量關(guān)注,粉絲暴增。因此網(wǎng)絡(luò)并不能確切地證明某人的社交圈子,也就是說互聯(lián)網(wǎng)的數(shù)據(jù)很難還原用戶現(xiàn)實(shí)中的信息。

2.大數(shù)據(jù)對于“黑天鵝”事件的滯后性

在現(xiàn)實(shí)世界,總會出現(xiàn)不可預(yù)測的“黑天鵝”事件,一旦出現(xiàn)則有可能沖擊大數(shù)據(jù)風(fēng)控模型的基本假設(shè),進(jìn)而影響大數(shù)據(jù)風(fēng)控的有效性。大到美國的次貸危機(jī),小到個人意外事件的發(fā)生,在某種程度上大數(shù)據(jù)風(fēng)控是無法預(yù)測的,但這些事件的發(fā)生,對宏觀經(jīng)濟(jì)和微觀主體都會產(chǎn)生重大的影響。

例如,2008年美國次貸危機(jī)后產(chǎn)生了一種“策略性違約”行為——貸款主體本身有能力還款,但是其在房價遠(yuǎn)低于貸款總額的時候,重新購買一套房子,并對之前的房貸斷供,貸款者可以此方法進(jìn)行“套利”。

雖然此類違約者會因此有不良信用記錄,但是這對信用報(bào)告的影響有限,因?yàn)槠渌膫鶆?wù)按期償還。而大數(shù)據(jù)對這種突變事件的預(yù)測能力則非常有限。

(三)大數(shù)據(jù)收集和使用的制度問題

在數(shù)據(jù)收集和使用的過程中也面臨著合法使用的問題。如何高效、適度地開發(fā)和使用大數(shù)據(jù),不僅僅是一個技術(shù)問題,也是一個社會問題,這些泄露的數(shù)據(jù)大量流入數(shù)據(jù)黑市,造成了用戶安全、企業(yè)安全甚至國家安全方面的連鎖反應(yīng)。數(shù)據(jù)的收集和使用在很多時候都沒有征得數(shù)據(jù)生產(chǎn)主體的同意,這導(dǎo)致了數(shù)據(jù)的濫用和隱私的泄露。

近年來,個人數(shù)據(jù)泄露事件頻頻發(fā)生,因個人數(shù)據(jù)泄露而造成損失的新聞屢見報(bào)端。獵豹移動安全實(shí)驗(yàn)室發(fā)布的《2015年上半年移動安全報(bào)告》顯示,截至2015年上半年,獵豹共監(jiān)測到496起數(shù)據(jù)泄露事件,影響超過544萬人。2015年10月19日,烏云網(wǎng)發(fā)布消息稱,網(wǎng)易的用戶數(shù)據(jù)庫疑似泄露。

  圖2 2005-2014年國內(nèi)外數(shù)據(jù)泄密情況

資料來源:上海漢均信息技術(shù)有限公司《2005—2014年全球泄密事件分析報(bào)告》

數(shù)據(jù)安全問題也將越來越多的企業(yè)推向風(fēng)口浪尖。

上海漢均信息技術(shù)有限公司發(fā)布的《2005—2014年全球泄密事件分析報(bào)告》顯示,10年間,全球泄密事件中,我國泄密事件數(shù)量占比為58.5%,其中高頻發(fā)地域主要是東部沿海經(jīng)濟(jì)較發(fā)達(dá)、產(chǎn)業(yè)格局以高技術(shù)含量為主的一二線城市(如圖2)。

Verizon發(fā)布《2015年數(shù)據(jù)泄露調(diào)查報(bào)告》,報(bào)告覆蓋95個國家,其中有61個報(bào)告了問題,涉及79790個安全事件(Security Incident),超過2000個(2122個)確認(rèn)數(shù)據(jù)泄露(Data Breach)。

三.提高大數(shù)據(jù)風(fēng)控有效性的路徑

盡管大數(shù)據(jù)風(fēng)控的有效運(yùn)用尚處在諸多障礙,但這并不能成為大數(shù)據(jù)風(fēng)控?zé)o效的理由。因?yàn)閷τ跀?shù)據(jù)這個資源的挖掘尚處于初級階段,在消除障礙、解決問題中前行,是大數(shù)據(jù)風(fēng)控發(fā)展的必然趨勢。有效掃除當(dāng)前大數(shù)據(jù)風(fēng)控的障礙需要各方面的共同努力,其中金融企業(yè)、金融研究部門和政府監(jiān)管部門的角色尤為重要。

對于金融企業(yè)而言,要從基礎(chǔ)數(shù)據(jù)上保證客戶數(shù)據(jù)的多樣化、連續(xù)性和實(shí)時性,確保數(shù)據(jù)真實(shí)可靠。

對于金融研究者而言,可從經(jīng)濟(jì)學(xué)、數(shù)學(xué)等多個角度綜合論證大數(shù)據(jù)風(fēng)控的有效性,為大數(shù)據(jù)風(fēng)控提供理論支持。

對于政府監(jiān)管部門而言,需要從法律制度、會計(jì)制度等方面進(jìn)行建設(shè),構(gòu)建數(shù)據(jù)合理運(yùn)用的良好環(huán)境體系。

(一)對于金融企業(yè)而言,要構(gòu)建多樣化、連續(xù)性和實(shí)時性的基礎(chǔ)數(shù)據(jù)

1.多維度的收集數(shù)據(jù),互聯(lián)互通,打破數(shù)據(jù)的孤島

美國征信系統(tǒng)的完善是因?yàn)槊绹畬ζ鋼碛械拇髷?shù)據(jù)資源的開放程度日益透明化。

目前我國的大數(shù)據(jù)風(fēng)控系統(tǒng)還沒有實(shí)現(xiàn)互通互聯(lián),阿里、銀聯(lián)、平安、騰訊以及眾多的P2P公司,都是各自為政,P2P公司拿不到央行的數(shù)據(jù),幾家大的互聯(lián)網(wǎng)平臺在相關(guān)大數(shù)據(jù)的分享上彼此也未互通有無。

因而,各金融企業(yè)要建立互聯(lián)互通機(jī)制,打破數(shù)據(jù)孤島,從而能多維度地收集數(shù)據(jù),確保數(shù)據(jù)之間能夠相互驗(yàn)證。

2.從供應(yīng)鏈交易環(huán)節(jié)獲取數(shù)據(jù)

獲取真實(shí)數(shù)據(jù)最好的途徑就是要切入客戶的交易環(huán)節(jié),尤其是穩(wěn)定可持續(xù)的交易環(huán)節(jié),即供應(yīng)鏈。

一方面,經(jīng)過了幾十年的發(fā)展,當(dāng)前的供應(yīng)鏈都有一套完整上下游進(jìn)入和退出機(jī)制,數(shù)據(jù)的真實(shí)性對于核心企業(yè)而言至關(guān)重要,因而這些數(shù)據(jù)的質(zhì)量非常優(yōu)異。

另一方面,這些數(shù)據(jù)和數(shù)據(jù)維度對于供應(yīng)鏈中的企業(yè)評價是可靠的,金融企業(yè)可以此為基礎(chǔ),加上自身的風(fēng)險(xiǎn)控制經(jīng)驗(yàn),構(gòu)建一套全新的基于數(shù)據(jù)的信用評價機(jī)制。

3.積極布局“物聯(lián)網(wǎng)+”

物聯(lián)網(wǎng)覆蓋了產(chǎn)品生產(chǎn)、交易和使用的環(huán)節(jié),因而互聯(lián)網(wǎng)只是物聯(lián)網(wǎng)的一部分。在物聯(lián)網(wǎng)下,不僅要獲取交易環(huán)節(jié)的數(shù)據(jù),更重要的是獲取生產(chǎn)環(huán)節(jié)和使用環(huán)節(jié)的數(shù)據(jù)。

因而,金融企業(yè)要積極布局“物聯(lián)網(wǎng)+”,為獲取更為全面的數(shù)據(jù)打下基礎(chǔ)。例如,企業(yè)機(jī)器運(yùn)行數(shù)據(jù),可以收集客戶汽車駕駛數(shù)據(jù),可穿戴設(shè)備的身體狀況數(shù)據(jù),等等。這些數(shù)據(jù)都是大數(shù)據(jù)風(fēng)控不可或缺的部分。

(二)對于金融研究部門而言,可從經(jīng)濟(jì)、金融等多個角度綜合論證大數(shù)據(jù)風(fēng)控的有效性,為大數(shù)據(jù)風(fēng)控提供理論支持

當(dāng)前對于大數(shù)據(jù)風(fēng)控模型的構(gòu)建大多是從技術(shù)的角度探討的。但是,從經(jīng)濟(jì)、金融角度進(jìn)行的探討亟待加強(qiáng),不同的經(jīng)濟(jì)假設(shè)會使模型推導(dǎo)的結(jié)果產(chǎn)生截然不同的變化。因而,從經(jīng)濟(jì)、金融等角度對大數(shù)據(jù)風(fēng)控有效性的研究就顯得很有必要了。比如大數(shù)據(jù)風(fēng)控如何順應(yīng)經(jīng)濟(jì)周期的變化,如何從統(tǒng)計(jì)上論證過去的數(shù)據(jù)對于未來行為判斷的準(zhǔn)確性,如何解決道德風(fēng)險(xiǎn)所帶來的不確定性。例如,唐時達(dá)(2015)提出要把數(shù)據(jù)提升至與傳統(tǒng)抵質(zhì)押品同等重要的高度,建立“數(shù)據(jù)質(zhì)押”風(fēng)控體系。

(三)對于政府監(jiān)管部門而言,要推動和完善與數(shù)據(jù)相關(guān)的制度建

1.法律制度的建設(shè),對數(shù)據(jù)的收集和使用予以法律上的保護(hù)

我國對于數(shù)據(jù)保護(hù)的制度性舉措散見于多部法律中,如憲法、刑法、侵權(quán)責(zé)任法等,多是以保護(hù)個人隱私、通信秘密等形式出現(xiàn),尚缺乏一部數(shù)據(jù)保護(hù)的專門性法律。這導(dǎo)致了數(shù)據(jù)的法律邊界不明,數(shù)據(jù)保護(hù)法律的操作性不強(qiáng)、數(shù)據(jù)保護(hù)執(zhí)法機(jī)制滯后等問題,制約了數(shù)據(jù)收集和運(yùn)用的發(fā)展。

對此,最理想的狀況是出臺一部《信息保護(hù)法》。在完善個人信息保護(hù)法律制度的道路上,應(yīng)出臺《個人信息保護(hù)法》,明確國家機(jī)關(guān)、商家和其他法人、自然人掌握個人信息的邊界和使用的范圍[6-7]。齊愛民、盤佳(2015)認(rèn)為要構(gòu)建數(shù)據(jù)主權(quán)和數(shù)據(jù)權(quán)法律制度[8]。2014年最高人民法院頒布的《關(guān)于審理侵害信息網(wǎng)絡(luò)傳播權(quán)民事糾紛案適用法律若干問題的規(guī)定》(以下簡稱《規(guī)定》)就是此領(lǐng)域的進(jìn)展之一,《規(guī)定》首次明確了個人信息保護(hù)的范圍。

2.會計(jì)制度建設(shè),對數(shù)據(jù)資產(chǎn)予以明確的計(jì)量

隨著數(shù)據(jù)重要性的提升,數(shù)據(jù)列入企業(yè)資產(chǎn)負(fù)債表只是時間問題,數(shù)據(jù)將和土地、勞動力和資本一樣,成為一種生產(chǎn)要素(Viktor Mayer-Schnberger,2013)。越來越多的理論界和實(shí)務(wù)界的研究者都傾向于認(rèn)為數(shù)據(jù)將成為個體的財(cái)產(chǎn)和資產(chǎn)。

2012年達(dá)沃斯世界經(jīng)濟(jì)論壇發(fā)布的《大數(shù)據(jù),大影響》報(bào)告認(rèn)為,數(shù)據(jù)已經(jīng)成為一種新的經(jīng)濟(jì)資產(chǎn)類別。

姜建清在2014達(dá)沃斯世界經(jīng)濟(jì)論壇上發(fā)表觀點(diǎn),其認(rèn)為個體的數(shù)據(jù)其實(shí)就是個體財(cái)產(chǎn)的一部分,沒有經(jīng)過本人同意不應(yīng)該被濫用。

因此,需要建立相應(yīng)的會計(jì)制度對于數(shù)據(jù)價值進(jìn)行科學(xué)有效的評估。有學(xué)者對此進(jìn)行了初步研究。例如,劉玉(2014)從會計(jì)的角度對數(shù)據(jù)的資產(chǎn)可行性進(jìn)行了分析,探討了數(shù)據(jù)資產(chǎn)的計(jì)量方法,研究了大數(shù)據(jù)資產(chǎn)的折舊、披露等問題。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號-6京公網(wǎng)安備 11010502049343號