P2P網(wǎng)絡(luò)貸款是互聯(lián)網(wǎng)發(fā)展的產(chǎn)物,大數(shù)據(jù)則是互聯(lián)網(wǎng)時(shí)代最重要的研究工具之一,起著舉足輕重的作用,成為現(xiàn)階段行業(yè)重點(diǎn)研究的問題。本文從挖掘大數(shù)據(jù)的來源和特征出發(fā),探索其在互聯(lián)網(wǎng)金融領(lǐng)域的應(yīng)用。根據(jù)目前網(wǎng)貸平臺(tái)的情況來研究分析大數(shù)據(jù)在互聯(lián)網(wǎng)金融領(lǐng)域應(yīng)用存在的問題、創(chuàng)新方向以及未來面臨的挑戰(zhàn)。
包括P2P網(wǎng)絡(luò)借貸在內(nèi)的互聯(lián)網(wǎng)金融近年之所以得到快速發(fā)展,部分原因與大數(shù)據(jù)的應(yīng)用密切相關(guān)。換而言之,以大數(shù)據(jù)為基礎(chǔ)、互聯(lián)網(wǎng)為媒介,為金融行業(yè)帶來了顛覆性的變革,促進(jìn)了“普惠金融”時(shí)代的來臨。在去擔(dān)保化熱潮來襲的P2P網(wǎng)貸市場(chǎng),各大平臺(tái)開始重視通過大數(shù)據(jù)建立信用評(píng)估體系,進(jìn)行信息采集、信息分析和信用評(píng)估。但實(shí)踐中,遇到很多問題和挑戰(zhàn)。即便行業(yè)第一家開發(fā)自有征信系統(tǒng)的P2P平臺(tái)拍拍貸,其信息采集渠道和可信度也讓很多人感到質(zhì)疑,其他起步稍晚的平臺(tái)對(duì)于大數(shù)據(jù)更是無從下手。大數(shù)據(jù)的機(jī)遇和挑戰(zhàn)如何把握,是每一家網(wǎng)貸平臺(tái)需要思考的問題。
一、大數(shù)據(jù)的來源
大數(shù)據(jù)分為結(jié)構(gòu)化數(shù)據(jù)與非結(jié)構(gòu)化數(shù)據(jù),其占比分別為15%和85%,它們大量存在于社交網(wǎng)絡(luò)、互聯(lián)網(wǎng)和電子商務(wù)等領(lǐng)域。隨著社交網(wǎng)路日益壯大,大量的用戶內(nèi)容、音頻、文本信息、視頻、圖片等非結(jié)構(gòu)化數(shù)據(jù)不斷地涌現(xiàn)。用戶在線的每一次點(diǎn)擊、每一次評(píng)論都是大數(shù)據(jù)來源的一個(gè)方面。此外,社交軟件的定位服務(wù)和朋友圈業(yè)務(wù)能更快速的搜集用戶的常居地址和生活信息等數(shù)據(jù)。
近年來,量化自我運(yùn)動(dòng)(Quantified Self)成為大數(shù)據(jù)的新來源。通過帶著UP、Nike+或Googleglass來搜集數(shù)據(jù),搜集的數(shù)據(jù)不僅包括生理活動(dòng)數(shù)據(jù),而且包括各種行為數(shù)據(jù)。在全球?qū)ζ鋺?yīng)用最為突出的是印象筆記(Evernote),其用戶數(shù)量已突破1億大關(guān)。其使命是讓每一個(gè)人都能記錄生活中的每一個(gè)時(shí)刻、每一個(gè)靈感、每一次心動(dòng)、每一種經(jīng)歷,隨時(shí)隨地在平臺(tái)上記錄所思所想、所見所得。
云計(jì)算的出現(xiàn)讓大數(shù)據(jù)信息的存儲(chǔ)不再是瓶頸,更多數(shù)據(jù)挖掘項(xiàng)目可以得到更大的施展空間。例如:金融領(lǐng)域的精準(zhǔn)信息服務(wù)的創(chuàng)新就是通過社交網(wǎng)絡(luò)得到的個(gè)人數(shù)據(jù)和需求分析,將合適的金融產(chǎn)品推送給個(gè)人的同時(shí),也將個(gè)人需求精準(zhǔn)的匹配給相應(yīng)的機(jī)構(gòu)。
二、大數(shù)據(jù)的特征
大數(shù)據(jù)的內(nèi)涵包括海量數(shù)據(jù)并對(duì)信息有快速高效處理的能力,具有多樣性和高效性。
(一)多樣性
最初大數(shù)據(jù)的出現(xiàn)是電商為了統(tǒng)計(jì)商品的點(diǎn)擊率、成交率來確定每個(gè)商品的進(jìn)貨比例的。從消費(fèi)者第一次點(diǎn)擊到完成訂單支付,其中間經(jīng)歷了復(fù)雜的點(diǎn)擊、瀏覽、收藏、對(duì)比等過程,在這個(gè)復(fù)雜操作的過程中,大量信息被遺漏,只記錄了銷量信息。伴隨著近幾年移動(dòng)互聯(lián)網(wǎng)和便捷社交軟件的開發(fā)與發(fā)展,大數(shù)據(jù)在悄然生變。社交媒體將人與人的關(guān)系、個(gè)人的心理性格在海量大數(shù)據(jù)的支撐下呈現(xiàn)給了各網(wǎng)貸平臺(tái),只有在多樣化并且復(fù)雜的大數(shù)據(jù)下才能盡量減少結(jié)論的誤差,而在傳統(tǒng)的模式下是根本無法實(shí)現(xiàn)的。
(二)高速性
高速性主要表現(xiàn)為數(shù)據(jù)流和大數(shù)據(jù)的移動(dòng)性?,F(xiàn)實(shí)應(yīng)用中則體現(xiàn)在對(duì)數(shù)據(jù)及時(shí)更新的需求上。隨著移動(dòng)網(wǎng)絡(luò)的發(fā)展,人們對(duì)數(shù)據(jù)的實(shí)時(shí)應(yīng)用需求更加普遍,比如通過手持終端設(shè)備關(guān)注新聞、交通情況、物流進(jìn)度等信息。高速性要求具有時(shí)間敏感性和決策性的分析,要求能在第一時(shí)間抓住重要事件發(fā)生的信息。
三、大數(shù)據(jù)在P2P網(wǎng)貸領(lǐng)域的應(yīng)用
大數(shù)據(jù)在蓬勃發(fā)展的互聯(lián)網(wǎng)金融領(lǐng)域的應(yīng)用非常廣泛,企業(yè)可以通過大數(shù)據(jù)反映的客戶需求提前預(yù)測(cè)企業(yè)的未來及發(fā)展趨勢(shì)、通過統(tǒng)計(jì)點(diǎn)擊率和整理評(píng)論來分析網(wǎng)絡(luò)金融民意、通過對(duì)大數(shù)據(jù)進(jìn)行歸類和分析來進(jìn)行風(fēng)險(xiǎn)控制等。其中最為創(chuàng)新性的應(yīng)用歸征信和產(chǎn)品研發(fā)莫屬。網(wǎng)貸平臺(tái)諸如拍拍貸對(duì)個(gè)人信息搜集整理,結(jié)合個(gè)人的社交信息和網(wǎng)購行為來綜合的對(duì)一個(gè)人的信用進(jìn)行評(píng)估并推算其可能違約的成本。產(chǎn)品研發(fā)是打破了傳統(tǒng)的生產(chǎn)線,逆向的通過確定的需求量來進(jìn)行產(chǎn)品的生產(chǎn),避免了傳統(tǒng)模式下的生產(chǎn)過剩和供不應(yīng)求的現(xiàn)象。
(一)信用征信
運(yùn)用大數(shù)據(jù)進(jìn)行信用征信,主要基于3個(gè)元素展開分析,包括個(gè)體狀況、社交網(wǎng)絡(luò)行為、網(wǎng)絡(luò)購物行為。
1.個(gè)體狀況分析
個(gè)體狀況主要包括個(gè)人基本信息(姓名、身份證號(hào)、住所等)、教育及技能信息(學(xué)歷、資格證書等)、個(gè)人收入及資產(chǎn)信息(工資、房產(chǎn)、汽車等)、個(gè)人工作信息(行業(yè)、單位、職位)、個(gè)人關(guān)系信息(婚姻子女狀況等)。最早對(duì)個(gè)體狀況進(jìn)行分析的平臺(tái)是拍拍貸,2009年公安信息平臺(tái)開放,居民身份證信息開始對(duì)外開放,提高了拍拍貸的個(gè)人信息統(tǒng)計(jì)的準(zhǔn)確度和效率,使拍拍貸的交易規(guī)模得到了迅猛增長。目前網(wǎng)貸平臺(tái)也可以通過教育部主辦的學(xué)信網(wǎng)對(duì)借款人的學(xué)歷進(jìn)行查詢。除了這些公開信息外,平臺(tái)還要求借款人提交收入證明和工作信息,通過社交軟件提取關(guān)系圈信息以確保能準(zhǔn)確的判斷借款人的身份是否真實(shí),是否有基本還款能力等,借助個(gè)人狀況排除P2P網(wǎng)貸平臺(tái)上的大多數(shù)詐騙分子、惡意借款人等,保證網(wǎng)貸平臺(tái)的基本穩(wěn)定與安全。
2.社交網(wǎng)絡(luò)行為分析
社交網(wǎng)絡(luò)行為分析是從高科技的社交軟件如微信、微博、人人網(wǎng)、論壇等網(wǎng)站出發(fā),通過記錄好友數(shù)量、粉絲數(shù)量、發(fā)帖內(nèi)容等因素對(duì)其進(jìn)行信用評(píng)估。其認(rèn)為在社交網(wǎng)絡(luò)越活躍的人,朋友越多的人其違約風(fēng)險(xiǎn)越低。例如微博加V,微信升級(jí)公共賬號(hào)等都是對(duì)大數(shù)據(jù)有效的搜集渠道。而如今人們對(duì)這些網(wǎng)絡(luò)社交軟件的依賴高于電話短信,導(dǎo)致越來越多的社交網(wǎng)絡(luò)信息可以被采集并利用起來對(duì)一個(gè)人的信用進(jìn)行評(píng)估,使P2P信用評(píng)估體系將愈發(fā)完善、準(zhǔn)確,從而帶動(dòng)整個(gè)網(wǎng)貸行業(yè)的發(fā)展。
3.網(wǎng)絡(luò)購物行為分析
網(wǎng)絡(luò)購物行為是征信評(píng)估中唯一一個(gè)把行為與金錢密切相連的重要因素。通過分析個(gè)人購物行為及電子帳戶資金流水來了解一個(gè)人的消費(fèi)能力及資金狀況,并在此基礎(chǔ)上進(jìn)行信用評(píng)估。2014年2月,京東商城推出“京東白條”,在京東商城購物時(shí),消費(fèi)者可申請(qǐng)最高1.5萬元的個(gè)人貸款支付,京東白條類似于虛擬信用卡,不過與銀行發(fā)放信用卡煩瑣的審核程序不同,京東完全根據(jù)用戶以往的購物行為來授予信用額度。目前1000多家網(wǎng)貸平臺(tái)中,積木盒子也著手通過平臺(tái)的個(gè)人消費(fèi)標(biāo)的搜集客戶的網(wǎng)絡(luò)購物行為,在快樂時(shí)代平臺(tái)項(xiàng)目中鏈接其他網(wǎng)商平臺(tái),為客戶提供分期付款的網(wǎng)購服務(wù)??鞓窌r(shí)代總部位于北京,目前已經(jīng)在全國數(shù)百個(gè)城市開展分期購物業(yè)務(wù),也是國內(nèi)首家支持全網(wǎng)商品分期的商家。拍拍貸也以主打網(wǎng)商標(biāo)的和網(wǎng)購標(biāo)的來間接搜集網(wǎng)絡(luò)購物信息,其平臺(tái)上50%左右的借款人為電商用戶,以天貓用戶居多。其它P2P平臺(tái)即使沒有自己的信息搜集渠道,在對(duì)借款人資料進(jìn)行審核時(shí)也要求提供網(wǎng)購憑證或流水單來對(duì)其進(jìn)行評(píng)估。
(二) 產(chǎn)品研發(fā)
在傳統(tǒng)模式下,企業(yè)要開發(fā)新產(chǎn)品、新產(chǎn)業(yè)鏈要進(jìn)行很高成本的市場(chǎng)調(diào)查調(diào)研工作,最終的產(chǎn)品設(shè)計(jì)是由產(chǎn)品部經(jīng)理所決定的,但是再有能力的經(jīng)理也不能確保自己創(chuàng)新的產(chǎn)品完全符合消費(fèi)者的意愿。而在大數(shù)據(jù)時(shí)代,是根據(jù)大數(shù)據(jù)來分析客戶的習(xí)慣和偏好,按照客戶自己的意愿對(duì)產(chǎn)品和服務(wù)進(jìn)行升級(jí)和更新的。使用大數(shù)據(jù)進(jìn)行產(chǎn)品研發(fā)的主要的優(yōu)勢(shì)是產(chǎn)品的創(chuàng)新點(diǎn)是由客戶自己互動(dòng)提供的,按其大眾人群的特點(diǎn)設(shè)計(jì),融洽的將生產(chǎn)方與需求方緊密的聯(lián)系起來。從傳統(tǒng)的生產(chǎn)產(chǎn)品—尋找客戶群變?yōu)榇_定客戶群體—產(chǎn)品生產(chǎn),既節(jié)省了人力、物力、財(cái)力,又效率、便捷的得到了超預(yù)期的結(jié)果。
表1 傳統(tǒng)模式與大數(shù)據(jù)時(shí)代的比較
四、大數(shù)據(jù)應(yīng)用的困境
在大數(shù)據(jù)的推動(dòng)下,網(wǎng)貸平臺(tái)起飛式迅速增長,為個(gè)人和小微企業(yè)的貸款提供了渠道,很大程度的擴(kuò)寬了金融行業(yè)的服務(wù)范圍。但由于大數(shù)據(jù)應(yīng)用在P2P行業(yè)存在的問題,未能準(zhǔn)確的對(duì)違約概率進(jìn)行評(píng)估,出現(xiàn)多家平臺(tái)跑路事件。因此,P2P行業(yè)應(yīng)用大數(shù)據(jù)效率低的原因成為了行業(yè)關(guān)注的焦點(diǎn)。
(一) 網(wǎng)絡(luò)信息很難還原現(xiàn)實(shí)中的信息
目前大數(shù)據(jù)的來源主要依賴于互聯(lián)網(wǎng),而人們?cè)诰W(wǎng)絡(luò)中的表現(xiàn)并不能完全反映其真實(shí)的一面。在互聯(lián)網(wǎng)上人性是被放大的,現(xiàn)實(shí)生活中不敢說的話,不敢抱怨的事情,在互聯(lián)網(wǎng)上卻敢說,導(dǎo)致現(xiàn)實(shí)中內(nèi)向的人在互聯(lián)網(wǎng)上卻給人展現(xiàn)了外向的一面。例如有些人不善與人接觸,卻將自己做的美食展現(xiàn)在了微博上,導(dǎo)致吃貨們頻頻關(guān)注,從而使得粉絲暴增。因此通過網(wǎng)絡(luò),并不能確切的說明此人的有多廣泛的社交圈子。也就是說互聯(lián)網(wǎng)的數(shù)據(jù)很難還原用戶現(xiàn)實(shí)中的信息。
(二) 金融信用與社會(huì)信用的相關(guān)性不確定
在我國現(xiàn)階段的互聯(lián)網(wǎng)發(fā)展中,并沒有對(duì)金融信用與社會(huì)信用的相關(guān)性進(jìn)行細(xì)致的研究。個(gè)人信用體現(xiàn)是多方面的,其包括朋友信用、愛情信用、事業(yè)信用、其他社會(huì)信用和金融信用等等。而每個(gè)方面不一定與金融信用緊密相關(guān)。一個(gè)人有很好的朋友信用,但不代表其在金融方面的信用就很好,也就是說不能單憑日常生活的信用來給個(gè)人的違約風(fēng)險(xiǎn)進(jìn)行定位。
(三) 缺失“閉環(huán)的交易數(shù)據(jù)”
目前在國內(nèi)的金融行業(yè),成功運(yùn)用大數(shù)據(jù)做風(fēng)控只有阿里小貸等有限幾家,主要是通過賣家累計(jì)的海量的交易信息及資金流水,在幾秒內(nèi)完成對(duì)商家的授信。如今在P2P網(wǎng)貸行業(yè),一些平臺(tái)都以用大數(shù)據(jù)來做風(fēng)控審核這樣虛無縹緲的定義來吸引投資者,但其模式為應(yīng)收賬款質(zhì)押融資或貨物抵押融資,并未真正的應(yīng)用了大數(shù)據(jù)。因?yàn)橐蕾嚧髷?shù)據(jù)風(fēng)控主要靠及時(shí)更新的數(shù)據(jù)和對(duì)客戶的約束力來實(shí)現(xiàn)其有效性。這兩個(gè)因素也被稱為閉環(huán)數(shù)據(jù),目前國內(nèi)的P2P平臺(tái)缺乏閉環(huán)的交易數(shù)據(jù),對(duì)借款人的約束力也不強(qiáng)硬,所以使其風(fēng)控很難有效的和大數(shù)據(jù)結(jié)合起來,很難單憑大數(shù)據(jù)來對(duì)借款人的違約風(fēng)險(xiǎn)進(jìn)行評(píng)估。
五、大數(shù)據(jù)創(chuàng)新——私人訂制
在互聯(lián)網(wǎng)迅速崛起的現(xiàn)代社會(huì),P2P依靠大數(shù)據(jù)做風(fēng)控弊端涌現(xiàn),但不代表大數(shù)據(jù)在此行業(yè)失效,而是可以對(duì)大數(shù)據(jù)的應(yīng)用進(jìn)行創(chuàng)新,例如用大數(shù)據(jù)來改變平臺(tái)的營銷手段,對(duì)客戶實(shí)行私人定制。私人定制是指通過個(gè)人在平臺(tái)兩次及以上的貸款記錄和良好的還款記錄的數(shù)據(jù)進(jìn)行分析,用系統(tǒng)的方式為其量身制定貸款方案、利率、手續(xù)費(fèi)、還款方式等相匹配的產(chǎn)品。首先通過歷史借貸記錄推算出客戶在什么時(shí)間需要資金周轉(zhuǎn),并根據(jù)其從事行業(yè)分析其資金的用途和預(yù)計(jì)還款時(shí)間,提前推送定制的服務(wù)方案,準(zhǔn)確的滿足貸款人心里需求,避免客戶被動(dòng)接受他不一定適合的信貸產(chǎn)品。然而大數(shù)據(jù)的及時(shí)更新,能夠更效率的通過更新的數(shù)據(jù)對(duì)資金需求者的額度、利率、還款方式進(jìn)行調(diào)整。
六、大數(shù)據(jù)金融的兩大挑戰(zhàn)
(一)金融數(shù)據(jù)開放挑戰(zhàn)
美國征信系統(tǒng)的完善是因?yàn)槠湔畬?duì)其擁有的大數(shù)據(jù)資源的開放程度日益透明化。而我國現(xiàn)階段一些權(quán)威的政府?dāng)?shù)據(jù)能否向民間開放,比如中國人民銀行的政信系統(tǒng),是大數(shù)據(jù)時(shí)代互聯(lián)網(wǎng)金融發(fā)展面臨的首要挑戰(zhàn)。只有建立一個(gè)開放的數(shù)據(jù)規(guī)則,才能有利于未來大數(shù)據(jù)產(chǎn)業(yè)生態(tài)的建設(shè)。而不是各個(gè)平臺(tái)通過自己的渠道,記錄不同客戶集體、不同維度、不同時(shí)間序列的數(shù)據(jù)混合起來應(yīng)用,大部分的數(shù)據(jù)因?yàn)闆]有特定的規(guī)則而產(chǎn)生了“噪音”效果,使征信模型失效。目前,我國出現(xiàn)150家左右平臺(tái)跑路現(xiàn)象,其原因之一也與大數(shù)據(jù)信息的不透明緊密相關(guān),數(shù)據(jù)的封閉使平臺(tái)捕捉的項(xiàng)目公司信息偏離了大數(shù)據(jù)的特性,不能及時(shí)的預(yù)測(cè)風(fēng)險(xiǎn)的來臨,連帶的導(dǎo)致投資者對(duì)網(wǎng)絡(luò)借貸乃至互聯(lián)網(wǎng)金融的創(chuàng)新失去信心,形成行業(yè)發(fā)展的瓶頸。
(二)大數(shù)據(jù)人才短缺
麥肯錫公司的《大數(shù)據(jù):下一個(gè)創(chuàng)新、競爭和生產(chǎn)力的前沿》指出,具備大數(shù)據(jù)高級(jí)分析技能的人才供應(yīng)量,2008年為15萬人,預(yù)計(jì)2018年將翻倍增長,達(dá)到30萬人。而現(xiàn)階段對(duì)這類人才的需求高達(dá)50萬左右,這意味著將產(chǎn)生20萬左右的人才缺口。目前平臺(tái)大量吸收有相關(guān)專業(yè)知識(shí)和技能豐富的人才,對(duì)其進(jìn)行大數(shù)據(jù)的思維和分析思路的培養(yǎng)。例如:今年4月,拍拍貸完成了數(shù)千萬的B輪融資,這輪融資主要是用于加強(qiáng)網(wǎng)絡(luò)征信系統(tǒng)建設(shè)、IT技術(shù)水平提升和高級(jí)人才招聘。為了滿足各大行業(yè)對(duì)大數(shù)據(jù)人才的需求,中國科學(xué)院大學(xué)開設(shè)首個(gè)“大數(shù)據(jù)技術(shù)與應(yīng)用”專業(yè)方向,該專業(yè)將面向于科研發(fā)展及產(chǎn)業(yè)實(shí)踐,培養(yǎng)信息技術(shù)與行業(yè)需求結(jié)合的復(fù)合型的大數(shù)據(jù)人才,并得到了IBM、微軟、騰訊、阿里巴巴、NEC、58同城等在大數(shù)據(jù)分析及應(yīng)用領(lǐng)域具有前瞻性的企業(yè)專家的大力支持。