導(dǎo)讀
互聯(lián)網(wǎng)征信業(yè)務(wù)有很多雷區(qū),比如不能采集敏感的個人信息,數(shù)據(jù)的安全與透明度,不同機構(gòu)間數(shù)據(jù)的交換難題等。此外,騰訊征信、芝麻信用等公司雖具備大量的用戶行為數(shù)據(jù),但這些數(shù)據(jù)與個人的借貸行為關(guān)系并不大,因而其建立的模型不一定準確,很難被主流的金融機構(gòu)引用。
千呼萬喚之后,個人征信業(yè)務(wù)市場終于放開。1月5日,央行發(fā)布了《關(guān)于做好個人征信業(yè)務(wù)準備工作的通知》,要求八家機構(gòu)做好個人征信業(yè)務(wù)的準備工作,準備時間為六個月。
這八家機構(gòu)中,最受關(guān)注的入局者是螞蟻金服旗下的“芝麻信用”,以及騰訊旗下的“騰訊征信”。 螞蟻金服和騰訊也表示,將通過海量的在線數(shù)據(jù)分析,建立模型來判斷用戶的信用程度。
事實上,隨著互聯(lián)網(wǎng)金融業(yè)務(wù)的高速發(fā)展,個人征信體系的建設(shè)顯得極為迫切。但需要指出的是,盡管互聯(lián)網(wǎng)征信將極大地豐富傳統(tǒng)征信數(shù)據(jù),又具有實時性,但該系統(tǒng)的建立仍面臨諸多困境。
有業(yè)內(nèi)人士稱,互聯(lián)網(wǎng)征信業(yè)務(wù)有很多雷區(qū),比如不能采集敏感的個人信息,數(shù)據(jù)的安全與透明度,不同機構(gòu)間數(shù)據(jù)的交換難題等。此外,騰訊征信、芝麻信用等公司雖具備大量的用戶行為數(shù)據(jù),但這些數(shù)據(jù)與個人的借貸行為關(guān)系并不大,因而其建立的模型不一定準確,很難被主流的金融機構(gòu)引用。
眼下,這些征信機構(gòu)尚沒有完整的產(chǎn)品推出,而6個月的準備時間也難有實質(zhì)性操作。“沒有三五年的數(shù)據(jù)積累和產(chǎn)品開發(fā),互聯(lián)網(wǎng)征信很難有成熟的產(chǎn)品推出。”一位互聯(lián)網(wǎng)金融人士告訴21世紀經(jīng)濟報道記者。
海量數(shù)據(jù)的煩惱
螞蟻金服方面稱,芝麻信用有著非常廣泛的信用數(shù)據(jù)來源,日數(shù)據(jù)處理量在30PB以上,相當(dāng)于5000個國家圖書館的數(shù)據(jù)總量,其中包含了用戶網(wǎng)購、還款、轉(zhuǎn)賬以及個人信息等方方面面的數(shù)據(jù)。通過分析大量的電商交易及行為數(shù)據(jù),芝麻信用可以對用戶進行信用評估,判斷用戶的還款意愿及還款能力,繼而為用戶提供快速授信及現(xiàn)金分期服務(wù)。
作為螞蟻金服的子品牌,芝麻信用體系將包括芝麻分、芝麻認證、風(fēng)險名單庫、芝麻信用報告、芝麻評級等一系列信用產(chǎn)品。
而騰訊的財付通團隊早在2年前就開始推進征信業(yè)務(wù)的探索,幫助用戶建立個人信用。據(jù)悉,騰訊征信將基于騰訊現(xiàn)有的QQ、微信活躍用戶,以及在SNS、門戶、娛樂等眾多領(lǐng)域的群眾基礎(chǔ),通過海量數(shù)據(jù)挖掘和分析技術(shù)來預(yù)測其風(fēng)險表現(xiàn)和信用價值。
但是,數(shù)據(jù)量大并不一定是一件好事,因為數(shù)據(jù)的篩選和清洗是一個非常枯燥復(fù)雜的過程。況且,數(shù)據(jù)量越大,審核維度越多,由此帶來的“數(shù)據(jù)噪音”也越多,模型越失真。
在P2P平臺“點融網(wǎng)”共同創(chuàng)始人、聯(lián)合CEO郭宇航看來,海量的網(wǎng)絡(luò)數(shù)據(jù)意味著互聯(lián)網(wǎng)征信機構(gòu)一是得找到技術(shù)非常強的牛人,二是要不斷地試錯。
“美國征信公司FICO針對個人采集了100多個數(shù)據(jù)維度,但真正納入征信模型的只有十幾個維度。這其中也是經(jīng)歷了大量的分析運算。”郭宇航稱。
此外,在信息采集的過程中,這些民間征信機構(gòu)又會面臨諸多限制。
出于對信息安全的保護,2013年1月出臺的《征信管理條例》,對個人信息的采集做了明確的限制:比如禁止征信機構(gòu)采集個人的宗教信仰、基因、指紋、血型、疾病和病史信息以及法律、行政法規(guī)規(guī)定禁止采集的其他個人信息。那么,如何在法律許可的范圍內(nèi),盡量掌握每個用戶完善、豐富的數(shù)據(jù)信息,又不侵犯用戶隱私,就變得非常重要。
在郭宇航眼里,法律禁止采集的數(shù)據(jù)恰恰是能反映個人信用的比較關(guān)鍵的數(shù)據(jù),這意味著,騰訊征信、芝麻信用等公司必須在大量的“邊緣化”數(shù)據(jù)的基礎(chǔ)上,通過反復(fù)比對和計算,找出一定的規(guī)律。
而在隱私保護層面,螞蟻金服相關(guān)人士向記者稱,公司在處理用戶數(shù)據(jù)時會先進行“脫敏”處理,即將數(shù)據(jù)清洗、加工后再使用。“我們在搜集用戶數(shù)據(jù)前會先得到用戶的授權(quán),并且對于那些電話、地址等敏感信息,也絕對不會透露出去。”此外,在數(shù)據(jù)存儲中,螞蟻金服也會對數(shù)據(jù)進行加密處理,并根據(jù)數(shù)據(jù)的重要程度采取不同的存儲方式。
實際上,民營征信機構(gòu)眼下在用戶隱私問題上,面臨的壓力還不大。郭宇航坦言,在中國,針對隱私的保護很弱,在互聯(lián)網(wǎng)金融領(lǐng)域更是對隱私缺乏實質(zhì)性的管理。另一廂,一些90后的年輕人本身對隱私的泄露也不是很在意,一些年輕人為了一些優(yōu)惠券,就能輕易地把自己的手機號、身份證號泄露出去。郭宇航甚至聽說有的用戶會將信用卡號和密碼提供給一個小型APP,只是為了讓這個軟件為其做賬單的整合。
“當(dāng)用戶自己都不介意隱私的時候,又談何隱私保護呢?”他反問道。
數(shù)據(jù)的短板
值得一提的是,民營企業(yè)開展的個人征信業(yè)務(wù)能否順利對接央行信用報告的核心數(shù)據(jù)(如工資收入、社保記錄、信用卡記錄、貸款記錄等),還存在很多不確定性。此前,許多P2P平臺就是由于無法對接央行信用數(shù)據(jù),而不得不親力親為地做征信。眼下,騰訊等企業(yè)在一定程度上與銀行有競爭關(guān)系,要將核心數(shù)據(jù)共享給競爭對手,對銀行來說并不容易。
假使騰訊征信、芝麻信用等企業(yè)拿不到央行的核心數(shù)據(jù),那么其信用報告便不太可能被主流的金融機構(gòu)所引用。由于缺乏金融數(shù)據(jù),騰訊等民營機構(gòu)必須不斷地試錯,再用自己體系內(nèi)的數(shù)據(jù)慢慢替代傳統(tǒng)的金融數(shù)據(jù)。而這一過程,通常需要三五年之久。
以P2P為例,一個信貸周期通常需要1.5-3年,換言之,要摸清用戶的還款情況,民營征信機構(gòu)必須等上一年半以上。這一結(jié)果還需要反復(fù)驗證。
況且,央行本身的數(shù)據(jù)也不完整。目前,我國提供個人征信服務(wù)的“正規(guī)軍”只有央行征信中心及其下屬的上海資信公司。截至2014年10月底,征信系統(tǒng)收錄1963萬戶企業(yè)及其他組織和8.5億自然人信用信息。值得一提的是,有征信記錄的個人大多是與銀行有業(yè)務(wù)往來的優(yōu)質(zhì)客戶,而騰訊等公司的用戶中,有相當(dāng)多是在央行征信范圍之外的,即“草根”用戶。換言之,央行的征信系統(tǒng)也無法覆蓋主流用戶之外的個人的信用情況,騰訊等公司仍需要親自摸索。
郭宇航指出,騰訊掌握的用戶信息,在網(wǎng)絡(luò)營銷推廣方面會比較有效,但這些數(shù)據(jù)對金融信用的驗證則不那么有用。事實上,利用社交數(shù)據(jù)來驗證金融信用,在美國也只是剛剛起步。郭宇航在與一些美國同行交流的時候,對方稱社交數(shù)據(jù)對于驗證欺詐有一定的作用,但在信用評級方面的作用還十分有限。
一個明顯例子是,美國最大的P2P平臺Lending club,曾嘗試通過用戶在Facebook上的表現(xiàn)來確定其信用度,結(jié)果遭遇慘痛的滑鐵盧。之后,Lending club轉(zhuǎn)而向美國征信局這一傳統(tǒng)機構(gòu)獲得數(shù)據(jù),平臺上的壞賬率隨之下降了許多。
“阿里掌握大量的交易信息,對個人信用還有一定價值。而那些瀏覽行為、在線時長、活躍度等,一定是非主流的數(shù)據(jù)。”郭宇航稱。正因為此,點融網(wǎng)目前的風(fēng)控人員大多是傳統(tǒng)銀行業(yè)出身,用的也是傳統(tǒng)的風(fēng)險檢驗標準。
這種情況下,互聯(lián)網(wǎng)企業(yè)出具的信用報告,很多時候?qū)ι虡I(yè)機構(gòu)只能起到較小的輔助作用。拍拍貸CEO張俊此前向記者稱,芝麻信用曾來洽談?wù)餍欧矫娴暮献魇乱?,但拍拍貸在驗證芝麻信用的模型后,發(fā)現(xiàn)其準確度并不高。
張俊解釋說,數(shù)據(jù)里缺乏用戶的違約數(shù)據(jù),即沒有用戶真實的貸款記錄,因此其模型的精準度大約只有拍拍貸的70%左右。在拍拍貸的風(fēng)控模型里,用戶的社交數(shù)據(jù)大約只占8%到9%的權(quán)重,消費數(shù)據(jù)的權(quán)重也不到10%。相比之下,用戶的還款記錄、還款行為占到50%到60%的權(quán)重。
抵押類P2P企業(yè)速貸邦總經(jīng)理萬劍鈞告訴記者,作為信用報告的需求方,他最看重的信息是用戶之前在民間借貸行為中的不良率和違約率。這一信息是央行征信報告中所不具備的。
“對我們來說,互聯(lián)網(wǎng)企業(yè)出具的征信報告可以作為傳統(tǒng)征信報告的一種補充,提供過去涉及不到的信息。”萬劍鈞稱,“但互聯(lián)網(wǎng)征信報告必須有自己獨特的競爭力,有實打?qū)嵉脑u估,而不是去粉飾一些內(nèi)容。”
他指出,像螞蟻金服試運行的消費信貸產(chǎn)品“花唄”,以及“京東白條”等產(chǎn)品可以捕捉到一些用戶的違約情況,但前期用戶不足,運行時間也較短。一段時間后,它們或許能提供有價值的個人信用信息。相比之下,那些和社交、娛樂相關(guān)的數(shù)據(jù)與金融就不大相關(guān)。“我以后會試著用一下互聯(lián)網(wǎng)公司出具的報告,再決定是全用,還是部分用,還是增加哪部分數(shù)據(jù)的比重。”萬劍鈞表示。
合作的困境
除了缺乏金融數(shù)據(jù)外,純線上采集數(shù)據(jù)同樣有著無法回避的劣勢。試想一下,如果沒有實地探訪,沒有線下的審核機制把關(guān),單憑身份證和第三方機構(gòu)出具的報告,哪個銀行或金融機構(gòu)敢放幾百上千萬的貸款呢?
眾所周知,2014年初,阿里和騰訊都曾計劃與中信銀行合作發(fā)行網(wǎng)絡(luò)信用卡,但之后被央行叫停。其中,支付寶計劃的授信額度是200起步,沒有上限;而騰訊打算推出的“微信信用卡”,額度分為三個檔次:50元、200元和1000-5000元。
不難發(fā)現(xiàn),網(wǎng)絡(luò)信用卡的信用額度非常低,原因之一,就是機構(gòu)無法在授信前對用戶的風(fēng)險系數(shù)進行詳細、完整、全面的追蹤和評估。換言之,僅僅擁有網(wǎng)上數(shù)據(jù)遠遠不夠。
對此,螞蟻金服相關(guān)負責(zé)人告訴記者,芝麻信用可以與外部機構(gòu)合作,獲取線下數(shù)據(jù),或由用戶主動提供線下數(shù)據(jù),以此豐富數(shù)據(jù)的種類。
在此基礎(chǔ)上,芝麻信用的數(shù)據(jù)偏交易,而騰訊的數(shù)據(jù)偏社交,其他的6家機構(gòu)也各有特點。而要讓不同企業(yè)之間互相合作,打通數(shù)據(jù),似乎又很難做到。
“事實上,美國的三大征信機構(gòu)都是獨立的第三方機構(gòu),且互相之間有合作。但在中國,數(shù)據(jù)的共享和交換并不現(xiàn)實。”郭宇航指出,“這是因為,考慮到騰訊和阿里的背景,你很難把它們的征信機構(gòu)當(dāng)做一個獨立的公允的平臺。”
進一步說,騰訊和阿里“什么都做”,在征信之外有其龐大的主體業(yè)務(wù)。一旦其他的業(yè)務(wù)與征信業(yè)務(wù)產(chǎn)生沖突,外部合作就變得十分艱難。舉例來說,新浪微博雖已式微,但仍擁有大量的用戶行為數(shù)據(jù)。然而,考慮到阿里第二大股東的身份,新浪微博或許很難和其他征信機構(gòu)合作。
另一種情況是,假使芝麻信用和騰訊征信與外部的商業(yè)機構(gòu)合作,但外部商業(yè)機構(gòu)與阿里、騰訊旗下的其他業(yè)務(wù)正好是競爭對手的關(guān)系,那么阿里、騰訊又如何平衡好內(nèi)部的關(guān)系呢?外部第三方機構(gòu),又如何愿意將核心數(shù)據(jù)提供給芝麻信用與騰訊征信呢?
而阿里和騰訊本身,對另一方出具的數(shù)據(jù)報告也可能難以認可。此前,淘寶屏蔽了微信鏈接,微信又屏蔽了快的紅包,之后新浪微博又禁推微信公眾號。如此簡單粗暴的競爭,不斷地上演著。盡管各家企業(yè)都高呼“平臺性思維”,但可以預(yù)見的是,未來在互聯(lián)網(wǎng)征信領(lǐng)域的商戰(zhàn)又會再次上演。
而騰訊征信、芝麻信用出具的征信報告,短期內(nèi)也很難在更多外部的應(yīng)用場景中占到主流地位,往往只能在騰訊、阿里各自的體系內(nèi)發(fā)揮效應(yīng)。