伴隨著阿里集團在美國上市,互聯(lián)網(wǎng)金融的大戲進入高潮,大數(shù)據(jù)、云計算以及互聯(lián)網(wǎng)金融等幾年前對公眾還很陌生的技術術語,迅速成為社會熱點。這些底層技術以移動互聯(lián)的用戶體驗呈現(xiàn)出來,不僅通過互聯(lián)網(wǎng)產(chǎn)品改變了人們的衣食住行,更通過互聯(lián)網(wǎng)金融產(chǎn)品開始沖擊"智力博弈巔峰"的金融業(yè)。
不管你恐懼還是欣喜,大數(shù)據(jù)金融時代已經(jīng)來臨。
如何理解由技術創(chuàng)新逐漸引領的金融創(chuàng)新?何謂大數(shù)據(jù)金融?我們選取三個最有代表性的例子來解答。
何謂大數(shù)據(jù)?大數(shù)據(jù)沒有嚴格定義,顧名思義就是"很多數(shù)據(jù)"??梢詮娜齻€層面來解析這個特別的稱謂--
從生產(chǎn)來看,不需要特別的采集過程,因為監(jiān)管要求、業(yè)務邏輯或者技術便利,具有"自生產(chǎn)"特征,比如搜索數(shù)據(jù)、交易數(shù)據(jù)等;從存儲來看,相對于傳統(tǒng)數(shù)據(jù)庫的數(shù)據(jù)規(guī)模,量變引起質(zhì)變,需要新的數(shù)據(jù)庫技術來支持存儲和訪問;從使用來看,分析方法從基于概率論的抽樣理論過渡到人工智能、統(tǒng)計學習等講求高維、高效率分析技術。
從行業(yè)細分角度,大數(shù)據(jù)金融業(yè)主要有大數(shù)據(jù)銀行金融和大數(shù)據(jù)證券金融,分別和銀行業(yè)務、證券業(yè)務相關。當然,保險業(yè)天然就和大數(shù)據(jù)相關。
信用卡自動授信是典型的大數(shù)據(jù)銀行金融。從銀行角度是否應該對申請者授信、發(fā)授多少信用額度,是個重要問題。傳統(tǒng)方式是人工審核申請資料,然后根據(jù)大致的檔位發(fā)放額度或拒絕申請。但是當銀行積累了足夠多的用卡客戶數(shù)據(jù),可以把是否違約,違約概率,有效使用額度等指標作為被評價對象,然后調(diào)用與此相關的各種客戶信息建立統(tǒng)計模型,自動計算授信結(jié)果。
機器人投資是大數(shù)據(jù)證券金融的代表形式,股票價格波動受各種因素影響,傳統(tǒng)的投資方式一般人工收集信息,手動交易。機器人投資可以建立多因素模型,自動選擇股票或?qū)ふ医灰讜r機,在適當?shù)娘L控模型下建立機器人投資云交易模式。
再如,連接銀行和證券的大數(shù)據(jù)不良資產(chǎn)評估。2005年,某國有不良資產(chǎn)管理公司開始嘗試在海量數(shù)據(jù)基礎上進行不良資產(chǎn)評估。原本銀行信貸資產(chǎn)的評估都是基于會計模型,但是不良資產(chǎn)基本沒有會計特征,很難用傳統(tǒng)方法評估。因此,收集已處置資產(chǎn)和待處置資產(chǎn)樣本進行對比,建立數(shù)據(jù)挖掘模型,可以方便評估待處置資產(chǎn)的價格。
了解了大數(shù)據(jù)和大數(shù)據(jù)金融的幾個應用實例,我們總結(jié)一下何謂大數(shù)據(jù)金融。
金融業(yè)積累的大數(shù)據(jù)就是金融大數(shù)據(jù),根據(jù)銀行金融和證券金融本身的不同,這些數(shù)據(jù)也分成銀行金融大數(shù)據(jù)和證券金融大數(shù)據(jù)。積累數(shù)據(jù)過程中,產(chǎn)生了數(shù)據(jù)采集、存儲、使用的相關工作和企業(yè),這樣就完成了金融大數(shù)據(jù)的產(chǎn)業(yè)鏈,但總體依然是信息技術產(chǎn)業(yè)鏈。
隨著信息技術全面發(fā)展,金融大數(shù)據(jù)產(chǎn)業(yè)具備提供信息技術服務之外的金融服務能力時,就產(chǎn)生了大數(shù)據(jù)金融。大數(shù)據(jù)金融是脫穎于金融大數(shù)據(jù)的新服務,是技術服務催生出來的金融服務。
出走的“阿里系”
聶歐宋怡青張曙霞
阿里巴巴在美國紐交所上市次日,清華五道口金融學院的一場EMBA課后,蔣韜被講臺下各路大佬包圍,要求私聊。
復旦大學計算機碩士畢業(yè)后,蔣韜從IBM到了美國硅谷,2009年加入阿里,從事反欺詐和風控領域研究,位至安全部技術總監(jiān)。2013年創(chuàng)業(yè),成立"同盾科技",同年獲得IDG和華創(chuàng)資本的1000萬元投資。
除他之外,從阿里出走的還有一批人。
創(chuàng)業(yè)最初,蔣韜一個人拉客戶、談投資、建團隊,但不久就有原同事加入進來。眼下,核心團隊匯集了阿里安全部、美國PayPal公司的一批反欺詐科學家和技術高管,專注于賬號、交易、支付和網(wǎng)絡信用等領域的一系列反欺詐技術開發(fā)。
"創(chuàng)業(yè)圈里有騰訊系、百度系、華為系、IBM系、復星系等,我們是阿里系。"
蔣韜團隊目前所做的,是接入銀行、保險公司、第三方支付和P2P等機構(gòu)的大數(shù)據(jù)庫,以數(shù)學建模來抓取行為、用戶習慣等信息,"抓壞人"。
在全球規(guī)模龐大的信息泄露關聯(lián)產(chǎn)業(yè),一批黑客長期從事截獲并販賣大眾信息的工作,而接貨者則通過計算機自動比對,將買來的賬號密碼等信息在各大金融機構(gòu)網(wǎng)站、電商網(wǎng)站進行"撞庫",成功率通??梢赃_到5%?10%,成功"撞庫"的信息將高價賣出,以便下個團隊用以挪走消費者資金、非法支付和欺詐勒索,等等。
按照銀監(jiān)會一位人士的說法,金融機構(gòu)自身安全措施并不完善,技術不斷升級但總趕不上黑色產(chǎn)業(yè)的蓬勃生長,加之互聯(lián)網(wǎng)金融中的P2P、直銷銀行、NFC支付、在線保險、比特幣等新業(yè)態(tài)如雨后春筍般涌現(xiàn),金融系統(tǒng)的反欺詐手段亟待升級。
蔣韜的公司很快就獲得國內(nèi)部分有反欺詐市場需求的金融機構(gòu)的重視,商業(yè)銀行中也有不少于10家開始試用并購買其產(chǎn)品。而他,也開始在各種場合一遍遍"掃盲"。
"但是,別以為沒有競爭。"蔣韜說。公司產(chǎn)品瞄準了商業(yè)銀行的信用卡、貸款、理財、P2P、電子銀行和對私業(yè)務等領域,這些"肥肉"早有人垂涎三尺。
蔣韜眼下最大的心病是人才。公司的現(xiàn)有團隊人數(shù)明年需要翻番,"推薦人才吧,好的都要"。只是這個"好",恐怕得兼具金融、數(shù)學、IT、統(tǒng)計等多專業(yè)背景。
人才缺乏是行業(yè)共同的難題。在杭州,阿里高薪招人的條件家喻戶曉,非名校應屆生的工程師崗位,底薪已經(jīng)加至每月9000?12000元。
蔣韜說,人力成本被炒得很高,公司現(xiàn)有100人的團隊,每月要付出200多萬元運營成本。但是在長三角地區(qū),阿里系的創(chuàng)業(yè)者仍舊如雨后春筍。有人統(tǒng)計,阿里系已然占據(jù)長三角創(chuàng)業(yè)圈1/3的規(guī)模。
而阿里最讓人難以捉摸的,是其在技術上不畏分享的態(tài)度,以無償?shù)募夹g開源社區(qū)供創(chuàng)業(yè)者免費使用。蔣韜的公司就大部分搭建于阿里開源出來的技術框架,并由此得以在巨人的肩膀上成長。
至于由此而生的大數(shù)據(jù)金融生態(tài)系統(tǒng),也很可能成為未來影響中國發(fā)展的力量中,最風生水起的那一支。
大數(shù)據(jù)監(jiān)管的混業(yè)挑戰(zhàn)
文/《財經(jīng)國家周刊》記者宋怡青聶歐實習生張曙霞
在大數(shù)據(jù)金融時代,"大數(shù)據(jù)監(jiān)管"模式也將應運而生,即圍繞數(shù)據(jù)的生成、傳輸和使用等環(huán)節(jié),采取實時、互動方式,實現(xiàn)對金融市場的監(jiān)管。
《財經(jīng)國家周刊》記者在調(diào)研中發(fā)現(xiàn),無論是頂層設計,還是"一行三會"的實際監(jiān)管工作,"大數(shù)據(jù)監(jiān)管"都已經(jīng)在籌備和應用中。一位不愿具名的專家說,各部委動起來,更多是意識到大數(shù)據(jù)能夠為己所用,但相互間仍處于割裂狀態(tài)。
"一行三會"動起來
"征信系統(tǒng)為金融機構(gòu)提供了一個共享借款人信用記錄的平臺。"央行征信中心副主任王曉蕾對《財經(jīng)國家周刊》記者說。
根據(jù)央行提供的數(shù)據(jù)顯示,截至2014年8月底,企業(yè)征信系統(tǒng)累計收錄企業(yè)和其他組織信息1951萬戶,個人征信系統(tǒng)累計收錄自然人數(shù)8.5億,其中,收錄有信貸記錄的自然人約3.4億,中國已建成世界上最大的個人征信數(shù)據(jù)庫。
近幾年新金融業(yè)態(tài),譬如小貸公司、融資性擔保公司的發(fā)展都對央行征信系統(tǒng)提出新要求。這些新業(yè)態(tài)的數(shù)據(jù)是否納入征信系統(tǒng)也一直為各界所討論。
"從法律層面沒有任何障礙。"王曉蕾表示,《征信業(yè)管理條例》第二十九條規(guī)定,從事信貸業(yè)務的機構(gòu)應當按照規(guī)定向金融信用信息基礎數(shù)據(jù)庫提供信貸信息。
《財經(jīng)國家周刊》記者了解到,由央行征信中心控股的上海資信有限公司,已經(jīng)發(fā)起設立了網(wǎng)絡金融征信系統(tǒng),開始收集P2P借貸機構(gòu)上報的信息。
大數(shù)據(jù)給監(jiān)管機構(gòu)帶來的壓力日增。"銀監(jiān)會既要管好每家銀行,又要關注整個銀行體系,還要參與宏觀調(diào)控,這就可想而知所需要的數(shù)據(jù)統(tǒng)計量了。"銀監(jiān)會統(tǒng)計部副主任苗雨峰在接受《財經(jīng)國家周刊》記者采訪時表示。
證監(jiān)會則充分利用了大數(shù)據(jù)這一神器,如稽查"老鼠倉"。證監(jiān)會一位司局級官員對《財經(jīng)國家周刊》記者透露,"捕鼠"的線索就是來自交易所日常監(jiān)控下的大數(shù)據(jù)。他透露,每天下午4點鐘,監(jiān)管部門就能拿到全國基金公司報送的交易和凈值數(shù)據(jù),"基金獲益率是否異常,通過大數(shù)據(jù)檢測一眼就能看出。"
2014年,中國保險信息技術管理有限責任公司成立,負責統(tǒng)一建設、運營和管理保險信息共享平臺,主要通過信息技術手段,采集保險經(jīng)營管理數(shù)據(jù),建立標準化、系統(tǒng)性的數(shù)據(jù)體系。
協(xié)調(diào)不易
《財經(jīng)國家周刊》獲悉,一個關于中國金融業(yè)的大數(shù)據(jù)庫早在2012年就已醞釀,目前正加緊推進。
9月24日,"一行三會"主管統(tǒng)計或調(diào)統(tǒng)的負責人齊聚央行,關于中國金融綜合統(tǒng)計平臺建設的討論會正在召開,央行副行長潘功勝參加。
會議討論籌建中國規(guī)模最大、涵蓋最廣的金融信息數(shù)據(jù)庫。它將在集合"一行三會"現(xiàn)有數(shù)據(jù),涵蓋銀行、證券、保險、基金等金融行業(yè),甚至將銀行業(yè)表外業(yè)務數(shù)據(jù)進行統(tǒng)一的基礎上,建立起中國金融業(yè)信息統(tǒng)計平臺。
"金融業(yè)綜合信息統(tǒng)計是決策層特別提出的,從2012年就開始醞釀。"央行一位司局級領導接受《財經(jīng)國家周刊》記者采訪時表示,之所以建立金融業(yè)綜合信息統(tǒng)計平臺,主要出于兩點:一是中國金融數(shù)據(jù)歷來以銀行業(yè)為主,當下混業(yè)趨勢日漸明顯,如何建立全維度、全覆蓋的大數(shù)據(jù)系統(tǒng),是"一行三會"的共同難題;另一方面,互聯(lián)網(wǎng)金融等新興業(yè)態(tài)層出不窮,對監(jiān)管統(tǒng)計工作提出重大挑戰(zhàn)。
但是,中國金融綜合統(tǒng)計平臺建設的細節(jié)問題仍需解決。9月24日會上,一行三會人士進行了激烈的討論,主要集中在以下幾點:
首先,金融綜合統(tǒng)計平臺的建設亟須在統(tǒng)計方式、指標、對象、主體上實現(xiàn)標準化,包括金融機構(gòu)代碼、企業(yè)代碼和個人代碼都需要制定標準;
其次,這一新型數(shù)據(jù)系統(tǒng)要實現(xiàn)綜合化覆蓋,囊括新型金融業(yè)態(tài),這就涉及新型金融機構(gòu)、準金融機構(gòu)如何統(tǒng)計、是否強制性納入等問題;
再次,是該系統(tǒng)最終要實現(xiàn)共享,需要解決社會服務共享中是否收費、如何收費等問題。
前述知情人士還表示,建設金融綜合統(tǒng)計平臺必須打破現(xiàn)有分業(yè)監(jiān)管"畫地為牢"的思想,"有些部委的數(shù)據(jù)庫,不準別人插手,目前協(xié)調(diào)的難度仍相當大"。
民間數(shù)據(jù)對接難題
通過10余年積累,電商巨頭已經(jīng)積累了海量的信用數(shù)據(jù),如今這些數(shù)據(jù)的商業(yè)價值正逐步顯現(xiàn)。政府機構(gòu)是否可以利用這些數(shù)據(jù)?
中央財經(jīng)大學中國銀行業(yè)研究中心主任郭田勇表示,目前我國最大的數(shù)據(jù)庫征信系統(tǒng)的信息覆蓋面主要集中在信貸系統(tǒng),而對于個人其他經(jīng)濟活動和社會活動尚缺乏信用報告。
央行副行長潘功勝也曾公開表示,鼓勵包括民間資本在內(nèi)的各類資本進入征信業(yè),也歡迎阿里、騰訊等互聯(lián)網(wǎng)企業(yè)進入征信體系建設。
但是,一位接近央行征信中心的監(jiān)管人士卻表示,目前電商數(shù)據(jù)庫很難被直接納入官方數(shù)據(jù)庫?!墩餍殴芾項l例》規(guī)定,采集個人信息應當經(jīng)信息主體本人同意,未經(jīng)本人同意不得采集--電商數(shù)據(jù)來源是否合法難以界定。
此外,"電商平臺上的差評是否算不良信息?目前很難說。"這位監(jiān)管人士強調(diào),在不知道電商數(shù)據(jù)質(zhì)量如何的情況下,不會盲目將其納入央行征信系統(tǒng)。
杭州同盾科技有限公司首席執(zhí)行官蔣韜向《財經(jīng)國家周刊》記者介紹說,在美國,金融、互聯(lián)網(wǎng)各個行業(yè)都有自己的數(shù)據(jù)體系。"民間、官方的數(shù)據(jù)很難放到一個數(shù)據(jù)庫里去,只能是開放的心態(tài),雙方在數(shù)據(jù)層面上達到共建共享。"
國家統(tǒng)計局局長馬建堂也表示,所有擁有海量數(shù)據(jù)的機構(gòu),無論是企業(yè)還是政府機構(gòu),原則上除涉及國家安全、商業(yè)秘密和個人隱私等數(shù)據(jù)外,都應以更加開放的姿態(tài)、更加積極的行動促進大數(shù)據(jù)的深度應用,通過立法保障各方在大數(shù)據(jù)應用中的共享共贏。
沉睡的銀行大數(shù)據(jù)
文/《財經(jīng)國家周刊》記者宋怡青聶歐實習生付晶
互聯(lián)網(wǎng)金融正式進入破繭成蝶的大數(shù)據(jù)時代,傳統(tǒng)銀行業(yè)面臨的挑戰(zhàn)前所未有。
清華大學五道口金融學院一位專業(yè)人士表示,互聯(lián)網(wǎng)時代海量的數(shù)據(jù)和分析工具,催生出很多新的金融業(yè)態(tài),切入傳統(tǒng)銀行的禁地,"他們比傳統(tǒng)銀行有更強的數(shù)據(jù)收集和分析能力"。
北京銀行一位高管也對《財經(jīng)國家周刊》記者坦言,大數(shù)據(jù)應用可能對銀行的一些觀念和經(jīng)營模式產(chǎn)生顛覆。
接受采訪的一些人士認為,探索以大數(shù)據(jù)為基礎的解決方案,是中國的銀行提高自身競爭力的重要手段。如何建立強大穩(wěn)定的數(shù)據(jù)分析系統(tǒng),開發(fā)創(chuàng)新數(shù)據(jù)應用,實現(xiàn)經(jīng)營轉(zhuǎn)型,是銀行業(yè)在大數(shù)據(jù)時代迫在眉睫的任務。
夢想很遠,現(xiàn)實卻很緊迫。"國內(nèi)銀行還處在搭建推廣手機銀行、網(wǎng)上銀行階段,"前述五道口人士表示,"我們已經(jīng)慢了一拍。"
"金融富士康"
華道數(shù)據(jù)處理有限公司是隱身在銀行大數(shù)據(jù)"轉(zhuǎn)型"背后的"推手公司"。
"只要你去銀行填表單,無論是對私還是對公業(yè)務,銀行都會把手寫表單的影像第一時間發(fā)給我們,我們再通過人工錄入生成電子表單返回給銀行。"該人士介紹,"時間很短,可能就1分鐘。"
這就是銀行后臺外包業(yè)務,也是銀行最初的大數(shù)據(jù)入口?!敦斀?jīng)國家周刊》記者了解到,目前幾乎所有的大中型銀行都將數(shù)據(jù)錄入業(yè)務外包。
"這個工作比較枯燥,屬勞動密集型。銀監(jiān)會一位領導來檢查時,稱我們?yōu)?#39;金融富士康'。"該人士有些不好意思地笑著說。
銀行業(yè)具有天然的數(shù)據(jù)屬性,但是與阿里巴巴等電商動態(tài)的數(shù)據(jù)采集系統(tǒng)相比,銀行目前經(jīng)營管理數(shù)據(jù)挖掘和采集方式仍比較落后。而且,不僅數(shù)據(jù)錄入處于原始狀態(tài),一位信息系統(tǒng)的管理人員透露,目前銀行仍有不少業(yè)務處理系統(tǒng)和管理系統(tǒng)缺乏標準化的統(tǒng)一設計,直接導致大數(shù)據(jù)二次開發(fā)難。
銀行正逐漸意識到這一點,不少銀行開始用移動終端直接錄入客戶信息。但是華道數(shù)據(jù)人士表示,由于國家于電子類單據(jù)尚未立法保障,所以在今后一段時間內(nèi),銀行大數(shù)據(jù)的獲取仍離不開手工錄入。
《財經(jīng)國家周刊》記者了解到,在數(shù)據(jù)錄入完成后,銀行的每張紙質(zhì)單據(jù)仍需作為憑證,歸檔庫存。
除為銀行錄入單據(jù)之外,華道還承擔了另一項外包業(yè)務--信息審核。
幾乎每人申請信用卡的時候都會接到核實信息的電話,"這個電話一般都不是銀行打來的,多是外包公司打的。"華道人士介紹。
至于業(yè)務銀行信用卡的審核,也由華道負責。前述人士說,在審核流程中,銀行可能會調(diào)取央行的征信系統(tǒng)信息,但是,查詢一條信息的費用為5元左右,所以很多銀行查詢完就放到自己的信息池中,不再更新。"我們對照核實的信息很有可能是幾年前的。"
除此之外,銀行傳統(tǒng)的數(shù)據(jù)庫可能會涵蓋客戶的基本身份信息,更深一步的信息譬如性格特征、消費習慣、興趣愛好等卻是銀行難以準確掌握的。而這正是互聯(lián)網(wǎng)金融的強項。
沉睡的大數(shù)據(jù)
互聯(lián)網(wǎng)公司頻頻在已有的大數(shù)據(jù)基礎上開展金融業(yè)務,這些業(yè)務跨過銀行傳統(tǒng)的信貸領域,開始向轉(zhuǎn)賬匯款、現(xiàn)金管理、資產(chǎn)管理、供應鏈金融、支付等領域蔓延。
前述五道口人士表示,互聯(lián)網(wǎng)、電子商務等新興企業(yè)在大數(shù)據(jù)處理經(jīng)驗、產(chǎn)品創(chuàng)新能力、市場靈活度等方面都擁有明顯的優(yōu)勢,一旦涉足金融領域,將對銀行造成很大的威脅。在這種情況下,銀行更應激活利用內(nèi)部的"沉睡數(shù)據(jù)"。
記者了解到,目前銀行對數(shù)據(jù)的分析仍集中在結(jié)構(gòu)化數(shù)據(jù),譬如單據(jù)、借貸行為,等等。對于非結(jié)構(gòu)性數(shù)據(jù),如客戶瀏覽銀行網(wǎng)站的行為信息、服務通話的語音信息、營業(yè)網(wǎng)點或ATM機的錄像信息都無法分析,更談不上挖掘利用。
麥肯錫的一份研報指出,這類非結(jié)構(gòu)性數(shù)據(jù)中蘊含了豐富的客戶信息,如客戶身份、客戶偏好、服務質(zhì)量、競爭對手信息,等等。但現(xiàn)實中,此類數(shù)據(jù)除了少量的人工質(zhì)檢調(diào)閱外,幾乎沒有其他用途。
"國際經(jīng)驗已經(jīng)表明,加強數(shù)據(jù)分析能力會使銀行具體業(yè)務收益得到改善。在國內(nèi)銀行轉(zhuǎn)型的這個節(jié)點,加強數(shù)據(jù)分析,也有利于銀行挖掘資源,找到獨特的經(jīng)營模式。"前述五道口人士表示。
畏首畏尾
銀行業(yè)對大數(shù)據(jù)的挖掘創(chuàng)新似乎并不如互聯(lián)網(wǎng)企業(yè)那么熱衷,這其中既有傳統(tǒng)行業(yè)理念的保守,也有制度上的掣肘。
"銀行進行大數(shù)據(jù)挖掘,必然牽扯多方面,譬如觀念轉(zhuǎn)變、制度建設、流程優(yōu)化、系統(tǒng)開發(fā)以及人才儲備,等等。"一位股份制銀行的信息管理人士說。
首先是合法性問題。前述央行司局級官員說,與電商相比,銀行機構(gòu)同樣也能做到消費者信息實時跟蹤,但《征信業(yè)管理條例》第十三條規(guī)定,采集個人信息應當經(jīng)信息主體本人同意,未經(jīng)本人同意不得采集。
"所以很多信息,尤其是服務通話的語音信息、營業(yè)網(wǎng)點或ATM機的錄像信息等,這些數(shù)據(jù)信息采集尚未得到當事人允許,所以能否進一步分析開發(fā)是否合法沒有定論,這也使得很多銀行無法拓展這方面的業(yè)務。"前述股份制銀行人士表示。
其次,銀行現(xiàn)行的架構(gòu)缺陷。國內(nèi)銀行傳統(tǒng)架構(gòu)中,信息科技部門是作為配角出現(xiàn)的。與電商成千上萬的IT工程師相比,銀行的技術部門僅有幾十甚至十幾人,并且基本上集中在電子銀行、系統(tǒng)維護等邊緣業(yè)務。
"進行數(shù)據(jù)分析開發(fā)必須把信息科技部門提到一個新高度,整合全銀行的數(shù)據(jù)資源。但是這又牽扯到部門利益,必須進行大刀闊斧的改革,所以很復雜。"前述股份制銀行人士說,進行數(shù)據(jù)開發(fā),銀行要從內(nèi)部把數(shù)據(jù)標準化,這又會牽扯到很多細節(jié)問題,僅統(tǒng)一日期格式的工作就很繁重。所以,在大數(shù)據(jù)時代來臨之時,很多銀行仍顯得猶疑不定。
大數(shù)據(jù)金融時代
文/馮永昌微量網(wǎng)董事長
伴隨著阿里集團在美國上市,互聯(lián)網(wǎng)金融的大戲進入高潮,大數(shù)據(jù)、云計算以及互聯(lián)網(wǎng)金融等幾年前對公眾還很陌生的技術術語,迅速成為社會熱點。這些底層技術以移動互聯(lián)的用戶體驗呈現(xiàn)出來,不僅通過互聯(lián)網(wǎng)產(chǎn)品改變了人們的衣食住行,更通過互聯(lián)網(wǎng)金融產(chǎn)品開始沖擊"智力博弈巔峰"的金融業(yè)。
不管你恐懼還是欣喜,大數(shù)據(jù)金融時代已經(jīng)來臨。
如何理解由技術創(chuàng)新逐漸引領的金融創(chuàng)新?何謂大數(shù)據(jù)金融?我們選取三個最有代表性的例子來解答。
何謂大數(shù)據(jù)?大數(shù)據(jù)沒有嚴格定義,顧名思義就是"很多數(shù)據(jù)"。可以從三個層面來解析這個特別的稱謂--
從生產(chǎn)來看,不需要特別的采集過程,因為監(jiān)管要求、業(yè)務邏輯或者技術便利,具有"自生產(chǎn)"特征,比如搜索數(shù)據(jù)、交易數(shù)據(jù)等;從存儲來看,相對于傳統(tǒng)數(shù)據(jù)庫的數(shù)據(jù)規(guī)模,量變引起質(zhì)變,需要新的數(shù)據(jù)庫技術來支持存儲和訪問;從使用來看,分析方法從基于概率論的抽樣理論過渡到人工智能、統(tǒng)計學習等講求高維、高效率分析技術。
從行業(yè)細分角度,大數(shù)據(jù)金融業(yè)主要有大數(shù)據(jù)銀行金融和大數(shù)據(jù)證券金融,分別和銀行業(yè)務、證券業(yè)務相關。當然,保險業(yè)天然就和大數(shù)據(jù)相關。
信用卡自動授信是典型的大數(shù)據(jù)銀行金融。從銀行角度是否應該對申請者授信、發(fā)授多少信用額度,是個重要問題。傳統(tǒng)方式是人工審核申請資料,然后根據(jù)大致的檔位發(fā)放額度或拒絕申請。但是當銀行積累了足夠多的用卡客戶數(shù)據(jù),可以把是否違約,違約概率,有效使用額度等指標作為被評價對象,然后調(diào)用與此相關的各種客戶信息建立統(tǒng)計模型,自動計算授信結(jié)果。
機器人投資是大數(shù)據(jù)證券金融的代表形式,股票價格波動受各種因素影響,傳統(tǒng)的投資方式一般人工收集信息,手動交易。機器人投資可以建立多因素模型,自動選擇股票或?qū)ふ医灰讜r機,在適當?shù)娘L控模型下建立機器人投資云交易模式。
再如,連接銀行和證券的大數(shù)據(jù)不良資產(chǎn)評估。2005年,某國有不良資產(chǎn)管理公司開始嘗試在海量數(shù)據(jù)基礎上進行不良資產(chǎn)評估。原本銀行信貸資產(chǎn)的評估都是基于會計模型,但是不良資產(chǎn)基本沒有會計特征,很難用傳統(tǒng)方法評估。因此,收集已處置資產(chǎn)和待處置資產(chǎn)樣本進行對比,建立數(shù)據(jù)挖掘模型,可以方便評估待處置資產(chǎn)的價格。
了解了大數(shù)據(jù)和大數(shù)據(jù)金融的幾個應用實例,我們總結(jié)一下何謂大數(shù)據(jù)金融。
金融業(yè)積累的大數(shù)據(jù)就是金融大數(shù)據(jù),根據(jù)銀行金融和證券金融本身的不同,這些數(shù)據(jù)也分成銀行金融大數(shù)據(jù)和證券金融大數(shù)據(jù)。積累數(shù)據(jù)過程中,產(chǎn)生了數(shù)據(jù)采集、存儲、使用的相關工作和企業(yè),這樣就完成了金融大數(shù)據(jù)的產(chǎn)業(yè)鏈,但總體依然是信息技術產(chǎn)業(yè)鏈。
隨著信息技術全面發(fā)展,金融大數(shù)據(jù)產(chǎn)業(yè)具備提供信息技術服務之外的金融服務能力時,就產(chǎn)生了大數(shù)據(jù)金融。大數(shù)據(jù)金融是脫穎于金融大數(shù)據(jù)的新服務,是技術服務催生出來的金融服務。
阿里數(shù)據(jù)到底有多美?
文/《財經(jīng)國家周刊》記者宋怡青聶歐實習生付晶張曙霞
彭蕾和自己女兒同學的媽媽打賭,因為對方不相信孩子的專業(yè)課本--《天目山植物學實習手冊》能在淘寶上買到。結(jié)果,同學媽媽搜到了此書的25個賣家鏈接后,瞬間折服。
接下來,這位媽媽只要一登錄淘寶或阿里旺旺,天目山、莫干山等各種"山",植物學、動物學等各種"學",甚至從大學英語到旅游手冊,無數(shù)相關商品撲面而來,所有的依據(jù),就是其僅有的一次搜索。
她感慨自己瞬間就"被大數(shù)據(jù)"了。而參與打賭的彭蕾,正是阿里小微金融服務集團CEO。
在歷時近一個月的調(diào)研活動中,《財經(jīng)國家周刊》記者所見阿里金融劍之所向,是成為環(huán)境舒適安全、人流絡繹不絕的全維度大"超市"--無論銀行、證券、保險,抑或擁有數(shù)據(jù)和技術的互聯(lián)網(wǎng)公司,將統(tǒng)統(tǒng)會在該"超市"上架。
而整個阿里集團,也將轉(zhuǎn)向定位于大數(shù)據(jù)服務商和技術提供商,不賣數(shù)據(jù)賣分析,不賣硬件賣服務。"馬云想要的,是下一個IBM。"阿里一位高管說。
不過,在央行一位官員看來,阿里能提供給客戶的大數(shù)據(jù)產(chǎn)品,瑕疵不少而且安全難保,"一切并非所見的那么美好"。
"毛細血管"的野心
阿里原安全部技術總監(jiān)蔣韜說,阿里的大數(shù)據(jù)技術至少全球前三,甚至已超過另兩位--亞馬遜和谷歌。8000多人的技術團隊,從2003年底第一筆支付寶交易以來的10年內(nèi),他們已鉚足勁頭,等待爆發(fā)。
阿里大數(shù)據(jù)之戰(zhàn)的戰(zhàn)略核心,就在于此。
阿里小微金融服務集團副總裁俞勝法給出一組調(diào)研數(shù)據(jù),稱傳統(tǒng)銀行的客服、柜臺和客戶經(jīng)理人數(shù)占比達80%左右,數(shù)據(jù)工作人員不足10%,而阿里微貸事業(yè)部采用數(shù)據(jù)化決策,60%從事數(shù)據(jù)相關工作,余下則主做數(shù)據(jù)底層架構(gòu)搭建。整個阿里的金融團隊,90%的人每天與數(shù)據(jù)打交道。
目前,阿里擁有全國最大的Hadoop分布式計算集群,日增數(shù)據(jù)50TB(數(shù)據(jù)存儲單位,1TB=1024G),有40PB(1PB=1024TB)海量數(shù)據(jù)存儲,分布于全國80多個節(jié)點的CDN網(wǎng)絡,支撐流量超過800Gbps,即同時支撐對數(shù)十億商品的實時搜索和記錄。
關鍵的是,所有訪客行為都被如實記錄。部分數(shù)據(jù)采用1:120的高壓縮極限存儲技術,通過由3000多臺服務器組成的"云梯"超大規(guī)模數(shù)據(jù)系統(tǒng),以及阿里自研的ODPS數(shù)據(jù)系統(tǒng),持續(xù)挖掘和分析。
"有人說我們要賣數(shù)據(jù),也有銀行來洽談,但其實數(shù)據(jù)是不賣的。"俞勝法很直接,說阿里傾盡全力打造的大數(shù)據(jù)庫,難以定價。
他表示,阿里每一步的初衷都很簡單,成立支付寶,意在解決網(wǎng)購雙方信譽和擔保問題;余額寶,是為減少網(wǎng)購涉及的銀行備付金及其利息;涉足小貸,則是為了讓無廠房、無固定資產(chǎn)、無財務報表的淘寶賣家們,能有融資和生存之路。而眼下的大數(shù)據(jù)金融,是意在滿足市場對高效金融服務的需求,并帶動淘寶賣家實現(xiàn)電算化。
那么,捂著這些數(shù)據(jù)黃金,馬云究竟想做什么?
"馬云要自己動手取代IBM。"前述阿里高管告訴《財經(jīng)國家周刊》記者。
具體的商業(yè)模式,是阿里將拿出5000臺服務器的系統(tǒng)處理能力作為基礎,將大數(shù)據(jù)庫作為核心競爭力,免去銀行建機房、造系統(tǒng)的成本,只出具少量服務費就能享用阿里式服務。
"銀行將繼續(xù)做金融系統(tǒng)主動脈,阿里一邊做毛細血管,一邊做數(shù)據(jù)和技術服務商。"前述高管勾勒出一幅藍圖--待納入基金、證券、保險等機構(gòu)后,擁有巨量金融信息的阿里平臺就將誕生。
局限性質(zhì)疑
對此,有人提出異議。
央行一位司局級官員指出,阿里前述商業(yè)模式明顯有三點局限性--
首先,阿里90%以上的數(shù)據(jù)來自含淘寶、天貓在內(nèi)的"大淘寶",支付寶實名制用戶2013年底接近3億人,但與"大淘寶"高度重疊。阿里只能駕馭自有平臺的數(shù)據(jù),之外則無優(yōu)勢。
"我們確實在數(shù)據(jù)采集上存有局限。"前述阿里高管也坦言,他本人就少有網(wǎng)購行為,"數(shù)據(jù)庫中可能找不到我的信息"。
加之京東、1號店等電商崛起,同一客戶在不同電商平臺的表現(xiàn)是否一致,不同平臺的分析結(jié)果誰更準確等問題,還有待商榷。并且,阿里的客戶群相對單一和同質(zhì)化,一旦風險襲來則很難把控。相比之下,銀行卻擁有眾多細分市場和細分風險模型,小微業(yè)務即便做砸了,也不至全盤皆輸。
其次,阿里宣稱其具備確認支付寶用戶信息的能力,但其實,開設支付寶賬戶必須鏈接至少一張銀行卡,身份確認的工作和成本,早已由銀行付出,阿里只是借力而已。
不僅如此,阿里也不應具有對客戶數(shù)據(jù)的交易和處置權,至少應該在征得被搜集人許可后才能進行買賣。相比之下,銀行線上線下的業(yè)務辦理,均會書面通知客戶信息將被部分抓取,行為明顯規(guī)范得多。
其三,阿里目前呈現(xiàn)的數(shù)據(jù)產(chǎn)品,不包含細節(jié)信息和分析過程,僅是所謂評分系統(tǒng)給出的信用評分,不但真實性、可信度打上了問號,其評分標準亦可能各執(zhí)其詞。
例如,全球銀行普遍使用的美國FICO個人信用評分系統(tǒng),是在依據(jù)高達100萬的大樣本數(shù)據(jù)進行驗證與核對的基礎上,才開始使用的。阿里的大數(shù)據(jù)模型,卻尚未經(jīng)過數(shù)據(jù)檢驗和修正。
"金融數(shù)據(jù)必須足夠準確。阿里的產(chǎn)品缺乏標準,如何負起不良率的風險連帶責任?"一位有著阿里背景的高盛人士質(zhì)疑,"一個負責任的銀行,絕不會輕易購買。"
是故,一些數(shù)據(jù)源匱乏的中小銀行,就算高價買來阿里數(shù)據(jù)也難以二次使用。P2P和小貸公司等機構(gòu),則往往囊中羞澀,掏腰包也會"貨比三家"。
"例如,央行征信系統(tǒng)能給出個人或企業(yè)貸款90天內(nèi)的逾期概率,阿里能給出嗎?"前述央行官員說。
合規(guī)之忌
有監(jiān)管方面專家指出,阿里的大數(shù)據(jù)金融,從源頭到終端都畫了一個"圈","玩"到極致也跳不出來,沒"玩"好則將導致風險在"圈"內(nèi)爆炸。
按俞勝法的說法,大數(shù)據(jù)系統(tǒng)設計之初就囊括了風控措施,對店鋪信息的長期跟蹤,亦伴隨著準入、定價、反欺詐等風控評分;一旦發(fā)現(xiàn)經(jīng)營異象,阿里會有專人負責溝通核實、提早介入;一旦違約,還有一整套外包的催收機制。
《財經(jīng)國家周刊》記者獲悉,截至2014年7月底,阿里小貸已具有幾百億元貸款規(guī)模,戶均貸款余額和戶均授信分別僅約4萬元和18萬元,但貸款余額不良率在1.5%左右。這在業(yè)內(nèi)是個較高的數(shù)字。
"是金融背景還是互聯(lián)網(wǎng)背景的人在玩金融,一眼便知。"前述高盛人士稱,后者往往另辟蹊徑、大步向前,缺乏對金融應有的敬畏。
而更客觀和嚴峻的問題是,銀監(jiān)會規(guī)定小貸機構(gòu)放貸規(guī)模不得超過自有資本50%,貸款規(guī)模受到嚴格限制。但資本金僅20億元左右的阿里小貸,緣何能將貸款資金杠桿放大至幾百億元?
知情人士私下透露,阿里小貸早就"突破"20億元資本金的限制:各種合作方,能助其將資產(chǎn)包在交易所上市,比如2013年深交所東證資管將阿里的資管計劃掛牌出售,以資本市場交易來實現(xiàn)"出表",即貸款行為不再受到自身資產(chǎn)負債表制約,貸款余額得到大幅增長。
簡單說來,與絕大多數(shù)小貸公司孤立無援相比,阿里強大的"人脈網(wǎng)",能讓其放貸行為避開資本金規(guī)模和杠桿率監(jiān)管的制約。
"證券化能輕松將貸款余額做到資本金的數(shù)倍,這是做小貸的默認'行規(guī)',阿里玩得最猛。"高盛人士說,阿里無所畏懼地橫行于自己不擅長的領域,并且以全鏈條閉環(huán)封閉了可能的風險。
這一點,金融危機時的美國銀行業(yè)改革已給出警示。2010年初,奧巴馬宣布采納"沃克爾法則",要求銀行業(yè)剝離衍生品、抵押貸款等杠桿率過高的交易,并提高了資產(chǎn)2500億美元以上銀行的風險和資本標準,規(guī)定對抵押貸款進行證券化的金融機構(gòu)必須自身持有一部分風險頭寸并接受消費機構(gòu)檢查。
"此舉可謂美國1930年大蕭條以來最致命的金融改革,目標直指交易透明度,限制大型機構(gòu)以自有資本參與市場投機。"高盛人士指出。
有分析人士認為,阿里的核心問題,在于包括前述隱性擴大杠桿和實體經(jīng)濟下行等一系列風險,均內(nèi)置于一套金融閉環(huán)內(nèi),從數(shù)據(jù)收集、信用評估、模型建設、貸款發(fā)放、風險跟蹤直到還貸收貸,整個鏈條統(tǒng)統(tǒng)由阿里一家完成,風險無法跳出循環(huán),此乃金融業(yè)大忌。
"無論什么新花樣,其本質(zhì)是金融,就要尊重基本規(guī)律。"前述央行官員警示,阿里的金融閉環(huán)正在不斷放大風險。
銀監(jiān)會創(chuàng)新部主任助理李志磊告訴《財經(jīng)國家周刊》記者,不論出身不論形式,也不論線上線下,都要進行監(jiān)管,"只要是金融機構(gòu),就要接受與傳統(tǒng)金融機構(gòu)等同的監(jiān)管方式,沒有特殊。"
隱私裸奔?
隱私和安全是大數(shù)據(jù)時代的重要問題,阿里同樣繞不過去。在監(jiān)管尚未完全到位之時,如何把握大數(shù)據(jù)金融對于個人信息的抓取程度?如何劃定不觸及大眾隱私和安全的法律底線?
李志磊對此表示,消費者是否允許挖掘和跟蹤數(shù)據(jù),還需要出臺相關法律規(guī)定。與大數(shù)據(jù)公司相比,一些銀行機構(gòu)同樣也能做到信息實時跟蹤,只是考慮到法律授權比較慎重而已。
央行征信中心副主任王曉蕾指出,歐美國家的個人數(shù)據(jù)保護立法,基本包含四個原則,即目的性、適當性、本人同意及知情原則。大數(shù)據(jù)并不意味著無限制搜集,信息主體對自身信息的采集和使用也應有更多知情權和控制權。
《歐洲數(shù)據(jù)保護法》明確要求,搜集方在隱私聲明中要將信息及用途加以說明,允許用戶對個人信息進行修改,甚至要求將條款細化成一張列表,供用戶自行勾選。但在中國,盡管一些機構(gòu)認識到了"本人授權"能夠規(guī)避可能的法律風險,但這種"授權"往往是強制性和形式上的。
"金融業(yè)還無法完全駕馭大數(shù)據(jù)。"前述專家說,隨著金融市場乃至整個社會管理的信息基礎設施日益一體化和外向型,隱私和數(shù)據(jù)安全面臨越來越大的風險。
最近一份對歐洲150萬手機用戶數(shù)據(jù)的研究表明,只需要4項參照因素就能確認其中95%用戶的身份。顯然,中國大數(shù)據(jù)信息的搜集范圍嚴重"超標"。
相關法律法規(guī)和行業(yè)自律等措施,究竟由哪個機構(gòu)來牽頭負責,由怎樣的專業(yè)人士來制定游戲規(guī)則,是眼下擺在國家決策層面前的一道最緊迫的難題。
這一困境,已在實踐中逐漸顯現(xiàn)。
此前,有消息說阿里、騰訊等大型電商平臺數(shù)據(jù)未來有望納入征信系統(tǒng)中。但一位接近央行征信中心的人士對《財經(jīng)國家周刊》記者明確回應,"目前尚不可行。因為電商的一些數(shù)據(jù)來源與目前法律相悖。"
《征信業(yè)管理條例》第三章第十三條明確規(guī)定,采集個人信息應當經(jīng)信息主體本人同意,未經(jīng)本人同意不得采集。但是,依照法律、行政法規(guī)規(guī)定公開的信息除外。
"電商抓取客戶的行為信息,搜集客戶在電商平臺上的活動,經(jīng)過客戶允許了嗎?"該知情人士問。
此外,還有一個"產(chǎn)業(yè)",即在電商平臺上刷信用--"這種刷出來的信用占電商平臺的多少比例?是否會直接影響到其信用度的評定,這些都沒有定論"。
阿里于2014年9月19日在美國上市。有分析說,作為在美上市公司,阿里有義務對美國監(jiān)管部門和公眾履行非公開或公開披露義務,而阿里幾乎掌握所有商家、廠家及購買人的經(jīng)濟信息及重要金融端口,包括客戶姓名、住址、身份證號碼等等。這些信息能否披露?
有分析人士認為,阿里的數(shù)據(jù)業(yè)務模式可能代表著一個全新的發(fā)展方向,但必須清醒意識到,阿里是站在一堆法律并未明確定性的大數(shù)據(jù)的"刀尖"上跳舞。