Intetix Foundation(英明泰思基金會(huì))由從事數(shù)據(jù)科學(xué)、非營利組織和公共政策研究的中國學(xué)者發(fā)起成立,致力于通過數(shù)據(jù)科學(xué)改善人類社會(huì)和自然環(huán)境。通過聯(lián)絡(luò)、動(dòng)員中美最頂尖的數(shù)據(jù)科學(xué)家和社會(huì)科學(xué)家,以及分布在全球的志愿者,我們創(chuàng)造性地踐行著我們的使命:為美好生活洞見數(shù)據(jù)價(jià)值。
原文鏈接:
https://theconversation.com/machine-learning-and-big-data-know-it-wasnt-you-who-just-swiped-your-credit-card-48561
當(dāng)你在家卻接到信用卡檢測中心的電話詢問你剛剛是否在某個(gè)商場完成支付,而事實(shí)上這個(gè)時(shí)間段你根本沒有出門,更別說買什么昂貴的電器,那么銀行是怎么知道這可能是筆欺詐性交易呢?
正確分辨每筆商業(yè)交易的合法性對(duì)信用卡公司的利益影響巨大。美聯(lián)儲(chǔ)支付研究數(shù)據(jù)表明,2012年美國公民信用卡交易額達(dá)到262億美元。而同年由于未予授權(quán)的交易所產(chǎn)生的損失大約為61億美元。聯(lián)邦公平信用結(jié)賬法將持卡人的未授權(quán)交易責(zé)任限制在50美元,剩余損失由信用卡公司負(fù)責(zé)。由此可見,欺詐性支付對(duì)信用卡公司盈虧的巨大影響。然而,盡管每年信用卡使用點(diǎn)都會(huì)接受嚴(yán)格的安全審查,仍無法真正杜絕信用卡欺詐。
對(duì)銀行業(yè)來說,風(fēng)險(xiǎn)評(píng)估起著至關(guān)重要的作用。其總目標(biāo)是在造成巨大損失前,快速地判斷其是否為欺詐性質(zhì)。但如何做到這一點(diǎn)?銀行又如何辨別信用卡盜刷呢?
提高檢測能力因欺詐性支付過程的瞬間性,有效的反欺詐從客戶視角看來非常神奇的。這看似簡單且快速的檢測其實(shí)暗含了一系列復(fù)雜的技術(shù),涉及財(cái)經(jīng),法律及信息科學(xué)。
當(dāng)然,也有一些相對(duì)簡單的檢測機(jī)制,無需太過先進(jìn)的技術(shù)。例如,當(dāng)信用卡在非常用地區(qū)使用時(shí),無法提供其正確的郵政編碼將被視為欺詐的指示之一。但得知受害人的郵編十分容易,通常詐騙犯都能夠輕易躲過這一常規(guī)檢查。
在過去,反欺詐支付所需的數(shù)據(jù)分析技術(shù)要求大量的人力投入。通過電腦算法發(fā)現(xiàn)的可疑案例,最終都需經(jīng)過人工確認(rèn)。現(xiàn)如今,過于龐大的交易數(shù)量使得信用卡公司更需依賴于大數(shù)據(jù)分析。機(jī)器學(xué)習(xí)和云計(jì)算等先進(jìn)技術(shù)將提高檢測欺詐支付的準(zhǔn)確性。
通過機(jī)器學(xué)習(xí)判斷是否為欺詐簡單來說,機(jī)器學(xué)習(xí)由計(jì)算機(jī)操控,通過符合特殊規(guī)則的預(yù)設(shè)過程且能自我完善的算法。計(jì)算機(jī)會(huì)先從一個(gè)模型開始,然后通過實(shí)驗(yàn)和犯錯(cuò)來訓(xùn)練它。之后它就可以做出風(fēng)險(xiǎn)預(yù)測,例如預(yù)測金融交易相關(guān)的風(fēng)險(xiǎn)。
檢測欺詐的機(jī)器學(xué)習(xí)算法首先需用大量持卡人的正常交易數(shù)據(jù)來訓(xùn)練。交易序列就是這種訓(xùn)練數(shù)據(jù)的一個(gè)例子,如一個(gè)人通常每周加一次油,每兩周去一次超市購物等等。該算法學(xué)習(xí)到這是一個(gè)正常的交易序列。
這種微調(diào)過程后,我們就可以通過運(yùn)行算法檢測信用卡交易,理想情況下能達(dá)到實(shí)時(shí)狀態(tài)。然后算出一個(gè)概率指示交易被欺詐的可能性(例如,97%)。如果將欺詐檢測系統(tǒng)設(shè)定為阻止任何欺詐概率高于95%的交易,這個(gè)評(píng)估可以在交易發(fā)生時(shí)立即引發(fā)信用卡凍結(jié)。
算法考慮了許多因素來限定欺詐交易:商家的誠信值,持卡人的購買行為(包括時(shí)間和地點(diǎn)),IP地址,等。數(shù)據(jù)點(diǎn)越多,結(jié)果越精確。
沒有人可以在分析成千上萬的數(shù)據(jù)的同時(shí)做出判斷,但機(jī)器學(xué)習(xí)可以,它使實(shí)時(shí)檢測欺詐行為成為可能。
舉一個(gè)典型的例子,當(dāng)你在超市結(jié)賬刷卡時(shí),信用卡公司將會(huì)得到具體交易細(xì)節(jié),如時(shí)間、數(shù)額、商店名與信用卡的年限。這些數(shù)據(jù)會(huì)被提供給已學(xué)習(xí)你的采購模式的算法,通過與許多過去的采購數(shù)據(jù)點(diǎn)比對(duì)來分析此項(xiàng)交易是否符合你的行為習(xí)慣。
在你的信用卡被使用時(shí),無論你是身處每周六早晨都會(huì)去的餐廳,還是凌晨3點(diǎn)在兩個(gè)時(shí)區(qū)外的加油站,算法都會(huì)立即知道你在交易,并檢查你的交易行為是否正常。如果信用卡突然在同一天超額預(yù)付兩次,而在歷史數(shù)據(jù)中沒有這樣使用過的數(shù)據(jù),這種行為將提高欺詐概率的評(píng)分。如果交易欺詐分值高于某個(gè)閾值,通常快速人工審核后,算法將與銷售點(diǎn)系統(tǒng)聯(lián)系讓它拒絕交易。網(wǎng)上購物也會(huì)經(jīng)過相同的流程。
在這種類型的系統(tǒng)中,大量人工干預(yù)成為過去的事。事實(shí)上,如果一個(gè)人過于參與欺詐監(jiān)測周期,那么反應(yīng)時(shí)間會(huì)變得更長。然而,人工仍然可以發(fā)揮作用——驗(yàn)證欺詐或跟蹤被拒絕的交易。當(dāng)一張卡被多次拒絕交易時(shí),工作人員可以致電持卡人,以決定是否永久取消該卡。
在云端的電腦偵探大量需處理的金融交易是一個(gè)很重的負(fù)擔(dān),特別是在大數(shù)據(jù)領(lǐng)域。但機(jī)器學(xué)習(xí)就是建立在堆積如山的數(shù)據(jù)上的,更多的信息會(huì)增加算法的準(zhǔn)確性,幫助消除誤報(bào)。合法的交易也會(huì)引發(fā)的可疑交易的誤報(bào),(例如,一個(gè)卡在一個(gè)不常使用的位置)。太多的警報(bào)和沒有警報(bào)一樣糟糕。
這樣龐大的數(shù)據(jù)需要大量的計(jì)算能力。例如,貝寶(Paypal)無時(shí)無刻都在為其1.69億的客戶處理超過1.1 pb的數(shù)據(jù)。這些大量的數(shù)據(jù)——1 pb相當(dāng)于超過20萬張dvd的內(nèi)存——這對(duì)算法的機(jī)器學(xué)習(xí)有積極影響,但也會(huì)對(duì)一個(gè)組織的計(jì)算基礎(chǔ)設(shè)施產(chǎn)生很大負(fù)擔(dān)。
這時(shí)就需要云計(jì)算了。遠(yuǎn)程計(jì)算資源可以在這里發(fā)揮著重要的作用。云計(jì)算是可伸縮的,而不會(huì)受限于公司自己的計(jì)算能力。
欺詐檢測是“正義”與“邪惡”之間的軍備競賽。目前,“正義”一方似乎取得很大進(jìn)展,在技術(shù)芯片等方面取得創(chuàng)新,同時(shí)還結(jié)合加密功能,機(jī)器學(xué)習(xí),大數(shù)據(jù)。當(dāng)然,還有云計(jì)算。
而騙子肯定會(huì)繼續(xù)試圖取勝和挑戰(zhàn)欺詐檢測系統(tǒng)的極限。劇烈變化的支付模式本身是另一個(gè)障礙。你的手機(jī)現(xiàn)在能夠存儲(chǔ)信用卡信息,可以用來無線支付,而這將會(huì)引入新的漏洞。幸運(yùn)的是,目前的欺詐檢測技術(shù)并不受制于支付系統(tǒng)技術(shù)。