有句古話,"有人的地方就有江湖,是江湖就會有爭斗"。對于互聯(lián)網(wǎng)金融平臺來說,有實惠的活動中必定有這樣一群人出現(xiàn),大家戲稱他們?yōu)?ldquo;羊毛黨”。他們是這個時代的產(chǎn)物,也伴隨著P2P網(wǎng)貸行業(yè)的發(fā)展,可是人心不足蛇吞象,猖獗的薅羊毛行為讓很多平臺開始警惕了這個群體,隨著薅羊毛技術(shù)的迭代更新,大數(shù)據(jù)技術(shù)也在發(fā)展,一場攻防惡戰(zhàn)正悄無聲息的進(jìn)行著。
新的2017年,大家雞年快樂
有句古話,"有人的地方就有江湖,是江湖就會有爭斗"。對于互聯(lián)網(wǎng)金融平臺來說,有實惠的活動中必定有這樣一群人出現(xiàn),大家戲稱他們?yōu)?ldquo;羊毛黨”。他們是這個時代的產(chǎn)物,也伴隨著P2P網(wǎng)貸行業(yè)的發(fā)展,可是人心不足蛇吞象,猖獗的薅羊毛行為讓很多平臺開始警惕了這個群體,隨著薅羊毛技術(shù)的迭代更新,大數(shù)據(jù)技術(shù)也在發(fā)展,一場攻防惡戰(zhàn)正悄無聲息的進(jìn)行著。
新的一年,整個大數(shù)據(jù)圈子,鋪天蓋地全是AI技術(shù)的發(fā)展,大家可謂是悲喜交加。
它好像一條狗
一方面情緒高漲,歡呼著新時代的來臨。一方面惆悵不安,對自己的未來感到迷茫。
不管如何,大數(shù)據(jù)技術(shù)正在彰顯著它的價值,你關(guān)心或忽視,它也的確來了。
而我們能做的,就是勇敢去面對,用大數(shù)據(jù)技術(shù)去服務(wù)于生活,應(yīng)用于業(yè)務(wù),甚至是用技術(shù)改革去與羊毛黨展開一場正面的較量。
一. 羊毛黨與平臺的難舍難分
羊毛黨起源于互聯(lián)網(wǎng)金融的P2P平臺,是指那些專門選擇互聯(lián)網(wǎng)渠道的優(yōu)惠促銷活動,以低成本甚至零成本換取物質(zhì)上實惠的人,而這一切的行為稱之為薅羊毛。
來自于百度百科
在這個充滿爭議的群體身上,具有很多標(biāo)識性的特征。
羊毛黨群體的特點
都說知己知彼,方能百戰(zhàn)不殆??杉词购芏嗥脚_都熟悉了羊毛黨群體的套路,但每次遇到正規(guī)軍團(tuán)伙,還是節(jié)節(jié)敗退下來,慘不忍睹。
羊毛黨有很多神奇的物種:個人、家庭、同事、朋友、技術(shù)團(tuán)隊、專業(yè)團(tuán)伙等等。
薅羊毛
但是對于平臺而言,重點打擊的是以薅羊毛來養(yǎng)家糊口,甚至是發(fā)家致富,不折手段套取平臺活動福利的羊毛黨團(tuán)伙。
可謂是魔高一尺,伴隨著科技的發(fā)展,羊毛黨薅羊毛的技術(shù)手段也在不斷迭代,從最初的游擊戰(zhàn),發(fā)展到最后的正規(guī)軍,越來越多的薅羊毛方法去規(guī)避平臺的監(jiān)控。
有購買大量SIM卡來進(jìn)行注冊賬號有購買大量低品牌待機(jī)手機(jī)進(jìn)行登錄,甚至不斷抹機(jī)來消除記錄通過網(wǎng)上購買大量銀行卡信息進(jìn)行實名認(rèn)證使用貓池設(shè)備偽造登錄信息通過代理商修改地理位置和IP地址......來自于淘寶的貓池設(shè)備
很多變幻莫測的方法,這也是國人如此厲害的一面,不斷的尋找漏洞去獲利,去碾壓平臺運(yùn)營人員的智商。
當(dāng)然,羊毛黨對于平臺而言,也有一定的好處,藕斷絲連。平臺也需要活躍度、用戶規(guī)模量、總投資額不斷突破目標(biāo)。這些都是平臺實力和知名度的體現(xiàn),也是融資上市的底氣。
可利和弊這個平衡點如何去把控,誰都沒底,沒人想大意失荊州。
對于羊毛黨,在一個又一個平臺薅羊毛的結(jié)局,無非就是這么幾種,可謂是驚心動魄。
成功薅到羊毛,離開平臺被監(jiān)控異常,凍結(jié)資金,需要征信反被平臺套住轉(zhuǎn)換為平臺忠實投資用戶被套住的羊毛黨
最后一種結(jié)局應(yīng)該是最完美的,當(dāng)然,這里面最受益的還是平臺自身。
二. 大多數(shù)平臺的攻防大戰(zhàn)
長期以來,惡意羊毛團(tuán)伙對平臺的活動運(yùn)營成本損失很大,甚至導(dǎo)致平臺直接被薅干,宣布提現(xiàn)困難,資金鏈斷裂。
可謂是四面楚歌
放眼于國內(nèi)P2P市場,羊毛黨監(jiān)控一直是十分頭疼的問題,大多數(shù)平臺都會選擇這兩條路:
借助于第三方接口服務(wù)來做一些離線場景下的黑名單監(jiān)測,比如中國移動養(yǎng)卡庫和通付盾黑名單也有平臺直接購買了第三方的安全產(chǎn)品去監(jiān)控平臺用戶的異常行為,比如同盾科技。國內(nèi)的反欺詐安全產(chǎn)品
但使用起來效果并不佳,有些說不定只是噱頭,平臺買了也沒用。
思前想后,最根本的原因還是在于:很多平臺把數(shù)據(jù)資產(chǎn)當(dāng)作自己的隱私,缺乏數(shù)據(jù)共享意識去跨領(lǐng)域合作打擊反欺詐團(tuán)伙,不希望平臺的核心數(shù)據(jù)脫離平臺本身,這也就導(dǎo)致很多第三方監(jiān)控產(chǎn)品能獲取的用戶數(shù)據(jù)極少,更別提監(jiān)控效果。
數(shù)據(jù)資產(chǎn)保護(hù)
在沒有平臺用戶全數(shù)據(jù)的整合分析下 (用戶行為、交易和資金數(shù)據(jù)、以及用戶個人信息),真正防范效果并不太顯著,真實用戶被誤殺的概率會很大。
借用理財運(yùn)營朋友的一句話:"寧可不撒網(wǎng),一如既往,也不希望看到平臺真實用戶被無故傷害,各種投訴負(fù)面消息也會接踵而來。"
各種投訴報告消息
當(dāng)然,隨著整個行業(yè)的良性發(fā)展和不斷試錯,很多平臺越來越會玩轉(zhuǎn)羊毛黨群體,說直白些,就是反擼羊毛黨。
這些平臺會通過設(shè)置一些活動的隱形規(guī)則、投資門檻和活動陷阱,盡最大努力去拉長羊毛黨投資資金在平臺上的周期時間,降低薅羊毛的整體收益。
平臺的這些狠招的確會讓不少羊毛黨呼天搶地,有苦說不出。
但同時也給平臺名聲留下了不少詬病,各種投訴舉報,多少影響平臺用戶的忠誠度,畢竟有些羊毛黨也有可能轉(zhuǎn)換為平臺的忠實投資用戶,甚至也有真實用戶被誤傷。
天平到底何時平衡?
所以利和弊如何去平衡,沒人有底。這也讓一些平臺不敢去重力度去開展很多新手理財活動和渠道推廣活動,去向平臺注入更多的新鮮血液,提高用戶規(guī)模,從而導(dǎo)致平臺發(fā)展停滯不前。
三. 大數(shù)據(jù)中的反欺詐技術(shù)的攻防
人人都談大數(shù)據(jù),也有不少人對它存在一定的誤解,但不可否認(rèn),大數(shù)據(jù)生態(tài)圈的很多技術(shù)已經(jīng)落地了,數(shù)據(jù)產(chǎn)品驅(qū)動于業(yè)務(wù)的時代已經(jīng)逐漸來臨。
相對來說,真正業(yè)務(wù)場景的痛點,主要有三個面:實時性、精準(zhǔn)性和行為干預(yù)。
也就是說,實時精準(zhǔn)地監(jiān)控惡意羊毛黨團(tuán)伙的異常行為,并在產(chǎn)品流程中采取相應(yīng)的防范措施,這是羊毛黨監(jiān)控真正要解決的痛點。
而接下來就需要深度思考這幾個問題:
監(jiān)控渠道的范圍需要有哪些?監(jiān)控事件的階段需要有哪些?異常校驗的流程會考慮哪些?對于監(jiān)控渠道范圍,主要會針對PC、Wap和APP這三個方面,完全囊括用戶群體接觸平臺的所有方式。
對于監(jiān)控事件而言,會單獨(dú)針對用戶在平臺投資流程中的顯著性階段,比如:注冊、實名、綁卡、充值、投資和提現(xiàn),以及后續(xù)的復(fù)投跟蹤。
對于異常校驗的流程,一方面需要去考慮用戶冷啟動的問題(平臺新用戶),一方面需要更精準(zhǔn)去識別惡意的羊毛黨團(tuán)伙。
一份監(jiān)控流程的草圖
毋庸置疑,整個反欺詐數(shù)據(jù)產(chǎn)品中,最核心的點就是實時監(jiān)控和反欺詐模型。
01.在實時場景上
我們借助了Spark Streaming流式計算來進(jìn)行處理。
目前能保證用戶觸發(fā)監(jiān)控事件后,整個反欺詐產(chǎn)品能在30秒內(nèi)完成該用戶的所有校驗環(huán)節(jié),最終評估用戶是否為風(fēng)險,以及異常詳情的分析。
數(shù)據(jù)源驅(qū)動
02.在校驗新用戶時
對于冷啟動用戶(沒有任何資金和投資記錄),整個反欺詐監(jiān)控系統(tǒng)采用了第三方風(fēng)險庫、平臺黑名單庫和規(guī)則引擎進(jìn)行綜合校驗評估。
考慮到第三方風(fēng)險校驗是一個收費(fèi)的服務(wù),就比如說,拿平臺用戶的手機(jī)號去驗證第三方接口,如果命中一次異常,則需要花費(fèi)幾塊錢不到的服務(wù)費(fèi)。
所以說整個數(shù)據(jù)產(chǎn)品只會在用戶注冊階段去驗證一次第三方風(fēng)險庫,并對異常用戶的數(shù)據(jù)和風(fēng)險詳情進(jìn)行存儲,服務(wù)于平臺自身黑名單庫的監(jiān)督性學(xué)習(xí)機(jī)制。
冷啟動用戶的校驗機(jī)制
03.在反欺詐監(jiān)控模型上
隨著用戶在平臺上的行為不斷積累,涉及用戶的信息、資金數(shù)據(jù)、投資記錄、推薦關(guān)系和用戶行為會逐漸完善一個用戶的完整模樣。
到這時候,整個反欺詐監(jiān)控模型的效果也將開始發(fā)力。
對于模型而言,它能解決的痛點,我在以往的文章中有提到一些細(xì)節(jié)。
還是那句話:好的業(yè)務(wù)模型不單單只是一個算法而已,它是由多個算法和業(yè)務(wù)運(yùn)營規(guī)則來組合在一起的。
對于其中一個用戶細(xì)分模型,除了去判斷用戶是否為羊毛黨,還需要去識別該用戶屬于哪一種類別的羊毛黨群體。
在判別出用戶屬于哪一類型的羊毛黨后。
最后還需要結(jié)合業(yè)務(wù)運(yùn)營的彈性因子,去綜合評估用戶的風(fēng)險,最大可能去挖掘出異常用戶群體中的潛力用戶,這是整個用戶細(xì)分模型所在做的事。
關(guān)系網(wǎng)絡(luò)的demo
上圖是用戶細(xì)分模型中的一個環(huán)節(jié),對于用戶的關(guān)系維度,有很多強(qiáng)關(guān)系、中關(guān)系和弱關(guān)系的指標(biāo)。
在挖掘用戶在整個平臺的關(guān)系時,模型可以橫向擴(kuò)展很多分析維度,從而更全面去挖掘出用戶的整個關(guān)系網(wǎng)絡(luò)。
舉個例子,兩個人都使用同一個身份證,那這兩個人基本上可以歸并為同一個用戶。而兩個人都使用過同一個手機(jī)設(shè)備,至少可以分析出這兩個人算是認(rèn)識,可能是朋友等等。
模型跑出來一個結(jié)果
我也看過很多大數(shù)據(jù)平臺在借款端的業(yè)務(wù)場景也使用過這種分析思想。
但中肯來說,結(jié)合業(yè)務(wù)分析用戶的特點,理財反欺詐和借貸反欺詐肯定有很多不一樣,而這種關(guān)系網(wǎng)絡(luò)的分析思想最合適用的場景還是針對于理財投資這塊。
而整個關(guān)系網(wǎng)絡(luò)的分析,困難點還是在于四個點:
大數(shù)據(jù)下的清洗分析的時間窗口選擇關(guān)系維度的選取權(quán)重信息熵的平衡所有的這些點都決定了整個關(guān)系網(wǎng)絡(luò)的挖掘效果好與壞。這也是精準(zhǔn)分析用戶異常的一個核心要素。
04.反欺詐產(chǎn)品的效果跟蹤
在后期,我們對雙11活動當(dāng)天,推廣渠道帶來的用戶數(shù)據(jù)進(jìn)行了細(xì)分場景的監(jiān)控評估,總共3.6w個用戶,分三個階段進(jìn)行分析。
誤殺的參考依據(jù):根據(jù)用戶是否在后期發(fā)次復(fù)購行為(這里設(shè)定達(dá)到3次)來評估效果。
用戶投資場景的細(xì)分
最后,通過整個反欺詐監(jiān)控系統(tǒng)的重重校驗,最終確定活動當(dāng)天的風(fēng)險用戶有760個(已去重)。
根據(jù)后續(xù)兩個月內(nèi)的用戶投資行為跟蹤,存在3個不到的用戶進(jìn)行復(fù)購行為。
也就是說誤殺率控制在不到0.3%,這效果顯然是能夠讓業(yè)務(wù)運(yùn)營方感到滿意,在監(jiān)控率和誤殺率上得到了平衡。
長路漫漫,羊毛黨與平臺的攻防大戰(zhàn)才正式開始。
新的2017年,隨著整個反欺詐產(chǎn)品的不斷迭代和模型調(diào)優(yōu),還會融入產(chǎn)品流程環(huán)節(jié),去對風(fēng)險用戶進(jìn)行真正的干預(yù)和征信環(huán)節(jié)。
我們所做的這一些,一方面保護(hù)真正投資人的利益。一方面對惡意羊毛黨團(tuán)伙的對抗絕不退縮。僅此而已!
作者介紹
汪榕,3年場景建模經(jīng)驗,曾累計獲得8次數(shù)學(xué)建模一等獎,包括全國大學(xué)生國家一等獎,在國內(nèi)期刊發(fā)表過相關(guān)學(xué)術(shù)研究。兩年電商數(shù)據(jù)挖掘?qū)嵺`,負(fù)責(zé)開發(fā)精準(zhǔn)營銷產(chǎn)品中的用戶標(biāo)簽體系。發(fā)表過數(shù)據(jù)挖掘相關(guān)的多篇文章。目前在互聯(lián)網(wǎng)金融行業(yè)從事數(shù)據(jù)挖掘工作,參與開發(fā)反欺詐實時監(jiān)控系統(tǒng)。微博:樂平汪二。