搜索一下“HR+大數(shù)據(jù)”,我們也許能得到幾百萬條記錄,可見大數(shù)據(jù)在HR領(lǐng)域并不是一個(gè)陌生的話題,遺憾的是,熱度有余而深度不足。北大光華的穆勝博士在其寫的《大數(shù)據(jù)為何走不進(jìn)人力資源管理?》一文中提出“HR可能誤會(huì)了大數(shù)據(jù)”, HR的大數(shù)據(jù)需要有自己的玩法,其不同于傳統(tǒng)的HR數(shù)據(jù)分析的功能可以概括為三個(gè)方面:
一是養(yǎng)成平臺(tái)的能力:
大數(shù)據(jù)的特征概括為4V, Volume(大量)、Velocity(高速)、Variety(多樣性)、veracity(真實(shí)性)。這也決定HR的大數(shù)據(jù)絕不僅僅是把一些數(shù)據(jù)拿過來分析,而是一個(gè)涵蓋數(shù)據(jù)的產(chǎn)生、存儲(chǔ)、抓取、清理、分析、挖掘、建模、訓(xùn)練、驗(yàn)證、呈現(xiàn)的全過程的綜合平臺(tái)。
二是要有連接的效能:
與傳統(tǒng)的數(shù)據(jù)分析只需要得出一個(gè)數(shù)據(jù)性的管理結(jié)論不同,HR的大數(shù)據(jù)分析包括了 提出概念、分析框架、數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)清理、數(shù)據(jù)挖掘、模型創(chuàng)建、訓(xùn)練驗(yàn)證以及管理行動(dòng),其過程充分卷入了HR三支柱的COE、BP和SDC,乃至于管理者和員工,其目標(biāo)是推動(dòng)HR管理的持續(xù)改善。
三是能夠牽引HR的方向:
傳統(tǒng)的數(shù)據(jù)分析多是事后的總結(jié),是一種滯后的管理。而HR的 大數(shù)據(jù)分析則要求能夠幫助HR進(jìn)行預(yù)測(cè),實(shí)現(xiàn)前置的管理。
例如傳統(tǒng)的人力資源通過績效管理來識(shí)別高績效的員工并幫助員工持續(xù)提升績效,而在大數(shù)據(jù)模式下的思路則是通過數(shù)據(jù)的挖掘找到高績效員工的特征要素,讓企業(yè)的每一個(gè)員工都能夠持續(xù)產(chǎn)生高績效。
由于多數(shù)企業(yè)在HR的數(shù)據(jù)領(lǐng)域缺乏規(guī)劃,要實(shí)現(xiàn)上述突破對(duì)HR部門而言將是一個(gè)漫長而艱難的過程。本文以HR大數(shù)據(jù)領(lǐng)域騰訊的實(shí)踐與探索為例,說明HR領(lǐng)域大數(shù)據(jù)實(shí)踐的現(xiàn)狀。
騰訊在HR領(lǐng)域的大數(shù)據(jù)實(shí)踐最早可以追溯到2012年,通過People Soft搭建起了HR的統(tǒng)一結(jié)果庫,并開展了第一期的數(shù)據(jù)清理工作。
1騰訊的HR大數(shù)據(jù)平臺(tái)由應(yīng)用層、功能層以及團(tuán)隊(duì)三個(gè)部分組成
(1)應(yīng)用層主要解決HR大數(shù)據(jù)如何支撐HR業(yè)務(wù)的問題,闡述的是大數(shù)據(jù)的應(yīng)用場景,以及需求如何被響應(yīng)和落地。
(2)功能層主要解決HR大數(shù)據(jù)在后臺(tái)如何運(yùn)作的問題,闡述的是如何去科學(xué)的管理和使用數(shù)據(jù),保障數(shù)據(jù)的質(zhì)量和價(jià)值,包括元數(shù)據(jù)管理、數(shù)據(jù)質(zhì)量管理和邏輯建模規(guī)劃三大核心模塊。
(3)從應(yīng)用層和功能層我們可以看到HR的 大數(shù)據(jù)涉及了HR專業(yè)以外的IT系統(tǒng)、數(shù)據(jù)庫、數(shù)據(jù)分析、產(chǎn)品設(shè)計(jì)等多個(gè)專業(yè),這也意味著 僅憑專業(yè)的HR是無法搭建起HR的大數(shù)據(jù)平臺(tái)的。
以騰訊SDC的大數(shù)據(jù)團(tuán)隊(duì)為例,其成員由SSC、E-HR、區(qū)域中心的員工共同組成,是一個(gè)擁有人力資源、HR信息化、數(shù)據(jù)庫、HR咨詢復(fù)合工作經(jīng)驗(yàn)和背景的團(tuán)隊(duì)。
2在連接效能上我以騰訊正在開展的某項(xiàng)目舉例
該項(xiàng)目由COE最先提出概念,先后卷入SDC和BP,執(zhí)行迅速成立了項(xiàng)目聯(lián)合團(tuán)隊(duì)。
其中COE團(tuán)隊(duì)負(fù)責(zé)政策、資源的協(xié)調(diào)以及專業(yè)方向的把控,BP團(tuán)隊(duì)負(fù)責(zé)模型驗(yàn)證以及落地研究,SDC團(tuán)隊(duì)則負(fù)責(zé)數(shù)據(jù)清理、質(zhì)量建設(shè)、特征挖掘以及模型的搭建和訓(xùn)練。
在這個(gè)項(xiàng)目中,不僅COE、BP和SDC的人被連接起來,同時(shí)連接的還有對(duì)應(yīng)的“事”和“信息”。
3在牽引HR的方向上以騰訊社招候選人穩(wěn)定性分析為例
傳統(tǒng)的HR數(shù)據(jù)分析會(huì)圍繞離職率展開分析,而在HR的大數(shù)據(jù)分析中則是 將騰訊歷史上所有的員工按照穩(wěn)定程度分成多個(gè)樣本,通過數(shù)據(jù)的挖掘找到與穩(wěn)定性相關(guān)的典型特征,建立起能夠識(shí)別候選人穩(wěn)定性的數(shù)學(xué)模型。
其目標(biāo)之一是希望通過應(yīng)聘者的簡歷自動(dòng)對(duì)其穩(wěn)定性給出評(píng)估建議,也為后續(xù)招聘以及保留環(huán)節(jié)提供參考。
幾點(diǎn)建議給到準(zhǔn)備進(jìn)行HR大數(shù)據(jù)探索的同行們
1. 從現(xiàn)在開始,夯實(shí)數(shù)據(jù)基礎(chǔ)。
以騰訊的某個(gè)HR大數(shù)據(jù)項(xiàng)目為例,一次調(diào)用的數(shù)據(jù)就超過了600萬條,400多個(gè)字段,一般的PC機(jī)以及excel、spss等工具都無法支撐此種量級(jí)的數(shù)據(jù)挖掘,但是其量級(jí)又達(dá)不到使用TDW的程度,加上數(shù)據(jù)敏感性等諸多因素,最終發(fā)現(xiàn)需要搭建用于HR大數(shù)據(jù)分析的服務(wù)器。
2. 數(shù)據(jù)質(zhì)量決定數(shù)據(jù)的價(jià)值。
涂子沛在《大數(shù)據(jù)》一書中用了整整一個(gè)章節(jié)來闡述 數(shù)據(jù)質(zhì)量,足見數(shù)據(jù)質(zhì)量的重要性。在此我想用一句話來補(bǔ)充說明:在 一堆錯(cuò)誤的數(shù)據(jù)中,你能指望得出正確的分析結(jié)果嗎?
3. 是挖掘數(shù)據(jù)而不是統(tǒng)計(jì)數(shù)據(jù)。
僅從統(tǒng)計(jì)學(xué)的方法上看就可以看到差別,傳統(tǒng)的HR數(shù)據(jù)分析用的最多的統(tǒng)計(jì)方法就是描述統(tǒng)計(jì)、箱型圖等。
但是到了 HR的大數(shù)據(jù)分析,相關(guān)性分析、方差分析、回歸分析、聚類分析、決策樹模型等用的會(huì)更多。其原因就像維克托.邁爾-舍恩伯格在其《大數(shù)據(jù)時(shí)代》中強(qiáng)調(diào)的, 大數(shù)據(jù)研究的“不是因果關(guān)系,而是相關(guān)關(guān)系。”
對(duì)于企業(yè)的HR而言, 當(dāng)HR遇上大數(shù)據(jù),我們更應(yīng)該抓住這個(gè)機(jī)會(huì),在大數(shù)據(jù)平臺(tái)能力,連接的效能,牽引HR方向這三方面尋求突破,進(jìn)行創(chuàng)新性的研究和探索,提升HR之于企業(yè)的價(jià)值和影響力。
最后借用名言:“It was the best of times, it was the worst oftimes”,I時(shí)代帶給HR的不僅僅有挑戰(zhàn),同樣也有機(jī)會(huì)。亦如郭重慶院士所言,“管理學(xué)界應(yīng)該抓住這個(gè)機(jī)會(huì),實(shí)現(xiàn)自己的歷史使命和擔(dān)當(dāng)。”