數(shù)據(jù)人才們可以處理不確定性。不管我們打交道的數(shù)據(jù)有多“大”,它含有有限個(gè)有偏的潛在樣本。我們的模型在太簡(jiǎn)單以至于無(wú)實(shí)際意義和太復(fù)雜以至于無(wú)法置信這兩種極端情況間平衡選擇。為了能找到控制數(shù)據(jù)噪聲的方法,我們不斷嘗試模擬、測(cè)試驗(yàn)證。一個(gè)杰出的數(shù)據(jù)人才能夠?qū)λ臄?shù)據(jù)、方法以及結(jié)論保持適度的懷疑態(tài)度。
那么當(dāng)有一天數(shù)據(jù)科學(xué)家面對(duì)出現(xiàn)的全新挑戰(zhàn):評(píng)估將成為他們團(tuán)隊(duì)中一員的面試者。這個(gè)樣本空間下降的很快,實(shí)驗(yàn)方法看起來(lái)不會(huì)那么實(shí)用,面試中的偏差比我們實(shí)際工作中精心控制的數(shù)據(jù)偏差更呈現(xiàn)數(shù)量級(jí)的顯著倍增。
許多數(shù)據(jù)人才的領(lǐng)導(dǎo)者借助于下面?zhèn)鹘y(tǒng)的招聘技巧(實(shí)際上他們本不該這樣做):
在開(kāi)始建立我的新團(tuán)隊(duì)時(shí),我與許多數(shù)據(jù)科學(xué)人才溝通收集他們的想法和最佳實(shí)踐經(jīng)驗(yàn)。Riley Newman(Airbnb公司的數(shù)據(jù)科學(xué)領(lǐng)導(dǎo),他設(shè)計(jì)并實(shí)施了招聘數(shù)據(jù)人才完全不同的方法,他也是我之前溝通過(guò)幾次的這套系統(tǒng)的設(shè)計(jì)人)的想法對(duì)我的影響很大。我也從Florida項(xiàng)目中從Drew Conway身上學(xué)到了很多,他持續(xù)不斷的改進(jìn)他的數(shù)據(jù)人才招聘流程,在他著名的數(shù)據(jù)科學(xué)維恩圖上正中目標(biāo)。
在這篇文章里,我將闡釋我所采用的Riley開(kāi)發(fā)的新流程目標(biāo),描述它的潛在原則,體驗(yàn)我們開(kāi)展的實(shí)驗(yàn)。當(dāng)然,這個(gè)向?qū)щx開(kāi)發(fā)掘改善的機(jī)會(huì)同時(shí)更好的改進(jìn)流程將是不完整的。
如何開(kāi)始一場(chǎng)招聘改革?
在開(kāi)展我們的招聘流程時(shí),我們?cè)O(shè)定了以下測(cè)量目標(biāo):
準(zhǔn)確:使新聘員工成為優(yōu)秀員工的機(jī)會(huì)最大化
損失:使有好的應(yīng)聘者過(guò)早離開(kāi)招聘流程的機(jī)會(huì)最小化
成功:使聘任意向書(shū)被接受的機(jī)會(huì)最大化
努力:減少招聘團(tuán)隊(duì)注意力長(zhǎng)期分散機(jī)會(huì)。
任何有經(jīng)驗(yàn)的招聘經(jīng)理乍一看,都會(huì)覺(jué)得同時(shí)提高這四項(xiàng)目標(biāo)不現(xiàn)實(shí)。前三項(xiàng)目標(biāo)在實(shí)際上是相互矛盾(例如:應(yīng)聘者越優(yōu)秀,讓他們接受聘任意向書(shū)的困難越大)。除此之外,提高全部目標(biāo)看起來(lái)會(huì)給團(tuán)隊(duì)施加更大的前行壓力。
在傳統(tǒng)的招聘流程中,如果他們的準(zhǔn)確性高于50%,多數(shù)招聘經(jīng)理會(huì)感到幸運(yùn)。也就是說(shuō),他們所聘任的員工最終被證明優(yōu)秀的機(jī)會(huì)將不超過(guò)一半。損失則很難測(cè)量(畢竟流程中失敗的應(yīng)聘者將不會(huì)為你工作),同時(shí)多數(shù)招聘經(jīng)理?yè)?dān)心他們會(huì)時(shí)常失去優(yōu)秀人才,原因是冗長(zhǎng)并困難重重的招聘流程。
在招聘數(shù)據(jù)人才這種競(jìng)爭(zhēng)激烈的領(lǐng)域,強(qiáng)有力的應(yīng)聘者經(jīng)常會(huì)接到3個(gè)甚至更多offer,因此成功率通常低于50%。
通過(guò)設(shè)計(jì)更智能的招聘流程——提高識(shí)別優(yōu)秀應(yīng)聘者的機(jī)會(huì)同時(shí)降低失去他們的風(fēng)險(xiǎn)——可以同時(shí)提高前三項(xiàng)目標(biāo)。同時(shí),增加早期投資,團(tuán)隊(duì)當(dāng)下的努力和精力分散狀況將會(huì)得以改善。
為了保障達(dá)成我們的目標(biāo),我們?cè)O(shè)置了一系列核心原則能夠用以招聘中任何模塊。促使每個(gè)人聚焦并使其流程化的原則能夠顯著的改善整個(gè)流程。這也在你不斷重復(fù)這個(gè)流程時(shí)也成為一個(gè)健康的生態(tài)基礎(chǔ):
1、確保你的招聘流程持續(xù)完善。
招聘經(jīng)常被認(rèn)為是一個(gè)你所偶爾參與的任務(wù)或者一場(chǎng)周期性強(qiáng)消耗的閃電戰(zhàn)。相反,將你招聘流程構(gòu)架為一臺(tái)經(jīng)常運(yùn)轉(zhuǎn)的發(fā)動(dòng)機(jī),伴隨人才通過(guò)招聘漏斗不斷進(jìn)入明確的下一步。這保證你不斷招聘,無(wú)論優(yōu)秀的人才何時(shí)進(jìn)入市場(chǎng),你將都有機(jī)會(huì)參與。
投資一個(gè)常規(guī)運(yùn)轉(zhuǎn)的流程將要求你將招聘作為鐵律。這將保持協(xié)議與結(jié)果的一致性,使你能收集你成功和失敗數(shù)據(jù),促使你能夠像管理你的數(shù)據(jù)管道一樣用心的管理人才管道。
2.無(wú)情的事實(shí):標(biāo)準(zhǔn)化的面試問(wèn)題是致命的缺陷
詢問(wèn)應(yīng)聘者他們之前的經(jīng)驗(yàn),你會(huì)發(fā)現(xiàn)他們是否能夠陳述另一項(xiàng)工作發(fā)生了什么。問(wèn)他們技術(shù)性問(wèn)題,你會(huì)發(fā)現(xiàn)他們重新組織知識(shí)的能力。讓他們?cè)诎装迳辖鉀Q“玩具”一樣的問(wèn)題,你會(huì)發(fā)現(xiàn)他們能怎樣快捷的解決玩具問(wèn)題。一個(gè)能夠順利通過(guò)所有障礙的應(yīng)聘者或許在實(shí)踐中是完全無(wú)用的數(shù)據(jù)人才。
為了重視這些缺陷,你必須首先對(duì)你想要應(yīng)聘者在實(shí)際數(shù)據(jù)工作做什么有一個(gè)非常清晰的理解。最高的要求是,你應(yīng)該清楚你的團(tuán)隊(duì)?wèi)?yīng)該最終呈現(xiàn)什么樣的最終產(chǎn)品。是否它是供決策制定者可視覺(jué)呈現(xiàn)和可分析的?設(shè)計(jì)或者原型是否給予開(kāi)發(fā)者?或者實(shí)施者能夠在生產(chǎn)環(huán)境中被測(cè)量并給與支持?
接下來(lái),你應(yīng)該對(duì)你想讓成功的應(yīng)聘者做什么有一個(gè)清晰的理解。確定給一個(gè)數(shù)據(jù)人才5個(gè)解決問(wèn)題的機(jī)會(huì)。對(duì)于每一個(gè)問(wèn)題,保證你有(或者應(yīng)該有理由能收集到)所需的數(shù)據(jù),能夠呈現(xiàn)有效的結(jié)果(即使你不能親自設(shè)計(jì)它)。這些機(jī)會(huì)與你公司的近期目標(biāo),你的組織或產(chǎn)品如何可靠運(yùn)轉(zhuǎn),數(shù)據(jù)的現(xiàn)有或有理由產(chǎn)生的限制相關(guān)。
知道你的團(tuán)隊(duì)如何完成數(shù)據(jù)項(xiàng)目以及你最想讓?xiě)?yīng)聘者能夠處理什么問(wèn)題的挑戰(zhàn),你能設(shè)計(jì)一個(gè)近似反映你的工作條件的招聘流程。這意味著你應(yīng)該把應(yīng)聘者放進(jìn)一個(gè)近似代表你們天天面對(duì)的環(huán)境。如果他們能夠成功的在面試過(guò)程中適應(yīng)環(huán)境,那么他們長(zhǎng)期成功的機(jī)會(huì)將大大增強(qiáng)。
3、有潛力成為最優(yōu)表現(xiàn)者的應(yīng)聘者可能會(huì)在傳統(tǒng)面試流程中失利
元兇是面試官的偏見(jiàn)。一旦你進(jìn)入應(yīng)聘者的面試房間,你就開(kāi)始形成對(duì)他們能力的判定(很可能是無(wú)意識(shí)產(chǎn)生的)。有很多種這樣的偏見(jiàn)(這里可查詢100多種認(rèn)知偏見(jiàn)),但最常見(jiàn)的偏見(jiàn)是偏好那些與我們自己相似的人。
優(yōu)秀的數(shù)據(jù)人才必須具備強(qiáng)大的數(shù)理及編程能力。這一點(diǎn)不折不扣。因此我們首先設(shè)計(jì)流程來(lái)測(cè)試這方面,接下來(lái)輪到問(wèn)題解決和溝通能力等更主觀的能力(仍可被測(cè)量)。
越到最后階段,主觀原則越多,評(píng)估最耗時(shí),也最容易產(chǎn)生評(píng)估偏差。使優(yōu)秀的應(yīng)聘者能夠在招聘流程漏斗的后部繼續(xù)將要平衡減少團(tuán)隊(duì)工作量的益處和降低過(guò)早損失一個(gè)優(yōu)秀應(yīng)聘者的風(fēng)險(xiǎn)。
大多數(shù)面試流程在向高水準(zhǔn)應(yīng)聘者的應(yīng)用中是失敗的。面試最好的情況是充滿壓力,而最差時(shí)單調(diào)苦悶。應(yīng)聘者經(jīng)常被迫向4個(gè)或更多面試官重復(fù)他們的故事并不斷回答他們的問(wèn)題。之后當(dāng)他們可以問(wèn)幾個(gè)自己的問(wèn)題時(shí),他們會(huì)經(jīng)常盡量設(shè)想自己在公司工作的樣子。接下來(lái)他們會(huì)為少有真誠(chéng)的面試結(jié)果而等待很長(zhǎng)時(shí)間。你將如何處理這種支離破碎的狀態(tài)。
創(chuàng)造一個(gè)你能給予應(yīng)聘者數(shù)據(jù)以及能夠反映他們將在你的組織中面對(duì)實(shí)際挑戰(zhàn)的問(wèn)題的流程。在此之上,確保你的招聘流程與你團(tuán)隊(duì)的實(shí)際動(dòng)態(tài)和文化相符,以使應(yīng)聘者能夠獲得很多與實(shí)際工作相同的體驗(yàn)。每一位應(yīng)聘者應(yīng)該帶著加入你的團(tuán)隊(duì)可獲取的信任感完成整個(gè)面試流程。
不管如何招聘,每一位招聘經(jīng)理都不得不面對(duì)艱難的抉擇。建立對(duì)招聘漏斗每一階段應(yīng)聘者的清晰的評(píng)估框架,并依據(jù)此自信決策。這包括定義團(tuán)隊(duì)所共識(shí)的目標(biāo)和測(cè)量。
同時(shí),與團(tuán)隊(duì)一起開(kāi)放的決策。這保證招聘經(jīng)理能夠從參與招聘流程的每一個(gè)人那得到對(duì)于應(yīng)聘者的直接反饋。更重要的是,這確保你們?cè)趯で笸毁|(zhì)量標(biāo)準(zhǔn)。開(kāi)放的討論幫助你不斷改進(jìn)招聘要求和策略。
最后,在評(píng)估應(yīng)聘者時(shí)引入跨領(lǐng)域的招聘伙伴。數(shù)據(jù)科學(xué)領(lǐng)域從不是真空中工作。你將與決策者、工程師、產(chǎn)品經(jīng)理合作。引入這些領(lǐng)域的關(guān)鍵招聘伙伴能夠使你所挑選的人才能夠跨越組織各部門(mén)。
優(yōu)秀數(shù)據(jù)人才的招聘市場(chǎng)競(jìng)爭(zhēng)激烈,因此你的流程應(yīng)該確保你能夠快速在招聘漏斗中前行,保持高動(dòng)能,降低他們接受競(jìng)爭(zhēng)者offer的機(jī)會(huì)。快速的招聘需要有流線型的流程設(shè)計(jì)以確保速度與置信。投資能夠追蹤應(yīng)聘者在招聘漏斗中每一階段多長(zhǎng)時(shí)間的工具和后勤設(shè)施并快速到位的優(yōu)化你的招聘系統(tǒng)將會(huì)為你贏得競(jìng)爭(zhēng)優(yōu)勢(shì)。
在電影《模仿游戲》中,Alan Turing的管理技能使英國(guó)對(duì)德國(guó)編碼設(shè)備的反情報(bào)破解工作幾近破產(chǎn)。當(dāng)他意識(shí)到他需要幫助時(shí),他已經(jīng)在Bletchley公園孤立無(wú)援。無(wú)論如何,千鈞一發(fā)時(shí)這個(gè)知名計(jì)算機(jī)科學(xué)家的優(yōu)秀品質(zhì)幫助他嘗試另辟蹊徑招募新的團(tuán)隊(duì)成員。
為了打造他的團(tuán)隊(duì),Turing通過(guò)發(fā)布在《倫敦每日電訊報(bào)》一個(gè)猜字游戲來(lái)尋找新的人才,邀請(qǐng)那些12分鐘之內(nèi)完成該游戲的應(yīng)聘者申請(qǐng)神秘職位。成功的應(yīng)聘者被召集在一個(gè)房間里在可控的環(huán)境下限定時(shí)間內(nèi)挑戰(zhàn)他們的數(shù)學(xué)和問(wèn)題解決能力。Turing最終給大約30個(gè)應(yīng)聘者其中表現(xiàn)最好的2人發(fā)放了offer。
從這個(gè)案例中可以學(xué)習(xí)到很多東西。
這樣的流程確保Turing最大可能的向現(xiàn)有人才廣撒大網(wǎng),用挑戰(zhàn)性問(wèn)題和工作機(jī)會(huì)吸引他們,然后在可控的環(huán)境下驗(yàn)證他們的技能。 影片中的一個(gè)虛構(gòu)環(huán)節(jié),Turing招募了一個(gè)叫Joan Clarke的女應(yīng)聘者,她成為了非常緊密的一名合作者。Joan是一個(gè)難得的天才,但是如果不是Turing采取了科學(xué)的招聘方法,而是存在一定的偏見(jiàn),Joan幾乎可以確定從密碼破解團(tuán)隊(duì)的角色中被忽略掉。
就像電影《模仿游戲》,我們將應(yīng)聘者放進(jìn)一系列可以模擬他們工作環(huán)境以及容易評(píng)價(jià)他們?cè)谄溉魏竽芊駝偃喂ぷ魉邆涞膯?wèn)題解決能力的體驗(yàn)環(huán)節(jié)。令人驚訝的是,通過(guò)正確的規(guī)劃和前期投入,這種方法比傳統(tǒng)的面試更加有效率,節(jié)省你的團(tuán)隊(duì)時(shí)間。面試流程在高的水準(zhǔn)要求下包含兩個(gè)關(guān)鍵要素:
開(kāi)放答卷:一種測(cè)試應(yīng)聘者解決一系列逐漸增加難度問(wèn)題的簡(jiǎn)短練習(xí)
數(shù)據(jù)工作日:需要在團(tuán)隊(duì)中針對(duì)一個(gè)或更多開(kāi)發(fā)性問(wèn)題工作一整天時(shí)間,用一個(gè)他們整體的工作報(bào)告向面試團(tuán)隊(duì)做總結(jié)。
我們將這個(gè)流程作為招聘流程漏斗。在500個(gè)進(jìn)入的申請(qǐng)者中,250人(50%)提交了開(kāi)放答卷,25人(10%)通過(guò)了測(cè)試,20人(80%)參與了數(shù)據(jù)工作日,4個(gè)人(20%)將會(huì)通過(guò)測(cè)試,
最終3個(gè)人(75%)接受了offer 。這意味著每發(fā)現(xiàn)一名優(yōu)秀的雇員,我們需要超過(guò)150名申請(qǐng)者。
提升的關(guān)鍵幾個(gè)環(huán)境是(A)漏斗中申請(qǐng)者的質(zhì)量,(B)申請(qǐng)開(kāi)放答卷和數(shù)據(jù)工作日的成功率,(C)開(kāi)放答卷和數(shù)據(jù)工作日的準(zhǔn)確率。通過(guò)跟蹤你在漏斗中應(yīng)聘者以及檢測(cè)每個(gè)階段的損失率(如:他們從哪里來(lái)),你能確定成績(jī)較好和較差的測(cè)試環(huán)節(jié)。
給定我們四個(gè)直接目標(biāo)——準(zhǔn)確率(聘任優(yōu)秀的人才)和成功率(確保他們接受offer)最大化,同時(shí)降低損失(應(yīng)聘者過(guò)早放棄)和團(tuán)隊(duì)時(shí)間精力損耗(團(tuán)隊(duì)的長(zhǎng)期時(shí)間精力損耗)——我們投入大量的時(shí)間來(lái)設(shè)計(jì)一個(gè)數(shù)據(jù)驅(qū)動(dòng)并且有吸引力的清晰高效的流程。
這個(gè)流程包含如下6個(gè)階段,從簡(jiǎn)單客觀逐漸過(guò)渡到復(fù)雜主觀:
前期核查:診斷脈搏
開(kāi)放答卷:測(cè)試各項(xiàng)技能
銷(xiāo)售宣傳:確保他們能參加數(shù)據(jù)工作日
數(shù)據(jù)工作日:在現(xiàn)實(shí)、可控的環(huán)境中測(cè)試能力并評(píng)估文化
決策:進(jìn)行快速?zèng)Q定性決策
溝通:跟進(jìn)每一個(gè)數(shù)據(jù)工作日應(yīng)聘者
讓我們看看每個(gè)階段更深入更策略的分析。
前期檢查
值得說(shuō)明的是,我們不用提前篩查數(shù)據(jù)應(yīng)聘者。我們不必核查他們的簡(jiǎn)歷或者探討他們的經(jīng)驗(yàn)或認(rèn)證。如果他們有興趣(并且有email地址),我們給他們開(kāi)放答卷測(cè)試。這是我們版本的《模仿游戲》字謎,這節(jié)省了大量的時(shí)間和精力去更快速服務(wù)更有希望的應(yīng)聘者。
但是不進(jìn)行核查的最重要的原因是它將會(huì)移除大量初始的偏見(jiàn)來(lái)源。很多非常有才智的應(yīng)聘者沒(méi)有招聘者所期待的教育和經(jīng)驗(yàn)信息。這不僅僅意味著你將失去優(yōu)秀的應(yīng)聘者,同時(shí)也讓你更加激進(jìn)的去尋找少數(shù)文案測(cè)試表現(xiàn)好的應(yīng)聘者名單——每一個(gè)其他應(yīng)聘者都想成為名單中的人。
開(kāi)放答卷
開(kāi)放答卷是極其重要的。這是過(guò)濾應(yīng)聘者的第一道保障線,因大量的潛在申請(qǐng)從而需要你的團(tuán)隊(duì)大量工作。這也是應(yīng)聘者第一次能了解你的團(tuán)隊(duì)工作的機(jī)會(huì)。這個(gè)階段不僅是一道阻攔在不合適的應(yīng)聘者上浪費(fèi)過(guò)多時(shí)間的屏障,同時(shí)也是向匹配角色的應(yīng)聘者極其重要的宣傳窗口。因此,當(dāng)你通過(guò)招聘漏斗收集了應(yīng)聘者成績(jī)和興趣數(shù)據(jù)時(shí),你應(yīng)該不斷的優(yōu)化該流程步驟。
有效的開(kāi)放答卷應(yīng)該具備如下的特征:
可自我解釋——你想減少應(yīng)聘者有問(wèn)題詢問(wèn)或者需要說(shuō)明的機(jī)會(huì)
時(shí)間限制——對(duì)于有技能的應(yīng)聘者完成應(yīng)該花費(fèi)不超過(guò)2個(gè)小時(shí)
分散脫敏——分布應(yīng)該寬泛,不包括任何財(cái)產(chǎn)性或敏感性數(shù)據(jù)
相關(guān)性——與你實(shí)際工作中面臨的挑戰(zhàn)問(wèn)題匹配
直接——清晰準(zhǔn)確的表明你想通過(guò)測(cè)試考察的答案,你想怎樣評(píng)估應(yīng)聘者的業(yè)績(jī)
循序漸進(jìn)——逐步提升所問(wèn)問(wèn)題的難度,以便于簡(jiǎn)單的辨認(rèn)應(yīng)聘者的實(shí)際技能水平。
設(shè)計(jì)開(kāi)放答卷測(cè)試,首先從你數(shù)據(jù)團(tuán)隊(duì)中現(xiàn)存的重要問(wèn)題開(kāi)始著手。在這些問(wèn)題中,你可以從(A)擁有或者可以編纂出好的數(shù)據(jù),(B)對(duì)于應(yīng)聘者樂(lè)于解決,(C)能夠被簡(jiǎn)化(大概粗略)成2個(gè)小時(shí)內(nèi)被優(yōu)秀的應(yīng)聘者解答的問(wèn)題,中挑出一個(gè)或者兩個(gè)。
當(dāng)你收窄了問(wèn)題的范圍后,編纂開(kāi)放答卷中問(wèn)題答案數(shù)據(jù)。理想情況下,這些數(shù)據(jù)來(lái)源于你的生產(chǎn)環(huán)境并足夠清晰,進(jìn)行過(guò)修改或者加工匯總的,以至于當(dāng)它落入任何人手中也不造成公司損失(假設(shè)數(shù)據(jù)最終將會(huì)這樣)。
替代方法是你能構(gòu)造完全的虛假數(shù)據(jù),但是要謹(jǐn)慎對(duì)待一些因數(shù)據(jù)不連續(xù)或者異常點(diǎn)引發(fā)的很多數(shù)據(jù)處理難題。我建議提供一百萬(wàn)行數(shù)據(jù)(可能涉及多個(gè)文檔)——足以對(duì)代碼成效引起關(guān)注也不至于成為負(fù)擔(dān)。
一旦你配備了數(shù)據(jù),創(chuàng)造2-3個(gè)非常清晰的,由易到難依次排列,并且具有確定性可測(cè)量答案的問(wèn)題。確保你的問(wèn)題不僅能測(cè)試應(yīng)聘者的數(shù)據(jù)處理能力,同時(shí)也能測(cè)試他們的邏輯分析能力和模型解釋能力。
給出了配備的數(shù)據(jù)、選擇的問(wèn)題和撰寫(xiě)的指導(dǎo)文檔。應(yīng)該有一份簡(jiǎn)短易懂的文檔來(lái)描述所提供的數(shù)據(jù)并包含最終的問(wèn)題;同時(shí)你應(yīng)該指出應(yīng)聘者應(yīng)該用多長(zhǎng)時(shí)間,不是強(qiáng)加給他們時(shí)間限制,而是暗示你評(píng)估需用多長(zhǎng)時(shí)間,以便他們不會(huì)花費(fèi)幾天時(shí)間在一個(gè)本應(yīng)該花費(fèi)幾個(gè)小時(shí)時(shí)間的問(wèn)題上。
更重要的是,包括一個(gè)如何期待應(yīng)聘者回答問(wèn)題的部分。你希望他們使用什么工具?你希望他們提交什么樣的答案結(jié)果?代碼的質(zhì)量方面你有何期待?可視化或者解釋是否對(duì)你重要?認(rèn)真對(duì)待這些問(wèn)題。這是你推薦你和你的組織的關(guān)鍵機(jī)會(huì)。
接下來(lái),讓你其他的團(tuán)隊(duì)成員或者社區(qū)朋友們測(cè)試開(kāi)放答卷。通過(guò)這些讓你的答卷標(biāo)準(zhǔn)化,確保對(duì)你的判斷答案有反饋。你所要做的最后事情是避免給應(yīng)聘者問(wèn)題混淆。
銷(xiāo)售宣傳
當(dāng)應(yīng)聘者通過(guò)開(kāi)放答卷測(cè)試,你的下一個(gè)挑戰(zhàn)是確認(rèn)他們能參加你的“數(shù)據(jù)工作日”面試。多數(shù)人會(huì)以為在你的辦公室的進(jìn)行不超過(guò)4個(gè)小時(shí)的傳統(tǒng)面試——當(dāng)然不會(huì)是一整天。讓他們相信值得花費(fèi)一整天在你這里是必要的。
銷(xiāo)售宣傳的關(guān)鍵部分是你如何與應(yīng)聘者聯(lián)系,你如何表述你將呈現(xiàn)的令人興奮的機(jī)會(huì),你如何描述并準(zhǔn)備“數(shù)據(jù)工作日”。這些應(yīng)該指向建立他們的興趣和熱情——這不是你評(píng)價(jià)他們的時(shí)候。
每一個(gè)應(yīng)聘者會(huì)被不同的因素所激發(fā)興趣,因此對(duì)于你來(lái)講認(rèn)真傾聽(tīng)并與他們直接談?wù)撍麄冊(cè)谝獾脑掝}變得尤為關(guān)鍵。根據(jù)我的經(jīng)驗(yàn),我發(fā)現(xiàn)如下的關(guān)鍵因素:
產(chǎn)品與公司的總體潛力
數(shù)據(jù)工作是如何開(kāi)展的?哪里報(bào)告的?對(duì)日后有什么影響?
不久的未來(lái)數(shù)據(jù)工作的主要挑戰(zhàn)或機(jī)會(huì)是什么?
數(shù)據(jù)工作如何跨部門(mén)與其他團(tuán)隊(duì)配合?
所需數(shù)據(jù)的未來(lái)的范圍、大小與質(zhì)量,未來(lái)可收集的機(jī)會(huì)
團(tuán)隊(duì)如何管理他們的工作并協(xié)調(diào)不同優(yōu)先事項(xiàng)與決定。
團(tuán)隊(duì)要用到什么特定的工具與技術(shù)。
最終你會(huì)發(fā)現(xiàn)那些不愿或不能參加“數(shù)據(jù)工作日”的應(yīng)聘者。或者這意味著你將失去一些應(yīng)聘者,但也不得不承擔(dān)這個(gè)風(fēng)險(xiǎn)。“數(shù)據(jù)工作日”會(huì)成為你評(píng)估所有應(yīng)聘者的良好標(biāo)準(zhǔn)。
“數(shù)據(jù)工作日”
“數(shù)據(jù)工作日”是整個(gè)招聘流程的核心部分。它把對(duì)應(yīng)聘者最終的技術(shù)、策略和技能評(píng)估以及對(duì)他/她在工作日中對(duì)于團(tuán)隊(duì)和公司的文化體驗(yàn)的適應(yīng)性匯集在一起。有了充足的準(zhǔn)備,完成這些并不比你的團(tuán)隊(duì)開(kāi)展傳統(tǒng)面試多需多少時(shí)間。
這些準(zhǔn)備清單包括:
介紹:言簡(jiǎn)意賅的描述工作日挑戰(zhàn)任務(wù)、數(shù)據(jù)和評(píng)估原則、應(yīng)聘者成功所需指導(dǎo)的其他事項(xiàng)等介紹文檔。
數(shù)據(jù):豐富的被抓取的生產(chǎn)數(shù)據(jù)可以挑戰(zhàn)并激發(fā)你的應(yīng)聘者。優(yōu)秀的數(shù)據(jù)人員應(yīng)該能不知疲倦的在數(shù)據(jù)中工作長(zhǎng)達(dá)一周時(shí)間。
筆記本電腦:嶄新性能良好的筆記本電腦將會(huì)和他們未來(lái)實(shí)際工作使用和處理數(shù)據(jù)所需的預(yù)備工具相同。
籌備是成功的數(shù)據(jù)工作日的關(guān)鍵。確保應(yīng)聘者有激發(fā)他們更有產(chǎn)能的環(huán)境,可以最大限度地提高他們達(dá)成出色工作的時(shí)間。
準(zhǔn)備介紹:
當(dāng)應(yīng)聘者來(lái)到他們的“數(shù)據(jù)工作日”現(xiàn)場(chǎng),你該做的第一件事是給他們提供一份打印的系列指南。其中的部分包括(盡可能的詳細(xì)):
簡(jiǎn)介——一封歡迎信和對(duì)“數(shù)據(jù)工作日”的日程及任務(wù)介紹
免責(zé)聲明(或許是保密協(xié)議)——向你的法務(wù)部門(mén)咨詢是否需要免責(zé)聲明
目標(biāo)——工作任務(wù)的總體精要概況和你所期望成功的“數(shù)據(jù)工作日”應(yīng)得到的成果
建議的時(shí)限——你預(yù)期應(yīng)聘者需要多長(zhǎng)的時(shí)間。讓他們了解自己最大的挑戰(zhàn)是時(shí)間的限制。
數(shù)據(jù)——你所提供的數(shù)據(jù)的一個(gè)寬泛的描述,足以給下面章節(jié)的一些背景信息。
主題——4個(gè)或5個(gè)精簡(jiǎn)的主體列表。
評(píng)價(jià)——你想從成功的應(yīng)聘者中得到什么
技術(shù)安裝——筆記本電腦提供的簡(jiǎn)要的工具解釋。
數(shù)據(jù)信息——
所提供數(shù)據(jù)的更全面詳盡的描述。每一個(gè)文檔,作為一個(gè)整體的內(nèi)容描述,每一個(gè)包含的領(lǐng)域,和數(shù)據(jù)集的大小(行或觀測(cè)值的數(shù)量)。
最重要的事情是選擇研究主題。主題應(yīng)該盡量差異化以便不同背景的應(yīng)聘者能夠找到他們自己感興趣同時(shí)也是可進(jìn)行的主題。同時(shí),確保這些主題聚焦在對(duì)于你工作有價(jià)值的實(shí)際應(yīng)用上。這樣既可以確保你所需要測(cè)試的技能,同時(shí)也能給應(yīng)聘者關(guān)于你們團(tuán)隊(duì)工作更加真實(shí)的感觸。
最后,研究主題應(yīng)該只是作為建議。我更愿意給與應(yīng)聘者自由發(fā)揮的空間。最重要的是在結(jié)束時(shí)他們能夠?qū)ψ约核龅挠幸饬x的分析和記錄感到自信。
記住,如果你的說(shuō)明清晰切中要點(diǎn)的話,應(yīng)聘者將花費(fèi)更少的時(shí)間回答問(wèn)題。
筆記本電腦
向應(yīng)聘者提供一臺(tái)在可查詢的路徑下預(yù)裝了說(shuō)明、數(shù)據(jù)和軟件的筆記本電腦。我們使用蘋(píng)果的MacBook Pro(所有的數(shù)據(jù)科學(xué)家和工程師使用Mac或者Linux工作),我們安裝了如下軟件:
HomeBrew
Anaconda(Python distribution)
R
RStudio
EmacsandVim
Java 7
Eclipse
在HomeBrew的幫助下,數(shù)據(jù)人員能很快安裝其他需要的軟件。同時(shí),我們把.CSV的數(shù)據(jù)文檔放進(jìn)他們的根目錄下。我們建議應(yīng)聘者使用開(kāi)源的編輯語(yǔ)言(如Python,R或者Julia)提交他們的開(kāi)放問(wèn)卷以便每個(gè)人都習(xí)慣使用它。
時(shí)間表:
在公司一個(gè)典型的數(shù)據(jù)工作日是這樣的:
上午10:00—簽到
應(yīng)聘者簽到,受到我們招聘團(tuán)隊(duì)的歡迎,并參觀指定地點(diǎn)
上午10:05—搭檔
應(yīng)聘者的搭檔(指定的數(shù)據(jù)科學(xué)團(tuán)隊(duì)成員)帶應(yīng)聘者喝咖啡并帶他/她參觀辦公室。
上午10:15—培訓(xùn)
數(shù)據(jù)工作日拍檔給候選用筆記本和簡(jiǎn)要說(shuō)明向應(yīng)聘者在哪里可以找到數(shù)據(jù)
上午10:20—指導(dǎo)
應(yīng)聘者坐下來(lái)閱讀行動(dòng)指南檢查數(shù)據(jù),并決定選擇一個(gè)研究方向
上午11:30—籌備會(huì)
應(yīng)聘者認(rèn)真聽(tīng)取團(tuán)隊(duì)籌備會(huì),了解他或她的工作內(nèi)容,并陳述他或她的研究方向是什么。
上午12:30—午飯
一些拍檔帶著應(yīng)聘者去吃飯,過(guò)程中了解更多關(guān)于他/她的背景和性格,并讓?xiě)?yīng)聘者問(wèn)一些問(wèn)題。
如果需要問(wèn)問(wèn)題:
應(yīng)聘者可能會(huì)問(wèn)團(tuán)隊(duì)中任何成員數(shù)據(jù)、技術(shù)或背景相關(guān)的問(wèn)題,但往往從他們的拍檔開(kāi)始(如果可行的話)。
下午4:30—提醒
我們提醒應(yīng)聘者,他/她將在5:30提交結(jié)果,并鼓勵(lì)他們開(kāi)始準(zhǔn)備他們的演示。
下午5:30—結(jié)果呈現(xiàn)
應(yīng)聘者用20分鐘呈現(xiàn)他/她一天中所發(fā)現(xiàn)的內(nèi)容,然后是10分鐘的團(tuán)隊(duì)及其他與會(huì)者的問(wèn)答環(huán)節(jié)。
下午6:00—反饋
我們要求應(yīng)聘者給我們對(duì)他/她的體驗(yàn)反饋,然后搭檔或招聘人員引導(dǎo)應(yīng)聘者暫時(shí)離開(kāi)并約定期望溝通最終結(jié)果的時(shí)間。
下午6:15—決策
總體而言,從招聘團(tuán)隊(duì)給出的時(shí)限是很合理的。拍檔在早上花15分鐘時(shí)間,也許下午再花15分鐘回答應(yīng)聘者問(wèn)題?;I備會(huì)和午餐會(huì)不可精簡(jiǎn)。演講和問(wèn)答一組五人需30分鐘,然后通常再需要15分鐘做決策??偟膩?lái)說(shuō),團(tuán)隊(duì)花費(fèi)超過(guò)4人小時(shí)和應(yīng)聘者在一起,不會(huì)比花在傳統(tǒng)面試上的實(shí)際多。
到目前為止,從文化匹配視角看當(dāng)天最深刻的部分應(yīng)該是午餐時(shí)間,你可以看到應(yīng)聘者在一個(gè)非正式的社會(huì)場(chǎng)合的行為表現(xiàn)。從技術(shù)角度來(lái)看,這一天最深刻的部分是成果呈現(xiàn)后的問(wèn)答環(huán)節(jié),我們?yōu)榱蓑?yàn)證應(yīng)聘者方法的嚴(yán)謹(jǐn)性并確定他們?nèi)绾螒?yīng)對(duì)我們的團(tuán)隊(duì)中很常見(jiàn)的激烈的技術(shù)或分析辯論,會(huì)想盡辦法去提出探索性和挑戰(zhàn)性問(wèn)題。
4. 決策
我們基于如下的維度評(píng)估應(yīng)聘者。
a.問(wèn)題分析結(jié)構(gòu)
如何進(jìn)行問(wèn)題的解構(gòu)分析,有什么假設(shè)條件,如何限定研究范圍?
b.技術(shù)嚴(yán)謹(jǐn)性
你所代碼編寫(xiě)的代碼在完成任務(wù)方面可靠性、可讀性和靈活性如何?方法的可擴(kuò)展性如何?
c. 分析的嚴(yán)謹(jǐn)性
你所運(yùn)用的方法(機(jī)器學(xué)習(xí),統(tǒng)計(jì),分析,可視化)的邏輯是否通順完整有意義?
d. 可溝通
你將如何清除的表述你的工作,方法和結(jié)論?你問(wèn)他的答案有效性怎樣?
e. 有用性
如果生產(chǎn)過(guò)程有意義,這些結(jié)果在你的工作中是否有用?
我們?cè)跀?shù)據(jù)工作日包括了這些指導(dǎo)原則,應(yīng)聘者知道后就更容易成功。
在應(yīng)聘者完成他們的演講和問(wèn)答后,他們的拍檔出現(xiàn)在辦公室。然后我們立即開(kāi)始討論應(yīng)聘者,盡管大家的印象都是陌生的。我們給每位參與者一個(gè)機(jī)會(huì)來(lái)分享對(duì)上述標(biāo)準(zhǔn)的反饋(如果他們有意見(jiàn)),從我們團(tuán)隊(duì)以外的人先開(kāi)始。我們團(tuán)隊(duì)成員中經(jīng)驗(yàn)最少的人先說(shuō),最有經(jīng)驗(yàn)后說(shuō)。這會(huì)有助于事先防止房間里其他人的意見(jiàn)受團(tuán)隊(duì)或領(lǐng)導(dǎo)人的偏見(jiàn)影響。
一般來(lái)說(shuō),如果任何面試官對(duì)應(yīng)聘者是一種強(qiáng)烈的“拒絕”態(tài)度時(shí),這是足夠的理由來(lái)拒絕應(yīng)聘者。
因?yàn)榧夹g(shù)原因(開(kāi)放答卷應(yīng)使大多數(shù)考生完全符合產(chǎn)出要求)這種情況很少發(fā)生。但當(dāng)它發(fā)生時(shí),你應(yīng)該認(rèn)真地重新評(píng)估你的測(cè)試以確保它的有效篩選應(yīng)聘者。
如果每個(gè)人都對(duì)應(yīng)聘者不冷不熱,這也是一個(gè)明顯的“拒絕”。這通常是因?yàn)榫窒抻谒麄兊墓ぷ飨拗?mdash;—他們工作完成情況,他們思維的嚴(yán)謹(jǐn)性,或他們的技術(shù)實(shí)施情況。如果僵局存在,那么要么團(tuán)隊(duì)的領(lǐng)導(dǎo)者應(yīng)該做出最后的決定(判定是否是錯(cuò)誤的拒絕),或者在更少數(shù)情況下,你可能需要邀請(qǐng)應(yīng)聘者回去進(jìn)一步討論。
5. 溝通
這個(gè)流程的最后階段是向應(yīng)聘者溝通結(jié)果。那些開(kāi)放答卷測(cè)試中失利的人從會(huì)我們的招聘者那里獲知信息。我們都希望給每位申請(qǐng)者直接的反饋,但鑒于申請(qǐng)者的數(shù)量規(guī)模不甚可行。
可以說(shuō),數(shù)據(jù)團(tuán)隊(duì)的成員被參加數(shù)據(jù)工作日后沒(méi)有收到offer的每一位應(yīng)聘者跟隨著。這確保這些應(yīng)聘者收到建設(shè)性的反饋從而可以從經(jīng)驗(yàn)中學(xué)習(xí)更多。
最終,我們因每天大量的數(shù)據(jù)工作日應(yīng)聘者而感到興奮,同時(shí)也要尊重他們的時(shí)間并保持聯(lián)系的情況下以期我們會(huì)再見(jiàn)。數(shù)據(jù)科學(xué)領(lǐng)域是一個(gè)小社群。
挑戰(zhàn)與未來(lái)的機(jī)遇
招聘優(yōu)秀的數(shù)據(jù)科學(xué)家是很難的事情,而我相信,這個(gè)流程公司的招聘中已經(jīng)產(chǎn)生了非常積極的影響,我也相信我們有更多需要學(xué)習(xí)的地方。這就是我們繼續(xù)拼搏的意義。
我們的招聘流程中可能會(huì)產(chǎn)生太多的錯(cuò)誤,即非常適合數(shù)據(jù)科學(xué)工作的應(yīng)聘者沒(méi)有收到offer。最大的錯(cuò)誤來(lái)源可能發(fā)生在開(kāi)放答卷階段,考生可能不愿意花時(shí)間來(lái)完成測(cè)試。對(duì)優(yōu)秀人才來(lái)講使測(cè)試更容易完成并提高我們?cè)谏鐓^(qū)組織的品牌都是我們可以采取的步驟。最終,這是一個(gè)通道的優(yōu)化問(wèn)題,問(wèn)題的根源是它會(huì)降低你能招聘到最優(yōu)秀的人才的能力。
淘汰那些在數(shù)據(jù)工作日積極拼搏的優(yōu)秀應(yīng)聘者遠(yuǎn)不是我們的初衷,這些應(yīng)聘者投資了我們,而我們已經(jīng)投資了他們。發(fā)生這種情況有幾個(gè)原因,但最常見(jiàn)的是數(shù)據(jù)工作日是一個(gè)高壓力的環(huán)境。應(yīng)聘者必須在短短的8個(gè)小時(shí)內(nèi)了解一個(gè)新的數(shù)據(jù)集,謀劃解題框架,制定解決方案和進(jìn)行結(jié)果呈現(xiàn)。
有些應(yīng)聘者在這種壓力下脫穎而出,而另一些被迫屈從,并不能向我們證明他們通常能夠做到的。不幸的是,我們無(wú)法在我們的決策中考慮這一點(diǎn),因?yàn)檫@無(wú)法將其與無(wú)能或低效區(qū)分開(kāi)來(lái),兩者都是我們積極反對(duì)的。
應(yīng)聘者在數(shù)據(jù)工作日不能勝出的另一個(gè)原因是他們不熟悉工具。他們可能對(duì)專(zhuān)有的或商業(yè)的工具或者另一個(gè)操作系統(tǒng)有更多的經(jīng)驗(yàn)。這可以通過(guò)提供更多的商業(yè)軟件許可證和在虛擬機(jī)上提供Windows使用來(lái)緩解問(wèn)題。這些選項(xiàng)會(huì)花銷(xiāo)大量現(xiàn)金和運(yùn)營(yíng)成本。同時(shí),對(duì)Linux操作環(huán)境和開(kāi)源工具是我們強(qiáng)烈認(rèn)為必須的。
最后不要再擔(dān)心招聘優(yōu)秀的科學(xué)人才了。
原文叫How to Consistently Hire Remarkable Data Scientists
End.