提供洞察和分析的公司都在盡力為自己組建完美的數(shù)據(jù)科學(xué)團(tuán)隊,這通常有兩條路可以走。
大部分公司都在掙扎中選擇了第一條路:尋找這些工資非常貴又很少見的獨角獸人才,即同時具備這多種技能的獨立個體。
完美的數(shù)據(jù)科學(xué)家完美地掌握了數(shù)學(xué)、統(tǒng)計學(xué)、編程以及溝通技術(shù)。這些人不光具備完成復(fù)雜工作的專業(yè)技術(shù)能力,還能夠向非技術(shù)人員解釋這些技術(shù)工作可能會帶來的影響。
除了這些數(shù)據(jù)科學(xué)家會很昂貴的事實之外,這些天才科學(xué)家一周7天,每天24小時連軸工作也是不太可能的。
當(dāng)然這不是唯一的一條路。
人類史上最早的科學(xué)家之一亞里士多德曾經(jīng)說過:“整體大于它的各部分之和”,這給了我們一些啟發(fā)。與其尋找這些很受歡迎的同時具備三方面技能的人,還不如挑選分別具備其中一項技能的人來組成一個團(tuán)隊。畢竟,沒有一個人能夠永遠(yuǎn)解決組織不斷增長的對數(shù)據(jù)科學(xué)研究的需求。它需要一個數(shù)學(xué)家來負(fù)責(zé)深入鉆研,還需要一個具備交叉學(xué)科知識的人來進(jìn)行橫向整合,最終組成一個完美的團(tuán)隊。
數(shù)據(jù)科學(xué)團(tuán)隊的活力
任何一個數(shù)據(jù)科學(xué)團(tuán)隊的終極目標(biāo)就是要成為一個解決問題的機(jī)器,一個能在不斷變化的環(huán)境中不斷攪動出價值的團(tuán)隊。越來越豐富的數(shù)據(jù)給曾經(jīng)無法回答的業(yè)務(wù)問題提供了可能,這就給客戶對洞察復(fù)雜性的期待提升到了一個新的高度。但隨著這一套連鎖反應(yīng)而來的卻是沒有成熟方法論和解決方案的問題。隨著輸入越來越多樣化,所需要的匹配的技能同樣需要變得多樣化。“酷呆瓜”團(tuán)隊的三個特點沒有一個是可以缺失的,因此這個團(tuán)隊的集體智慧才真正是當(dāng)今數(shù)據(jù)世界的驅(qū)動力。
顯然,完美數(shù)據(jù)科學(xué)家團(tuán)隊中的任意兩塊都無法獨立于第三塊運作。而且,挖掘并保持?jǐn)?shù)據(jù)科學(xué)家團(tuán)隊的內(nèi)部平衡才能帶來最大程度的準(zhǔn)確性和相關(guān)性。
數(shù)學(xué)家/統(tǒng)計學(xué)家
這些受過訓(xùn)練的學(xué)者在理解了相關(guān)理論以及結(jié)果所需要的條件后,基于這些輸入構(gòu)建起先進(jìn)的模型。
程序員
這位親自操刀的架構(gòu)師負(fù)責(zé)清洗、管理以及修整數(shù)據(jù),以及建造模擬器或其他高科技工具來使數(shù)據(jù)變得更加方便易用。
溝通者/內(nèi)容專家
將技術(shù)翻譯為業(yè)務(wù)的專家利用自己的全局觀,基于過去的知識幫助尋找技術(shù)與用戶需求的連接點。
這些技能的互相支持才使得團(tuán)隊變得完整,并具備完美的數(shù)據(jù)交付能力:
數(shù)學(xué)家/統(tǒng)計學(xué)家的工作嚴(yán)重依賴于程序員。“垃圾進(jìn)入垃圾出去”的概念在這里非常適用,也就是說如果程序員沒有清晰地獲取數(shù)據(jù)、管理數(shù)據(jù),那么科學(xué)家很難構(gòu)建出有用的模型。此外,數(shù)學(xué)家和程序員又依賴于溝通者的知識。即便數(shù)據(jù)是完美的,也符合統(tǒng)計學(xué)結(jié)論,如果其無法直接涉及到要解決的商業(yè)問題,那么這些就是沒有意義的。此外,內(nèi)部不平衡的團(tuán)隊將會面臨一些無法充實準(zhǔn)備的困難,也無法交付出完美的作品。
是購買還是自建?
今天的世界充滿了大量、高速的數(shù)據(jù),企業(yè)都面臨著一個選擇。傳統(tǒng)那些寫代碼來編輯調(diào)查問卷、收集數(shù)據(jù)的程序員都被整合在了具備洞察的組織中。然而,他們中的很多人都沒有接受過數(shù)學(xué)或統(tǒng)計學(xué)的正統(tǒng)培訓(xùn)。同樣地,那些面向客戶并具有數(shù)值定量頭腦的商務(wù)人才在團(tuán)隊構(gòu)建中也應(yīng)當(dāng)有一席之地。培訓(xùn)現(xiàn)有數(shù)學(xué)或統(tǒng)計學(xué)人才是可行的,但漫長的過程需要極強(qiáng)的耐心。如果組織認(rèn)可且相信他們已有的人才并且選擇這條路來組建團(tuán)隊,這也就指向了需要填補(bǔ)的空白從而打造完美團(tuán)隊。
組織機(jī)構(gòu)很久之前就知道數(shù)據(jù)的價值了,但如果沒有人的參與,無論數(shù)據(jù)量有多大,細(xì)節(jié)有多深,到2019年實現(xiàn)數(shù)據(jù)科學(xué)300億美金的估值都是很難的。一個互相平衡的團(tuán)隊對各類數(shù)據(jù)作出的解讀、過濾以及修正都會加速這種成長并提升數(shù)據(jù)科學(xué)的重要性。
許多人覺得Hilary的“酷呆瓜”概念只適用于個人。但實際上,我們必須認(rèn)識到團(tuán)隊的集體“酷”也是充滿潛力的。
當(dāng)組織在組建和招聘數(shù)據(jù)科學(xué)團(tuán)隊時,或許團(tuán)隊宗旨可以簡單的稱為“如果你能找到呆瓜,那就留住他們。但如果缺少聚集了各類獨角獸人才的團(tuán)隊,那就創(chuàng)造一個。”