IBM 招聘數(shù)據(jù)科學(xué)家,看重的是哪些技能和特質(zhì)?

責(zé)任編輯:editor006

作者:Smiletalker

2017-12-11 16:07:20

摘自:36kr

編者按:求職者有時(shí)會(huì)問(wèn) IBM 如何定義“數(shù)據(jù)科學(xué)家”這一職位。根據(jù)定義,要實(shí)現(xiàn)數(shù)據(jù)科學(xué)的真正潛力,我們需要具有非常特殊的經(jīng)驗(yàn)和技能的數(shù)據(jù)科學(xué)家,具體來(lái)說(shuō),我們需要具備運(yùn)行和完成數(shù)據(jù)科學(xué)項(xiàng)目所需經(jīng)驗(yàn)和技能的人員:

編者按:求職者有時(shí)會(huì)問(wèn) IBM 如何定義“數(shù)據(jù)科學(xué)家”這一職位。這是一個(gè)重要的問(wèn)題,因?yàn)槭袌?chǎng)需要越來(lái)越多的數(shù)據(jù)科學(xué)家,IBM 分析師Seth Dobrin 在本文中詳細(xì)定義了 IBM 眼中的數(shù)據(jù)科學(xué)家。

IBM 招聘數(shù)據(jù)科學(xué)家,看重的是哪些技能和特質(zhì)?

第一步是區(qū)分真正的數(shù)據(jù)科學(xué)家和從事相關(guān)工作的其他專業(yè)人員(例如數(shù)據(jù)工程師,業(yè)務(wù)分析師和 A I應(yīng)用開(kāi)發(fā)人員)。為了做這個(gè)區(qū)分,我們首先定義數(shù)據(jù)科學(xué)的含義。

數(shù)據(jù)科學(xué)的核心是運(yùn)用科學(xué)的方法來(lái)解決商業(yè)問(wèn)題。

你可以進(jìn)一步擴(kuò)展定義,使用人工智能來(lái)解決這些業(yè)務(wù)問(wèn)題,進(jìn)行預(yù)測(cè),并優(yōu)化流程。

根據(jù)定義,要實(shí)現(xiàn)數(shù)據(jù)科學(xué)的真正潛力,我們需要具有非常特殊的經(jīng)驗(yàn)和技能的數(shù)據(jù)科學(xué)家,具體來(lái)說(shuō),我們需要具備運(yùn)行和完成數(shù)據(jù)科學(xué)項(xiàng)目所需經(jīng)驗(yàn)和技能的人員:

1、接受過(guò)科學(xué)訓(xùn)練,有相關(guān)學(xué)位

2、具備機(jī)器學(xué)習(xí)和統(tǒng)計(jì)方面的專業(yè)知識(shí),重點(diǎn)在于決策優(yōu)化

3、擁有 R,Python 或 Scala 的專業(yè)知識(shí)

4、能夠轉(zhuǎn)換和管理大型數(shù)據(jù)集

5、有能力將上述技能應(yīng)用于現(xiàn)實(shí)世界的商業(yè)問(wèn)題

6、能夠評(píng)估模型的性能并進(jìn)行相應(yīng)地調(diào)整

1、接受科學(xué)訓(xùn)練,有相關(guān)學(xué)位

這不是關(guān)于學(xué)位本身,而是關(guān)于你在獲得高等學(xué)位時(shí)學(xué)到的東西。 簡(jiǎn)而言之,學(xué)習(xí)科學(xué)的方法,能夠從復(fù)雜而抽象的問(wèn)題開(kāi)始,將其分解成一系列可驗(yàn)證的假設(shè),你設(shè)計(jì)實(shí)驗(yàn)來(lái)測(cè)試你的假設(shè),以及你如何分析結(jié)果以確定假設(shè)是否被證實(shí)或證偽。你也可以在學(xué)術(shù)界之外學(xué)習(xí)這些技能,甚至通過(guò)在線培訓(xùn),所以學(xué)位這一點(diǎn)具有一定的靈活性,但應(yīng)用科學(xué)方法的直接經(jīng)驗(yàn)是必須的。

擁有高等學(xué)位的另一個(gè)優(yōu)點(diǎn)是同行評(píng)審過(guò)程和發(fā)表論文要求的嚴(yán)格性。為了獲得發(fā)表,候選人必須以允許其他人審閱和作品。還必須提供證據(jù)表明結(jié)果是有效的,方法是正確的。 這樣做需要深刻理解概率和確定性因素之間的差異以及相關(guān)性的價(jià)值。

2、機(jī)器學(xué)習(xí)和統(tǒng)計(jì)方面的專業(yè)知識(shí),重點(diǎn)在于決策優(yōu)化

將科學(xué)方法應(yīng)用于商業(yè)問(wèn)題,可以讓我們預(yù)測(cè)未來(lái)會(huì)發(fā)生什么,從而做出更好的決策。這種預(yù)測(cè)是人工智能的產(chǎn)物,更具體地說(shuō)是機(jī)器學(xué)習(xí)。 對(duì)于一個(gè)真正的數(shù)據(jù)科學(xué)家來(lái)說(shuō),機(jī)器學(xué)習(xí)和統(tǒng)計(jì)的核心技術(shù)技能必須的。

3、R,Python 或 Scala 的專業(yè)知識(shí)

作為一名數(shù)據(jù)科學(xué)家,并不要求你像專業(yè)開(kāi)發(fā)人員一樣精通編程,但是創(chuàng)建和運(yùn)行支持?jǐn)?shù)據(jù)科學(xué)過(guò)程的代碼的能力是必須的,包括能夠統(tǒng)一使用統(tǒng)計(jì)和機(jī)器學(xué)習(xí)中流行的數(shù)據(jù)科學(xué)語(yǔ)言。

4、能夠轉(zhuǎn)換和管理大型數(shù)據(jù)集

第四種技能也就是大數(shù)據(jù)能力。使用 Apache Spark 等分布式數(shù)據(jù)處理框架的能力是關(guān)鍵。 真正的數(shù)據(jù)科學(xué)家知道如何在數(shù)據(jù)科學(xué)團(tuán)隊(duì)的幫助下,從多個(gè)來(lái)源和多種數(shù)據(jù)類型中提取數(shù)據(jù)集。數(shù)據(jù)本身可能是存在于多個(gè)云中的結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)的組合。

5、有能力將上述技能應(yīng)用于現(xiàn)實(shí)世界的商業(yè)問(wèn)題

第五種技能是一種軟技能。 這是與非數(shù)據(jù)科學(xué)家進(jìn)行交流的能力,以確保數(shù)據(jù)科學(xué)團(tuán)隊(duì)獲得所需的數(shù)據(jù)資源,并將數(shù)據(jù)科學(xué)應(yīng)用于正確的業(yè)務(wù)問(wèn)題。 掌握這一技能還意味著確保數(shù)據(jù)科學(xué)項(xiàng)目的結(jié)果,例如關(guān)于業(yè)務(wù)可能發(fā)展的預(yù)測(cè)得到商業(yè)人士的充分理解和操作。這需要良好的講故事技巧,尤其是將數(shù)學(xué)概念映射到常識(shí)的能力。

6、能夠評(píng)估模型的性能并進(jìn)行相應(yīng)地調(diào)整

對(duì)于一些人來(lái)說(shuō),第六個(gè)技能是第二個(gè)技能的一個(gè)方面:機(jī)器學(xué)習(xí)的專長(zhǎng)。 我想要分開(kāi)描述,因?yàn)檫@一點(diǎn)經(jīng)常是一個(gè)好的數(shù)據(jù)科學(xué)家和壞的數(shù)據(jù)科學(xué)家的區(qū)別。 缺乏這種技能的數(shù)據(jù)科學(xué)家經(jīng)常輕易相信已經(jīng)創(chuàng)建并部署了有效的模型,而事實(shí)上他們的模型與訓(xùn)練數(shù)據(jù)并不匹配。

做一個(gè)真正的數(shù)據(jù)科學(xué)家

如果你想成為一個(gè)真正的數(shù)據(jù)科學(xué)家,而不是一個(gè)沒(méi)有有抱負(fù)的數(shù)據(jù)科學(xué)家或只個(gè)數(shù)據(jù)科學(xué)家頭銜,我鼓勵(lì)你掌握全部這六個(gè)能力。 數(shù)據(jù)科學(xué)家與業(yè)務(wù)分析師或數(shù)據(jù)分析師從根本上不同,業(yè)務(wù)分析師或數(shù)據(jù)分析師經(jīng)常擔(dān)任數(shù)據(jù)科學(xué)團(tuán)隊(duì)的產(chǎn)品所有者,擔(dān)任向數(shù)據(jù)科學(xué)家提供專業(yè)知識(shí)的重要角色。

這并不是說(shuō)業(yè)務(wù)分析師、數(shù)據(jù)分析師和其他人不能轉(zhuǎn)型為真正的數(shù)據(jù)科學(xué)家,但要明白,這需要時(shí)間,堅(jiān)持,指導(dǎo),并一次又一次地將自己應(yīng)用于真實(shí)的困難問(wèn)題。

原文鏈接:https://venturebeat.com/2017/11/30/what-ibm-looks-for-in-a-data-scientist/

編譯組出品。編輯:郝鵬程

編者按:求職者有時(shí)會(huì)問(wèn) IBM 如何定義“數(shù)據(jù)科學(xué)家”這一職位。這是一個(gè)重要的問(wèn)題,因?yàn)槭袌?chǎng)需要越來(lái)越多的數(shù)據(jù)科學(xué)家,IBM 分析師Seth Dobrin 在本文中詳細(xì)定義了 IBM 眼中的數(shù)據(jù)科學(xué)家。

第一步是區(qū)分真正的數(shù)據(jù)科學(xué)家和從事相關(guān)工作的其他專業(yè)人員(例如數(shù)據(jù)工程師,業(yè)務(wù)分析師和 A I應(yīng)用開(kāi)發(fā)人員)。為了做這個(gè)區(qū)分,我們首先定義數(shù)據(jù)科學(xué)的含義。

數(shù)據(jù)科學(xué)的核心是運(yùn)用科學(xué)的方法來(lái)解決商業(yè)問(wèn)題。

你可以進(jìn)一步擴(kuò)展定義,使用人工智能來(lái)解決這些業(yè)務(wù)問(wèn)題,進(jìn)行預(yù)測(cè),并優(yōu)化流程。

根據(jù)定義,要實(shí)現(xiàn)數(shù)據(jù)科學(xué)的真正潛力,我們需要具有非常特殊的經(jīng)驗(yàn)和技能的數(shù)據(jù)科學(xué)家,具體來(lái)說(shuō),我們需要具備運(yùn)行和完成數(shù)據(jù)科學(xué)項(xiàng)目所需經(jīng)驗(yàn)和技能的人員:

1、接受過(guò)科學(xué)訓(xùn)練,有相關(guān)學(xué)位

2、具備機(jī)器學(xué)習(xí)和統(tǒng)計(jì)方面的專業(yè)知識(shí),重點(diǎn)在于決策優(yōu)化

3、擁有 R,Python 或 Scala 的專業(yè)知識(shí)

4、能夠轉(zhuǎn)換和管理大型數(shù)據(jù)集

5、有能力將上述技能應(yīng)用于現(xiàn)實(shí)世界的商業(yè)問(wèn)題

6、能夠評(píng)估模型的性能并進(jìn)行相應(yīng)地調(diào)整

1、接受科學(xué)訓(xùn)練,有相關(guān)學(xué)位

這不是關(guān)于學(xué)位本身,而是關(guān)于你在獲得高等學(xué)位時(shí)學(xué)到的東西。 簡(jiǎn)而言之,學(xué)習(xí)科學(xué)的方法,能夠從復(fù)雜而抽象的問(wèn)題開(kāi)始,將其分解成一系列可驗(yàn)證的假設(shè),你設(shè)計(jì)實(shí)驗(yàn)來(lái)測(cè)試你的假設(shè),以及你如何分析結(jié)果以確定假設(shè)是否被證實(shí)或證偽。你也可以在學(xué)術(shù)界之外學(xué)習(xí)這些技能,甚至通過(guò)在線培訓(xùn),所以學(xué)位這一點(diǎn)具有一定的靈活性,但應(yīng)用科學(xué)方法的直接經(jīng)驗(yàn)是必須的。

擁有高等學(xué)位的另一個(gè)優(yōu)點(diǎn)是同行評(píng)審過(guò)程和發(fā)表論文要求的嚴(yán)格性。為了獲得發(fā)表,候選人必須以允許其他人審閱和作品。還必須提供證據(jù)表明結(jié)果是有效的,方法是正確的。 這樣做需要深刻理解概率和確定性因素之間的差異以及相關(guān)性的價(jià)值。

2、機(jī)器學(xué)習(xí)和統(tǒng)計(jì)方面的專業(yè)知識(shí),重點(diǎn)在于決策優(yōu)化

將科學(xué)方法應(yīng)用于商業(yè)問(wèn)題,可以讓我們預(yù)測(cè)未來(lái)會(huì)發(fā)生什么,從而做出更好的決策。這種預(yù)測(cè)是人工智能的產(chǎn)物,更具體地說(shuō)是機(jī)器學(xué)習(xí)。 對(duì)于一個(gè)真正的數(shù)據(jù)科學(xué)家來(lái)說(shuō),機(jī)器學(xué)習(xí)和統(tǒng)計(jì)的核心技術(shù)技能必須的。

3、R,Python 或 Scala 的專業(yè)知識(shí)

作為一名數(shù)據(jù)科學(xué)家,并不要求你像專業(yè)開(kāi)發(fā)人員一樣精通編程,但是創(chuàng)建和運(yùn)行支持?jǐn)?shù)據(jù)科學(xué)過(guò)程的代碼的能力是必須的,包括能夠統(tǒng)一使用統(tǒng)計(jì)和機(jī)器學(xué)習(xí)中流行的數(shù)據(jù)科學(xué)語(yǔ)言。

4、能夠轉(zhuǎn)換和管理大型數(shù)據(jù)集

第四種技能也就是大數(shù)據(jù)能力。使用 Apache Spark 等分布式數(shù)據(jù)處理框架的能力是關(guān)鍵。 真正的數(shù)據(jù)科學(xué)家知道如何在數(shù)據(jù)科學(xué)團(tuán)隊(duì)的幫助下,從多個(gè)來(lái)源和多種數(shù)據(jù)類型中提取數(shù)據(jù)集。數(shù)據(jù)本身可能是存在于多個(gè)云中的結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)的組合。

5、有能力將上述技能應(yīng)用于現(xiàn)實(shí)世界的商業(yè)問(wèn)題

第五種技能是一種軟技能。 這是與非數(shù)據(jù)科學(xué)家進(jìn)行交流的能力,以確保數(shù)據(jù)科學(xué)團(tuán)隊(duì)獲得所需的數(shù)據(jù)資源,并將數(shù)據(jù)科學(xué)應(yīng)用于正確的業(yè)務(wù)問(wèn)題。 掌握這一技能還意味著確保數(shù)據(jù)科學(xué)項(xiàng)目的結(jié)果,例如關(guān)于業(yè)務(wù)可能發(fā)展的預(yù)測(cè)得到商業(yè)人士的充分理解和操作。這需要良好的講故事技巧,尤其是將數(shù)學(xué)概念映射到常識(shí)的能力。

6、能夠評(píng)估模型的性能并進(jìn)行相應(yīng)地調(diào)整

對(duì)于一些人來(lái)說(shuō),第六個(gè)技能是第二個(gè)技能的一個(gè)方面:機(jī)器學(xué)習(xí)的專長(zhǎng)。 我想要分開(kāi)描述,因?yàn)檫@一點(diǎn)經(jīng)常是一個(gè)好的數(shù)據(jù)科學(xué)家和壞的數(shù)據(jù)科學(xué)家的區(qū)別。 缺乏這種技能的數(shù)據(jù)科學(xué)家經(jīng)常輕易相信已經(jīng)創(chuàng)建并部署了有效的模型,而事實(shí)上他們的模型與訓(xùn)練數(shù)據(jù)并不匹配。

做一個(gè)真正的數(shù)據(jù)科學(xué)家

如果你想成為一個(gè)真正的數(shù)據(jù)科學(xué)家,而不是一個(gè)沒(méi)有有抱負(fù)的數(shù)據(jù)科學(xué)家或只個(gè)數(shù)據(jù)科學(xué)家頭銜,我鼓勵(lì)你掌握全部這六個(gè)能力。 數(shù)據(jù)科學(xué)家與業(yè)務(wù)分析師或數(shù)據(jù)分析師從根本上不同,業(yè)務(wù)分析師或數(shù)據(jù)分析師經(jīng)常擔(dān)任數(shù)據(jù)科學(xué)團(tuán)隊(duì)的產(chǎn)品所有者,擔(dān)任向數(shù)據(jù)科學(xué)家提供專業(yè)知識(shí)的重要角色。

這并不是說(shuō)業(yè)務(wù)分析師、數(shù)據(jù)分析師和其他人不能轉(zhuǎn)型為真正的數(shù)據(jù)科學(xué)家,但要明白,這需要時(shí)間,堅(jiān)持,指導(dǎo),并一次又一次地將自己應(yīng)用于真實(shí)的困難問(wèn)題。

原文鏈接:https://venturebeat.com/2017/11/30/what-ibm-looks-for-in-a-data-scientist/

編譯組出品。編輯:郝鵬程

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號(hào)-6京公網(wǎng)安備 11010502049343號(hào)