數(shù)據(jù)科學初學者九種常見錯誤

責任編輯:editor005

2017-07-24 14:35:37

摘自:中國大數(shù)據(jù)

如果你想開始一個數(shù)據(jù)科學方面的職業(yè),你可以通過避免這9個會使你付出高代價的初學者錯誤來免去幾天,幾個星期甚至幾個月的挫折。在本指南中,你學習了數(shù)據(jù)科學初學者應該避免的9種代價高的錯誤的實用技巧:  1 花費太多時間在理論上。

如果你想開始一個數(shù)據(jù)科學方面的職業(yè),你可以通過避免這9個會使你付出高代價的初學者錯誤來免去幾天,幾個星期甚至幾個月的挫折。

如果你不仔細,這些錯誤將會消耗你最寶貴的資源:你的時間、精力和動力。

我們將它們分為三類:

學習數(shù)據(jù)科學時的錯誤

求職時的錯誤

求職面試中的錯誤

大數(shù)據(jù)

  學習數(shù)據(jù)科學時

第一組錯誤是“隱蔽的”,很難發(fā)現(xiàn)。沒有絲毫的預兆,它們如同溫水煮青蛙般耗盡你的時間和精力,并且它們產生的誤解圍繞這個領域。

1.花費太多時間在理論上

許多初學者陷入了花費太多時間在理論上的陷阱,無論是數(shù)學相關(線性代數(shù),統(tǒng)計學等)還是機器學習相關的(算法,派生等)。

這種方法效率低下有三個主要原因:

首先,這是緩慢而艱巨的。如果你曾經(jīng)被所有要學的東西壓垮,那么你很有可能陷入了這個陷阱。

第二,你也不會保留這些概念。數(shù)據(jù)科學是一個應用領域,而鞏固技能的最好方法是實踐。

最后,還有一個更大的風險就是如果你不明白你所學的東西與現(xiàn)實內容有什么聯(lián)系,那么你會變得消極然后放棄。

傳統(tǒng)上這種重理論的方法在學術界中傳授,但大多數(shù)從業(yè)者可以從更注重結果的觀念中受益。

為了避免這個錯誤:

平衡你的研究和你實踐的項目。

學會適應局部知識。當你進步的時候,你自然會填補空白。

了解每一部分如何適應大局(包括在我們免費7天速成課程)。

2.從頭開始編寫太多的算法

下一個錯誤也會導致學生片面重視局部而忽略了整體。一開始你真的不需要從頭開始編寫每個算法。

雖然為了學習而實現(xiàn)一些這么做很好,但現(xiàn)實是算法正在成為商品。由于成熟的機器學習庫和基于云的解決方案,大多數(shù)從業(yè)者實際上從不從頭編寫代碼。

今天,了解如何在正確的設置(以正確的方式)中應用正確的算法更為重要。

為了避免這個錯誤:

使用通用的機器學習庫,如Scikit-Learn(Python)或Caret(R)(需翻墻)。

如果你從頭開始編寫一個算法,那么這樣做是為了學習而不是完善你的實現(xiàn)。

理解現(xiàn)代機器學習算法的環(huán)境及其優(yōu)缺點。

3.急于深入更高的層次

有些人進入這個領域是因為他們想要構建未來的技術:自駕車,高級機器人,計算機視覺等。 這些技術由深度學習和自然語言處理等技術所驅動。

但是,掌握基本原理很重要。 一口吃不成胖子。每個奧運潛水員都需要先學習如何游泳,那么你也應該如此。

為了避免這個錯誤:

首先掌握“經(jīng)典”機器學習的技術和算法,以此作為高級課題的基石。

要知道經(jīng)典機器學習仍然具有驚人的潛力。雖然算法已經(jīng)成熟,但我們仍然處于發(fā)現(xiàn)使用富有成效的方法的早期階段。

學習一個系統(tǒng)的方法來解決任何形式的機器學習問題(包括在我們免費7天速成課程)。

不要在家里嘗試這個(除非你有足夠的練習)

求職時

下一組錯誤可能會導致你在求職過程中錯過一些很好的機會。 即使你能夠勝任,但你可以通過避免這些問題來發(fā)揮到最好的效果。

4.簡歷中有太多的專業(yè)術語

許多應聘者在寫簡歷時犯的最大錯誤就是用專業(yè)術語填滿了簡歷。

相反,你的簡歷應該簡潔明了并且你的要點要闡述清晰。你的簡歷應該主張你能給公司帶來的影響,尤其是當你申請初級職位的時候。

為了避免這個錯誤:

不要簡單列出你所使用的編程語言或庫。描述你如何使用它們并解釋結果。

少即是多。考慮強調最重要的技能,并突出它們。

制作一個簡歷主模板,這樣你就可以根據(jù)不同的職位定制不同的版本。這樣可以使每個版本保持整潔。

5.高估學位的價值

有時,畢業(yè)生會高估他們的教育價值。雖然在相關領域有高等學位肯定會增加你的機會,但這是不夠的,也不是最重要的因素。

當然了,我們并不是說畢業(yè)生傲慢自大…

在大多數(shù)情況下,在學校學習的東西與在企業(yè)中應用的機器學習完全不同。處理期限、客戶和技術障礙需要在學術界不那么迫切的實際權衡。

為了避免這個錯誤:

用真實的數(shù)據(jù)集補充大量項目的課程。

學會用機器學習解決問題的系統(tǒng)方法(我們免費7天速成課程)。

參加相關實習,即使是兼職。

在LinkedIn上接觸當?shù)氐臄?shù)據(jù)科學家面對面聊一聊。

6.搜索內容太狹隘

數(shù)據(jù)科學是一個相對較新的領域,機構還在不斷發(fā)展,以適應數(shù)據(jù)日益增長的影響。如果你只搜索“數(shù)據(jù)科學家”的空缺,你就會限制自己。

許多職位沒有被稱為“數(shù)據(jù)科學”,但它們可以讓你以類似的角色發(fā)展類似的技能和功能。

為了避免這個錯誤:

搜索所需技能(機器學習,數(shù)據(jù)可視化,SQL等)。

按工作職責進行搜索(預測建模、A/B測試、數(shù)據(jù)分析等)。

用職位所需的技術搜索(Python,R,Scikit Learn,Keras,等)。

通過職位名稱(數(shù)據(jù)分析師、定量分析師、機器學習工程師等)擴展搜索范圍。

  來源: Cyanide and Happiness

面試過程中

最后一組錯誤是面試時的絆腳石。你已經(jīng)為達到這一步做了艱苦的工作,所以現(xiàn)在是結束的時候了。

7.沒有事先做討論項目的準備

在你的產品組合中有項目用于回答“你會如何”這類的面試問題,以此作為一個主要的安全保障。而不是說假設,你可以指出你如何處理某些情況的具體例子。

此外,許多面試官都會特別關注你獨立自主的能力,因為數(shù)據(jù)科學的職位自然包含項目管理的要素。這意味著你應該理解整個數(shù)據(jù)科學工作流程,并了解如何將所有內容整理在一起。

為了避免這個錯誤:

完整的端到端的項目,能使你實踐每一個主要步驟(即數(shù)據(jù)清理、模型培訓等)。

組織你的一套方法。數(shù)據(jù)科學應該是深思熟慮的,而不是偶然的。

回顧和實踐從過去的實習、工作或課程中所做的項目。

8.低估領域知識的價值

技術技能和機器學習知識是獲得數(shù)據(jù)科學職位的基本前提。然而,要真正脫穎而出,你應該更多地了解你將運用技能的具體行業(yè)。

記住,數(shù)據(jù)科學永遠不會存在于真空中。

為了避免這個錯誤:

如果你在銀行面試一個職位,就要了解一些基本的財務概念。

如果你正在為財富500強的戰(zhàn)略職位面試,那就去面試幾次,了解一下盈利能力的驅動因素。

如果你正要去一家初創(chuàng)公司面試,要了解它的市場,并試著辨別它將如何獲得競爭優(yōu)勢。

簡而言之,在這方面采取一些額外的舉措可以帶來很大的好處!

9.忽視溝通技巧

目前,在大多數(shù)機構中,與開發(fā)團隊或分析師團隊相比,數(shù)據(jù)科學團隊仍然非常小。因此,當一個入門級的軟件工程師經(jīng)常被一個高級工程師管理時,數(shù)據(jù)科學家傾向于在更多跨功能的環(huán)境中工作。

面試官會注重你和不同技術背景和數(shù)學背景的同事交流的能力。

為了避免這個錯誤:

向非技術受眾講解技術概念。例如,試著向朋友解釋你喜歡的算法。

為常見的面試問題準備要點,并練習回答問題。

實踐分析各種數(shù)據(jù)集,提取關鍵的見解,并展示你的發(fā)現(xiàn)。

總結

在本指南中,你學習了數(shù)據(jù)科學初學者應該避免的9種代價高的錯誤的實用技巧:

1.花費太多時間在理論上。

2.從頭編寫太多的算法。

3.跳入高深的主題,例如深度學習、太快了。

4.在簡歷中有太多的技術術語。

5.高估學位的價值。

6.找工作搜索太狹窄。

7.在面試中沒有準備好討論項目。

8.低估領域知識的價值。

9.忽視溝通技巧。

本文由北郵@愛可可-愛生活推薦,阿里云云棲社區(qū)翻譯。

文章原標題《9 Mistakes to Avoid When Starting Your Career in Data Science》

作者:elitedatascience網(wǎng)站,譯者:TIAMO_ZN,審閱:海棠

鏈接已復制,快去分享吧

企業(yè)網(wǎng)版權所有?2010-2024 京ICP備09108050號-6京公網(wǎng)安備 11010502049343號