數(shù)據(jù)分析工具獨(dú)領(lǐng)風(fēng)騷 數(shù)據(jù)科學(xué)服務(wù)表示不服

責(zé)任編輯:editor005

作者:Bridget Botelho

2016-07-25 15:01:41

摘自:TechTarget中國

企業(yè)需要從大量收集的數(shù)據(jù)中攫取價(jià)值,但很多企業(yè)似乎無法找到足夠的數(shù)據(jù)科學(xué)家來做這件事。博士學(xué)位并不是成為數(shù)據(jù)科學(xué)家的前提,你需要成為某項(xiàng)技術(shù),特定業(yè)務(wù)線的專家,這樣我們的人才混合才是獨(dú)一無二的,而且這對(duì)于公司才是有價(jià)值的。

企業(yè)需要從大量收集的數(shù)據(jù)中攫取價(jià)值,但很多企業(yè)似乎無法找到足夠的數(shù)據(jù)科學(xué)家來做這件事。因此數(shù)據(jù)科學(xué)作為一項(xiàng)服務(wù)變呼之而出。

處于如此困境的企業(yè)可以把他們的原生數(shù)據(jù)外包給類似DataScience這樣的公司,這是一家位于加利福尼亞Culver City的創(chuàng)業(yè)公司。其分析團(tuán)隊(duì)對(duì)數(shù)據(jù)進(jìn)行清理并使用復(fù)雜的建模工具、國產(chǎn)軟件來提供建議,這樣客戶就可以根據(jù)這些建議來改進(jìn)產(chǎn)品和服務(wù),展他們的客戶群,最終增加收入。

SearchBusinessAnalytics與DataScience的CEO兼創(chuàng)始人Ian Swanson談?wù)撽P(guān)于新興數(shù)據(jù)科學(xué)作為一項(xiàng)服務(wù)的發(fā)展空間。他談及其數(shù)據(jù)科學(xué)家組成的團(tuán)隊(duì)能夠提供數(shù)據(jù)分析工具無法提供東西,數(shù)據(jù)科學(xué)驅(qū)動(dòng)收入的方式以及其風(fēng)險(xiǎn)投資公司如何在不到兩年的時(shí)間內(nèi)獲得并發(fā)展了一個(gè)強(qiáng)大而穩(wěn)定的數(shù)據(jù)科學(xué)家和數(shù)據(jù)工程師團(tuán)隊(duì),而與此同時(shí)大量的科技公司卻往往是很艱難地做著同樣的事。

公司們長期以來便利用數(shù)據(jù)來改善運(yùn)營效率,但如今越來越多的是強(qiáng)調(diào)以新的方式來使用數(shù)據(jù)連接客戶以促進(jìn)銷售。那么如今還有哪些新穎的方式可以讓你來使用數(shù)據(jù)呢?

Ian Swanson:我們擁有的訂閱電子商務(wù)公司每年的業(yè)務(wù)超過十億。我們能夠識(shí)別哪些客戶會(huì)有在下月離開的風(fēng)險(xiǎn),他們生命周期的潛力是什么以及如何才能留住他們。生命周期價(jià)值是我們連接顧客的核心。很多企業(yè)試圖使用瘋狂的Excel數(shù)學(xué)來解決該問題。我們?cè)诩?xì)粒度水平進(jìn)行觀察(很多屬性和特性)以決定一名客戶的生命周期價(jià)值。我們可以通過在該屬性上有針對(duì)性的投放特定廣告來增加客戶。

數(shù)據(jù)貨幣化對(duì)于你的客戶來說到底有多重要?

Swanson:某些公司將其看得很簡單,即我們要如何銷售數(shù)據(jù)?而我們看待它的方式是:我們要如何利用數(shù)據(jù)來增加收入?

我們與一家連接技術(shù)公司協(xié)作來找出他們的客戶到底是如何使用他們的產(chǎn)品的。企業(yè)可能會(huì)使用典型群體來了解如何對(duì)自己進(jìn)行營銷,但是這些我們能夠收集在一起的元素顯示了客戶是為什么以及如何使用他們產(chǎn)品的。我們查看了他們所有的數(shù)據(jù)并雇用了幾個(gè)數(shù)據(jù)科學(xué)技師來發(fā)掘大多數(shù)人是如何使用產(chǎn)品的并決定如何來對(duì)產(chǎn)品進(jìn)行營銷。我們提供建議來幫助客戶支持團(tuán)隊(duì)利用我們客戶能夠控制的東西將顧客從批評(píng)者轉(zhuǎn)變?yōu)榇龠M(jìn)者

我們還可以對(duì)一款尚未上馬的產(chǎn)品預(yù)測供需,因此一家公司就能夠?qū)⑵洳⑷胨麄兊呢?cái)務(wù)預(yù)測。公司通常會(huì)用遙不可及的邏輯來做這件事,但我們會(huì)用科學(xué)手段來完成。

對(duì)于那些將數(shù)據(jù)科學(xué)作為一項(xiàng)服務(wù)的公司來說,他們的員工中是否有數(shù)據(jù)科學(xué)家呢?

Swanson:是的,我們所有的客戶都至少會(huì)擁有一個(gè)。財(cái)富500強(qiáng)公司擁有強(qiáng)大的數(shù)據(jù)科學(xué)團(tuán)隊(duì),但他們可能不會(huì)集中在市場營銷和客戶服務(wù)以及人力資源上。內(nèi)部數(shù)據(jù)科學(xué)團(tuán)隊(duì)通常不具有技術(shù)或能力完成所有工作。我們是一個(gè)75人的團(tuán)隊(duì),其中70人是數(shù)據(jù)工程師或數(shù)據(jù)科學(xué)家。

對(duì)于這一點(diǎn),我們非常重視,但是我們也已經(jīng)在構(gòu)建知識(shí)產(chǎn)權(quán),以處理人們需要解決的問題。我告訴我的團(tuán)隊(duì),任何你需要用來讓工作變得高效的工具都可以購買。在這樣的環(huán)境中,有一些相互并不連貫的工具用于連接,清理,探索,數(shù)據(jù)角力,建模,但它們結(jié)合的并不好。我們已經(jīng)在內(nèi)部生產(chǎn)中使用了自己的工具,而且我們將會(huì)把它們打包并提供給客戶使用,這樣他們就能使用和我們一樣的工具。

你使用什么類型的基礎(chǔ)設(shè)施來支持你所有的數(shù)據(jù)處理工作?

Swanson:我們是Amazon Web Services的重度使用者,但是我們的技術(shù)還可用于Azure,因此我們并不受困于此。根據(jù)數(shù)據(jù)科學(xué)工具,如果你考慮一名數(shù)據(jù)分析師的路徑,它們使用的是R,Python或者Scala語言。我們5%是R語言,大部分是Python,但也處在Scala和Spark的前沿位置。我們建立了真正的預(yù)測模型。

數(shù)據(jù)科學(xué)作為一項(xiàng)服務(wù)是否成功取決于公司是否以他們最為珍貴的財(cái)富(即數(shù)據(jù))來信任第三方。你是如何克服這一信任問題和數(shù)據(jù)安全考量的?

Swanson:數(shù)據(jù)隱私和安全對(duì)我們來說是相當(dāng)重要的,而且我們并不需要個(gè)人身份信息。例如,我不需要知道一名客戶的姓名是Joe Smith,我可能只需要他的用戶ID。因此,我們可以與大型上市公司進(jìn)行協(xié)作。

我們已經(jīng)通了數(shù)據(jù)隱私和安全測試,這是由American Express的一個(gè)90人的團(tuán)隊(duì)對(duì)我們進(jìn)行審查的(American Express在2011年收購了Swanson的虛擬貨幣公司Sometrics)。還沒有一家客戶因?yàn)閿?shù)據(jù)安全方面的考慮而拒絕過我們。

你正在和如此之多的公司競爭,他們雇用了數(shù)據(jù)科學(xué)家,而且在人才資源有限的環(huán)境下,你要如何為你的團(tuán)隊(duì)聚攏人才呢?

Swanson:我們?cè)谶^去一年半籌集了3000萬美元的風(fēng)險(xiǎn)基金,而且當(dāng)我在和VC公司討論的時(shí)候,他們都說我們瘋了,認(rèn)為我們永遠(yuǎn)無法招到合適的人。我們?cè)谌齻€(gè)月內(nèi)證明了我們業(yè)務(wù)規(guī)模的擴(kuò)張和增長?,F(xiàn)在我們一個(gè)月可以收到超過1000份求職數(shù)據(jù)科學(xué)職位的簡歷。

我們還會(huì)穿梭于各種會(huì)議、活動(dòng),而且我們開展了DS12,這是一項(xiàng)為期12周的面向?qū)W生的數(shù)據(jù)科學(xué)實(shí)習(xí)項(xiàng)目。它是一個(gè)真正的并非入門級(jí)數(shù)據(jù)科學(xué)課程,而且我們并不對(duì)它收費(fèi);我們會(huì)支付他們的住宿,而且他們會(huì)獲得少量報(bào)酬。我們會(huì)向其他公司開放該課程,這樣他們也能從中學(xué)到東西。這關(guān)系到為數(shù)據(jù)科學(xué)領(lǐng)域增值。

像IBM和Microsoft這樣的大型科技公司強(qiáng)調(diào)大數(shù)據(jù)分析,而且他們正在尋求雇用數(shù)據(jù)科學(xué)專家。我可以想象類似這樣的人收購你的公司,從而迅速獲得人才。你是否有被主流科技公司接洽過關(guān)于收購的事宜呢?

Swanson:是的,有很多。

對(duì)于要如何談?wù)撨@個(gè)問題我必須謹(jǐn)慎——大公司們已經(jīng)找過我們,而且我們已經(jīng)拒絕了,而原因是在這一領(lǐng)域中公司眾多,但沒有幾家知道如何去增值。DataScience可以成長為一家大公司。我們的五年愿景是想成為研究,教育,服務(wù)和知識(shí)產(chǎn)權(quán)領(lǐng)域的思想領(lǐng)袖,而在今天這樣的組合并不存在。

博士學(xué)位并不是成為數(shù)據(jù)科學(xué)家的前提,你需要成為某項(xiàng)技術(shù),特定業(yè)務(wù)線的專家,這樣我們的人才混合才是獨(dú)一無二的,而且這對(duì)于公司才是有價(jià)值的。

與此同時(shí),有很多的自助分析工具來協(xié)助人們?cè)跊]有數(shù)據(jù)專家?guī)椭那闆r下連點(diǎn)成線并作出更好的業(yè)務(wù)決策。公司需要數(shù)據(jù)科學(xué)家的真諦是什么呢?

Swanson:類似Tableau或Domo的工具對(duì)可視化和常識(shí)是有好處的,但不適用于影響公司未來的營銷決策。它們是回到過去的一扇窗,但這扇窗并不通向未來。它們可以反映公司當(dāng)前狀況,但無法給出公司的未來描述。

我們使用模型做的事包括以95%的準(zhǔn)確率預(yù)測客戶流失。有些客戶想知道這樣的百分比是真的么?但是想想現(xiàn)在人們是如何做出決策的。他們是在一間會(huì)議室里看著Excel表格決策的。我們認(rèn)為要將科學(xué)應(yīng)用到該過程中來。這是與你的直覺和經(jīng)驗(yàn)并駕齊驅(qū)的另一款武器。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號(hào)-6京公網(wǎng)安備 11010502049343號(hào)