目前,商業(yè)工具在數(shù)據(jù)虛擬化軟件市場占據(jù)主導(dǎo)地位,但在數(shù)據(jù)管理和分析等領(lǐng)域,開源技術(shù)開始迎頭趕上,比如D3.js數(shù)據(jù)可視化庫,Leaflet地圖庫,再加上附加交互可視化功能的R語言(一種廣泛用于統(tǒng)計(jì)分析的編程語言)。
當(dāng)然,對(duì)于開源數(shù)據(jù)可視化工具也有一些批評(píng)的聲音,例如有人認(rèn)為這些工具的使用門檻太高,使用者必須具備大量代碼知識(shí),還要經(jīng)過專門培訓(xùn)。不過,熟悉開源可視化工具的用戶透露,隨著技術(shù)部署的不斷深入,這些可視化產(chǎn)品用起來會(huì)越來越得心應(yīng)手。而對(duì)于R語言,很多軟件供應(yīng)商都為企業(yè)用戶提供商業(yè)產(chǎn)品。
Paul Bradley是美國醫(yī)保管理SaaS云應(yīng)用供應(yīng)商ZirMed公司的首席數(shù)據(jù)科學(xué)家,他認(rèn)為:“這些工具之所以開始流行起來,是因?yàn)樗鼈兂墒烨铱捎谩S脩舾靖惺懿坏介_源工具的限制,因?yàn)樵谟|碰到限制之前就能完成大量工作。”Bradley是R語言的擁躉者,他介紹到,供應(yīng)商RStudio公司針對(duì)R語言開發(fā)的同名圖形用戶界面就很友好,而且也不需要太多的代碼知識(shí)。
Bradley的觀點(diǎn)得到了Clement Brunet的認(rèn)同,Brunet是美國保險(xiǎn)公司The Co-operators的研究和分析主管。在波士頓舉行的數(shù)據(jù)倉庫研究院(TDWI)2015大會(huì)演講上,Brunet表示:“有R語言在手,你可以走的很遠(yuǎn)。”他認(rèn)為如果要在概念證明(POC)階段開展實(shí)驗(yàn)性分析項(xiàng)目,之后再擴(kuò)展到產(chǎn)品應(yīng)用,那R語言簡直是不二之選。而且隨著R語言環(huán)境在本質(zhì)上變得更加圖形化,工作會(huì)越來越容易。
美國在線借貸公司Avant同時(shí)使用了商業(yè)化的商務(wù)智能(BI)軟件和開源的數(shù)據(jù)可視化技術(shù)。該公司的BI負(fù)責(zé)人Charles Whittaker表示,任何能夠幫助他節(jié)省數(shù)據(jù)可視化時(shí)間,讓他能夠集中精力進(jìn)行數(shù)據(jù)分析的東西,他都感興趣。他表示,D3庫預(yù)建的圖形正能滿足他的需求,這些圖形讓W(xué)hittaker這樣的用戶“能夠把資源集中在數(shù)據(jù)挖掘和數(shù)據(jù)科學(xué)上,而不是去創(chuàng)建酷炫的圖表”。
如果要簡化流程,咨詢公司PowerTrip Analytics的聯(lián)合創(chuàng)始人兼首席數(shù)據(jù)科學(xué)家Stephen McDaniel建議使用具有省略數(shù)據(jù)發(fā)現(xiàn)功能的開源可視化工具,可以讓用戶專注于創(chuàng)建表格和圖形。華盛頓大學(xué)開發(fā)的開源工具Lyra備受McDaniel青睞,他稱之為“數(shù)據(jù)可視化領(lǐng)域的Photoshop”。
McDaniel介紹道,Lyra采用D3框架,D3框架是JavaScript文檔的組合,需要用戶執(zhí)行一些手動(dòng)編碼,可以通過點(diǎn)選式(只要用鼠標(biāo)點(diǎn)擊而不用鍵盤操作就可以使用的容易上手的軟件)界面自動(dòng)完成任務(wù)。因?yàn)檩敵龈袷讲捎玫氖荋TML、SVG或CSS等常見的網(wǎng)站語言,所以數(shù)據(jù)可視化結(jié)果很容易在組織中傳播,也很容易發(fā)布到網(wǎng)上。他還表示:“這正是我們所需要的,現(xiàn)在我們要做的不是如何反復(fù)研究數(shù)據(jù),而是如何構(gòu)建具體的圖形,把他們發(fā)布到網(wǎng)站服務(wù)器上,融入到內(nèi)容中,讓所有人都能使用。”