開源從最初的“洪水猛獸”,已經(jīng)儼然成為一個名媛,備受各大企業(yè)喜愛。近日,領(lǐng)英(LinkedIn)宣布即將開源一個企業(yè)級的數(shù)據(jù)挖掘軟件:WhereHows。
領(lǐng)英
數(shù)據(jù)挖掘,對于很多人來說已經(jīng)不再陌生。大數(shù)據(jù)的崛起,DT時代的來臨,數(shù)據(jù)挖掘?qū)τ谄髽I(yè)來說顯得越來越重要。而領(lǐng)英雖然成立時間僅有14年,但是在自己的領(lǐng)域有著很好的口碑。
當(dāng)然,數(shù)據(jù)挖掘在其中的作用不言而喻。此次開源自己內(nèi)部的應(yīng)用軟件WhereHows,主要目標(biāo)是從分布式的多種元數(shù)據(jù)中進(jìn)行挖掘。
據(jù)悉,WhereHows已經(jīng)挖掘了50,000條數(shù)據(jù)集,14,000條評論和35,000,000個工作機(jī)會,多達(dá)15PB的數(shù)據(jù)。
WhereHows
龐大的數(shù)據(jù)需要一個完整的數(shù)據(jù)生態(tài)鏈來完成這些數(shù)據(jù)的資產(chǎn)轉(zhuǎn)化,不同類型的數(shù)據(jù)用最適合的,專業(yè)的工具進(jìn)行分析,制定專業(yè)的解決方案。但是,要想在不同平臺、框架、系統(tǒng)中總覽所有數(shù)據(jù)變得非常困難。于是,為了避免做無用功浪費(fèi)生產(chǎn)力,領(lǐng)英制作了自己的數(shù)據(jù)挖掘軟件WhereHows。
此次開源WhereHows,領(lǐng)英希望開源社區(qū)能夠做些貢獻(xiàn),比如解決bug,增加特性之類的,但與此同時,廣大開源愛好者也可以從中學(xué)習(xí)領(lǐng)英的技術(shù)經(jīng)驗(yàn),這種互惠互利的方式,也正是眾多企業(yè)開源自己應(yīng)用的原因之一。