搭建一個(gè)開(kāi)源平臺(tái),組織就能利用云供應(yīng)商套利來(lái)降低成本
由于Doug Cutting和Apache軟件基金會(huì)有多年的合作關(guān)系,于是經(jīng)常被問(wèn)到“什么是開(kāi)源技術(shù)的未來(lái)?”。Doug的回應(yīng)一般要么是“我不知道”,要么是“有無(wú)窮的可能性”。
在過(guò)去的一年中,我們已經(jīng)看到開(kāi)源技術(shù)強(qiáng)勢(shì)的發(fā)展成了企業(yè)的技術(shù)主流。誰(shuí)會(huì)想到十年前Doug在Hadoop所做的工作會(huì)影響到那么多的行業(yè),從制造到電信,再到金融等等。它們都掌握了開(kāi)源生態(tài)系統(tǒng)的力量,不僅改善了客戶(hù)的體驗(yàn),變得有創(chuàng)新性并獲得了利潤(rùn)增長(zhǎng),而且支持對(duì)社會(huì)有更大利益的工作,比如通過(guò)基因組研究、精密醫(yī)學(xué)等項(xiàng)目來(lái)阻止人口販賣(mài),這僅僅是一小部分例子。
有人會(huì)很好奇如何開(kāi)始著手進(jìn)行開(kāi)源工作,以及從不斷變化的生態(tài)系統(tǒng)里期望能得到什么,下面Doug列出5個(gè)小貼士:
1. 擁抱開(kāi)源的不斷改變和演進(jìn)
不斷地變化,這是每一個(gè)剛接觸開(kāi)源技術(shù)的人需要學(xué)習(xí)的第一課,也是開(kāi)源有別于傳統(tǒng)軟件的最大不同之處。開(kāi)源的本質(zhì)是易變、靈活,它的新項(xiàng)目常常起源于一些特別的用例。這種動(dòng)態(tài)的循環(huán)促使產(chǎn)品變得更好、更快。因此,公司如果想從開(kāi)源獲得完全的好處,他們必須對(duì)技術(shù)轉(zhuǎn)變保持開(kāi)放的心態(tài)。Spark和MapReduce的辯論就完美的體現(xiàn)了這點(diǎn)的重要性:
事實(shí)上,人們?cè)跇?gòu)建新的應(yīng)用時(shí),MapReduce用得越來(lái)越少,而Spark成為他們默認(rèn)的數(shù)據(jù)處理引擎。MapReduce正逐漸成為Hive、Pig的底層引擎,這并不意味著它過(guò)時(shí)了。它還會(huì)為現(xiàn)存應(yīng)用很好地工作很多年,而且對(duì)某些大規(guī)模批量加載來(lái)說(shuō)仍然是卓越的工具。這一趨勢(shì)遵循開(kāi)源技術(shù)的自然演進(jìn):MapReduce是開(kāi)源數(shù)據(jù)生態(tài)系統(tǒng)的1.0引擎,Spark是2.0,而某一天會(huì)出現(xiàn)3.0讓Spark成為歷史。
2. 當(dāng)引入一個(gè)新技術(shù)棧時(shí),從小開(kāi)始、由上而下
先不去考慮要構(gòu)建、部署什么樣的解決方案,我們現(xiàn)在有了很多通用數(shù)據(jù)平臺(tái)和很多工具,它們能靈活地組合在一起去做搜索、流處理、機(jī)器學(xué)習(xí)還有更多事情。這些工作需要的不僅僅是一套不同的技能,而且還需要管理方式、組織結(jié)構(gòu)等在文化上的轉(zhuǎn)變。為此,重要的是要獲得組織內(nèi)高層的支持,并讓數(shù)據(jù)管理列入董事會(huì)層面的一項(xiàng)重點(diǎn)議題。同時(shí),建議拿一些新的應(yīng)用來(lái)逐步建立一個(gè)新文化,而不是要取代所有的一切,這樣可以讓大家通過(guò)一個(gè)個(gè)具體的用例來(lái)適應(yīng)這個(gè)變化。
3. 仔細(xì)挑選開(kāi)源軟件以避免云供應(yīng)商捆綁
隨著使用云計(jì)算的企業(yè)組織和產(chǎn)業(yè)越來(lái)越多,應(yīng)該考慮到開(kāi)源軟件不僅會(huì)帶來(lái)越來(lái)越好的健壯性、可擴(kuò)展性和安全性,而且也可以幫助他們避免被云供應(yīng)商捆綁。通過(guò)開(kāi)源平臺(tái)的構(gòu)建,組織可以采用云供應(yīng)商套利以降低成本,可以使用不同地域的不同云,或者基于云和內(nèi)部部署的混合方式。事實(shí)上,開(kāi)源平臺(tái)已經(jīng)證明了自己的技術(shù)優(yōu)越性,2017年也許會(huì)取得更多的落地。大量的機(jī)構(gòu)通過(guò)開(kāi)源項(xiàng)目進(jìn)行合作,單一的供應(yīng)商要去競(jìng)爭(zhēng)是很困難的。例如,現(xiàn)在那些開(kāi)源數(shù)據(jù)系統(tǒng)在性能和靈活性上就處于領(lǐng)先地位,并且改進(jìn)得更加迅速。
4. 對(duì)求職者來(lái)說(shuō),開(kāi)源生態(tài)環(huán)境里要關(guān)注森林,而不是樹(shù)木
IT領(lǐng)域的求職者,不管是編程還是數(shù)據(jù)科學(xué),不應(yīng)該僅僅專(zhuān)注于掌握個(gè)別技術(shù),而應(yīng)該關(guān)注理解開(kāi)源數(shù)據(jù)生態(tài)系統(tǒng)各個(gè)組成部分的最佳利用,以及如何把它們連接起來(lái)解決問(wèn)題。這種上層建筑的理解是企業(yè)在技術(shù)創(chuàng)新中最有價(jià)值的技能。隨著新技術(shù)的到來(lái),至關(guān)重要的是了解它們的適應(yīng)力如何、它們能取代什么、它們能做到什么。
5. 在技能缺口中尋找機(jī)會(huì)
大數(shù)據(jù)的技能缺口將在明年保持相對(duì)穩(wěn)定,但這不應(yīng)該成為人們采用Hadoop以及其它開(kāi)源技術(shù)的阻礙。大多數(shù)人都知道,當(dāng)新的技術(shù)被創(chuàng)造出來(lái)并爭(zhēng)奪用戶(hù)時(shí),它們對(duì)外界而言是很陌生的。只有當(dāng)一個(gè)特定類(lèi)型的軟件成為某個(gè)規(guī)范的成熟而標(biāo)準(zhǔn)的一部分,才會(huì)開(kāi)始出現(xiàn)大量熟練使用它的人,而即使如此仍然會(huì)存在技能缺口。只有當(dāng)我們不再對(duì)技術(shù)棧做大的改進(jìn)時(shí),才會(huì)消除這種缺口,不過(guò)Doug不認(rèn)為我們會(huì)希望這樣做。簡(jiǎn)而言之,技能缺口是影響平臺(tái)變革速度的主要因素之一,也是即將來(lái)臨的創(chuàng)新的標(biāo)志。
結(jié)論
在未來(lái)的幾年內(nèi),開(kāi)源生態(tài)系統(tǒng)將繼續(xù)擴(kuò)大,也會(huì)不斷地在有實(shí)際意義的項(xiàng)目里實(shí)施。它匯聚了今天最聰明的頭腦,在通力合作下,以十年前不可能的速度推進(jìn)軟件開(kāi)發(fā)。如果你想改善現(xiàn)有技術(shù),或者想支持打破傳統(tǒng)的觀念,可以加入這里。Doug鼓勵(lì)每個(gè)人都有興趣參與進(jìn)來(lái),也鼓勵(lì)經(jīng)驗(yàn)豐富的人因?yàn)檫@個(gè)原因繼續(xù)堅(jiān)持下去。點(diǎn)擊這里可以了解更多如何加入ASF社區(qū)的信息。
查看英文原文:5 Ways to Be Successful with Open-Source Software: Hadoop Creator Doug Cutting’s Advice for 2017