之前我們在提到Teradata的大數(shù)據(jù)產(chǎn)品和方案時,必然要提到2011年被Teradata收購的Aster Data(現(xiàn)名Teradata Aster)。Teradata Aster在Teradata統(tǒng)一數(shù)據(jù)架構中承擔著數(shù)據(jù)分析和探索的重任。我們知道Teradata的大數(shù)據(jù)架構中最引以為傲的就是將數(shù)據(jù)倉庫、Aster以及Hadoop做了最好的整合,形成統(tǒng)一數(shù)據(jù)架構,并且在金融、電信等行業(yè)形成了非常成熟的行業(yè)應用案例。
在大中華區(qū),Teradata在大數(shù)據(jù)方面有了更新的動作,Teradata Aster事業(yè)部也正式變更為Teradata大數(shù)據(jù)事業(yè)部,其承擔的是Teradata在大數(shù)據(jù)層面無論是技術還是應用方面的更新和拓展工作。
增加更多新功能 加快與Hadoop的整合
關于Teradata的統(tǒng)一數(shù)據(jù)架構(UDA)以及Aster在其中扮演的角色,在前兩年我們都做過很多介紹。在這個開放的數(shù)據(jù)分析平臺上,數(shù)據(jù)倉庫提供整個企業(yè)級的單一視圖、Aster承擔數(shù)據(jù)挖掘和探索平臺、Hadoop主要承擔文件存儲和ELT等功能。
至于Aster和Hadoop的區(qū)別,Teradata天睿公司大中華區(qū)大數(shù)據(jù)事業(yè)部總監(jiān)孔宇華是這樣描述的:“Hadoop下面是文件存儲系統(tǒng),上面用MapReduce做運算引擎。而Aster最大的不同是底層通過數(shù)據(jù)庫做存儲,上面有不同的運算引擎,諸如SQL、MapReduc、文本、關聯(lián)分析、圖像分析等。”同時,Aster提供業(yè)內使用最為廣泛的SQL接口。
Teradata天睿公司大中華區(qū)大數(shù)據(jù)事業(yè)部總監(jiān)孔宇華
孔宇華強調,在Aster里面有各種分析工具,需要什么樣的工具就直接調用,而且不用轉移數(shù)據(jù)的存儲位置。
但是不能否認,Hadoop也體現(xiàn)出加速發(fā)展的趨勢,尤其是近一年來更新了眾多版本,并增加了各種新的功能模塊。在Teradata看來,開源社區(qū)對Hadoop的影響和貢獻很大,所以Teradata不會在這方面嘗試改變社區(qū)的發(fā)展方向。
“我們會盡量擁抱更多的開源產(chǎn)品,通過與HortonWorks合作,在Hadoop上面做開發(fā)。”孔宇華也指出,因為Storm和Spark開始成熟,可以實現(xiàn)一些流分析的應用,因此Teradata也會在這方面做相應的研究和應用。
同時,近期Teradata收購了兩家公司,其中Revelytix專長實現(xiàn)Hadoop上的元數(shù)據(jù)管理,而Hadapt更是能夠在Hadoop上基于SQL建立數(shù)據(jù)倉庫。“我們收購這兩家公司的人員資產(chǎn)和知識產(chǎn)權,這將擴展Teradata的大數(shù)據(jù)產(chǎn)品組合,增強Teradata統(tǒng)一數(shù)據(jù)架構功能。”孔宇華介紹到。
目前Teradata在推動Hadoop的應用其實都是基于統(tǒng)一數(shù)據(jù)架構,可以讓客戶更好地利用Hadoop和其他的大數(shù)據(jù)分析解決方案。“這些平臺應該是整合的,而不是孤立的,我們不希望每一個數(shù)據(jù)平臺,如Hadoop、數(shù)據(jù)倉庫、探索平臺和數(shù)據(jù)集市等是不同的獨立平臺,那樣企業(yè)就會形成數(shù)據(jù)孤島。”因此,在Teradata的統(tǒng)一數(shù)據(jù)架構里面還有一個工具就是QueryGrid,其可以整合和訪問分布在不同平臺的數(shù)據(jù),做到更好的數(shù)據(jù)共享。
我們可以看到,今年Teradata在Hadoop方面做了很多的工作,也看到了Teradata大數(shù)據(jù)戰(zhàn)略中通過強化統(tǒng)一數(shù)據(jù)架構,擁抱快速發(fā)展的開源解決方案,幫助客戶獲得各種不同解決方案優(yōu)勢。
此外,在今年7月份,Teradata在支持開源解決方案的重大突破就是實現(xiàn)Aster與R的整合。因此,在整個分析引擎中,除了SQL、MapReduce等之外,還增加了R。孔宇華說:“Aster與R的整合,是一個強強聯(lián)合,R上面有很多不同的算法、不同的分析函數(shù)的展示方法,可以通過Aster獲得分布式高性能計算。。”現(xiàn)在Aster這把瑞士軍刀將能夠幫助R語言分析師,通過開發(fā)的他們熟悉的R語言和工具,獲得強大的處理能力及豐富的分析方法。分析師還能夠從多個數(shù)據(jù)源訪問海量整合數(shù)據(jù)。
當然,Teradata對統(tǒng)一數(shù)據(jù)架構的功能更新和強化一直在繼續(xù),無論是從數(shù)據(jù)獲取、存儲還是分析層面都加入了更多的功能。但是我們可以看到,Teradata在補充這些功能時,前提始終是基于這個“開放并包”的統(tǒng)一數(shù)據(jù)架構,而不是孤立的增加功能。
更多傳統(tǒng)行業(yè)成為目標客戶
前文我們提到了Teradata大數(shù)據(jù)功能和技術方面的新進展,而在行業(yè)應用方面,從與孔宇華的采訪中,也能感受到Teradata在一些傳統(tǒng)領域的“野心”。
以前提到Teradata的客戶時,我們可以數(shù)出一堆大金融企業(yè)、電信運營商,這些都是Teradata的優(yōu)勢領域。而從前文的各種功能更新上也看到,其實Teradata在降低大數(shù)據(jù)分析的應用門檻,無論是與Hadoop的各種整合,還是與R的整合等,這其實在一定程度降低了更多的傳統(tǒng)企業(yè)應用大數(shù)據(jù)的技術門檻。
孔宇華在提到Teradata的統(tǒng)一數(shù)據(jù)架構的優(yōu)勢時,也提到企業(yè)并不需要一次將所有的數(shù)據(jù)進行分析,而是可以將某一些數(shù)據(jù)快速地完成從獲取、存儲、探索到獲得價值這樣的一個流程,企業(yè)可以對數(shù)據(jù)的價值“先睹為快”,然后再決定自己的大數(shù)據(jù)戰(zhàn)略真正是怎樣的。
這也就是“大數(shù)據(jù)從小做起。”
而這樣一種思路必然會對Teradata進軍一些數(shù)據(jù)積累并不很好、IT技術并不是很強的行業(yè)產(chǎn)生推動作用。
在采訪孔宇華時,他提到Teradata的一些大數(shù)據(jù)成功案例時,聚焦在了三個領域,即醫(yī)療、零售和高科技制造業(yè)。據(jù)其透露,這三個領域也是之后Teradata在中國發(fā)力拓展的行業(yè)。
關于這三個行業(yè)的應用場景,孔宇華也做了一些舉例。比如醫(yī)療行業(yè),可以針對同一病癥不同患者的治療周期和方法進行分析,以得出為何不同的患者的花費會有較大的差距。當然在醫(yī)療的應用場景并不是只有這么簡單,還有諸如區(qū)域醫(yī)療、臨床路徑等。
大數(shù)據(jù)在被提出來之時,很多人將目光放在了互聯(lián)網(wǎng)、金融、電信等行業(yè),其實我們應該看到所有的行業(yè)都有著挖掘數(shù)據(jù)價值的愿望。而更多的傳統(tǒng)行業(yè),一方面技術人才并不多,另一方面數(shù)據(jù)積累也并不完善,Teradata在大數(shù)據(jù)上的思路顯然照顧了這些行業(yè)的需求,更加追求易用和包容性,以讓更多的行業(yè)并不需要一開始大而全的做大數(shù)據(jù),而是從小做起,一步步感受大數(shù)據(jù)的魅力和價值。
相關資訊不懼大數(shù)據(jù)挑戰(zhàn) NetApp打造高性能E平臺不懼大數(shù)據(jù)挑戰(zhàn) NetApp打造高性能E平臺Informatica孫大山:大數(shù)據(jù)下的生意經(jīng)Informatica孫大山:大數(shù)據(jù)下的生意經(jīng)為4G戰(zhàn)局注入強芯針Marvell發(fā)64位5模LTE芯片為4G戰(zhàn)局注入強芯針 Marvell新發(fā)64位5模LTE芯片沃森通過認知計算來認知整個世界沃森通過認知計算來認知整個世界插上資本翅膀的大象Hortonworks籌劃IPO插上資本翅膀的大象Hortonworks籌劃IPO英特爾在開放架構之下將會如何表現(xiàn)?英特爾在開放架構之下將會如何表現(xiàn)?數(shù)據(jù)遷移真理:解決方案與軟件間的較量數(shù)據(jù)遷移真理:解決方案與軟件間的較量從丑小鴨到白天鵝 致數(shù)據(jù)十年從丑小鴨到白天鵝 致數(shù)據(jù)十年數(shù)據(jù)經(jīng)濟 引領下一個十年數(shù)據(jù)經(jīng)濟 引領下一個十年埃森哲:89%高管認為大數(shù)據(jù)將徹底改變做生意方式埃森哲:89%高管認為大數(shù)據(jù)將徹底改變做生意方式