大數據分析服務供應商Teradata天睿公司(Teradata Corporation,紐交所:TDC)宣布推出一種全新的數據湖部署“設計模式”,利用多年在大數據咨詢和優(yōu)化方面豐富的經驗,幫助客戶建設數據湖并獲益。作為業(yè)內首次推出,全新的設計模式方法將使得Teradata繼續(xù)領先同業(yè),幫助企業(yè)用戶、數據科學家和IT專業(yè)人員建立數據湖,并產生卓越的業(yè)務價值。
企業(yè)正在探索數據湖的功能,在激增的數據量中產生洞察和機會。然而,一些嚴重的問題也令其IT團隊備受困惑,包括:缺乏最佳實踐、缺少數據科學家,甚至存在數據湖定義的混亂等。除了這些挑戰(zhàn),技術的選擇也越來越多。例如,數據湖通常被假定為Hadoop的代名詞,盡管Hadoop是處理大量數據湖工作負載的良好選擇,但是數據湖構建可以使用多種技術,如Hadoop、NoSQL、Amazon S3、關系型數據庫(RDBMS),以及各種技術組合等。雖然技術選擇攸關洞察結果,但是成功的數據湖亦需要周密的計劃。數據湖設計模式包含一系列基于企業(yè)級最佳實踐的知識產權,以及在大量的客戶成功項目中共同開發(fā)的產品等。
全球知名的科技分析研究公司OVUM高級分析師Tony Baer表示:“Teradata已經率先為數據湖確定了實施模式。數據湖不同于操作型數據存儲系統(tǒng),Teradata的價值主張源自真正的實踐經驗,幫助客戶應對不同環(huán)境中的數據管理。收購Think Big后,Teradata獲得了設計模式這一寶貴的知識產權,將有助于構建透明的數據湖。”
通過訪問新的數據,例如存儲在數據湖中的客戶服務記錄、點擊流數據、IP流、日志信息和傳感器數據等,用戶能夠解決通常需要多次同步解讀的數據,并進行相互驗證的難題。這些應用案例包括:
?通過提取存儲在數據湖中客服通話的文本信息,創(chuàng)建客戶流失偵測的改善模型,再應用預測性文本分析方法。
?通過將大量機器數據和消費數據組合提供趨勢分析。在電力行業(yè),數據湖能夠運行多個數據模型,評估安裝節(jié)能設備的影響,以及數月后降低能耗帶來的潛在影響。
Teradata天睿公司旗下Think Big公司創(chuàng)始人兼總裁Ron Bodkin表示:“數據湖實施的挑戰(zhàn)巨大,這也成為幫助我們獲得快速發(fā)展的原因:我們應邀幫助企業(yè)處理因各種原因而停滯的困難且昂貴的數據湖項目,為不同的情形定制數據湖設計模式方法。這些模式以及相關軟件框架是強大且可靠的價值加速器。遺憾的是,很多企業(yè)很難發(fā)現大數據的雷區(qū),我們協(xié)助客戶擺脫危機,幫助企業(yè)、IT和數據科學家完成數據湖的規(guī)劃、實施并獲益,產生巨大的商業(yè)價值。當客戶獲得實踐經驗時,他們應該并愿意去創(chuàng)建數據湖。”
自創(chuàng)立伊始,Think Big就一直堅持技術和平臺中立的原則,專注于通過Apache™ Hadoop®、Apache Spark™和 NoSQL等開源技術產生實際價值。Think Big 提供數種數據湖設計模式服務:針對剛開始數據湖項目或者尋求最佳實踐咨詢的團隊的數據湖基礎(Data Lake Foundation);針對尋求數據湖最佳實踐和技術選擇的企業(yè)的數據湖架構(Data Lake Architecture);以及針對分析周期執(zhí)行中數據準備的數據湖分析(Data Lake Analytics)等。
Think Big已經幫助大量行業(yè)領導企業(yè)和創(chuàng)新公司建立數據湖,并提供Hadoop和大數據部署的工程服務,并擁有典型的客戶案例,如西部數據硬盤旗下HGST公司、一家全球最大的金融服務商、領先的半導體制造商、領先的計算機存儲和數據管理公司、著名的體育用品服裝制造商,以及全球著名的軟飲料生產商等。
Teradata還提供多種產品和技術,強化數據湖環(huán)境中的應用。包括:通過智能、自助服務軟件解決方案簡化數據湖中流數據(streaming data)的Teradata Listener;低成本的數據存儲選項Teradata Appliance for Hadoop;提供流行的SQL-on-Hadoop架構的Presto;以及被稱為管道控制器(Pipeline Controller)和緩沖服務器(Buffer Server)等知識產權的數據湖加速器,能夠將數據高效地從本地服務器移動到Hadoop上。