以大數(shù)據(jù)優(yōu)化為基礎(chǔ)構(gòu)建未來就緒企業(yè)

責(zé)任編輯:cres

作者:崔昊

2016-02-25 15:13:46

摘自:戴爾企業(yè)級(jí)解決方案

大數(shù)據(jù)真正的價(jià)值即在于為面向未來做好準(zhǔn)備,幫助企業(yè)規(guī)避風(fēng)險(xiǎn)。

引言

打造未來就緒的企業(yè),并非以“預(yù)測(cè)未來”為前提,而是面向未來做好準(zhǔn)備。

大數(shù)據(jù)真正的價(jià)值即在于為面向未來做好準(zhǔn)備,幫助企業(yè)規(guī)避風(fēng)險(xiǎn)。

戴爾提供專門為大數(shù)據(jù)目標(biāo)而設(shè)計(jì)的端到端體系架構(gòu),助力企業(yè)通過大數(shù)據(jù)獲得商業(yè)洞察,面向未來就緒。

正如納特·西爾弗(Nate Silver)在他的暢銷書《信號(hào)與噪聲》(The Signal and the Noise)中寫的,預(yù)測(cè)未來是非常困難的,因?yàn)?ldquo;我們選擇性地忽略了最難以衡量的風(fēng)險(xiǎn),即便這些風(fēng)險(xiǎn)對(duì)我們的生活構(gòu)成了最大的威脅”。

以大數(shù)據(jù)獲得商業(yè)洞察 面向未來就緒

在商業(yè)領(lǐng)域,企業(yè)的領(lǐng)導(dǎo)人往往寄希望于通過“預(yù)測(cè)未來”讓自己在競(jìng)爭(zhēng)中勝出,他們不厭其煩地說服自己和其他人:這世界上確實(shí)存在一些具有前瞻性的,能夠“遠(yuǎn)遠(yuǎn)眺望到未來的人”,而這些人就是他們自己——企業(yè)的領(lǐng)導(dǎo)者和管理者。

但正如戴爾在打造“未來就緒企業(yè)”(FRE)戰(zhàn)略中所倡導(dǎo)的,打造未來就緒的企業(yè)(FRE),并非基于對(duì)未來的預(yù)測(cè),而是側(cè)重于面向未來做好準(zhǔn)備——設(shè)計(jì)并實(shí)施靈活、高效的體系架構(gòu),從而讓企業(yè)更靈敏地反應(yīng)、更果斷地改變。未來就緒的企業(yè)致力于成為倡導(dǎo)開放性的典范——樂于接受新觀念、新流程,尤其是接受能夠避免刻板和傳統(tǒng)的、促進(jìn)創(chuàng)新和靈活的開放式IT架構(gòu)。

這同樣也應(yīng)當(dāng)是企業(yè)對(duì)待大數(shù)據(jù)的態(tài)度,客觀來說,大數(shù)據(jù)確實(shí)蘊(yùn)含了寶貴的企業(yè)經(jīng)營(yíng)信息,通過對(duì)大數(shù)據(jù)分析,企業(yè)的管理者能夠有效、直接、準(zhǔn)確地了解企業(yè)的運(yùn)營(yíng)情況、潛在問題以及商業(yè)優(yōu)勢(shì),但就對(duì)未來的預(yù)測(cè)來說,大數(shù)據(jù)更多的是提供進(jìn)行預(yù)測(cè)的藍(lán)本和避免錯(cuò)誤發(fā)生的預(yù)警。

換句話說,大數(shù)據(jù)分析乃至實(shí)時(shí)分析,提供的是側(cè)重于面向未來做好準(zhǔn)備、或是及時(shí)發(fā)現(xiàn)問題以規(guī)避企業(yè)經(jīng)營(yíng)風(fēng)險(xiǎn)的作用,“以古通今”可以,“以過去預(yù)測(cè)未來”則顯得不是那么實(shí)際了。

但這并非意味著大數(shù)據(jù)沒有價(jià)值了,對(duì)企業(yè)運(yùn)營(yíng)來說,避免發(fā)生錯(cuò)誤和疏漏,可以說對(duì)企業(yè)維持正常運(yùn)營(yíng)貢獻(xiàn)了一半以上的價(jià)值,如果再能藉此獲得一些“預(yù)測(cè)未來以及做出決定”的可供參考的數(shù)據(jù)支撐,則大數(shù)據(jù)對(duì)于企業(yè)經(jīng)營(yíng)的價(jià)值肯定還會(huì)大幅上升,這也就是為什么當(dāng)前人們要求越來越快、越來越準(zhǔn)確的大數(shù)據(jù)實(shí)時(shí)分析的重要原因之一。

在企業(yè)運(yùn)營(yíng)過程中,大數(shù)據(jù)產(chǎn)生價(jià)值至少需要三個(gè)組成部分,缺一不可:

第一,承載大數(shù)據(jù)的平臺(tái)是足夠可靠的,并且是足夠快的,可以將大數(shù)據(jù)快速供給到數(shù)據(jù)處理、分析平臺(tái),保證“持續(xù)性的數(shù)據(jù)供應(yīng)”;

第二,數(shù)據(jù)處理及分析的體系架構(gòu)是高效率且可信的,這要求整體架構(gòu)(特別是軟件平臺(tái))不僅分析速度要快,響應(yīng)時(shí)間要短,更要求任何數(shù)據(jù)分析平臺(tái)都可以快速融合到企業(yè)現(xiàn)有的數(shù)據(jù)平臺(tái)或數(shù)據(jù)源/流中;

第三,數(shù)據(jù)的備份、恢復(fù)仍然非常重要,隨著數(shù)據(jù)實(shí)時(shí)分析成為企業(yè)的關(guān)鍵業(yè)務(wù),一旦出現(xiàn)數(shù)據(jù)丟失、損壞等原因無法向?qū)崟r(shí)分析平臺(tái)供給數(shù)據(jù),這相當(dāng)于關(guān)鍵業(yè)務(wù)出現(xiàn)了停擺,這是不能被允許的。

在戴爾大數(shù)據(jù)及數(shù)據(jù)分析的技術(shù)藍(lán)圖中,戴爾強(qiáng)調(diào)“提供端到端的體系架構(gòu)”,專門為大數(shù)據(jù)目標(biāo)而設(shè)計(jì),利用數(shù)據(jù)分析和數(shù)據(jù)管理在軟硬件上的集成,實(shí)現(xiàn)最終效果的提升,徹底改變數(shù)據(jù)業(yè)務(wù)運(yùn)行效率,推動(dòng)業(yè)務(wù)轉(zhuǎn)型,在企業(yè)客戶的應(yīng)用中,“分析速度最高可提升70倍,預(yù)測(cè)分析響應(yīng)時(shí)間最快可加快60倍”,那么,戴爾是怎么做到的呢?

硬件加速 讓運(yùn)行速度快上100倍

作為所有大數(shù)據(jù)解決方案的基礎(chǔ),硬件平臺(tái)所能提供的速度是任何軟件優(yōu)化所不能比擬的,正如國(guó)內(nèi)許多互聯(lián)網(wǎng)公司的DBA最近幾年對(duì)閃存技術(shù),尤其是PCIe SSD的追捧,遠(yuǎn)勝過他們對(duì)于SQL語句和數(shù)據(jù)結(jié)構(gòu)優(yōu)化的熱情,硬件平臺(tái)是一切速度提升最直接、最根本的辦法。


針對(duì)這一市場(chǎng)需求,戴爾與Hadoop領(lǐng)域的No.1 Cloudera合作,面向Cloudera Enterprise打造了內(nèi)存一體化應(yīng)用,Dell (Cloudera)In-MemoryAppliances,這一平臺(tái)以戴爾的PowerEdge C系列服務(wù)器為基礎(chǔ),結(jié)合戴爾與英特爾合作的性能及安全調(diào)優(yōu)方案和高性能網(wǎng)絡(luò),借助Cloudera針對(duì)Hadoop及Spark工作負(fù)載的部署、配置、調(diào)優(yōu)技術(shù),建立起高性能、可靠的大數(shù)據(jù)平臺(tái)。

這一方案與MapReduce相比,運(yùn)行工作的速度快100倍,與傳統(tǒng)磁盤的方案相比,in-memory的速度快10倍,同時(shí),這一單一平臺(tái)可以支持多種框架,支持Hadoop和Spark,簡(jiǎn)化運(yùn)營(yíng)、降低成本,并且完全基于橫向擴(kuò)展的技術(shù)進(jìn)行搭建。

除此以外,戴爾在近兩年針對(duì)數(shù)據(jù)存儲(chǔ)及大數(shù)據(jù)需求,不斷優(yōu)化硬件平臺(tái)性能:提升13G PowerEdge服務(wù)器的能力,特別推出FX2、R730/R730xd、R530xd等適合大數(shù)據(jù)環(huán)境的高性能計(jì)算系統(tǒng);完全針對(duì)閃存特性進(jìn)行了性能優(yōu)化的戴爾存儲(chǔ)SC系列存儲(chǔ)系統(tǒng);Force 10系列高性能、高密度、低延遲的網(wǎng)絡(luò)交換機(jī),都為面向大數(shù)據(jù)優(yōu)化的解決方案提供了完整就緒的硬件平臺(tái)。

讓預(yù)測(cè)和分析輕松起來 將數(shù)據(jù)轉(zhuǎn)化為洞察力

在數(shù)據(jù)處理、分析、進(jìn)而提取價(jià)值、實(shí)現(xiàn)預(yù)測(cè),并更進(jìn)一步將數(shù)據(jù)轉(zhuǎn)化為洞察力之前,數(shù)據(jù)先要進(jìn)行由外向內(nèi)的遷移,并進(jìn)行數(shù)據(jù)集成,構(gòu)建起覆蓋面足夠廣、數(shù)據(jù)量級(jí)足夠大的數(shù)據(jù)集合,這其中至少包括兩項(xiàng)工作:在數(shù)據(jù)集(如數(shù)據(jù)庫)之間進(jìn)行數(shù)據(jù)的復(fù)制和遷移,以及在應(yīng)用程序之間的遷移。

比如說,就實(shí)現(xiàn)數(shù)據(jù)集中的數(shù)據(jù)遷移來說,當(dāng)前大數(shù)據(jù)主流的數(shù)據(jù)集平臺(tái)是Hadoop、Greenplum,而企業(yè)業(yè)務(wù)系統(tǒng)和原有平臺(tái)中的結(jié)構(gòu)化數(shù)據(jù)往往是基于Oracle數(shù)據(jù)庫或是SQL Server所構(gòu)建的,這意味著企業(yè)需要從Oracle數(shù)據(jù)庫遷移到Hadoop或是Greenplum。這就是戴爾SharePlex所做的事情。

在其客戶網(wǎng)秦的應(yīng)用過程中,SharePlex非常好地幫助網(wǎng)秦消除了各類應(yīng)用系統(tǒng)軟件升級(jí)或遷移過程中的服務(wù)停滯時(shí)間,實(shí)現(xiàn)了在線式的軟件系統(tǒng)升級(jí),另一方面Quest SharePlex高效支持異構(gòu)的IT平臺(tái),可以幫助數(shù)據(jù)庫管理員實(shí)現(xiàn)高效融合,輕松完成數(shù)據(jù)的匯集和分發(fā),這讓網(wǎng)秦?cái)?shù)據(jù)管理效率提升10倍。

在應(yīng)用程序之間同步數(shù)據(jù)同樣令人頭疼,為了消除使用舊式中間件、應(yīng)用方案或自定義代碼時(shí),所產(chǎn)生的與集成、及維護(hù)集成相關(guān)的成本,企業(yè)客戶尋找過很多的解決方案,但歸根結(jié)底,他們需要的不過是簡(jiǎn)化軟件及設(shè)備的、連接內(nèi)部或云中同步業(yè)務(wù)關(guān)鍵型應(yīng)用程序之間的數(shù)據(jù)(比如Salesforce)的方法。

換言之,企業(yè)需要連接內(nèi)部傳統(tǒng)IT架構(gòu)、內(nèi)部私有云、外部混合云及公有云的數(shù)據(jù)連接及同步方案——這正是Boomi AtomSphere要做的事情,以數(shù)據(jù)映射建議引擎Boomi Suggest為核心,企業(yè)客戶可以使用直觀的拖放界面立即創(chuàng)建集成流程,自動(dòng)準(zhǔn)確建議映射并在應(yīng)用程序之間輕松映射數(shù)據(jù)字段;

更可使用Boomi基于Web且功能豐富的控制板,監(jiān)控和維護(hù)已部署的集成流程。

Boomi AtomSphere的價(jià)值在于,數(shù)據(jù)映射的建立只需要通過簡(jiǎn)單地拖動(dòng)來解決,可視化設(shè)計(jì)的界面避免了復(fù)雜的編碼工作,“封包”了所有的復(fù)雜性,并且可以集中管理和監(jiān)控所有集成流程,“以跟蹤總體集成性能以及個(gè)別流程的執(zhí)行指標(biāo)”。

具有行業(yè)特性的服務(wù)和解決方案 更聚焦、更可信的商業(yè)洞察

基礎(chǔ)架構(gòu)已經(jīng)準(zhǔn)備就緒,數(shù)據(jù)集合已經(jīng)準(zhǔn)備就緒,順理成章來到了第三步,這一步正是大數(shù)據(jù)真正創(chuàng)造價(jià)值的部分:統(tǒng)計(jì)數(shù)據(jù)、處理數(shù)據(jù)、分析數(shù)據(jù),形成對(duì)業(yè)務(wù)的有效結(jié)論,將數(shù)據(jù)轉(zhuǎn)化為洞察力。

戴爾Statistica大數(shù)據(jù)分析正是這一步的關(guān)鍵,Statistica Big Data Analytics是一種先進(jìn)的內(nèi)容挖掘和分析解決方案,完全集成了自動(dòng)化配置及云功能,可以在幾分鐘內(nèi)匯集自然語言處理、機(jī)器學(xué)習(xí)、高級(jí)搜索和可視化,并可以與Hadoop結(jié)合起來,幫助各種規(guī)模的企業(yè)更有效地處理數(shù)據(jù)。

最新的Statistica 13可以將企業(yè)把預(yù)測(cè)模型直接部署到數(shù)據(jù)源的流程進(jìn)行簡(jiǎn)化和改進(jìn),無論這些數(shù)據(jù)源在防火墻內(nèi)、云中還是合作伙伴生態(tài)系統(tǒng)中。作為一個(gè)無需編碼并與開源R無縫集成,且易于使用的解決方案,戴爾Statistica提供全面的數(shù)據(jù)融合、數(shù)據(jù)發(fā)現(xiàn)以及先進(jìn)的預(yù)測(cè)分析工具,幫助企業(yè)利用所有數(shù)據(jù)來預(yù)測(cè)未來趨勢(shì)、發(fā)現(xiàn)新客戶和銷售機(jī)會(huì)、探索“假設(shè)”場(chǎng)景,并降低欺詐和其它業(yè)務(wù)風(fēng)險(xiǎn)的可能性。

值得一提的是,新的本地分布式分析(NDA)功能,讓用戶可以直接在數(shù)據(jù)所在的數(shù)據(jù)庫中運(yùn)行分析,并更有效地使用不斷增長(zhǎng)的大型數(shù)據(jù)集。

NDA功能把預(yù)測(cè)算法建模和計(jì)分功能直接推送到數(shù)據(jù)源。這消除了把數(shù)據(jù)拉取到中間服務(wù)器或桌面的耗費(fèi)時(shí)間,且規(guī)避了令數(shù)據(jù)受限的流程,讓所有分析處理直接在數(shù)據(jù)庫內(nèi)發(fā)生,并讓企業(yè)能夠充分利用Hadoop集群、數(shù)據(jù)庫設(shè)備和其它高性能平臺(tái)的威力。

但戴爾在大數(shù)據(jù)領(lǐng)域的業(yè)務(wù)就緒并非只有軟硬件,隨著戴爾服務(wù)繼續(xù)在高級(jí)分析和數(shù)據(jù)科學(xué)領(lǐng)域加強(qiáng)IP主導(dǎo)的服務(wù)產(chǎn)品,一系列新的BPO服務(wù)正式上線,其中包括欺詐、浪費(fèi)和濫用的管理,拒絕可能性計(jì)分和預(yù)測(cè)分析,客戶流失管理/客戶保留服務(wù),以及創(chuàng)建早期報(bào)警和文本分析的Dell Service DeskAnalytics,和幫助客戶跟蹤、監(jiān)測(cè)各種計(jì)分卡或預(yù)測(cè)分析模型效果的Dell ModelHealth Tracker。

除此以外,戴爾深刻理解“大數(shù)據(jù)是具有行業(yè)特性的,行業(yè)要解決的是具有行業(yè)特色的大數(shù)據(jù)”,戴爾服務(wù)在先進(jìn)分析領(lǐng)域有50多個(gè)解決方案,包括聚焦人口健康、患者再入院和健康風(fēng)險(xiǎn)分層等關(guān)鍵問題的醫(yī)療分析產(chǎn)品;聚焦在線交易和欺詐監(jiān)測(cè)的金融分析產(chǎn)品;以及保險(xiǎn)相關(guān)產(chǎn)品,聚焦于通過LifeSys(用于保險(xiǎn)索賠處理的戴爾平臺(tái))中嵌入的分析而減少客戶流失。

高性能的數(shù)據(jù)保護(hù)與恢復(fù) 為大數(shù)據(jù)的可靠、可用保駕護(hù)航

最后一步,為了保證大數(shù)據(jù)可靠、可用,在戴爾的未來就緒企業(yè)的技術(shù)藍(lán)圖中,數(shù)據(jù)保護(hù)、備份恢復(fù)乃至容災(zāi)是非常重要的組成部分,AppAssure 備份、復(fù)制和恢復(fù)軟件 + NetVault 備份正是為此準(zhǔn)備的。

在這一解決方案之中,企業(yè)客戶可以在單一的解決方案中統(tǒng)一進(jìn)行備份、復(fù)制和恢復(fù),保護(hù)物理、虛擬和云環(huán)境中的數(shù)據(jù);幾乎可以瞬間恢復(fù)系統(tǒng)運(yùn)行,恢復(fù)時(shí)間目標(biāo)(RTO)只有幾分鐘;在意外發(fā)生后,提供近乎不間斷的數(shù)據(jù)訪問,確保業(yè)務(wù)的不間斷,但戴爾在這方面的能力還不止如此。


Rapid Recovery在戴爾的數(shù)據(jù)保護(hù)產(chǎn)品組合之中是一個(gè)值得記住的名字,因?yàn)檫@一產(chǎn)品不僅集成了AppAssure,而且是一款在開發(fā)時(shí)充分考慮了云恢復(fù)的產(chǎn)品,比如說可以從云存檔中裸機(jī)恢復(fù) (BMR),采用含加密的Rapid Recovery Repository(R3)以及基于經(jīng)過驗(yàn)證的Rapid Data Access(RDA)客戶端重復(fù)數(shù)據(jù)刪除技術(shù)——這為從云中實(shí)現(xiàn)更快速的快照復(fù)制、縮短數(shù)據(jù)傳輸時(shí)間和更高的規(guī)模提供了技術(shù)基礎(chǔ)。

除此以外,Rapid Recovery還包括兩個(gè)功能:

1.Rapid Snap for Applications技術(shù),可以捕捉整個(gè)應(yīng)用及相關(guān)狀態(tài),實(shí)現(xiàn)完整的應(yīng)用和系統(tǒng)恢復(fù),擁有接近于零的RTO和激進(jìn)的RPO;

2.Rapid Snap for Virtual功能,基于Dell vRanger技術(shù),為不斷擴(kuò)大的VMWare環(huán)境提供可擴(kuò)展的無代理保護(hù),并自動(dòng)檢測(cè)和備份ESXi主機(jī)上配置的虛擬機(jī)。

Rapid Recovery的高性能、大規(guī)模、云適應(yīng)能力,能夠?yàn)榇髷?shù)據(jù)提供可靠、可用的有效保障,而這正是四步大數(shù)據(jù)優(yōu)化的最后一步,歷經(jīng)基礎(chǔ)架構(gòu)、數(shù)據(jù)集合、數(shù)據(jù)洞察與數(shù)據(jù)保護(hù)的四步優(yōu)化,大數(shù)據(jù)才能夠真正順暢地在企業(yè)中發(fā)揮其應(yīng)用的價(jià)值,為未來就緒企業(yè)的商業(yè)洞察與業(yè)務(wù)發(fā)展,提供萬全的大數(shù)據(jù)準(zhǔn)備。
 

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號(hào)-6京公網(wǎng)安備 11010502049343號(hào)