這兩個業(yè)務(wù)驅(qū)動力都要求企業(yè)更敏捷、更成熟地將精準(zhǔn)定義的信息管理實踐與構(gòu)成端到端信息管理框架的技術(shù)相結(jié)合。
數(shù)據(jù)集成
數(shù)據(jù)集成現(xiàn)已成為企業(yè)的命脈。企業(yè)日益認(rèn)識到跨業(yè)務(wù)部門實現(xiàn)數(shù)據(jù)共享是何等重要,為滿足這一需求,他們必須提高數(shù)據(jù)集成的可靠性、性能和數(shù)據(jù)集成訪問速度,尤其是在以下基礎(chǔ)領(lǐng)域:
• 數(shù)據(jù)可訪問性 – – 企業(yè)必須支持龐大的傳統(tǒng)數(shù)據(jù)系統(tǒng)環(huán)境,尤其是當(dāng)他們希望掃描歷史數(shù)據(jù)資產(chǎn)以獲得潛在的商業(yè)價值時。數(shù)據(jù)集成的一個關(guān)鍵點便是數(shù)據(jù)可訪問性,先進的信息管理框架必須能夠提供通往此類廣泛數(shù)據(jù)源的連接器,包括基于文件的樹形結(jié)構(gòu)數(shù)據(jù)集、關(guān)系數(shù)據(jù)庫甚至流數(shù)據(jù)源。
• 數(shù)據(jù)轉(zhuǎn)換、交換和交付 – – 一旦數(shù)據(jù)集允許源頭訪問,數(shù)據(jù)集成框架就必須能在源和目的地之間有效地轉(zhuǎn)移數(shù)據(jù),必須能將數(shù)據(jù)從其原始格式轉(zhuǎn)換為適宜的目標(biāo)格式,同時能夠驗證數(shù)據(jù)集是否已被合理打包和傳遞。
• 數(shù)據(jù)復(fù)制和變更數(shù)據(jù)捕獲 – – 面對不斷增長的數(shù)據(jù)量,數(shù)據(jù)交付瓶頸導(dǎo)致企業(yè)無法在指定時段內(nèi)控制數(shù)據(jù)的可訪問性和數(shù)據(jù)交付,尤其是在從源系統(tǒng)定期提取數(shù)據(jù)期間以及向數(shù)據(jù)倉庫中加載數(shù)據(jù)期間。數(shù)據(jù)復(fù)制技術(shù)可快速批量傳輸大型數(shù)據(jù)集。您可使用名為“變更數(shù)據(jù)捕獲”的方法來監(jiān)視系統(tǒng)日志并在源系統(tǒng)發(fā)生變化時觸發(fā)更新目標(biāo)系統(tǒng)。從而通過源源不斷地饋送數(shù)據(jù)變更來實現(xiàn)進程同步。
數(shù)據(jù)虛擬化
當(dāng)用戶日益需要訪問采用不同結(jié)構(gòu)和格式的大量來源的數(shù)據(jù)時,高效數(shù)據(jù)集成可幫助應(yīng)對某些相關(guān)挑戰(zhàn)。但仍然無法解決及時一致地填充數(shù)據(jù)倉庫以滿足消費系統(tǒng)性能要求等問題。您在執(zhí)行同步提取和轉(zhuǎn)換數(shù)據(jù)的復(fù)雜任務(wù)時,您會遇到定時和同步問題,從而導(dǎo)致數(shù)據(jù)使用者與原始的源系統(tǒng)之間無法保持一致。
您可嘗試通過縮短數(shù)據(jù)感知延遲和減小異步程度來解決此問題。數(shù)據(jù)虛擬化技術(shù)已經(jīng)發(fā)展成熟,能夠幫您排除這些顧慮。數(shù)據(jù)虛擬化工具和技術(shù)可提供以下三項主要功能:
• 聯(lián)合 – – 這項功能可將標(biāo)準(zhǔn)或規(guī)范數(shù)據(jù)模型映射至面向包含聯(lián)合模型的各類數(shù)據(jù)源的訪問方法中,從而實現(xiàn)異構(gòu)源的聯(lián)合。
• 緩存 – – 通過在虛擬(“緩存”)環(huán)境中管理訪問和聚合數(shù)據(jù),數(shù)據(jù)虛擬化可縮短數(shù)據(jù)延遲,從而提高系統(tǒng)性能。
• 一致性 – – 聯(lián)合和虛擬化功能結(jié)合在一起,可提取數(shù)據(jù)訪問方法并將其與數(shù)據(jù)驗證、清理和統(tǒng)一標(biāo)準(zhǔn)結(jié)合使用。
虛擬化數(shù)據(jù)環(huán)境可簡化最終用戶應(yīng)用和業(yè)務(wù)數(shù)據(jù)分析人員的數(shù)據(jù)訪問方式,無需他們了解源數(shù)據(jù)位置、數(shù)據(jù)集成或相關(guān)業(yè)務(wù)規(guī)則。
事件流處理
傳統(tǒng)的商業(yè)智能系統(tǒng)可能不足以將實時事件信息的主動捕獲、監(jiān)控和關(guān)聯(lián)轉(zhuǎn)化為切實可用的知識。如想解決這個問題,您可通過名為“事件流處理”(ESP)的技術(shù)對流經(jīng)信息流的事件之模式和序列進行實時監(jiān)控。
ESP系統(tǒng)能幫企業(yè)快速響應(yīng)因多個信息流匯合而帶來的新機遇。這些系統(tǒng)允許信息管理專業(yè)人員模擬企業(yè)內(nèi)部用戶如何受到多個不同數(shù)據(jù)輸入流的影響,并對觸發(fā)產(chǎn)生心儀結(jié)果的模式進行分析。ESP系統(tǒng)可根據(jù)預(yù)期模式持續(xù)(實時)監(jiān)控具有潛在影響的所有事件流,并能在指定的事件發(fā)生期內(nèi)實現(xiàn)低延遲和事件處理。當(dāng)發(fā)現(xiàn)實際情況與預(yù)期存在出入或新機會時,該系統(tǒng)可向適當(dāng)人員發(fā)出警報,以便他們迅速采取行動,速度之快遠(yuǎn)非傳統(tǒng)的數(shù)據(jù)分析工具可比。
ESP網(wǎng)絡(luò)可以監(jiān)視來自多個輸入數(shù)據(jù)源的大量數(shù)據(jù),具有極低的事件處理延遲。ESP系統(tǒng)具有延遲低和分析周轉(zhuǎn)短等特點,能通過可擴展的方式持續(xù)監(jiān)控大量的流數(shù)據(jù)源,從而允許您識別出并響應(yīng)新情況。實質(zhì)上,您可使用ESP針對許多既定模式同時搜索大量動態(tài)數(shù)據(jù),無需對靜態(tài)數(shù)據(jù)執(zhí)行動態(tài)查詢。
元數(shù)據(jù)管理
跨職能部門的數(shù)據(jù)共享與交換暴露了與各部門獨立設(shè)計、開發(fā)和實施的數(shù)據(jù)系統(tǒng)相關(guān)的固有的不一致問題。鑒于早期的元數(shù)據(jù)管理方法只關(guān)注于數(shù)據(jù)模型的結(jié)構(gòu)和技術(shù)層面(不考慮與業(yè)務(wù)相關(guān)的含義和語義),導(dǎo)致元數(shù)據(jù)管理項目經(jīng)常徘徊不前?,F(xiàn)代化企業(yè)信息管理環(huán)境必須能夠?qū)崿F(xiàn)業(yè)務(wù)導(dǎo)向的元數(shù)據(jù)管理,包括以下工具和方法:
• 業(yè)務(wù)術(shù)語詞匯表,用于捕獲常用的業(yè)務(wù)術(shù)語及其權(quán)威定義
• 數(shù)據(jù)標(biāo)準(zhǔn),如命名慣例、既定的參考數(shù)據(jù)集、以及數(shù)據(jù)存儲和交換標(biāo)準(zhǔn)
• 數(shù)據(jù)元素定義,用于反映數(shù)據(jù)與業(yè)務(wù)術(shù)語的關(guān)聯(lián)性并提供上下文相關(guān)的定義以在業(yè)務(wù)應(yīng)用中使用
• 數(shù)據(jù)譜系,用于顯示數(shù)據(jù)元素概念與其在不同模型和應(yīng)用中的表示法之間的關(guān)系
• 與數(shù)據(jù)治理策略相集成,以支持驗證、合規(guī)性和控制
數(shù)據(jù)質(zhì)量管理
數(shù)據(jù)質(zhì)量管理的最佳業(yè)務(wù)實踐旨在幫助企業(yè)提高識別數(shù)據(jù)缺陷和錯誤的精準(zhǔn)度,并簡化對數(shù)據(jù)缺陷根源的分析和修復(fù)流程。與此同時,數(shù)據(jù)質(zhì)量保證工具和技術(shù)必須允許用戶實現(xiàn)數(shù)據(jù)標(biāo)準(zhǔn)化,并在可能的情況下糾正錯誤數(shù)據(jù)、實時標(biāo)記出新發(fā)現(xiàn)的問題、通知適當(dāng)?shù)臄?shù)據(jù)管理員、并促成企業(yè)與源數(shù)據(jù)提供商就潛在數(shù)據(jù)問題進行交流。納入以下技術(shù)的正式的數(shù)據(jù)質(zhì)量管理框架可幫您實現(xiàn)上述目標(biāo):
• 數(shù)據(jù)解析和標(biāo)準(zhǔn)化 - 掃描數(shù)據(jù)值,旨在將非標(biāo)準(zhǔn)表示法轉(zhuǎn)換為標(biāo)準(zhǔn)格式。
• 數(shù)據(jù)糾正和清理 - 應(yīng)用數(shù)據(jù)質(zhì)量規(guī)則來糾正已發(fā)現(xiàn)的數(shù)據(jù)錯誤,從而清理數(shù)據(jù)并消除不一致性。
• 數(shù)據(jù)質(zhì)量規(guī)則管理 - 集中管理數(shù)據(jù)質(zhì)量要求和規(guī)則,以驗證數(shù)據(jù)是否符合預(yù)期規(guī)定。
• 數(shù)據(jù)質(zhì)量評估和報告 - 提供服務(wù)調(diào)用框架,以根據(jù)數(shù)據(jù)規(guī)則來驗證數(shù)據(jù)并報告異常和數(shù)據(jù)缺陷。
• 標(biāo)準(zhǔn)化數(shù)據(jù)集成驗證 - 持續(xù)驗證現(xiàn)有的數(shù)據(jù)集成流程并對新開發(fā)的數(shù)據(jù)集成流程實施嵌入式驗證。
• 數(shù)據(jù)質(zhì)量評估 - 使用數(shù)據(jù)分析和其他統(tǒng)計工具來評估源數(shù)據(jù)和數(shù)據(jù)問題,以識別出潛在的數(shù)據(jù)質(zhì)量規(guī)則。
• 事故管理 - 數(shù)據(jù)質(zhì)量事故管理的標(biāo)準(zhǔn)化方法(報告、分析/評估、分配優(yōu)先級、補救、跟蹤)。
數(shù)據(jù)治理
最后,如果缺少數(shù)據(jù)規(guī)則驗證技術(shù)及數(shù)據(jù)政策合規(guī)保障技術(shù),任何的現(xiàn)代化企業(yè)信息管理環(huán)境都將是不完整的。現(xiàn)代化企業(yè)信息管理環(huán)境至少應(yīng)能通過適當(dāng)工具來管理數(shù)據(jù)政策的整個生命周期,包括起草策略、向數(shù)據(jù)治理委員會提出策略、審查與修訂、審批、以及規(guī)則的實際應(yīng)用等。
這些任務(wù)必須與組織系統(tǒng)開發(fā)生命周期中的設(shè)計和開發(fā)任務(wù)保持一致。這一點適用于信息管理的整個生命周期,從數(shù)據(jù)使用者的需求分析與匯總、到概念建模、邏輯和物理設(shè)計、以及后續(xù)實施。