戴爾科技沖破重重阻礙,助力實現(xiàn)對非結構化數(shù)據(jù)的存儲、挖掘和洞察

責任編輯:cres

2022-04-15 14:33:00

來源:企業(yè)網(wǎng)D1Net

原創(chuàng)

戴爾科技沖破重重阻礙,助力實現(xiàn)對非結構化數(shù)據(jù)的存儲、挖掘和洞察。

你知道嗎?
 
你每低頭多玩幾分鐘手機
 
世界上就會多一個頸椎不適者
 
以及一堆非結構化數(shù)據(jù)
 
我們正大踏步邁入非結構化數(shù)據(jù)時代
 
聊微信、打電話、發(fā)郵件、手機拍照
 
……
 
你的每一次指尖輕舞
 
都有源源不斷的非結構化數(shù)據(jù)為伴

 
IDC 預測,2018年到2025年間,全球產(chǎn)生的數(shù)據(jù)量將會從33 ZB增長到175 ZB,其中超過80%為非結構化數(shù)據(jù),并且每年將以指數(shù)級趨勢遞增。
 
數(shù)字化汪洋之上,海霧彌漫,遮天蔽日,組織如何沖破重重阻礙,實現(xiàn)對非結構化數(shù)據(jù)的存儲、挖掘和洞察呢?
 
你問我答
 
歡迎來到⌈你問我答⌋第二期。今天我們將對非結構化數(shù)據(jù)的價值挖掘問題進行探討,希望為在非結構化數(shù)據(jù)存儲方面有困惑的讀者提供思路。
 
歡迎大家多多關注,多多提問~
 
非結構化數(shù)據(jù)怎么存?
 
結構化數(shù)據(jù)如日期、電話號、賬戶余額、產(chǎn)品名稱等,嚴格遵循數(shù)據(jù)格式與長度規(guī)范、易于由二維表結構進行邏輯表達和實現(xiàn),與之相反,非結構化數(shù)據(jù)結構不規(guī)則或不完整、缺乏預定義數(shù)據(jù)模型、格式多種多樣,比如文檔、圖片、音頻、視頻、社交媒體記錄等,往往呈現(xiàn)出雜亂無章的特點。
 
針對結構化數(shù)據(jù),市面上有大量成熟的分析工具可用來實現(xiàn)數(shù)據(jù)洞察,但非結構化數(shù)據(jù)難以標準化和理解,處理難度較大,對其價值挖掘尚處于發(fā)展階段。

 
關于非結構化數(shù)據(jù)存儲,目前業(yè)內(nèi)主要有擅長存儲海量文件的NAS文件存儲和對象存儲兩種選項。
 
文件存儲
 
以文件和文件夾為操作對象,基于文件夾/文件的路徑訪問數(shù)據(jù)。這是一種比較接地氣的形式,我們?nèi)粘T陔娔X里先打開父文件夾,再層層點開父文件夾嵌套的子文件夾,最后找到子文件夾里的某個文件,這一套流程就是文件存儲的體驗。
 
作為數(shù)據(jù)存儲老手,文件存儲已經(jīng)被廣泛應用十幾年,它能兼顧多個應用和多個用戶訪問,突出優(yōu)勢是方便文件共享。

 
對象存儲
 
是近些年的存儲網(wǎng)紅,它以對象(object,不是搞對象的對象)為操作對象。不同于文件存儲的樹狀嵌套分層結構,對象存儲架構更為扁平化,它將數(shù)據(jù)及其元數(shù)據(jù)打包放到一個超大的資源池,用戶可根據(jù)唯一的元數(shù)據(jù)快速定位文件。
 
有這么一個比喻,同樣到商場存包,文件存儲這個商場里,你要記住自己的物品放在哪間儲存室的哪排柜子的第幾號,而在對象存儲商場,存包員會給你一張憑條,你只需將憑條交給存包員即可取包,無需記住數(shù)據(jù)以什么形式存在了哪里。
 
對象存儲的靈活性和扁平架構決定了它可以通過擴展來存儲海量數(shù)據(jù),其容量通常可達到EB級以上,從理論上講對象存儲的容量和對象數(shù)量可以無限擴充。
 
文件存儲還是對象存儲?
 
既然文件存儲和對象存儲的都適用于海量非結構化數(shù)據(jù)存儲,那么用戶什么時候選擇文件存儲,什么時候選擇對象存儲呢?
 
有兩個主要指標,一看數(shù)據(jù)規(guī)模,二看應用場景。
 
01
 
數(shù)據(jù)規(guī)模
 
文件存儲通過將數(shù)據(jù)劃分為類別、目錄和文件夾來獲取非結構化數(shù)據(jù)并將其結構化,由此用戶可以快速輕松地查詢搜索。
 
但是文件存儲中,一旦文件數(shù)達到數(shù)千萬級別,目錄樹越建越深,就會造成性能瓶頸,不僅查詢效率嚴重下降,而且超多超大文件管理困難,嚴重影響業(yè)務效率。

 
對于幾乎無形中可以添加更多空間、彈性擴容的對象存儲來說,爆炸性膨脹的非結構化數(shù)據(jù)存儲簡直是小菜一碟。
 
因此,如果組織要處理的非結構化數(shù)據(jù)量有限,文件存儲是最佳選擇。若組織需要處理大量數(shù)據(jù),那么選擇對象存儲是更明智的決定。
 
02
 
應用場景
 
對象存儲之所以成為近些年的存儲頂流,除了其容量無限制、強擴展的特性,還在于其天然擁抱云和互聯(lián)網(wǎng)的特質。
 
在對象存儲中,用戶若想修改文件,只能先下載、修改,再將修改后的文件上傳,這一特性決定了它非常適合讀取多寫入少的場景——比如網(wǎng)站視頻播放、網(wǎng)盤應用、機器學習的數(shù)據(jù)訓練、物聯(lián)網(wǎng)數(shù)據(jù)傳輸、云原生等,對于這些現(xiàn)代化應用,對象存儲大有可為。

 
此外,對象存儲也被稱為云存儲,如今已成為云服務公司的一項基礎業(yè)務,全球各知名廠商紛紛推出基于對象存儲的云存儲服務,憑借其事實上的語言——AWS S3 API,對象存儲可以在內(nèi)部部署/私有云環(huán)境與公有云存儲之間進行無縫訪問和移動。
 
因此,對于人工智能、物聯(lián)網(wǎng)、云原生等新興應用,對象存儲將是不錯的選擇。
 
你要的,我們都有!
 
針對洶涌而來的非結構化數(shù)據(jù),戴爾科技洞悉組織從中挖掘價值的需求,專門為非結構化數(shù)據(jù)設計了兩款存儲系統(tǒng)——NAS文件存儲PowerScale和對象存儲ECS。
 
用戶可通過PowerScale進行基于文件的非結構化數(shù)據(jù)管理,ECS則負責基于對象和云原生的非結構化數(shù)據(jù)。
 
PowerScale搭載新一代橫向擴展文件系統(tǒng)OneFS和PowerEdge服務器,具備高并發(fā)帶寬、快速線性擴展、靈活的多協(xié)議訪問、完善的數(shù)據(jù)保護、穩(wěn)定可靠易管理等特點。

 
PowerScale由英特爾®至強®處理器提供支持,該處理器采用軟件定義的基礎設施和敏捷云架構,為PowerScale提供了卓越的性能和效率,可加速要求嚴苛的文件工作負載,使企業(yè)發(fā)揮數(shù)據(jù)資本的價值,加速業(yè)務的數(shù)字轉型。
 
PowerScale提供從最小11TB到多PB規(guī)模的存儲能力,支持對數(shù)百萬個文件進行操作。它允許無縫進行新舊節(jié)點服務器過渡升級,不需要數(shù)據(jù)遷移,60秒內(nèi)即可簡單擴容一個節(jié)點?;赑owerScale,用戶可以高效地存儲、管理、保護和分析非結構化數(shù)據(jù)。
 
作為一款企業(yè)級對象存儲平臺,ECS可支持組織以類似于公有云的規(guī)模靈活地捕獲、存儲、保護和管理非結構化數(shù)據(jù),所有這一切都在數(shù)據(jù)中心范圍內(nèi)實現(xiàn)。

 
ECS具有非凡的可擴展性、性能、彈性和經(jīng)濟性,可滿足現(xiàn)代企業(yè)的需求。用戶可利用高性能、兼容S3的ECS支持現(xiàn)代工作負載,并在較低的總擁有成本基礎上,使用ECS開發(fā)云原生應用程序、構建EB規(guī)模歸檔、推動戰(zhàn)略分析計劃和滿足SLA。
 
另外需要指出的是,戴爾PowerScale和ECS已通過著名大數(shù)據(jù)技術服務商Cloudera的CDP認證,由此PowerScale和ECS用戶可以獲得更輕松、更快速、更安全的自助式數(shù)據(jù)分析體驗,而這將進一步打破企業(yè)從數(shù)據(jù)存儲到數(shù)據(jù)洞察之間的重重阻礙。
 
大數(shù)據(jù)時代,體量占有壓倒性優(yōu)勢的非結構化數(shù)據(jù)將引領未來。目前組織對非結構化數(shù)據(jù)的利用和控制尚且不足,非結構化數(shù)據(jù)就像一座隱藏在海面下的龐大冰山,等待合適的工具開采。戴爾科技將為您提供洞察非結構化數(shù)據(jù)的雙槳,助您在數(shù)字化海洋劈波斬浪,一往無前。
 
歡迎提問
 
如果您有數(shù)據(jù)中心相關的疑問,歡迎在下方留言區(qū)告訴我們。問題一經(jīng)采用,我們將獎勵100元電話卡,同時還可進群與戴爾專家、業(yè)界同行一起交流學習!
 
Ps. 具有普遍性、能使廣大讀者受益的問題,更可能被我們采納!

鏈接已復制,快去分享吧

企業(yè)網(wǎng)版權所有?2010-2024 京ICP備09108050號-6京公網(wǎng)安備 11010502049343號