賬單又破表 讓云存儲成本超支的大魔王是什么?

責任編輯:editor005

2017-02-16 14:26:10

摘自:PConline原創(chuàng)

在這一領域,重復刪除技術(shù)需要解決兩大基本問題:  需要立足數(shù)據(jù)層起效,而非存儲層。使用云存儲有困擾的朋友,可以試試刪除一些重復的數(shù)據(jù)備份,節(jié)省空間又節(jié)約資金,刪的時候可要注意別錯刪了重要文件。

還記得云存儲優(yōu)點的嗎?其中有一點是可以幫助企業(yè)節(jié)約成本,企業(yè)將大部分數(shù)據(jù)轉(zhuǎn)移到云存儲上,讓云存儲服務提供商來為他們解決數(shù)據(jù)存儲的問題。一方面云存儲可以幫助我們消除使用硬件存儲數(shù)據(jù)的需要。用戶不必再購買、維護和升級電腦系統(tǒng)、硬件驅(qū)動和CD,就可以進行數(shù)據(jù)備份。再一方面用戶可以按需購買存儲空間,用多少買多少,使用靈活。

 

 

有的用戶會發(fā)現(xiàn)真正使用的時候卻事與愿違,企業(yè)收到賬單后會驚嘆,這是什么情況?怎么會這么多錢?那是因為云存儲與傳統(tǒng)內(nèi)部存儲間的成本差異在于,前者的成本要素更為分散。云存儲的成本要素主要包括:

一級數(shù)據(jù)存儲成本,包括對象或者塊存儲

AWS S3等對象存儲服務每月每TB的標準層使用成本僅為23美元,連續(xù)訪問層則為每TB 12.5美元。眾多現(xiàn)代應用已經(jīng)能夠發(fā)揮對象存儲的既有優(yōu)勢。云服務供應商提供自己的文件或者塊存儲選項,例如AWS EBS每月每TB塊存儲資源成本為100美元,且可按小時計費。亦有不少第三方方案可作為后端用于將傳統(tǒng)文件或塊存儲同對象存儲系統(tǒng)對接。

 

 

即使是每年每TB 1200美元的AWS EBS,其使用成本也僅為內(nèi)部解決方案的二分之一到三分之一,而且后者還需要更高昂的前期投入。正因為如此,企業(yè)紛紛選擇云存儲以降低運營成本及前期投入,且享受由此帶來的按使用量計費收益。

數(shù)據(jù)傳輸成本

公有云供應商通常會向不同云服務區(qū)或者云外部間的數(shù)據(jù)傳輸收費。例如在不同Amazon服務區(qū)間移動或復制1TB的AWS S3數(shù)據(jù)會帶來20美元成本,而將其移動至互聯(lián)網(wǎng)的成本則為90美元。事實上,GET、PUT、POST、LIST以及DELETE等請求都會產(chǎn)生對應的數(shù)據(jù)訪問成本。

 

 

大魔王在此——副本、快照、備份或數(shù)據(jù)歸檔的成本

成本破表由此發(fā)生,這與您存儲在云內(nèi)的具體數(shù)據(jù)量無關(guān),而且存儲單一副本也用不了多少投入。最可怕的是保存多份數(shù)據(jù)副本,包括備份、歸檔或者其它需求,這會在不經(jīng)意間帶來可怕的支出。

 

%20

 

在云環(huán)境中,每套副本都會產(chǎn)生與原始對象相同的成本。雖然云供應商可能會在后臺進行重復數(shù)據(jù)刪除或壓縮,但這種情況并不常見。對企業(yè)而言,這意味著快照、備份與歸檔數(shù)據(jù)都會產(chǎn)生額外費用。比如,AWS EBS的每月存儲快照成本為每GB 0.05美元。雖然快照會進行壓縮并僅存儲增量數(shù)據(jù),但由于不具備重復數(shù)據(jù)刪除機制,100TB數(shù)據(jù)集的快照每年需要花費60000美元!

重復數(shù)據(jù)刪除對于云存儲的重要意義

云應用在設計上具備分布式特性,且標準部署在非關(guān)系型大規(guī)??蓴U展數(shù)據(jù)庫內(nèi)。在非關(guān)系型數(shù)據(jù)庫中,即使不進行復制,大多數(shù)數(shù)據(jù)仍然屬于冗余信息。以MongoDB或者Cassandra為例,其復制因子為3,意味著為了確保數(shù)據(jù)完整性,其會在分布式集群中保留3份副本。

 

%20

 

備份或者次級副本通常由快照進行創(chuàng)建及維護。數(shù)據(jù)庫體系結(jié)構(gòu)決定當我們保存快照時,實際上同時也制作出了三份副本。

不僅是重復數(shù)據(jù)刪除——還有重復語義刪除

大多數(shù)重復數(shù)據(jù)刪除技術(shù)作用于存儲層,即對數(shù)據(jù)塊進行重復刪除。這種作法對于SAN或NAS等集中式存儲非常有效,但卻不太適用于MongoDB等分布式數(shù)據(jù)庫的數(shù)據(jù)層。在這一領域,重復刪除技術(shù)需要解決兩大基本問題:

 

%20

 

需要立足數(shù)據(jù)層起效,而非存儲層。為了在分布式集群中實現(xiàn)重復數(shù)據(jù)刪除,軟件需要理解并解釋底層數(shù)據(jù)結(jié)構(gòu)。

需要搶在冗余數(shù)據(jù)被寫入數(shù)據(jù)庫前將其清除。一旦數(shù)據(jù)寫入,則會在集群內(nèi)進行復制,這意味著必須利用實時重復數(shù)據(jù)刪除方可解決。

使用云存儲有困擾的朋友,可以試試刪除一些重復的數(shù)據(jù)備份,節(jié)省空間又節(jié)約資金,刪的時候可要注意別錯刪了重要文件。

鏈接已復制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號-6京公網(wǎng)安備 11010502049343號