摘要:如果企業(yè)想要從大數(shù)據(jù)中獲益,那么,當(dāng)涉及到數(shù)據(jù)存儲(chǔ)時(shí),其必須有效的避免踏入法律監(jiān)管的雷區(qū)。東盟企業(yè)的IT部門又是如何應(yīng)對(duì)大數(shù)據(jù)存儲(chǔ)所帶來的挑戰(zhàn)的呢?
處理和理解大型且復(fù)雜的數(shù)據(jù)集——或當(dāng)下已成為一大時(shí)髦術(shù)語(yǔ)的大數(shù)據(jù),儼然已成為企業(yè)的當(dāng)務(wù)之急,本文中,我們將為讀者介紹東南亞國(guó)家聯(lián)盟(東盟)的企業(yè)是如何應(yīng)對(duì)這一現(xiàn)實(shí)問題的。為了能夠從中獲得有價(jià)值的洞察和見解,該地區(qū)的企業(yè)不僅需要面臨一系列法律監(jiān)管的影響,同時(shí)還要處理如何龐大數(shù)據(jù)量存儲(chǔ)的技術(shù)挑戰(zhàn)。
存儲(chǔ)大數(shù)據(jù)的一大明顯的障礙就是如何存儲(chǔ)如此海量信息。傳統(tǒng)的數(shù)據(jù)存儲(chǔ)的方法,無論是從存儲(chǔ)空間還是從性能方面來說,其成本都是相當(dāng)昂貴的。
“使用傳統(tǒng)的數(shù)據(jù)庫(kù)來處理海量的數(shù)據(jù)是不容易的;僅僅使用樣本數(shù)據(jù)早已不足以滿足用戶對(duì)于追求更準(zhǔn)確的數(shù)據(jù)信息的胃口。” 新加坡最大的IT服務(wù)提供商,并在亞洲,澳大利亞和中東地區(qū)的10個(gè)國(guó)家設(shè)有辦事處的NCS公司首席顧問Andy Tan Choo Heng表示說。
為了應(yīng)對(duì)和處理如此海量的數(shù)據(jù)信息,大數(shù)據(jù)存儲(chǔ)方面的技術(shù)創(chuàng)新就包括了Hadoop。
有各種不同的Hadoop技術(shù)來適應(yīng)不同的需求,Tan說。高可用性的Hadoop使用商品級(jí)的計(jì)算機(jī)存儲(chǔ)數(shù)據(jù)和提供冗余,以實(shí)時(shí)的數(shù)據(jù)流查看和分析數(shù)據(jù);還有在Hadoop的拼接機(jī)的完全成熟的RDBMS;在Hadoop中的Apache Tajo的低延遲數(shù)據(jù)庫(kù);以及MongoDB的文檔型數(shù)據(jù)庫(kù)。
“東盟大多數(shù)國(guó)家使用的是開源軟件,如Apache Hadoop,而還要一些公司使用其他基于Hadoop或MongoDB的開放源碼。” Tan說。
總部位于馬來西亞的一家電子商務(wù)公司表示,他們當(dāng)前所面臨的挑戰(zhàn)不只是數(shù)據(jù)的存儲(chǔ),而且還包括數(shù)據(jù)的訪問。“我們需要確保數(shù)據(jù)庫(kù)的結(jié)構(gòu),同時(shí),在設(shè)計(jì)存儲(chǔ)方法時(shí)要充分考慮兼顧到與企業(yè)的成長(zhǎng)和發(fā)展相匹配。我們今天一個(gè)月的銷售就比我們過去三年前全年的銷售還多。因此,我們肯定需要強(qiáng)大而完善的方式來存儲(chǔ)數(shù)據(jù)和檢索信息。”據(jù)該公司一名希望匿名的發(fā)言人表示。
“除了處理數(shù)據(jù)的挑戰(zhàn),數(shù)據(jù)的快速膨脹同時(shí)也帶來了數(shù)據(jù)庫(kù)的安全問題,因?yàn)槲覀冃枰_保數(shù)據(jù)的完整性、以及敏感數(shù)據(jù)信息的匿名化,因?yàn)檫@些都是關(guān)于我們客戶、產(chǎn)品,或關(guān)系到我們的盈利能力的數(shù)據(jù)信息。”
為了應(yīng)對(duì)這些挑戰(zhàn),該公司使用了安全套接層(Secure Sockets Layer,SSL)加密,以確保安全地連接其數(shù)據(jù)庫(kù);并嘗試使用最新的工具和技術(shù),以確保其使用強(qiáng)大而高效的商業(yè)智能工具來獲取和檢索信息并進(jìn)行分析。
Gartner首席研究分析師Santhosh Rao認(rèn)為,當(dāng)個(gè)人或敏感數(shù)據(jù)被存儲(chǔ)時(shí),數(shù)據(jù)匿名化技術(shù)應(yīng)首先被部署,以便讓數(shù)據(jù)在被大數(shù)據(jù)系統(tǒng)攝取之前刪除個(gè)人數(shù)據(jù)。“另一種最好的做法是將個(gè)人數(shù)據(jù)保存在一個(gè)孤立的和安全的數(shù)據(jù)存儲(chǔ),為匿名數(shù)據(jù)創(chuàng)建一個(gè)單獨(dú)的數(shù)據(jù)存儲(chǔ),以便通過大數(shù)據(jù)平臺(tái)攝取匿名數(shù)據(jù)。”Rao說。
為了保證數(shù)據(jù)的穩(wěn)定性,并確保數(shù)據(jù)長(zhǎng)期以同一種安全狀態(tài)被存儲(chǔ),用戶使用存儲(chǔ)和備份系統(tǒng)支持一次性寫入后的多功能讀取和加密。為了節(jié)省存儲(chǔ)成本,一些有使用分層存儲(chǔ)和壓縮技術(shù),Rao補(bǔ)充說。
與大數(shù)據(jù)相關(guān)的法律挑戰(zhàn)
除了存儲(chǔ)大數(shù)據(jù)方面的技術(shù)難題,企業(yè)所面臨的另一大挑戰(zhàn)是數(shù)據(jù)保護(hù)和監(jiān)管方面的擔(dān)心。整個(gè)東盟的不同國(guó)家的數(shù)據(jù)保護(hù)法律意味著要處理這些法律的監(jiān)管難題可能會(huì)非常棘手,因?yàn)樾录悠潞婉R來西亞都有數(shù)據(jù)保護(hù)法,但印度尼西亞,泰國(guó)和其他東盟成員國(guó)則沒有。此外,一些國(guó)家要求企業(yè)所收集到的數(shù)據(jù)必須獲得明確的同意許可,而有些國(guó)家則接受默認(rèn)同意。新加坡Pinsent Masons法律事務(wù)所合作伙伴Bryan Tan說。
“大數(shù)據(jù)是利用已存儲(chǔ)的數(shù)據(jù)。而數(shù)據(jù)保護(hù)則限制了在哪些方面的數(shù)據(jù)可以被使用以及數(shù)據(jù)應(yīng)該如何存儲(chǔ)。即使是一個(gè)隱匿過程,在不同國(guó)界也有不同的解釋。”Pinsent Masons的Tan說。
此外,某些行業(yè)必須遵守特定的數(shù)據(jù)規(guī)定。“一些金融監(jiān)管機(jī)構(gòu)看不慣云存儲(chǔ),” Tan說。“在韓國(guó)和日本等國(guó)家,監(jiān)管機(jī)構(gòu)要求的個(gè)人資料必須被保存在其本國(guó)國(guó)土內(nèi)——這意味著公司無法將數(shù)據(jù)集中在數(shù)據(jù)中心,這是大數(shù)據(jù)分析的一大挑戰(zhàn)。而印度尼西亞和中國(guó)也正在制定具有本地特色的監(jiān)管法律,數(shù)據(jù)服務(wù)提供商只能在其各自國(guó)家使用服務(wù)器。”
除了法律和監(jiān)管方面的挑戰(zhàn),也有現(xiàn)實(shí)意義和歷史問題。數(shù)據(jù)質(zhì)量便可以說是一大問題,因?yàn)樵跂|盟,不同國(guó)家有不同的發(fā)展速度,并可能有其自己獨(dú)特的語(yǔ)言。其結(jié)果是,各管轄區(qū)的數(shù)據(jù)集保持不同,影響了數(shù)據(jù)的質(zhì)量。
在開始實(shí)施大數(shù)據(jù)項(xiàng)目之前,企業(yè)需要考慮大數(shù)據(jù)項(xiàng)目的合規(guī)性問題。
“將個(gè)人資料暴露在公共領(lǐng)域,數(shù)據(jù)保留期和故意刪除數(shù)據(jù)都可能會(huì)導(dǎo)致不符合監(jiān)管規(guī)定的問題。”Gartner的Rao說。
他說,某些國(guó)家已經(jīng)就如何保護(hù)個(gè)人數(shù)據(jù)提供了有限指引。這些安全機(jī)制的預(yù)期是合理的,確保未經(jīng)授權(quán)的數(shù)據(jù)并訪問和限制修改。例如,新加坡的一些數(shù)據(jù)保護(hù)法律強(qiáng)調(diào)了在特定行業(yè)的數(shù)據(jù)類型的保留期。
馬來西亞的電子商務(wù)企業(yè)的這名發(fā)言人同意對(duì)于他所在的企業(yè)而言,最重要的合規(guī)性問題是必須遵守馬來西亞的個(gè)人數(shù)據(jù)保護(hù)法(PDPA)。
“自2013年11月以來,馬來西亞已開始正在實(shí)施PDPA法案,以確保我們收集企業(yè)外部的數(shù)據(jù)信息必須要征得他們的同意。我們需要小心的使用這些信息,以尊重客戶和商家的隱私,當(dāng)涉及到使用這些信息,并要做到盡可能明確。”他說。
“作為馬來西亞最大的在線電子商務(wù)平臺(tái),我們要確保與我們合作的商家的合作合同是詳細(xì)完備的,然后將他們產(chǎn)品上架到我們的平臺(tái)進(jìn)行銷售,這為重點(diǎn)保護(hù)個(gè)人數(shù)據(jù)、數(shù)據(jù)治理及確保我們用戶數(shù)據(jù)的安全性奠定了重要的基礎(chǔ)。”
盡管馬來西亞的數(shù)據(jù)保護(hù)法并沒有限制企業(yè)在馬來西亞針對(duì)其大多數(shù)數(shù)據(jù)存儲(chǔ)和數(shù)據(jù)服務(wù)器活動(dòng)的開展,但他們?nèi)员仨殗?yán)格遵循個(gè)人數(shù)據(jù)保護(hù)法。
現(xiàn)如今所正在生成和分析的數(shù)據(jù)的量和數(shù)據(jù)傳輸速度都在大幅增加,而這些問題在不久的將來將繼續(xù)構(gòu)成顯著的存儲(chǔ)和合規(guī)性問題。目前,存儲(chǔ)供應(yīng)商和各國(guó)企業(yè)都應(yīng)積極的應(yīng)對(duì)這些變化。
“大多數(shù)存儲(chǔ)供應(yīng)商都在試圖嚴(yán)格遵守相關(guān)的監(jiān)管法規(guī),如證券交易委員會(huì)(SEC)的17a-4(f),薩班斯·奧克斯利法案(SOX),健康保險(xiǎn)流通與責(zé)任法案(HIPAA)和商品期貨交易委員會(huì)監(jiān)管法規(guī)(CFTC)。”Gartner的Rao說。“我們期待在東盟國(guó)家的數(shù)據(jù)保護(hù)框架也將進(jìn)行修訂,以提供對(duì)數(shù)據(jù)安全性和存儲(chǔ)的具體指導(dǎo)方針。”