云計算改變了IT的交付模式,大數據將改變業(yè)務應用的模式。如今,企業(yè)普遍接受了數據是有價值的這一觀點,下一步就是如何應用大數據的工具和手段改變數據資產的管理,實現數據的公開與共享,改善企業(yè)的安全環(huán)境,這對于加速大數據應用的落地具有非常重要的意義。
一、安全就是大數據的事
傳統(tǒng)信息安全的核心是一個“防”字,就像是為了保證安全給房間裝上門、窗和鎖。門、窗和鎖雖然是必可不少的安全裝備,但是在大數據時代,您不覺得在房間里多安裝一些“攝像頭”會更加保險嗎?北京瀚思安信科技有限公司(以下簡稱瀚思安信)就是一家專門做“攝像頭”的大數據安全分析公司。攝像頭只是一個比喻,其實就是借助大數據工具,對企業(yè)內外部所有相關的數據進行分析,找出傳統(tǒng)安全工具無法發(fā)現的安全漏洞,從而改善企業(yè)的安全狀況。
從防御到偵測和響應
IDC預測,到2020年,全球信息安全市場的規(guī)模將達到500億美元,云安全、互聯網安全和大數據安全是信息安全市場的三大支柱。大數據安全就是通過分析的手段實現安全的智能化。它是未來保證企業(yè)安全的重中之重。
傳統(tǒng)的信息安全策略是基于簽名和規(guī)則的安全模型,對已知的各種安全威脅進行防御。但是在云計算、移動化等趨勢出現后,傳統(tǒng)的安全邊界正在被打破。早在兩年前,Gartner就已經預言,安全的邊界會越來越模糊,大數據將成為解決安全問題的關鍵所在。
“隨著安全威脅的增多,以及安全攻擊變得更有針對性,企業(yè)已經不能再依靠傳統(tǒng)的安全設備的簡單組合,就像門、窗和鎖那樣應對所有的安全攻擊了。”瀚思安信聯合創(chuàng)始人董昕分析說,“利用大數據解決安全問題并不是紙上談兵,而是已經有了實實在在的產品和解決方案。”美國硅谷已經出現了很多從事大數據安全分析的公司。在中國,瀚思安信沖在了前面。
信息安全1.0時代的特征是以防御為中心,它的基礎是基于規(guī)則和身份驗證的安全模型。但是現在,傳統(tǒng)的安全手段已經無法有效應對日益增長的高級可持續(xù)攻擊和內部安全攻擊?,F在已經步入信息安全2.0時代,其特征是以偵測和響應為中心?,F在也是大數據在安全方面真正發(fā)揮作用的時候了。
Gartner的數據顯示,過去,企業(yè)將安全預算的90%投入在防御方面,而今后60% 的安全預算將用于偵測與響應。大數據將完全改變安全市場的規(guī)則。上一次信息安全市場的大變革發(fā)生在1998年,轉折點是網絡安全取代了單機殺毒。 Gartner認為,現在,大數據給安全領域帶來的變革比上一次安全變革的意義更加重大,影響也更加深遠。
大數據安全不是紙上談兵
雖然公司成立不久,但瀚思安信基于大數據分析的下一代安全信息分析系統(tǒng)HanSight Enterprise已經在銀行、公安等關鍵行業(yè)客戶那里得到了部署。董昕舉了個例子,國內某銀行的網銀系統(tǒng)采用瀚思安信HanSight Enterprise,每天分析1TB的日志數據,通過算法和模式識別的方式,找出了很多以前用戶沒有發(fā)現的內部和外部的攻擊。
“我們遇到的或刻意尋找的客戶都是已經在安全方面有了較大投入的企業(yè),它們很清楚自己的安全問題所在,而且知道必須采用新的方法去解決。”董昕補充說,“采用大數據安全分析解決方案的企業(yè),首先必須部署一個比較完善的安全防護體系,防火墻、入侵檢測系統(tǒng)、防信息泄露系統(tǒng)等要一應俱全。在這種情況下,企業(yè)還要有分析大量數據的需求,比如1TB以上的數據,這樣才能更充分地發(fā)揮像 HanSight Enterprise這樣的產品的能力。不過,使用HanSight Enterprise并不需要掌握復雜的技術,普通的IT管理員就能勝任操作和管理工作。”
Gartner預測,到2016年,25%的全球大型企業(yè)將部署大數據分析系統(tǒng),專門應對信息安全或網絡欺詐,而今天這一比例僅為8%。企業(yè)在部署大數據分析系統(tǒng)的前6個月就可獲得有效的投資回報。
目標是大企業(yè)
談到公司的定位,董昕表示,大數據分析與安全在瀚思安信身上實現了有機統(tǒng)一。一方面,瀚思安信會基于Hadoop等不斷提升大數據的處理效率;另一方面,瀚思安信還會將大數據處理工具與企業(yè)的業(yè)務關聯起來,用于安全分析。
解決大數據時代的安全問題,瀚思安信的理念是“數據搜索+安全分析”,具體來說包括存儲和索引、搜索和檢測、機器學習和模式識別、安全知識庫、監(jiān)控和告警、報表和分析等六大環(huán)節(jié)。
瀚思安信目前只有21個人,其中18個是工程師。新產品開發(fā)對公司的發(fā)展來說至關重要。現階段,瀚思安信只有兩個產品:一個是免費版的企業(yè)級日志管理系統(tǒng)HanSight DataViewer 2.0,它是基于業(yè)界較成熟的分布式生態(tài)系統(tǒng)Elasticsearch開發(fā)的企業(yè)級日志管理平臺,支持100TB數據量,提供搜索、大規(guī)模日志分析和可視化等服務;另一個是HanSight Enterprise。董昕希望用戶通過試用免費版的企業(yè)級日志管理系統(tǒng),先對瀚思安信利用大數據解決安全問題的思路和想法有一個直觀的認識,然后在企業(yè)需要進行大數據安全分析時就可以更好地采用HanSight Enterprise。
HanSight Enterprise具有三大能力:未知威脅的發(fā)現能力、安全事件取證和上下文關聯檢索能力、全面安全態(tài)勢展現和長周期分析報告能力。董昕介紹說:“正因為有了HanSight Enterprise,我們才可以幫助銀行客戶在秒級的時間里處理8億條數據,并從中發(fā)現安全漏洞。”
HanSight Enterprise的目標客戶群是大型企業(yè)。出于數據保密性和數據處理性能的考慮,現在的用戶都是將HanSight Enterprise部署在私有云的環(huán)境中。“下一步,瀚思安信會考慮與公有云服務商合作,讓中小型企業(yè)客戶未來也能采用瀚思安信的大數據安全分析工具。”董昕介紹說,“現階段,我們只能分析IT設備的日志數據。2015年,我們的產品將依靠全量網絡流進行更大規(guī)模的數據分析。”
與傳統(tǒng)安全廠商是互補關系
大數據安全分析產品與傳統(tǒng)的網絡安全產品并不矛盾,兩者是互補的關系。比如,傳統(tǒng)安全設備上的數據也能為HanSight Enterprise所分析。
“在很長一段時間里,我們將與傳統(tǒng)的安全廠商共存。畢竟‘門和窗’是必需的,但只有‘門和窗’已不能解決安全問題,還需要‘攝像頭’,然后對攝像頭采集來的數據進行分析。”董昕介紹說,“我們與國內的一些安全廠商,比如綠盟、啟明星辰等都保持著密切的溝通。”
其實,像瀚思安信下一代安全信息分析系統(tǒng)中最基本的日志數據分析功能,其他許多廠商的產品也都有,它們的區(qū)別到底在哪里呢?董昕解釋說,雖然很多廠商也在做日志分析,但是它們的產品只能分析自己系統(tǒng)產生的數據,在關聯性分析方面不盡如人意。另外,其他廠商的大數據分析工具在處理能力上還有不足,不能進行全量分析,無法將大數據分析工具的價值全部發(fā)揮出來。而瀚思安信的下一代安全信息分析系統(tǒng)是一個企業(yè)級的產品,在滿足安全性、合規(guī)性和審計要求的情況下,可以實現實時的全量數據的安全分析,無論是數據分析的廣度還是深度都有明顯優(yōu)勢。
二、數據資產要管起來
數據是有價值的,毋庸置疑。但是,在大數據的概念提出前,又有多少企業(yè)真正把數據當成資產去經營、管理和更深入地挖掘其中的價值呢?
數據管理新模式
以前,企業(yè)在數據管理方面的實踐最多就是把數據庫中的數據存儲起來,然后適當地做一些分析,用于營銷或提升客戶滿意度,但是這些做法并沒能充分發(fā)揮數據的價值。一方面,并不是所有的企業(yè)都做了類似的數據管理和挖掘工作;另一方面,數據挖掘的廣度和深度也不理想。
“企業(yè)在對一小部分數據進行分析時,可能之前已經扔掉了99%的數據。這是因為有的用戶沒有意識到這些被扔掉的數據具有價值,還有的是因為用戶沒有稱手的工具能夠加工和處理如此龐大的數據量。”亞信大數據事業(yè)群總經理張灝告訴記者。
張灝認為,未來人工智能的發(fā)展可能會進一步促進人們對大數據的有效利用。通過深度的機器學習,系統(tǒng)可以自動幫用戶捕捉所需的數據,其中很多數據可能以前僅憑人的經驗是無法獲得的。舉例來說,現在黑客的攻擊越來越有針對性,威脅無處不在,而僅靠銀行人員的專業(yè)知識和經驗來設定安全的規(guī)則,已經不能有效防范黑客的攻擊。因此,銀行希望他們的系統(tǒng)具有自動學習的能力,可以通過大數據分析來判斷威脅所在。
針對這樣一種趨勢,企業(yè)應該建立一種新的管理思維模式,即數據資產的管理思維。張灝表示,為了讓數據資產管理思維落地,必須做好以下幾件事:第一,企業(yè)管理者必須認可數據是一種資產,數據存儲的時間越長,數據可能越有價值;第二,企業(yè)內部要建立數據開放、共享的機制;第三,解決相關的技術難題,包括數據的安全性、隱私性等;第四,讓數據流動起來,并建立以流動性為關鍵點的資產管理思維方式,更好地實現數據可視化。
過去,人們通常以現金資產和設備資產來評估一個企業(yè)的價值,而未來一定會以企業(yè)所擁有的數據資產的量和活性來評估企業(yè)的價值。在這個轉變的過程中,數據資產的管理思維是必不可少的。
數據管理的利器
亞信就是數據資產管理思維的倡導者。如今,亞信可以提供包括數據采集、數據處理、分析挖掘等環(huán)節(jié)在內的大數據整體解決方案。近期,亞信發(fā)布了兩款大數據新品——數據資產云圖和數據資產管理一體機。
所謂數據資產云圖,其實就是一個大數據的挖掘、監(jiān)測和分析平臺,其上搭載了多種數據挖掘應用產品,包括電商價格監(jiān)控平臺、產品口碑監(jiān)測與分析、企業(yè)品牌監(jiān)測與分析等,可根據用戶的需求針對不同類型的數據進行多維度的分析。數據資產管理一體機則順應了當前軟硬件一體化的潮流,是一款集計算、存儲、網絡、大數據平臺軟件、大數據分析應用軟件等于一體的集成化解決方案。它基于異構計算的理念將應用與硬件進行了深度融合,提供比通用的大數據平臺更強大的數據分析和處理性能。
亞信的數據資產管理一體機采用的是標準化的x86硬件,并基于開源軟件進行了軟件開發(fā)。因此,該一體機具有很高的性價比,可以取代國外同類的一體機產品。由于亞信在電信行業(yè)擁有多年的開發(fā)和應用經驗,尤其是在聚合數據、加工數據方面具有很強的能力,此次發(fā)布的數據資產管理一體機1.0版也在處理電信運營商數據方面表現出很強的實力。不過,這并不代表亞信的數據資產管理一體機就是為電信一個行業(yè)量身定制的。從其底層數據的處理能力來看,它還是一個適用于多個行業(yè)的產品。“我們希望通過自己的技術專長和對用戶需求的透徹理解,為行業(yè)用戶提供一個經過全面優(yōu)化的軟硬件一體的解決方案,提高大數據處理的效率,而不要讓用戶自己再費心選擇和搭配軟硬件。”張灝解釋說。
雖然亞信的數據資產管理一體機可以適用于不同的行業(yè),但是每個行業(yè)的需求、應用場景畢竟有所差異。所以在實際使用中,亞信還是會根據不同用戶的特殊需求提供產品定制化的服務。
轉變思維
張灝強調說:“數據資產管理平臺對所有行業(yè)用戶來說都是不可或缺的基礎平臺。不過,部署一個數據資產管理平臺和部署一個Hadoop產品有很大不同,用戶需要轉變傳統(tǒng)的管理思維。接受數據資產管理平臺的前提是必須承認數據的價值是因為使用數據資產而產生的,然后才能談到具體如何管理數據資產,對數據進行聚合、分析、加密,并最終從應用中獲取價值。”
亞信是首個在銀行和電信運營商兩個領域里率先提出數據資產管理這一理念的。這兩個行業(yè)目前是大數據應用水平最高的行業(yè)。這兩個行業(yè)的客戶對于數據的可視化、可管理性、數據挖掘等有很大的需求。亞信的數據資產管理方案對于提升行業(yè)用戶的大數據應用水平起到了積極的作用。
三、數據交換要有開放的心態(tài)
北京騰云天下科技有限公司(以下簡稱騰云天下)高級總監(jiān)陳星霖向記者介紹說,“騰云天下專注于移動互聯網,目前覆蓋的獨立智能終端超過10萬個,所以在移動數據的采集和分析方面具有明顯優(yōu)勢。”
騰云天下在企業(yè)和移動應用之間搭建起了一座橋梁,將企業(yè)與個人消費者緊密聯系在一起。比如,國內TOP10的股份制商業(yè)銀行都是騰云天下的客戶。騰云天下幫助這些銀行通過數據的建模和分析提升了營銷和征信服務水平。
“我們發(fā)現,許多銀行客戶非常愿意借助大數據工具改善服務,提升營銷能力。”陳星霖介紹說,“下一步,我們要做的就是擴展業(yè)務范圍,覆蓋更多的數據消費場景。”
如今,數據的來源渠道越來越豐富,大量用戶更傾向于在移動終端上進行瀏覽、搜索、數據分析和社交。騰云天下的一大優(yōu)勢就是擁有大量的移動端用戶數據,可以對用戶的消費行為進行分析,并將分析的結果反饋給直接面向終端客戶的企業(yè)用戶,主要包括銀行、零售、快銷、汽車等行業(yè)的客戶。陳星霖介紹說:“我們只提供數據和數據分析,而數據與業(yè)務應用如何關聯還要由相關的應用軟件開發(fā)商來完成。我們的策略是與這些應用軟件開發(fā)商進行廣泛的合作。”
談到未來如何在移動互聯網領域進一步發(fā)展,陳星霖表示,騰云天下的一個努力方向是讓數據的來源和形態(tài)更豐富,包括線上線下的數據和企業(yè)內外部的數據,通過對這些不同來源的數據進行采集和分析,可以了解個人用戶喜好和消費行為。陳星霖舉例說: “我們在與航空公司接觸時發(fā)現,它們對于來自于PC和移動終端的數據無法進行關聯和統(tǒng)一的識別。而我們的優(yōu)勢就是可以打通移動互聯網與用戶生態(tài)圈,整合不同來源的數據進行統(tǒng)一的身份認證。”
為了豐富數據的來源,騰云天下也愿意在一定條件下與相關單位進行數據的交換。這就涉及到一個十分敏感的問題——數據隱私。“我們不會采集任何與個人身份相關的隱私數據,比如身份證信息。”陳星霖肯定地表示,“相對于像銀行這樣在數據交換方面較封閉的企業(yè)來說,我們的心態(tài)比較開放。”
一些移動互聯網領域的廣告主希望從更多途徑了解用戶的消費行為,所以愿意在一定條件下將自己的部分數據托管到由第三方可信的機構搭建的數據共享平臺上。來自各方的大量數據可以在這個第三方數據共享平臺上得到聚合、分析和挖掘,最終的分析結果也會反饋給廣告主或相關方。“我們與一些廣告主也在就此事進行溝通。”陳星霖介紹說,“這個數據共享平臺究竟由誰來負責搭建,是由行業(yè)內部自行決定的。參與數據交換的廣告主都可以使用這個平臺上的數據,但使用之后,數據就要被銷毀。這種數據共享模式可能會先在某些垂直行業(yè)中得到采用。”
人們都說,在大數據時代,誰擁有數據誰才是最后的贏家。但是在陳星霖看來,誰擁有數據并不重要,數據的形態(tài)和載體才是關鍵。數據的公開和共享將對大數據的落地產生非常大的促進作用。
“作為企業(yè),對數據共享要保持一個開放的心態(tài)。”陳星霖表示,“我們十分愿意與傳統(tǒng)的企業(yè)交換數據,只要這些數據是有用的,具體的交換價格可以進一步協(xié)商。阻礙數據共享的主要因素是行業(yè)內還沒有一個健全的數據交換機制?,F在發(fā)生的不同企業(yè)之間的數據交換基本都是基于某個特定的項目。不過相信再過一兩年,很多行業(yè)會建立起在本行業(yè)內可行的數據交換機制。“