大數(shù)據(jù)時代的到來已經(jīng)開啟了人類社會利用數(shù)據(jù)價值的另一個時代,每天人們的日常工作生活都會產(chǎn)生巨量的數(shù)據(jù)。對于一個企業(yè)來說,這一時代的來臨既是機(jī)會,也是挑戰(zhàn),商機(jī)利潤無處不在,卻也瞬息萬變,決策力和效率一旦下降,很有可能被淘汰。移動互聯(lián)網(wǎng)、物聯(lián)網(wǎng)產(chǎn)生了海量的數(shù)據(jù),大數(shù)據(jù)計算技術(shù)完美地解決了海量數(shù)據(jù)的收集、存儲、計算、分析的問題。然而大數(shù)據(jù)廠商如雨后新筍層出不窮,質(zhì)量也參差不齊,對于企業(yè)來說如何挑選大數(shù)據(jù)分析提供商呢?下面本文為您梳理國內(nèi)熱門大數(shù)據(jù)分析提供商及其主要產(chǎn)品。
一、IBM
產(chǎn)品類型:
1.基于Hadoop:
IBM BigInsights for Apache Hadoop——在企業(yè)平臺上提供符合大數(shù)據(jù)分析需求的分析功能,性能高、易用性強(qiáng),支持大規(guī)模部署,可加速實現(xiàn)價值。
IBM BigInsights on Cloud——在IBM的全球云基礎(chǔ)架構(gòu)上提供Hadoop即服務(wù),提供與在本地部署InfoSphere BigInsights一樣的功能,且無需本地基礎(chǔ)架構(gòu)即可利用大數(shù)據(jù)分析,隨需擴(kuò)展,提供高級工具加速現(xiàn)實價值,安全性較高。
2.基于流計算:
IBM Info Sphere Streams——高級計算平臺,擴(kuò)展企業(yè)現(xiàn)有系統(tǒng)價值,幫助應(yīng)用程序快速攝取、分析和關(guān)聯(lián)來自數(shù)千個實時源的信息,數(shù)據(jù)高吞吐率美妙數(shù)百萬事件或消息。
IBM Anonymous Resolution——提供匿名地確定,使金融、政府、執(zhí)法、醫(yī)療、工業(yè)協(xié)會等行業(yè)能夠進(jìn)行匿名協(xié)作,且協(xié)作有高安全性。在提供身份識別的同時,加強(qiáng)個人隱私保護(hù),審慎記錄是否重疊,并可以提供跨組織風(fēng)險管理。
InfoSphere Global Name Management——利用特定文化的姓名數(shù)據(jù)和語言規(guī)則,幫助管理、搜索、分析和比較多文化的姓名數(shù)據(jù)集。對文化傳統(tǒng)、相關(guān)國家、性別和姓名解析進(jìn)行識別與分類,從而支持可行的業(yè)務(wù)決策,處理多國語言音譯。
InfoSphere Identity Insight Solutions——可應(yīng)對威脅和欺詐的實時身份解析和分析平臺。幫助組織和企業(yè)識別威脅、欺詐和風(fēng)險并降低其發(fā)生率。功能點:身份解析、關(guān)系解析、復(fù)雜事件處理。
IBM對于Hadoop的研究5-6年前就已經(jīng)開始,其研究成果涉及很多方面,InfoSphere是其2011年推出的產(chǎn)品,是專門針對大數(shù)據(jù)分析的平臺產(chǎn)品。平臺包括BigInsights和Streams,兩者互補(bǔ),BigInsights對大規(guī)模的靜態(tài)數(shù)據(jù)進(jìn)行分析,提供多節(jié)點的分布式計算。Streams采用內(nèi)存計算方式分析實時數(shù)據(jù)。
BigInsights可與DB2、Netezza等集成,是更適合企業(yè)級的大數(shù)據(jù)平臺,并且IBM對其做出了很多改進(jìn),尤其是架構(gòu)方面,使其分析能力更高,更能適應(yīng)企業(yè)級需求。BigInsights對IBM推出的GPFS SNC平臺進(jìn)行支持,以更好的利用其強(qiáng)大的災(zāi)難恢復(fù)、高可靠性、高擴(kuò)展性的優(yōu)勢,沒有單點故障,讓整個分布式系統(tǒng)更加可靠。
IBM是經(jīng)典老牌科技廠商,其信譽(yù)及產(chǎn)品性能和安全性都十分有保障,但價格在行業(yè)內(nèi)也屬較高檔次,使用其產(chǎn)品的大多是大型公司及金融政府等領(lǐng)域的企業(yè)單位。其大數(shù)據(jù)分析解決方案比較全面,如果對信息質(zhì)量、大數(shù)據(jù)處理效率及安全性各方面要求都比較高,IBM的產(chǎn)品比較適合。
經(jīng)典案例:
1.IBM幫助騰訊網(wǎng)為中國球迷創(chuàng)造全新的觀賽體驗
2014年巴西世界杯,各大媒體爭相報道,市場競爭愈演愈烈,騰訊網(wǎng)若想脫穎而出,需要給球迷們?nèi)碌挠^賽體驗。在過去,中國球迷看到的賽事報道,都是媒體主導(dǎo)的報道方式。而這次報道,騰訊網(wǎng)借助IBM SoftLayer云平臺,快速部署大數(shù)據(jù)分析所需的 IT 基礎(chǔ)架構(gòu),實時抓取了海量的中國球迷社交數(shù)據(jù)。基于Watson技術(shù)的社交大數(shù)據(jù)分析平臺,在抓取社交數(shù)據(jù)的同時,還融合了語義分析技術(shù),能夠準(zhǔn)確挖掘出億萬中國球迷的觀點與喜好,并融進(jìn)騰訊網(wǎng)的世界杯報道中,開創(chuàng)了賽事報道的新模式。騰訊網(wǎng)在 2014年巴西世界杯期間,頁面訪問數(shù)量增長了54%,體育文章點擊率增長 134.5%;
2.意大利帕馬森雷佳諾干酪同業(yè)公會通過大數(shù)據(jù)分析來鑒別仿冒的干酪
意大利帕馬森雷佳諾干酪同業(yè)公會成立于 1934年,是一間防止造假或無證生產(chǎn)帕馬森雷佳諾干酪的質(zhì)量監(jiān)控聯(lián)營公會。過去,判斷干酪的真?zhèn)问且粋€極為耗時的復(fù)雜過程,需要手動抽查 600多家乳品店。而現(xiàn)在,IBM 的大數(shù)據(jù)分析解決方案提供的條碼標(biāo)簽和傳感器功能,讓其能夠有效監(jiān)控日常生產(chǎn)與產(chǎn)品,從而幫助他們準(zhǔn)確判斷和追溯每批產(chǎn)品是否純正。據(jù)某調(diào)查分析,一家普通公司每年因為被欺詐就會損失5%的年收入,全球每年因為被欺詐損失了3.5萬億美元。
3.美國迪凡斯動物園使用大數(shù)據(jù)分析來預(yù)測游客行為
以前,迪凡斯動物園和水族館只能憑借以往的經(jīng)驗猜測每一天的游客數(shù)量,并決定聘用多少員工以及準(zhǔn)備多少物資?,F(xiàn)通過IBM大數(shù)據(jù)分析解決方案,他們可以將移動端驗票及天氣預(yù)報等多個不同來源的數(shù)據(jù)關(guān)聯(lián)在一起進(jìn)行綜合分析,實現(xiàn)了對游客數(shù)量的精準(zhǔn)預(yù)測。同時,從這些數(shù)據(jù)中獲取洞察,幫助他們能夠更好地預(yù)測游客需求,并且做出更加有效的業(yè)務(wù)決策,讓游客在每一次游覽中都能獲得滿意的服務(wù)。
二、Oracle
產(chǎn)品類型:
Oracle Endeca Information Discovery——提供日常決策的數(shù)據(jù)探索功能,幫助組織快速瀏覽所有相關(guān)數(shù)據(jù),整合不同系統(tǒng)的結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù),自動整理信息搜索、發(fā)現(xiàn)和分析。
Oracle Advanced Analytics——將Oracle數(shù)據(jù)庫擴(kuò)展為高級分析平臺,將企業(yè)分析應(yīng)用與BI環(huán)境無縫集成,支持啟用廣泛性預(yù)測分析,并可以導(dǎo)入第三方模型。分析打分速度快,部署靈活、成本較低。
Oracle Advanced Analytics通過兩個主要組件將Oracle數(shù)據(jù)庫擴(kuò)展為全面的高級分析平臺:Oracle R Enterprise和Oracle Data Mining。它是全面的實時分析平臺,可洞察重要的業(yè)務(wù)事項,如客戶流失預(yù)測、產(chǎn)品建議和欺詐警示。客戶可將算法應(yīng)用于數(shù)據(jù)所在的數(shù)據(jù)庫,從而隨著數(shù)據(jù)量的增加輕松擴(kuò)展分析。使數(shù)據(jù)分析師能夠直接但受控地訪問Oracle數(shù)據(jù)庫中的數(shù)據(jù),在保證數(shù)據(jù)安全性的同時提高數(shù)據(jù)分析師的效率。無需移動數(shù)據(jù),且能夠在更短時間內(nèi)將“原始數(shù)據(jù)”轉(zhuǎn)換為“可操作的信息”,從而降低數(shù)據(jù)分析的總體TCO。
Oracle Business Intelligence Foundation Suite——全面、市場領(lǐng)先的現(xiàn)代商務(wù)智能平臺,幫助企業(yè)快速掌握與業(yè)務(wù)相關(guān)的更多信息,推動創(chuàng)新和掌握競爭優(yōu)勢,使組織從更多數(shù)據(jù)中獲得更多洞察,從而推動收入增長。它以采用集成架構(gòu)的商務(wù)智能為基礎(chǔ),為即席查詢和分析、儀表盤、企業(yè)報告、移動分析、記分卡、多維OLAP、預(yù)測分析等功能提供了業(yè)內(nèi)最佳的平臺。這一針對定制和打包的商務(wù)應(yīng)用而設(shè)計的支持技術(shù)可幫助組織推動創(chuàng)新、優(yōu)化流程并提供極致性能。
Oracle實時決策——一個適應(yīng)組織自身發(fā)展規(guī)劃的管理解決方案,是圖像、產(chǎn)品、服務(wù)一條線的業(yè)務(wù)完整流程。
OracleExalytics商務(wù)智能云服務(wù)器——商務(wù)智能軟件和內(nèi)存中數(shù)據(jù)庫技術(shù)構(gòu)建而成,該系統(tǒng)經(jīng)過優(yōu)化,可提供快速分析,提升智能、簡單性和可管理性。高級數(shù)據(jù)可視化和挖掘,可從大量數(shù)據(jù)中抽象出具有可行性的洞察。適用于發(fā)現(xiàn)、商務(wù)智能、建模和規(guī)劃應(yīng)用的快速解決方案。
Oracle Big Data SQL——大數(shù)據(jù)SQL,是大數(shù)據(jù)管理系統(tǒng)重要的組成部分。它打通了數(shù)據(jù)孤島,并簡化信息訪問和發(fā)現(xiàn)過程,可以幫助客戶跨Hadoop、NoSQL和Oracle數(shù)據(jù)庫運(yùn)行同一個SQL查詢,從而最大限度減少數(shù)據(jù)移動,同時提高性能。Oracle Big Data SQL在Oracle大數(shù)據(jù)機(jī)上運(yùn)行,可與Oracle Exadata數(shù)據(jù)庫云服務(wù)器配合使用。將關(guān)系和非關(guān)系型技術(shù)整合到單一架構(gòu)中,并引入業(yè)界標(biāo)準(zhǔn)數(shù)據(jù)訪問語言SQL,因此簡化了企業(yè)對大數(shù)據(jù)的訪問。
Oracle Spatial and Graph——提供3D和Web服務(wù)支持功能,用于管理所有地理空間數(shù)據(jù)(包括向量和光柵數(shù)據(jù)、拓?fù)浜途W(wǎng)絡(luò)模型)。Oracle Spatial可與Oracle Locator協(xié)同工作,后者是每個Oracle數(shù)據(jù)庫版本中都具備的一項特性,提供了定位眾多業(yè)務(wù)應(yīng)用程序所需的映射功能。
Oracle R Enterprise——Oracle R Enterprise與R語言集成,可處理大型數(shù)據(jù)集,并可以與OBIEE集成。R語言主要用來進(jìn)行數(shù)據(jù)探索、統(tǒng)計分析、作圖的解釋型語言,其運(yùn)算方面的能力較強(qiáng)。集成可發(fā)揮數(shù)據(jù)庫的并行優(yōu)勢,速度更快。
Oracle是目前國際排名第二大獨立軟件公司,是第一個跨整個產(chǎn)品線(數(shù)據(jù)庫、業(yè)務(wù)應(yīng)用軟件和應(yīng)用軟件開發(fā)與決策支持工具)開發(fā)和部署100%基于互聯(lián)網(wǎng)的企業(yè)軟件的公司。Oracle在數(shù)據(jù)庫方面有很強(qiáng)優(yōu)勢,且它的產(chǎn)品線完整,產(chǎn)品關(guān)聯(lián)性較強(qiáng),比較適合整套方案使用。Oracle解決方案在醫(yī)療方面也有很完整的體系,用戶眾多。其價格同類也相對比較高,用戶多是大企業(yè)機(jī)構(gòu)。
經(jīng)典案例:
1.Oracle助豐田應(yīng)對召回危機(jī)
豐田是全球汽車制造商,為提升業(yè)務(wù)質(zhì)量和效率,豐田必須降低保修成本和檢測正確時間,它渴望開發(fā)新的產(chǎn)品質(zhì)量分析系統(tǒng),以迅速應(yīng)對源于2010一個龐大產(chǎn)品召回事件的危機(jī)。甲骨文為其提供了一套整體解決方案,為豐田公司產(chǎn)品質(zhì)量內(nèi)部系統(tǒng)的數(shù)據(jù)提供一個通用接口,為豐田質(zhì)量工程師提供來自不同車輛配置系統(tǒng)、客戶呼叫中心、系統(tǒng)保養(yǎng)索賠、客戶調(diào)節(jié)小組和服務(wù)中心等的數(shù)據(jù)提供搜索功能和向下鉆取。提供搜索引擎界面、過濾器,允許用戶查看產(chǎn)品質(zhì)量數(shù)據(jù),這在以前是不可能實現(xiàn)的方式。此方案降低豐田汽車投產(chǎn)到市場的時間80%,每年撤銷數(shù)百、數(shù)千小時最終用戶的等待時間,在相關(guān)的系統(tǒng)中能使工程師快速導(dǎo)航到交易警報。
2.Oracle助UPMC打造個性化醫(yī)療
匹茲堡大學(xué)醫(yī)學(xué)中心(簡稱UPMC)是美國領(lǐng)先的非營利性醫(yī)療系統(tǒng),也是全美最知名的學(xué)術(shù)研究醫(yī)學(xué)中心之一。 UPMC利用Oracle大數(shù)據(jù)平臺打造個性化醫(yī)療,使用Oracle Exadata、高級分析和特定用途的應(yīng)用構(gòu)成了高性能平臺,收集分析病人醫(yī)療數(shù)據(jù)等內(nèi)容,幫助其實現(xiàn)了個性化治療,并大大改善UPMC的醫(yī)療衛(wèi)生成果。Oracle在醫(yī)療行業(yè)有多套完整解決方案,包括健康檔案、醫(yī)療分析和研究分析等,其臨床數(shù)據(jù)挖掘等方面都很有優(yōu)勢,并且合作客戶眾多。
三、Google
產(chǎn)品類型:
1.基于Percolator
Caffeine——增量處理索引系統(tǒng),取代MapReduce批處理索引系統(tǒng),搜索更快。
Colossus——專為BigTable設(shè)計的分布式存儲Colossus,也被稱為GFS2(二代Google文件系統(tǒng)),它專為建立Caffeine搜索索引系統(tǒng)而用。
2.基于Dremel系統(tǒng)
BigQuery——Google推出其強(qiáng)大的數(shù)據(jù)分析軟件和服務(wù) — BigQuery,它也是Google自己使用的互聯(lián)網(wǎng)檢索服務(wù)的一部分。Google已經(jīng)開始銷售在線數(shù)據(jù)分析服務(wù),試圖與市場上類似亞馬遜網(wǎng)絡(luò)服務(wù)(Amazon Web Services)這樣的企業(yè)云計算服務(wù)競爭。這個服務(wù),能幫助企業(yè)用戶在數(shù)秒內(nèi)完成萬億字節(jié)的掃描。
3. 基于搜索統(tǒng)計算法——Google推出搜索引擎的輸寫糾錯、統(tǒng)計型機(jī)器翻譯等服務(wù)。
Brand Lift in Adwords、Active GRP——Google的趨勢圖應(yīng)用,通過用戶對于搜索詞的關(guān)注度,很快的理解社會上的熱點是什么。對廣告主來說,它的商業(yè)價值就是很快的知道現(xiàn)在用戶在關(guān)心什么,他們應(yīng)該在什么地方投入一個廣告。以幫助廣告客戶分析和評估其廣告活動的效率。
Dremel被設(shè)計用來管理非常大量的大數(shù)據(jù)集(指數(shù)據(jù)集的數(shù)量和每數(shù)據(jù)集的規(guī)模都大),而PowerDrill則設(shè)計用來分析少量的大數(shù)據(jù)集(指數(shù)據(jù)集的規(guī)模大,但數(shù)據(jù)集的數(shù)量不多)時提供更強(qiáng)大的分析性能。
4.PowerDrill
Dremel可以在3秒鐘內(nèi)查詢一個P的數(shù)據(jù)。PowerDrill雖不能處理這么多數(shù)據(jù),可能應(yīng)對的量也不小了,而且它的處理速度更快。PowerDrill可以在30到40秒內(nèi)處理7820億個單元的數(shù)據(jù)。Google說,這比Dremel的方式“高好幾個數(shù)量級”。
PowerDrill設(shè)計用來分析少量的核心數(shù)據(jù)集。其數(shù)據(jù)存于內(nèi)存,PowerDrill做了組合范圍分區(qū),分析時可以跳過很多不需要的分區(qū)(真實應(yīng)用統(tǒng)計可以跳過92.41%的分區(qū))。PowerDrill用普通關(guān)系模型。PowerDrill數(shù)據(jù)要load,增加數(shù)據(jù)不太方便。
Google身為世界幾大搜索引擎之一,一直致力于互聯(lián)網(wǎng)搜索、云計算等領(lǐng)域,其衍生的大數(shù)據(jù)服務(wù)在搜索方面十分有優(yōu)勢,尤其在廣告服務(wù)、統(tǒng)計等領(lǐng)域。其搜索引擎、大數(shù)據(jù)處理相關(guān)方面的技術(shù)很成熟,但大數(shù)據(jù)方面的產(chǎn)品及解決方案覆蓋領(lǐng)域沒有十分完整,適合有特定需求用戶使用。
經(jīng)典案例:
2009年,Google通過分析5000萬條美國人最頻繁檢索的詞匯,將之和美國疾病中心在2003年到2008年間季節(jié)性流感傳播時期的數(shù)據(jù)進(jìn)行比較,并建立一個特定的數(shù)學(xué)模型。最終google成功預(yù)測了2009冬季流感的傳播甚至可以具體到特定的地區(qū)和州。
四、Amazon
產(chǎn)品種類:
1.基于Amazon Web Services(AWS)
Big Data Analytics Options on AWS——利用AWS可輕松預(yù)配置所需的存儲、計算和數(shù)據(jù)庫服務(wù),以便將這些數(shù)據(jù)轉(zhuǎn)換成您的企業(yè)需要的信息。同時,AWS 的數(shù)據(jù)傳輸服務(wù)可以快速地將大數(shù)據(jù)移入和移出云,例如 AWS Direct Connect 和 Import/Export 服務(wù)。而且,進(jìn)入 AWS 的所有入站數(shù)據(jù)流量都是免費(fèi)的。
2.基于流計算:
Amazon Kinesis——一項托管服務(wù),可實時處理流媒體大數(shù)據(jù)。Amazon Kinesis支持的每秒數(shù)據(jù)吞吐量為數(shù)兆字節(jié)數(shù)據(jù)到數(shù)吉字節(jié)數(shù)據(jù),并且可以通過無縫擴(kuò)展處理來自成千上萬個不同源的流。Amazon Kinesis旨在以經(jīng)濟(jì)節(jié)約的方式提供高可用性和耐久性,使用戶專注于利用數(shù)據(jù),以更快的速度、更低的成本做出決策。
3.基于Hadoop
Amazon Elastic MapReduce (EMR)——EMR在 Amazon EC2 上提供Apache Hadoop框架作為易于使用的托管服務(wù)。利用 Amazon EMR,用戶可減少查詢,利用廣泛的Hadoop工具生態(tài)系統(tǒng),同時部署到高度擴(kuò)展、安全的基礎(chǔ)設(shè)施平臺。在云中執(zhí)行大數(shù)據(jù)分析作業(yè),讓 Amazon EMR 來完成Hadoop集群的管理工作。
經(jīng)典案例:
1.NASA/JPL的沙漠研究和訓(xùn)練研究
NASA Jet Propulsion Laboratory(美國宇航局噴氣推進(jìn)實驗室)已開發(fā)出全地形六足地外探測器(ATHLETE)機(jī)器人。作為沙漠研究和訓(xùn)練研究的一部分,NASA/JPL結(jié)合其他NASA中心的機(jī)器人對ATHLETE機(jī)器人進(jìn)行年度實地測試。在驅(qū)動機(jī)器人的同時,操作員可以依賴高分辨率的衛(wèi)星圖像,獲取指導(dǎo)、定位和態(tài)勢感知。為了簡化衛(wèi)星圖像的處理,NASA/JP的工程師們開發(fā)了一個利用工作流并行特性的應(yīng)用程序。NASA/JPL依賴Amazon Web Services (AWS) 完成此項工作。
該應(yīng)用程序構(gòu)建在Polyphony之上,通過在本地機(jī)器上存儲過剩容量并在超級計算中心存儲備用資源,Polyphony與AWS云完美結(jié)合。Polyphony能夠?qū)⒏鞣N資源融合在一起以實現(xiàn)共同目標(biāo)。通過使用Amazon Simple Queue Service (Amazon SQS),NASA/JPL開發(fā)人員甚至只需編寫一個類,即可在Amazon EC2上部署大量計算。
2.助NOKIA打造數(shù)據(jù)處理平臺
電信巨頭諾基亞公司用其Xpress互聯(lián)網(wǎng)服務(wù)平臺,在印度、亞太、非洲和南美等新興市場提供移動互聯(lián)網(wǎng)服務(wù)。它的平臺上運(yùn)行著2200臺服務(wù)器,每日日志及日常收集數(shù)據(jù)量能達(dá)到800 GB。對于傳統(tǒng)數(shù)據(jù)庫來說這些數(shù)據(jù)量太過龐大,以至于諾基亞無法將其迅速分析生成所需報告。諾基亞通過將數(shù)據(jù)轉(zhuǎn)移到亞馬遜的AWS和Redshift平臺,使用亞馬遜的大數(shù)據(jù)解決方案,可以全面管理數(shù)據(jù)倉庫,數(shù)據(jù)運(yùn)算查詢的速度是以前的一倍,使用商業(yè)智能工具挖掘分析大數(shù)據(jù)也使成本節(jié)省了50%。
3.助Philips公司打造醫(yī)療服務(wù)平臺
飛利浦是荷蘭公司,專注于醫(yī)療保健領(lǐng)域,產(chǎn)品包括消費(fèi)者的生活方式、照明產(chǎn)品及其他服務(wù)。其公司的醫(yī)療信息解決方案和服務(wù)部門希望可以為全世界十幾億人的醫(yī)療健康服務(wù),并且建立飛利浦自己的醫(yī)療解決方案:HealthSuite數(shù)字平臺,而這些都是通過亞馬遜提供的AWS網(wǎng)絡(luò)服務(wù)來實現(xiàn)的。HealthSuite數(shù)字平臺分析和存儲病人的數(shù)據(jù)信息,并且收集研究了3.9億圖像和醫(yī)療記錄,成功的為醫(yī)療服務(wù)提供了可操作的數(shù)據(jù),這些數(shù)據(jù)會直接影響病人的護(hù)理。運(yùn)行在亞馬遜的AWS平臺會大大提升其數(shù)字平臺系統(tǒng)的可靠性、性能、和可擴(kuò)展性,這使飛利浦能更好的適應(yīng)其平臺內(nèi)容的增長速率,并且做出正確決策。
五、HP
產(chǎn)品類型:
Haven大數(shù)據(jù)平臺——提供處理全部企業(yè)大數(shù)據(jù)的功能,利用非結(jié)構(gòu)化和結(jié)構(gòu)化數(shù)據(jù)通知每個決定,提供可行的智能信息。
Haven既可在內(nèi)部部署,也可在云中部署,提供大數(shù)據(jù)分析和下一代應(yīng)用。HAVEn里面包含了很多組件,這些組件之間可以基于業(yè)務(wù)要求和應(yīng)用場景進(jìn)行組合,用戶可以選取適合的組件來滿足業(yè)務(wù)需要?;萜罩С种髁鞯腍adoop商業(yè)應(yīng)用,還可以把Vertica和Hadoop進(jìn)行集成,進(jìn)行大數(shù)據(jù)分析。它是將大數(shù)據(jù)軟件方案等系統(tǒng)集成在一起而成的大數(shù)據(jù)生態(tài)環(huán)境,可以給用戶提供完整的大數(shù)據(jù)解決方案。
Information Management——提供智能備份和恢復(fù),幫助用戶應(yīng)對當(dāng)前以及未來的備份與恢復(fù)挑戰(zhàn)。該解決方案利用與應(yīng)用、基礎(chǔ)設(shè)施和運(yùn)維分析的高級集成,可優(yōu)化備份,提高業(yè)務(wù)連續(xù)性和恢復(fù)能力,并增加IT環(huán)境持續(xù)正常運(yùn)行的時間?;萜招畔⒐芾斫鉀Q方案提供基于智能政策的保護(hù),提供訪問和組織數(shù)據(jù)優(yōu)化的可恢復(fù)性保留,減少損失和濫用數(shù)據(jù)的風(fēng)險。具有聯(lián)合的重復(fù)數(shù)據(jù)刪除功能,可最大程度地提高存儲效率和性能。
INFORMATION GOVERNANCE——降低未來數(shù)據(jù)風(fēng)險和控制成本,它可以協(xié)助企業(yè)獲取更多商業(yè)價值。惠普提供了一個投資組合的模塊化解決方案,幫助企業(yè)獲得計算機(jī)生成的信息后進(jìn)行分析,組織和控制集中的數(shù)據(jù),智能管理與業(yè)務(wù)。
BIG DATA INDUSTRY SOLUTIONS——大數(shù)據(jù)行業(yè)解決方案,幫助企業(yè)分析行業(yè)大數(shù)據(jù),使企業(yè)面臨更大的機(jī)遇,提升企業(yè)利潤及解決問題方式。
惠普作為一家全球性資訊科技公司,主要行業(yè)在打印機(jī)、數(shù)碼影像、計算機(jī)和資訊服務(wù)等領(lǐng)域,其在硬件方面相對有優(yōu)勢,其大數(shù)據(jù)解決方案較完善。并且惠普全球大數(shù)據(jù)基地位于中國青島,相對于其他外國企業(yè)來說本土優(yōu)勢較強(qiáng),價格對于中型企業(yè)來說大多能接受。其用戶多是金融領(lǐng)域及政府機(jī)構(gòu)等。
經(jīng)典案例:
1.迪拜警方提高執(zhí)法的速度和效率
迪拜是阿聯(lián)酋的七個酋長國之一,要維持一個擁有一萬五千多名員工并且配有高水平的專業(yè)培訓(xùn)的警察局,這對管理者來說十分復(fù)雜。在2009年,迪拜警方利用惠普平臺,部署了一個心形的掃描儀安裝在巡邏車上,可迅速“讀取”車牌號,快速計算識別出哪些車主有犯罪行為或是被通緝,這對警察的執(zhí)法十分有利,效率提升很大。以前沒有這個系統(tǒng)的時候,只能夠靠人工來大面積觀察車牌樣式和信息,但十分費(fèi)力且效果不佳。二這套系統(tǒng)已經(jīng)幫助迪拜警方逮捕了本地和國際的兩千七百多名犯人。
2.備份醫(yī)療健康數(shù)據(jù)
惠普系統(tǒng)曾幫助某組織備份醫(yī)療健康數(shù)據(jù),降低其備份管理難度,從每周需要四小時到現(xiàn)在每周只需要二十分鐘。不再使用以前的n多個服務(wù)器備份,使備份變得很簡單便捷。在備份大量數(shù)據(jù)時,安全性也有提升。
六、SAP
產(chǎn)品類型:
1.數(shù)據(jù)庫及數(shù)據(jù)倉庫
SAP HANA——具備強(qiáng)大的分析能力,提供多用途的內(nèi)存應(yīng)用設(shè)備,企業(yè)可以利用它即時掌握業(yè)務(wù)運(yùn)營情況,從而對所有可用的數(shù)據(jù)進(jìn)行分析,并對快速變化的業(yè)務(wù)環(huán)境做出迅速響應(yīng)?;赟AP HANA的SAP Business Suite(包含ERP、CRM、SCM、SRM、PLM)可推動整個企業(yè)實現(xiàn)實時運(yùn)營?;贖ANA平臺的SAP ERP可更快速響應(yīng)企業(yè)需求,通過精準(zhǔn)分析海量數(shù)據(jù)帶來更深層次的數(shù)據(jù)交換。
SAP Sybase IQ——面向大數(shù)據(jù)的高級分析,它打破數(shù)據(jù)分析的壁壘,并將其集成到企業(yè)級分析流程中。SAP Sybase IQ采用三層架構(gòu):1)基本層數(shù)據(jù)庫管理系統(tǒng)(DBMS),這是一個全共享MPP分析DBMS引擎;2)分析應(yīng)用程序服務(wù)層,其提供C++和Java數(shù)據(jù)庫內(nèi)API,并可實現(xiàn)與外部數(shù)據(jù)源的集成和聯(lián)邦,包括四種與Hadoop的集成方法,3)頂層Sybase IQ生態(tài)系統(tǒng),由四個不同的合作伙伴和認(rèn)證ISV應(yīng)用程序組成。
Sybase Adaptive Server Enterprise——能夠處理超大數(shù)據(jù)集的關(guān)系型數(shù)據(jù)庫管理系統(tǒng)(RDBMS)。它是基于客戶/服務(wù)器體系結(jié)構(gòu)的數(shù)據(jù)庫,也多線索化高性能的、事件驅(qū)動的、可編程的數(shù)據(jù)庫,同時提供自我管理、自動故障切換支持功能,以及大量性能優(yōu)化調(diào)整特性,可以節(jié)約運(yùn)行成本。
SAP NetWeaver Business Warehouse——利用組織架構(gòu)和在物流,財務(wù),人力資源領(lǐng)域的業(yè)務(wù)流程整合的見解,協(xié)助用戶進(jìn)行企業(yè)集中管理,深化企業(yè)應(yīng)用管理。
2.企業(yè)信息管理
SAP Data Services——軟件可在企業(yè)層面集成、轉(zhuǎn)換和改善數(shù)據(jù),讓企業(yè)能夠以較低的成本為所有關(guān)鍵業(yè)務(wù)職能部門提供可靠的信息。為IT團(tuán)隊提供了數(shù)據(jù)剖析和文本分析工具,能夠優(yōu)化運(yùn)營,提高數(shù)據(jù)質(zhì)量,并獲取對分散數(shù)據(jù)源和應(yīng)用的關(guān)鍵訪問。
SAP Informance Governance——信息治理,提升企業(yè)的信息一致性和準(zhǔn)確性,以更好的信息管理方法來提高業(yè)務(wù)有效性并降低風(fēng)險。
SAP NetWeaver——信息生命周期管理解決方案,幫助企業(yè)解決制定明確的生命周期內(nèi)信息存檔和銷毀策略。
SAP大數(shù)據(jù)解決方案主要集中在數(shù)據(jù)庫及數(shù)據(jù)倉庫層面和企業(yè)信息管理層面,其方案包括范圍不是很廣泛,但是很深入,適合管理、數(shù)據(jù)庫等方面需求強(qiáng)的企業(yè)。
經(jīng)典案例:
1.三全食品公司
是中國生產(chǎn)速凍食品最早、規(guī)模最大、市場網(wǎng)絡(luò)最廣的企業(yè)之一。SAP為其構(gòu)建營銷管理體系信息化平臺,助其提高效率、拓展市場。并且結(jié)合其業(yè)務(wù)需求,深化系統(tǒng)應(yīng)用,利用大數(shù)據(jù)分析協(xié)助其改進(jìn)采購戰(zhàn)略,縮短采購周期,壓縮成本、降低單位價格。并且融合外部數(shù)據(jù),提供決策支持的依據(jù)。其解決方案收效十分明顯,三全公司應(yīng)到賬款到期收款率由63%提升到97%,物料庫存準(zhǔn)確率由52%提高至99%,各產(chǎn)品線車間生產(chǎn)余料平均減少85%。
2. 助邯鄲鋼鐵信息化
邯鄲鋼鐵屬特大型鋼鐵生產(chǎn)企業(yè),進(jìn)入90年代后期,鋼鐵行業(yè)市場已由單純產(chǎn)量、速度競爭轉(zhuǎn)變?yōu)榘ㄙY源爭奪、產(chǎn)業(yè)鏈調(diào)整和產(chǎn)品科技含量等方面在內(nèi)的企業(yè)綜合實力競爭這一形式。企業(yè)急需有效管理的現(xiàn)代企業(yè)制度,以進(jìn)一步提高企業(yè)的競爭能力。邯鄲鋼鐵使用SAP的NetWeaver平臺,完成整體的業(yè)務(wù)流程設(shè)計,實現(xiàn)廠際間物料優(yōu)化和板材生產(chǎn)優(yōu)化,完善工序計量設(shè)施,建立基本數(shù)據(jù)庫,為科學(xué)決策和分析提供具有較強(qiáng)參考價值的綜合性依據(jù)。在人力資源管理、項目管理等模塊,深化供應(yīng)鏈管理模式,實現(xiàn)設(shè)備產(chǎn)能優(yōu)化和生產(chǎn)線排產(chǎn)的一體化。
七、Intel
產(chǎn)品類型:
Intel Hadoop Manager——提供專業(yè)咨詢服務(wù),幫助用戶構(gòu)建高可擴(kuò)展性的分布式系統(tǒng),結(jié)合Intel的硬件部門,提供全面你的軟硬件解決方案。其功能包括數(shù)據(jù)挖掘、數(shù)據(jù)流處理語言、數(shù)據(jù)倉庫等。Intel對Hadoop進(jìn)行了優(yōu)化,它囊括Intel針對現(xiàn)有客戶在實際使用中出現(xiàn)問題的解決方法,為數(shù)據(jù)處理平臺提供更高性能。
Intel至強(qiáng)E7v3產(chǎn)品家族——E7v3產(chǎn)品家族的四路、八路和更大型的服務(wù)器可提供卓越的性能和可擴(kuò)展性,支持對數(shù)TB乃至數(shù)PB規(guī)模的數(shù)據(jù)集執(zhí)行實時分析。
Intel不光是一個軟件公司,也是一個硬件公司,其產(chǎn)品多與開源軟件相結(jié)合。Intel在Hadoop技術(shù)這方面有它的領(lǐng)先優(yōu)勢,對于Hadoop進(jìn)行了很好的改進(jìn),軟件活躍度較高。其客戶多集中在金融、醫(yī)療、電信等領(lǐng)域。
經(jīng)典案例:
1. 銀行業(yè)欺詐管理
防欺詐是金融服務(wù)行業(yè)面臨的一場高風(fēng)險的戰(zhàn)爭。在多個渠道、業(yè)務(wù)部門和服務(wù)領(lǐng)域的共同作用下,銀行正面臨著不斷變化的威脅矩陣。確保交易安全極為復(fù)雜,但是卻是保護(hù)企業(yè)及其客戶必不可少的一環(huán)。Computacenter Germany與Concepts and Solutions(CAS)聯(lián)合為在英特爾至強(qiáng)處理器E7產(chǎn)品家族平臺上運(yùn)行的內(nèi)存分析應(yīng)用開發(fā)了多種強(qiáng)大、實時的欺詐檢測解決方案。借助這些處理器的大容量內(nèi)存、多個核心以及高級 RAS 特性,金融機(jī)構(gòu)能夠獲得前所未有的欺詐響應(yīng)速度和可靠性。
2.助中芯縮短芯片制造周期
中芯國際光罩廠為其代工客戶和其它芯片加工廠及機(jī)構(gòu)提供光掩模制造服務(wù),擁有中國最大及最先進(jìn)的光掩模制造設(shè)施。面臨芯片制造工藝的革新和不斷增加的客戶以及越來越復(fù)雜的客戶需求,中芯利用基于英特爾架構(gòu)的高性能計算中心應(yīng)對計算性能挑戰(zhàn),不斷提高光掩模制造工藝,縮短芯片制造周期,持續(xù)為客戶提供優(yōu)質(zhì)服務(wù)。中芯成功實現(xiàn)28納米制造工藝,提高了光掩模制造服務(wù)能力,顯著降低總體擁有成本。
八、Teradata
產(chǎn)品類型:
Teradata QueryGrid大數(shù)據(jù)解決方案——集成不同的分析工具和引擎,提供無縫的自助式服務(wù),靈活性較強(qiáng)。用戶只需在單一Teradata 數(shù)據(jù)庫或者Teradata Aster數(shù)據(jù)庫查詢,就能訪問和分析各個系統(tǒng)的數(shù)據(jù)。通過在數(shù)據(jù)的原有存儲位置進(jìn)行處理,最大限度避免數(shù)據(jù)移動和復(fù)制。
Teradata Database 15數(shù)據(jù)庫——實現(xiàn)了Teradata統(tǒng)一數(shù)據(jù)架構(gòu),讓用戶在訪問所有數(shù)據(jù)的同時獲得嶄新洞察力,從而實現(xiàn)邏輯數(shù)據(jù)倉庫的真正使命。用戶可以在多元系統(tǒng)中實現(xiàn)分析查詢、整合與使用JOSN數(shù)據(jù)、編寫并運(yùn)行數(shù)據(jù)庫內(nèi)非SQL語言,以及運(yùn)用新型分析。
Teradata Active EDW 6750動態(tài)企業(yè)級數(shù)據(jù)倉庫平臺——滿足規(guī)模最大、最苛刻的實時負(fù)載,擁有數(shù)以千計的應(yīng)用程序,能夠滿足無限數(shù)量的并發(fā)用戶在61 PB的數(shù)據(jù)中進(jìn)行查詢,為決策者提供最重要的數(shù)據(jù)。
Teradata天睿公司是全球最大的專注于大數(shù)據(jù)分析、數(shù)據(jù)倉庫和整合營銷管理解決方案的供應(yīng)商。其在大中華區(qū)有超過十多個行業(yè)的客戶,包含政府與公共服務(wù)、通信行業(yè)、銀行、保險、證券、航空、地鐵、交通運(yùn)輸、物流、快遞行業(yè)、制造行業(yè)、汽車、零售、電子商務(wù)、互聯(lián)網(wǎng)、電力能源等等。Teradata大數(shù)據(jù)平臺不改變業(yè)務(wù)的使用習(xí)慣,避免冗長的開發(fā)過程,對于磁盤故障、網(wǎng)絡(luò)故障、服務(wù)器故障等都有應(yīng)對機(jī)制,其安全性也比較高。
經(jīng)典案例:
1.促進(jìn)傳統(tǒng)挖掘模型升級,終端潛在客戶挖掘
當(dāng)前我們處在智能終端快速普及階段,智能終端占有率超過60%,換機(jī)市場是一個非常大的市場,據(jù)可信數(shù)據(jù),當(dāng)前各省每月終端換機(jī)已達(dá)到百萬部,甚至千萬部。那么對于終端廠商、運(yùn)營商,以及終端渠道商來說,這么大的市場,如何去發(fā)現(xiàn)潛在換機(jī)客戶?Teradata大數(shù)據(jù)提供了傳統(tǒng)潛在換機(jī)模型,主要是基于用戶移動業(yè)務(wù)的使用情況,采用決策樹的挖掘算法進(jìn)行數(shù)據(jù)挖掘,其中選取的典型業(yè)務(wù)指標(biāo)包括用戶的基礎(chǔ)情況、當(dāng)前機(jī)型、機(jī)齡(機(jī)齡指當(dāng)前用戶當(dāng)前終端使用時間)、月消費(fèi)額,參與終端營銷活動情況(如捆綁時間),以及客戶使用業(yè)務(wù)情況,如通話、流量等。提高命中率,獲取真實用戶需求??蛻羲阉鲾?shù)據(jù)引入后,傳統(tǒng)挖掘模型的命中率及覆蓋率大為提高,現(xiàn)在的模型效率是過去模型效率的3倍。
九、Microsoft
產(chǎn)品類型:
Windows Azure HDInsight——通過與Microsoft BI工具(如PowerPivot、Power View)進(jìn)行深度集成,HDInsight使企業(yè)可以利用Hadoop輕松找到洞察數(shù)據(jù)信息。HDInsight具有企業(yè)級的安全性和可管理性。通過PowerShell腳本的擴(kuò)展支持簡化了Hadoop群集的管理。
Modern data warehouse——現(xiàn)代數(shù)據(jù)倉庫,傳統(tǒng)的結(jié)構(gòu)化關(guān)系數(shù)據(jù)倉庫在設(shè)計上無法應(yīng)對爆炸式數(shù)據(jù)增長、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)類型,以及更快的數(shù)據(jù)處理速度?,F(xiàn)代數(shù)據(jù)倉庫解決方案將傳統(tǒng)數(shù)據(jù)倉庫與非關(guān)系數(shù)據(jù)進(jìn)行集成,從而可以處理各種規(guī)模和類型的數(shù)據(jù),并提供實時性能。
Business intelligence——通過Office和SQL Server在組織內(nèi)提供商業(yè)智能,發(fā)現(xiàn)、分析和可視化數(shù)據(jù),深入挖掘并將獲得的洞察力通過SharePoint和Office 365進(jìn)行共享。通過SQL Server,IT專業(yè)人士可使用強(qiáng)大的工具構(gòu)建現(xiàn)代化數(shù)據(jù)解決方案,該解決方案不僅可以跨組織擴(kuò)展,數(shù)據(jù)的可靠性和安全性也很有保證。
微軟能夠低成本儲存所有類型和規(guī)模的數(shù)據(jù),使用Hadoop數(shù)分鐘內(nèi)在HDInsight上快速部署群集。其大數(shù)據(jù)產(chǎn)品在系統(tǒng)信息處理及商業(yè)智能方面十分有優(yōu)勢。由于windows系統(tǒng)在全球使用很廣泛,使微軟大數(shù)據(jù)產(chǎn)品的易用性和靈活性很強(qiáng)。
經(jīng)典案例:
1. 中山醫(yī)院借助SQL Server 2014利用大數(shù)據(jù)推動醫(yī)療信息化發(fā)展
為加強(qiáng)院內(nèi)的醫(yī)療水平,復(fù)旦大學(xué)附屬中山醫(yī)院開啟了多個臨床病歷分析的課題,通過從歷史的病員病理分析,找出一些疾病的病性特性。但當(dāng)前臨床病歷分析無法直接滿足現(xiàn)階段醫(yī)生對數(shù)據(jù)訪問的性能需求。中山醫(yī)院使用SQL Server 2014,不僅顯著提升了醫(yī)療數(shù)據(jù)管理的性能,還提供了全新的特性幫助中山醫(yī)院整合結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù),為醫(yī)療數(shù)據(jù)的深度挖掘和臨床的學(xué)術(shù)研究提供了最新的技術(shù)手段。其為醫(yī)護(hù)人員提供了更便捷的報表體驗,提升臨床工作中對數(shù)據(jù)的查詢與分析性能,借助海量數(shù)據(jù)的力量為患者提供了更加優(yōu)質(zhì)的醫(yī)療服務(wù)。
十、阿里巴巴
產(chǎn)品類型:
阿里經(jīng)濟(jì)云圖——阿里推出的國內(nèi)首個面向政府開放的大數(shù)據(jù)產(chǎn)品,各級政府可自助查詢當(dāng)?shù)囟嗑S度的電子商務(wù)經(jīng)濟(jì)數(shù)據(jù),為政府實現(xiàn)互聯(lián)網(wǎng)經(jīng)濟(jì)分析與決策提供支持。
分析數(shù)據(jù)庫服務(wù)ADS——分析數(shù)據(jù)庫服務(wù)(Analytic Database Service,簡稱ADS),是阿里巴巴自主研發(fā)的海量數(shù)據(jù)實時高并發(fā)在線分析云計算服務(wù),使您可以在毫秒級針對千億級數(shù)據(jù)進(jìn)行即時的多維分析透視和業(yè)務(wù)探索。ADS對海量數(shù)據(jù)的自由計算和極速響應(yīng)能力,能讓用戶在瞬息之間進(jìn)行靈活的數(shù)據(jù)探索,快速發(fā)現(xiàn)數(shù)據(jù)價值,并可直接嵌入業(yè)務(wù)系統(tǒng)為終端客戶提供分析服務(wù)。其產(chǎn)品正在公測中。
采云間DPC——基于開放數(shù)據(jù)處理服務(wù)的DW/BI的工具解決方案??梢源蟠蠼档陀脩粼跀?shù)據(jù)倉庫和商業(yè)智能上的實施成本,加快實施進(jìn)度。天弘基金、高德地圖的數(shù)據(jù)團(tuán)隊基于DPC完成他們的大數(shù)據(jù)處理需求。其產(chǎn)品正在公測中。
分析數(shù)據(jù)庫服務(wù)ADS——阿里巴巴自主研發(fā)的海量數(shù)據(jù)實時高并發(fā)在線分析云計算服務(wù),使得您可以在毫秒級針對千億級數(shù)據(jù)進(jìn)行即時的多維分析透視和業(yè)務(wù)探索。目前也在公測中。
阿里巴巴作為互聯(lián)網(wǎng)巨頭,其在大數(shù)據(jù)產(chǎn)品方面算是新企業(yè),它的很多大數(shù)據(jù)產(chǎn)品仍然在公測中。但阿里巴巴作為國內(nèi)企業(yè),對于國內(nèi)企業(yè)的大數(shù)據(jù)需求很有優(yōu)勢,對于市場環(huán)境和企業(yè)情況的了解更多,產(chǎn)品更適合國內(nèi)中小型企業(yè)。并且淘寶網(wǎng)在雙十一高并發(fā)數(shù)據(jù)處理方面創(chuàng)造了紀(jì)錄,技術(shù)方面很有保證。但阿里巴巴的數(shù)據(jù)大多來自其內(nèi)部,支付寶、聚劃算、一淘等平臺,這些數(shù)據(jù)包括交易數(shù)據(jù)、用戶瀏覽和點擊網(wǎng)頁數(shù)據(jù)、購物數(shù)據(jù)等等。對于全部滿足平臺商家的數(shù)據(jù)需求,并不是十分完善。