這些大部分來(lái)自硬件和服務(wù)。對(duì)于大數(shù)據(jù)軟件而言,在某些情況下,每家公司的需求都是基于垂直行業(yè)的獨(dú)特需求。即使在同一行業(yè),如零售行業(yè)或制造行業(yè),每個(gè)公司的需求也會(huì)有所不同,因此開(kāi)發(fā)一種套裝軟件很難為所有行業(yè)的潛在客戶(hù)提供服務(wù)。
對(duì)于大數(shù)據(jù)軟件而言,成功的關(guān)鍵是為企業(yè)提供基礎(chǔ)應(yīng)用程序和工具來(lái)構(gòu)建自定義應(yīng)用程序。人們可以了解什么是真正的大數(shù)據(jù)應(yīng)用軟件。這些提供應(yīng)用程序的公司有很多是行業(yè)知名廠商,然而,也有一些令人關(guān)注的初創(chuàng)公司的產(chǎn)品也包括在內(nèi)。
以下是20家專(zhuān)門(mén)從事大數(shù)據(jù)構(gòu)建或相關(guān)業(yè)務(wù)的企業(yè)所提供的應(yīng)用程序。這個(gè)清單并沒(méi)有什么特別的順序。
(1)Domo
Omniture公司前首席執(zhí)行官Josh James于2010年創(chuàng)立了Domo公司,為企業(yè)提供了一種方法,可以從不同來(lái)源、不同的孤島中查看數(shù)據(jù)。它自動(dòng)從電子表格、社交媒體、內(nèi)部存儲(chǔ)、數(shù)據(jù)庫(kù),基于云的應(yīng)用程序,以及數(shù)據(jù)倉(cāng)庫(kù)中提取數(shù)據(jù),并在可定制儀表板上顯示信息。它以其易用性以及幾乎任何人都可以建立和使用它而聞名,而不僅僅是數(shù)據(jù)科學(xué)家采用。它配備了許多預(yù)加載的圖表和數(shù)據(jù)源設(shè)計(jì),可以快速移動(dòng)。
(2)Teradata Database
從Teradata Database 15開(kāi)始,該公司增加了Teradata統(tǒng)一數(shù)據(jù)架構(gòu)等新的大數(shù)據(jù)功能,使企業(yè)能夠跨多個(gè)系統(tǒng)訪問(wèn)和處理分析查詢(xún),其中包括從Hadoop導(dǎo)入和導(dǎo)出雙向數(shù)據(jù)。它還添加了地理空間數(shù)據(jù)的3D顯示和處理,以及增強(qiáng)的工作負(fù)載管理和系統(tǒng)可用性。支持AWS和Azure的基于云計(jì)算的版本稱(chēng)為T(mén)eradata Everywhere,它在基于公共云的數(shù)據(jù)和本地部署的數(shù)據(jù)之間提供了大規(guī)模的并行處理分析。
(3)Hitachi Vantara
Hitachi Vantara的大數(shù)據(jù)產(chǎn)品是建立一些流行的開(kāi)源工具基礎(chǔ)上。Hitachi Vantara成立于2017年,是日立數(shù)據(jù)系統(tǒng)公司的存儲(chǔ)和數(shù)據(jù)中心基礎(chǔ)設(shè)施業(yè)務(wù)部門(mén),是由Hitachi Insight集團(tuán)物聯(lián)網(wǎng)業(yè)務(wù)和日立Pentaho大數(shù)據(jù)業(yè)務(wù)組合成的一家合資公司。 Pentaho基于Apache Spark內(nèi)存計(jì)算框架和Apache Kafka消息系統(tǒng)。Pentaho 8.0還增加了對(duì)Apache Knox Gateway的支持,以對(duì)用戶(hù)進(jìn)行身份驗(yàn)證,并強(qiáng)制訪問(wèn)大數(shù)據(jù)存儲(chǔ)庫(kù)的訪問(wèn)規(guī)則。它還增加了對(duì)通過(guò)Docker容器構(gòu)建分析應(yīng)用程序的支持。
(4)TIBCO公司的Statistica
TIBCO公司的Statistica是針對(duì)各種規(guī)模企業(yè)的預(yù)測(cè)分析軟件,使用Hadoop技術(shù)對(duì)結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)執(zhí)行數(shù)據(jù)挖掘,解決物聯(lián)網(wǎng)數(shù)據(jù),能夠在全球任何地方的設(shè)備和網(wǎng)關(guān)上部署分析,并支持?jǐn)?shù)據(jù)庫(kù)內(nèi)分析來(lái)自Apache Hive、MySQL、Oracle、Teradata等平臺(tái)的功能。它使用模板來(lái)設(shè)計(jì)完整的分析,因此只有較少的技術(shù)用戶(hù)可以進(jìn)行自己的分析,并且可以將模型從電腦導(dǎo)出到其他設(shè)備。
(5)Panoply
Panoply公司通過(guò)使用人工智能來(lái)銷(xiāo)售所謂的智能云數(shù)據(jù)倉(cāng)庫(kù),以消除轉(zhuǎn)換、集成和管理數(shù)據(jù)所需的開(kāi)發(fā)和編碼。該公司聲稱(chēng),其智能云數(shù)據(jù)倉(cāng)庫(kù)實(shí)質(zhì)上提供了數(shù)據(jù)管理即服務(wù),能夠在無(wú)需任何干預(yù)的情況下消費(fèi)和處理高達(dá)1PB的數(shù)據(jù)。其機(jī)器學(xué)習(xí)算法可以檢查來(lái)自任何數(shù)據(jù)源的數(shù)據(jù),并對(duì)該數(shù)據(jù)執(zhí)行查詢(xún)和可視化。
(6)IBM Watson Analytics
Watson Analytics是IBM公司的基于云計(jì)算的分析服務(wù)。當(dāng)用戶(hù)將數(shù)據(jù)上傳到Watson時(shí),它會(huì)根據(jù)數(shù)據(jù)分析向用戶(hù)提供可幫助回答的問(wèn)題,并立即提供關(guān)鍵數(shù)據(jù)可視化。它還可以進(jìn)行簡(jiǎn)單分析、預(yù)測(cè)分析、智能數(shù)據(jù)發(fā)現(xiàn),并提供各種自助服務(wù)儀表板。IBM公司還有另一種分析產(chǎn)品SPSS,可用于從數(shù)據(jù)中發(fā)現(xiàn)模式,并查找數(shù)據(jù)點(diǎn)之間的關(guān)聯(lián)。
(7)SAS Visual Analytics
Statistical Analysis System (SAS)創(chuàng)建于1976年,比大數(shù)據(jù)的創(chuàng)建還要早,就是為了處理大量數(shù)據(jù)。它可以從各種來(lái)源中挖掘、更改、管理和檢索數(shù)據(jù),并對(duì)所述數(shù)據(jù)執(zhí)行統(tǒng)計(jì)分析,然后將其呈現(xiàn)在一系列方法中,如統(tǒng)計(jì)數(shù)據(jù)、圖表等,或?qū)?shù)據(jù)寫(xiě)入其他文件。它支持所有類(lèi)型的數(shù)據(jù)預(yù)測(cè)和分析要點(diǎn),并附帶預(yù)測(cè)工具來(lái)分析和預(yù)測(cè)流程。
(8)Sisense商業(yè)智能軟件
Sisense公司聲稱(chēng)其提供了唯一的商業(yè)智能軟件,使用戶(hù)可以通過(guò)從商品服務(wù)器硬件上的多個(gè)源進(jìn)行來(lái)準(zhǔn)備、分析和可視化復(fù)雜數(shù)據(jù)。Sisense的片上高性能數(shù)據(jù)引擎可以在一秒鐘內(nèi)完成對(duì)TB級(jí)數(shù)據(jù)的查詢(xún),并且為不同行業(yè)提供了一批模板。
(9)Talend的大數(shù)據(jù)工作室
Talend一直專(zhuān)注于為Hadoop生成干凈的原生代碼,無(wú)需手動(dòng)編寫(xiě)所有代碼。它為各種大數(shù)據(jù)存儲(chǔ)庫(kù)提供接口,如Cloudera,MapR,Hortonworks和Amazon EMR。它最近添加了一個(gè)數(shù)據(jù)準(zhǔn)備應(yīng)用程序,可以讓客戶(hù)創(chuàng)建一個(gè)通用字典,并使用機(jī)器學(xué)習(xí),自動(dòng)執(zhí)行數(shù)據(jù)清理過(guò)程,以便在更短的時(shí)間內(nèi)為數(shù)據(jù)處理準(zhǔn)備好數(shù)據(jù)。
(10)Cloudera
Apache Hadoop公司是最受歡迎的提供商和支持者,它與戴爾、英特爾、甲骨文、SAS、德勤和凱捷等公司都有合作關(guān)系。它由五個(gè)主要應(yīng)用程序組成:核心數(shù)據(jù)管理平臺(tái)Cloudera Essentials,數(shù)據(jù)管理平臺(tái)Cloudera Enterprise Data Hub,用于商業(yè)智能和基于SQL的分析的Cloudera Analytic DB; 高度可擴(kuò)展的NoSQL數(shù)據(jù)庫(kù)Cloudera Operational DB,以及Cloudera Data Science and Engineering,在Core Essentials平臺(tái)上運(yùn)行的數(shù)據(jù)處理、數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)。
(11)MongoDB
MongoDB已成為各行業(yè)大數(shù)據(jù)項(xiàng)目的首選數(shù)據(jù)庫(kù)。它的NoSQL支持適合大數(shù)據(jù)經(jīng)常使用的非結(jié)構(gòu)化數(shù)據(jù)。其靈活性、對(duì)JSON和JavaScript的支持、靈活的框架、豐富的查詢(xún)語(yǔ)言,以及廣泛的行業(yè)支持使其成為數(shù)據(jù)庫(kù)的標(biāo)準(zhǔn)。
(12)Vertica Analytics Platform
大數(shù)據(jù)的數(shù)據(jù)庫(kù)傳統(tǒng)上是非結(jié)構(gòu)化的,意味著可以在其中存儲(chǔ)任何類(lèi)型的數(shù)據(jù)。Micro Focus的Vertica分析平臺(tái)采用傳統(tǒng)的面向列的關(guān)系數(shù)據(jù)庫(kù)格式,但專(zhuān)門(mén)設(shè)計(jì)用于處理來(lái)自Hadoop集群的現(xiàn)代分析工作負(fù)載。該平臺(tái)使用集群方式存儲(chǔ)數(shù)據(jù),并全面支持SQL、JDBC和ODBC。它使用列式存儲(chǔ)而不是行式存儲(chǔ),因?yàn)樵L問(wèn)列可以更輕松地分組數(shù)據(jù)。
(13)SAP Vora
SAP HANA本身并不適用于大數(shù)據(jù)。這是一個(gè)內(nèi)存中的RDBMS系統(tǒng)。但是當(dāng)用戶(hù)添加HANA Vora這個(gè)大數(shù)據(jù)接口時(shí),它變得更加可行。Vora允許HANA連接到Hadoop存儲(chǔ)庫(kù),并擴(kuò)展Apache Spark執(zhí)行框架,以實(shí)現(xiàn)企業(yè)和Hadoop數(shù)據(jù)的交互式分析。所以數(shù)據(jù)科學(xué)家可以通過(guò)支持大數(shù)據(jù)存儲(chǔ)來(lái)獲得HANA的力量。
(14)Oracle Big Data suite
Oracle公司這個(gè)數(shù)據(jù)庫(kù)巨頭擁有全套大數(shù)據(jù)集成產(chǎn)品,如支持實(shí)時(shí)數(shù)據(jù)流、批量數(shù)據(jù)處理、企業(yè)數(shù)據(jù)質(zhì)量和數(shù)據(jù)治理功能的數(shù)據(jù)集成平臺(tái)云、流分析、物聯(lián)網(wǎng)支持,以及通過(guò)Oracle Event Hub云服務(wù)支持Apache Kafka。
(15)Apache Cassandra
雖然MongoDB是領(lǐng)先的數(shù)據(jù)庫(kù),但Cassandra在可擴(kuò)展性方面具有優(yōu)勢(shì)。這是由Facebook公司前員工所編寫(xiě),它跨越了大量的商品服務(wù)器,確保沒(méi)有故障點(diǎn)和高級(jí)容錯(cuò)能力。
(16)Plotly
Plotly或Plot.ly專(zhuān)注于數(shù)據(jù)可視化,而不需要編程或數(shù)據(jù)科學(xué)技能。它的GUI設(shè)計(jì)用于導(dǎo)入和分析數(shù)據(jù),并為其所有圖形使用D3.js JavaScript庫(kù)。它的儀表板可以實(shí)時(shí)生成,也可以從現(xiàn)有數(shù)據(jù)池生成,并支持導(dǎo)出到各種可視化工具,其中包括Excel,SQL數(shù)據(jù)庫(kù),Python,R和MATLAB。
(17)Wolfram Alpha
想要計(jì)算或了解有關(guān)事物的新內(nèi)容?Wolfram Alpha是一款用于查找關(guān)于所有內(nèi)容的信息非常棒的工具。Proessaywriting公司的Doug Smith表示,他的公司使用這個(gè)平臺(tái)進(jìn)行金融、歷史、社交和其他專(zhuān)業(yè)領(lǐng)域的高級(jí)研究。例如,如果輸入“Microsoft”,就會(huì)收到輸入解釋、基本面和財(cái)務(wù)信息、最新交易、價(jià)格歷史記錄、績(jī)效比較、數(shù)據(jù)回報(bào)分析、相關(guān)矩陣,以及許多其他信息。
(18)Tibco Spotfire
Spotfire是一款內(nèi)存分析平臺(tái),升級(jí)后包含對(duì)大數(shù)據(jù)存儲(chǔ)庫(kù)的支持并執(zhí)行預(yù)測(cè)分析。它為Apache Hadoop提供了一個(gè)連接器,它可以讓用戶(hù)在大數(shù)據(jù)上執(zhí)行數(shù)據(jù)混搭,數(shù)據(jù)發(fā)現(xiàn)和分析任務(wù),就像他們對(duì)Oracle,SAP和其他傳統(tǒng)數(shù)據(jù)源所做的那樣。它還支持實(shí)時(shí)數(shù)據(jù)驅(qū)動(dòng)的事件可視化,并具有人工智能驅(qū)動(dòng)的推薦引擎,可縮短數(shù)據(jù)發(fā)現(xiàn)時(shí)間。
(19)AnswerRocket
AnswerRocket專(zhuān)注于自然語(yǔ)言搜索數(shù)據(jù)發(fā)現(xiàn),使其成為商業(yè)用戶(hù)的工具,而不是數(shù)據(jù)科學(xué)家的神秘工具。它可以在幾分鐘內(nèi)提供答案,而不是等待幾天才能形成查詢(xún)。
AnswerRocket用戶(hù)可以使用日常語(yǔ)言提問(wèn),并在幾秒鐘內(nèi)獲得可視化效果,然后他們可以在特定的圖表或圖表上進(jìn)行深入查看以獲得進(jìn)一步的洞察。
(20)Tableau
Tableau專(zhuān)門(mén)從多個(gè)數(shù)據(jù)孤島中進(jìn)行繪圖,并將其集成到一個(gè)儀表板中,只需點(diǎn)擊幾下鼠標(biāo),即可使用自定義過(guò)濾器和拖動(dòng)和連接來(lái)創(chuàng)建交互式靈活的儀表板。Tableau還使用自然語(yǔ)言查詢(xún),因此用戶(hù)可以詢(xún)問(wèn)業(yè)務(wù)問(wèn)題,而不是技術(shù)問(wèn)題。
版權(quán)聲明:本文為企業(yè)網(wǎng)D1Net編譯,轉(zhuǎn)載需注明出處為:企業(yè)網(wǎng)D1Net,如果不注明出處,企業(yè)網(wǎng)D1Net將保留追究其法律責(zé)任的權(quán)利。