四種類型的數(shù)據(jù)分析模式

責任編輯:editor004

作者:CarolGuo

2017-07-27 11:28:12

摘自:INFOQ

在這篇博文中,我們聚焦于在數(shù)據(jù)科學領域所遇到的四種類型的數(shù)據(jù)分析模式:描述型、診斷型、預測型和指導型。設計良好的商業(yè)信息dashboard整合了時間序列數(shù)據(jù)(譬如,在多個聯(lián)系時間點上的數(shù)據(jù))的讀入、特征的過濾和鉆入功能,能夠用于這類分析。

在這篇博文中,我們聚焦于在數(shù)據(jù)科學領域所遇到的四種類型的數(shù)據(jù)分析模式:描述型、診斷型、預測型和指導型。

當我與剛涉足數(shù)據(jù)科學領域的年輕分析師們交談時,通常,我會問他們認為什么是數(shù)據(jù)科學家最重要的能力。他們的答案相當多樣化。

我想告訴他們的是,他們最重要的能力將是能夠把數(shù)據(jù)轉化為對非專業(yè)人士而言清楚而有意義的見解。瑞典統(tǒng)計學家Hans Rosling在這方面很有名。這種能力往往被忽略。下面Hans Rosling的這個TedTalk談到了這些:

https://www.youtube.com/watch?v=hVimVzgtD6w

分析能輔助開發(fā)有價值的見解,很有必要用一些工具來讓人們了解分析所起的作用。其中一種工具是分析四維圖。

簡單地來說,分析可被劃分為4個重要的類別。下面我將詳細解釋這四個類別。

1. 描述型:發(fā)生了什么?

 

這是最常見的一種。在業(yè)務中,它向分析師們提供業(yè)務的重要衡量標準的概覽。

一個例子是每月的利潤和損失賬單。類似地,分析師可以獲得大批客戶的數(shù)據(jù)。了解客戶(如,30%的客戶是自雇型)的地理信息也可認為是“描述型分析”。充分利用可視化工具能增強描述型分析所帶來的信息。

2. 診斷型:為什么會發(fā)生?

 

這是描述型分析的下一步難題。通過評估描述型數(shù)據(jù),診斷分析工具使得分析師們能夠深入分析問題的核心原因。

設計良好的商業(yè)信息dashboard整合了時間序列數(shù)據(jù)(譬如,在多個聯(lián)系時間點上的數(shù)據(jù))的讀入、特征的過濾和鉆入功能,能夠用于這類分析。

3. 預測型:可能發(fā)生什么?

 

預測型分析主要是進行預測。某事件在將來發(fā)生的可能性,預測一個可量化的值,或者是估計事情可能發(fā)生的某個時間點,這些都可以通過預測模型完成。

預測模型通常運用各種可變數(shù)據(jù)來作出預測。數(shù)據(jù)成員的多樣化與可能預測的目標是相關聯(lián)的(如,人的年齡越大,越可能發(fā)生心臟病,我們可以說年齡與心臟病風險是線性相關的)。隨后,這些數(shù)據(jù)被放在一起,產(chǎn)生分數(shù)或預測。

在一個充滿不確定性因素的世界里,能夠預測允許人們作出更好的決定。預測模型在很多領域都被用到。

這里是預測分析中要避免的前幾大陷阱

4. 指導型:我需要做什么?

 

在價值和復雜度上,下一步就是指導性模型。指導性模型基于發(fā)生了什么、為什么會發(fā)生以及一系列“可能發(fā)生什么”的分析,幫助用戶確定要采取的最好的措施。很顯然,指導性分析不是一個單獨的行為,實際上它是其他很多行為的主導。

交通應用是一個很好的例子,它幫助人們選擇最好的回家路線,考慮到了每條路線的距離、在每條路上的速度、以及很關鍵的目前的交通限制。

另一個例子是生成考試時間表,不讓任何學生的時間表發(fā)生沖突。

關于作者

Thomas Maydon是Principa公司的信用解決方案部門主管。他在南非、西非和中東地區(qū)有著超過13年的零售信貸市場的經(jīng)驗,主要參與咨詢、分析、信用局和預測模型服務。

查看英文原文:The 4 Types of Data Analytics

鏈接已復制,快去分享吧

企業(yè)網(wǎng)版權所有?2010-2024 京ICP備09108050號-6京公網(wǎng)安備 11010502049343號