Google發(fā)行的Facebook Prophet和TensorFlow是兩種旨在吸引開發(fā)人員創(chuàng)建數(shù)據(jù)科學應(yīng)用程序的機器學習協(xié)議。技術(shù)和分析經(jīng)理應(yīng)將這些工具視為擴展其DataOps功能并將其初始步驟擴展到機器學習的方法。
由Facebook核心數(shù)據(jù)科學團隊創(chuàng)建的Facebook Prophet提供了可靠的時間序列預(yù)測,其中處理能力是一個問題。先知基于加性模型,以解決非線性趨勢如何與每年、每周和每天的季節(jié)性相適應(yīng)。當數(shù)據(jù)包含周期性趨勢(例如發(fā)現(xiàn)突發(fā)事件影響趨勢)時,該框架將為企業(yè)提供幫助。 R編程和Python版本是在一年前發(fā)布的,因此企業(yè)可以利用開源資源來創(chuàng)建模型。 源代碼和示例可在GitHub上獲得。
神經(jīng)網(wǎng)絡(luò)框架還提供了一套附加的概率模型,在R中,模型被稱為一個單獨的庫。這使得更高級的統(tǒng)計模型可以更容易地構(gòu)建到模型中。在時間序列的情況下,用戶可以應(yīng)用貝葉斯結(jié)構(gòu)的時間序列。貝葉斯結(jié)構(gòu)時間序列是一組概率模型,它包含并延展了許多標準的時間序列建模概念。其目的是突出統(tǒng)計細節(jié),以便更準確地比較當前和以往各時期的時間序列數(shù)據(jù)。TensorFlow概率庫允許模型包含貝葉斯結(jié)構(gòu)時間序列。
為什么要對時間序列如此重視呢?時間序列報告和Excel電子表格一樣常見,許多工具都顯示時間序列數(shù)據(jù),而你只需看一下web分析解決方案或社交媒體分析報告就可以得到。但是,這些解決方案中時間序列數(shù)據(jù)的可視化并沒有真正考慮到統(tǒng)計分析。
例如Google Analytics(分析)之類的網(wǎng)絡(luò)分析解決方案,可以提供引薦流量的時間序列結(jié)果,這些結(jié)果可以決定哪些源始終向網(wǎng)站發(fā)送流量。但是,假設(shè)您需要預(yù)測給定轉(zhuǎn)診源的趨勢可以持續(xù)多久,如果時間足夠長,趨勢線的斜率可能無法立即從平面線中分辨出來。通常確定第一個客戶的搜索流量的最高轉(zhuǎn)換來源時會耗費較長時間,因為訪問量增長緩慢。
根據(jù)目前的數(shù)據(jù)源情況,給定時間序列的頻率模式也可能不是線性的。這意味著觀測結(jié)果將以對數(shù)或曲線的形式顯示出連續(xù)的增減。具有統(tǒng)計能力的工具能夠比標準解決方案更好地檢測這些細微差別的趨勢。進行股票市場預(yù)測的金融專業(yè)人士非常了解更好的統(tǒng)計能力的價值。他們使用先進的工具來創(chuàng)建精確的時間序列預(yù)測,但因為數(shù)據(jù)中的噪音和波動掩蓋了這一趨勢。
最新的工具使很多統(tǒng)計功能成為可能,加快了創(chuàng)建有意義的決策分析。數(shù)據(jù)中的隨機噪聲也可以過濾掉。但高級分析也可以在其他儀表板(如Tableau)中完成,或者像Prophet提供的用Python或R編程創(chuàng)建可視化模型。
雖然時間序列是一個簡單的分析,但有時也會包含復(fù)雜的統(tǒng)計細微差別。檢查這些細微差別可以快速顯示正確的細節(jié),幫助團隊更快更好地做出數(shù)據(jù)驅(qū)動下的正確決策。