使用AI的實(shí)戰(zhàn)方法論:做好這5個(gè)步驟

責(zé)任編輯:cres

2020-06-19 15:32:24

摘自:今日頭條-AI公園

人工智能(AI)是所有現(xiàn)代問(wèn)題的新靈丹妙藥嗎?或者它是一把雙刃劍,有時(shí)是破壞性的,有時(shí)是很有用的。事實(shí)是這樣的:有了正確的框架,人工智能就有潛力被利用。

根據(jù)Gartner的研究,大約37%的組織正在實(shí)施某種形式的人工智能。然而,根據(jù)安永(EY)的一項(xiàng)調(diào)查(

https://www.technologyreview.com/s/611013/impact-ofai-on-business/),只有大約20%的公司認(rèn)為自己擁有戰(zhàn)略人工智能能力。很少有組織能夠成功地利用人工智能的真正力量來(lái)產(chǎn)生有意義的影響。

如何利用人工智能?框架應(yīng)該是什么?這篇由麥肯錫全球研究所MGI發(fā)表的論文推薦了組織需要關(guān)注的五個(gè)領(lǐng)域。

使用AI的實(shí)戰(zhàn)方法論:做好這5個(gè)步驟

這些領(lǐng)域不是孤立的。它們是相互關(guān)聯(lián)的。這些領(lǐng)域中的每一個(gè)都需要共同努力,才能產(chǎn)生明顯的影響。

作為一名數(shù)據(jù)戰(zhàn)略家有其優(yōu)勢(shì)。在本文中,我將詳細(xì)說(shuō)明實(shí)現(xiàn)這個(gè)框架的實(shí)際方法。

1. 識(shí)別正確的用例

當(dāng)公司已決定踏上人工智能之旅。第一個(gè)任務(wù)是識(shí)別正確的用例。發(fā)散收斂法是一種行之有效的方法。頭腦風(fēng)暴來(lái)探索盡可能多的AI用例。一旦完成,聚合到前3個(gè)用例的候選列表。

如何聚合用例?探索的維度是什么

我建議以從下幾個(gè)方面入手:

  1. 業(yè)務(wù)影響:這個(gè)用例有實(shí)際的業(yè)務(wù)影響嗎?對(duì)其進(jìn)行量化。
  2. 技術(shù)可行性:當(dāng)前的技術(shù)環(huán)境是否支持此用例的實(shí)現(xiàn)?創(chuàng)建一個(gè)技術(shù)地圖。
  3. 數(shù)據(jù)可用性:是否有相關(guān)的數(shù)據(jù)點(diǎn)可用來(lái)交付用例?探索這些。

在這三個(gè)維度上映射用例提供了一個(gè)關(guān)于什么可行,什么不可行的用例圖。這方面的一個(gè)例子如下:

使用AI的實(shí)戰(zhàn)方法論:做好這5個(gè)步驟

在上面的用例圖中,用例#7和#6在三個(gè)維度上都得分很高。用例#3是下一個(gè)候選者,盡管它缺少所需的所有數(shù)據(jù)。

一個(gè)揮之不去的問(wèn)題是:有多少數(shù)據(jù)是足夠的

這個(gè)問(wèn)題沒(méi)有明確的答案。解決這個(gè)問(wèn)題的經(jīng)驗(yàn)法則是回答以下問(wèn)題:

可用的數(shù)據(jù)是否足以構(gòu)建最小可行模型

如果上述問(wèn)題的答案是“是”,那么建議繼續(xù)并考慮潛在開(kāi)發(fā)的用例。

2. 構(gòu)建高效的數(shù)據(jù)平臺(tái)

數(shù)據(jù)是新的石油。這種新的石油擴(kuò)散到整個(gè)公司。有必要從中提取價(jià)值。有必要對(duì)其進(jìn)行改進(jìn)。人工智能和數(shù)據(jù)有一種共生關(guān)系。他們需要彼此的繁榮和興旺。

從遠(yuǎn)古時(shí)代起,各個(gè)公司就試圖創(chuàng)建一個(gè)數(shù)據(jù)分析平臺(tái)。企業(yè)數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)集市、數(shù)據(jù)湖都試圖馴服這頭猛獸。隨著數(shù)據(jù)技術(shù)的進(jìn)一步發(fā)展,新的數(shù)據(jù)體系結(jié)構(gòu)模式不斷涌現(xiàn)。

2017年,我寫了一篇博客:Demystifying Data Lake Architecture,強(qiáng)調(diào)了創(chuàng)建一個(gè)有用的人工智能數(shù)據(jù)平臺(tái)的關(guān)鍵組件。此后,數(shù)據(jù)技術(shù)不斷發(fā)展。然而,核心仍然是相同的。這些概念仍然可以應(yīng)用。

然而,需要思考的問(wèn)題如下:

利用人工智能的數(shù)據(jù)平臺(tái)的原則是什么

以下是我的三條建議:

  1. 以原始格式存儲(chǔ)所有數(shù)據(jù):數(shù)據(jù)的性質(zhì)比較復(fù)雜。一個(gè)人只有在使用它的時(shí)候才知道它的用法。最好的策略是將它們?nèi)看鎯?chǔ)為它們自己的格式。沒(méi)有轉(zhuǎn)換。沒(méi)有管理。只是原始的存儲(chǔ)。隨著云技術(shù)的出現(xiàn),數(shù)據(jù)存儲(chǔ)變得廉價(jià)??梢允褂迷S多存儲(chǔ)層選項(xiàng)。例如,在Azure中,人們可以在許多層(高級(jí)、熱、冷、存檔)中存儲(chǔ)前50TB的數(shù)據(jù),平均成本為0.044美元/GB/月,即4.4美元/TB/月(比一杯星巴克高杯摩卡還低)。作為指導(dǎo)原則,我建議至少在過(guò)去5年內(nèi)存儲(chǔ)數(shù)據(jù)。在此之后,如果發(fā)現(xiàn)無(wú)用,總是可以歸檔。
  2. 解耦存儲(chǔ)和計(jì)算:存儲(chǔ)是常年的。處理是短暫的。處理引擎可以是批處理的,也可以是面向流的。處理也可能是一項(xiàng)昂貴的操作。因此,按需處理是有意義的。根據(jù)所需的處理類型,創(chuàng)建適當(dāng)?shù)奶幚硪?。一旦任?wù)完成,處理引擎就可以暫?;蜾N毀。解耦計(jì)算和存儲(chǔ)節(jié)省了大量成本。它還提供了很大的靈活性。一般來(lái)說(shuō),這是明智的做法。
  3. 分類目和管理數(shù)據(jù):防止數(shù)據(jù)湖變成交換空間的一個(gè)最重要的原則是仔細(xì)地分類目和管理數(shù)據(jù)。作為一個(gè)經(jīng)驗(yàn)法則,任何持久化的東西都會(huì)被編類目。主動(dòng)編類目將使業(yè)務(wù)分析人員、數(shù)據(jù)科學(xué)家或任何希望以正確格式查找正確數(shù)據(jù)的人能夠輕松地搜索數(shù)據(jù)元素。積極編類目的重要性再怎么強(qiáng)調(diào)也不為過(guò)。編類目和管理決定了數(shù)據(jù)分析平臺(tái)的成敗。

3. 采用正確的工具、過(guò)程和技術(shù)

第三部分是選擇合適的工具和技術(shù)來(lái)實(shí)現(xiàn)AI。當(dāng)然,有很多可用的工具來(lái)實(shí)現(xiàn)它。有三個(gè)基本原則對(duì)于人工智能的蓬勃發(fā)展至關(guān)重要。

  1. 利用規(guī)模:數(shù)據(jù)與人工智能之間存在相關(guān)關(guān)系。通常,需要訓(xùn)練的數(shù)據(jù)越多,就意味著模型越可用。在過(guò)去,訓(xùn)練模型的能力受到限制。存儲(chǔ)和計(jì)算能力有限。在過(guò)去的20年里,存儲(chǔ)和計(jì)算技術(shù)得到了發(fā)展。云計(jì)算平臺(tái)正在創(chuàng)新。存儲(chǔ)是便宜。計(jì)算是負(fù)擔(dān)得起的。以可接受的成本進(jìn)行大規(guī)模的數(shù)據(jù)處理和模型訓(xùn)練是可能的。過(guò)去的局限現(xiàn)在已不復(fù)存在了。
  2. 關(guān)注功能而不是技術(shù):創(chuàng)建一個(gè)靈活的數(shù)據(jù)架構(gòu)。每個(gè)組件都滿足特定的功能。可用的技術(shù)特性不固定組件。功能是不變的,而技術(shù)是不斷變化的。這是云平臺(tái)的另一個(gè)好處。云平臺(tái)創(chuàng)新。他們引進(jìn)新技術(shù),以更低的成本提供相同或更好的功能。
  3. 擁抱數(shù)據(jù)項(xiàng)目中的敏捷性:著名統(tǒng)計(jì)學(xué)家George Box曾打趣道:“所有模型都是錯(cuò)的,但有些模型是有用的。”得到那個(gè)有用的模型是一個(gè)迭代的過(guò)程。每次迭代都是向那個(gè)有用的模型邁進(jìn)的一步。不要在AI項(xiàng)目中追求絕對(duì)。它不存在。完美的模型是烏托邦。以該模型為目標(biāo),它對(duì)于給定的上下文來(lái)說(shuō)已經(jīng)足夠好了。

4. 在過(guò)程中集成AI決策

任何基于AI的項(xiàng)目的最終目標(biāo)都是產(chǎn)生積極的影響。無(wú)論是商業(yè)還是社交。然而,許多成功的人工智能項(xiàng)目在它的搖籃里夭折了。他們看不到光明。因此,一個(gè)人工智能項(xiàng)目,因?yàn)樗姆趸A段,需要從頭到尾的觀察。

我再怎么強(qiáng)調(diào)都不為過(guò):AI項(xiàng)目是基于影響力的項(xiàng)目。他們需要一個(gè)結(jié)果。它們不是技術(shù)項(xiàng)目

想象一個(gè)AI項(xiàng)目不應(yīng)該是關(guān)于模型和算法的。它必須是關(guān)于結(jié)果的。將給最終用戶帶來(lái)利益的結(jié)果。

每個(gè)過(guò)程都是一步一步連鎖的。需要回答的問(wèn)題如下:

AI會(huì)影響多少個(gè)階段 ?

  • 它能使過(guò)程自動(dòng)化嗎?
  • 它是否增加了一個(gè)過(guò)程?

根據(jù)答案,畫出正確的路線。

5. 構(gòu)建實(shí)驗(yàn)文化

文化是任何變化的基石。Peter Drucker曾經(jīng)說(shuō)過(guò):“文化以戰(zhàn)略為早餐。”“在采用人工智能方面,沒(méi)有什么與這個(gè)事實(shí)相距甚遠(yuǎn)。對(duì)于成功的AI實(shí)現(xiàn)來(lái)說(shuō),反復(fù)灌輸實(shí)驗(yàn)文化是至關(guān)重要的。根據(jù)定義,實(shí)驗(yàn)是一種證明或推翻假設(shè)的過(guò)程。并不是所有的實(shí)驗(yàn)都會(huì)成功。然而,所有的實(shí)驗(yàn)都是有收益的。這種實(shí)驗(yàn)文化需要滲透到公司的精神中。三個(gè)原則可以幫助公司創(chuàng)建實(shí)驗(yàn)文化。

1、度量指標(biāo),每個(gè)部門都需要度量以下三個(gè)方面的指標(biāo):

  • 在給定的時(shí)間內(nèi)嘗試的實(shí)驗(yàn)次數(shù)。
  • 在給定的時(shí)間內(nèi)采用到業(yè)務(wù)工作流的實(shí)驗(yàn)數(shù)量。
  • 在給定的時(shí)間內(nèi),管道中的實(shí)驗(yàn)次數(shù)。

2、擁抱敏捷,敏捷是人工智能之路。鑒于其本質(zhì),迭代方法最適合人工智能。它的三個(gè)核心原則:改善、透明度和深度協(xié)作應(yīng)該滲透到公司的DNA中。

3、具有AI意識(shí),人工智能是很多炒作,每個(gè)人、每個(gè)地方都在談?wù)撍?。伴隨著這種炒作而來(lái)的是恐懼。害怕被取代。對(duì)失業(yè)的恐懼。這種擔(dān)心是沒(méi)有根據(jù)的。在公司中建立對(duì)人工智能的普遍認(rèn)識(shí)是至關(guān)重要的。員工必須意識(shí)到AI能做什么和不能做什么。有了這種重要的意識(shí),員工更容易接受人工智能,并利用它來(lái)增強(qiáng)他們的技能。

總結(jié)

采用負(fù)責(zé)任的人工智能(AI)是不可避免的。所有人都應(yīng)該接受它。這不是長(zhǎng)生不老藥。但是,有了正確的框架,它就有可能產(chǎn)生影響。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號(hào)-6京公網(wǎng)安備 11010502049343號(hào)