把握數(shù)據(jù),在AI領(lǐng)域取勝的方法

責(zé)任編輯:cres

作者:Larry

2023-11-01 16:52:45

來源:企業(yè)網(wǎng)D1Net

原創(chuàng)

在AI的應(yīng)用中有一個(gè)令人深省的教訓(xùn):向AI系統(tǒng)提供糟糕的數(shù)據(jù),你會得到糟糕的結(jié)果。AI無疑將成為下一個(gè)重要的業(yè)務(wù)差異化因素,但只有那些能夠把握數(shù)據(jù)的公司才會如其所愿。

幾年前,Uber的一輛自動(dòng)駕駛汽車撞死了一名在人行橫道外過馬路的行人。哪里出了問題?當(dāng)技術(shù)人員訓(xùn)練汽車識別行人時(shí),他們大多使用包含人行橫道的圖像,他們無意中教會了AI系統(tǒng),人行橫道是重要的部分。
 
雖然大多數(shù)將AI應(yīng)用到他們的運(yùn)營中的公司都不會處理像人命這樣重要的事情,但這里有一個(gè)突出的教訓(xùn):向AI系統(tǒng)提供糟糕的數(shù)據(jù),你會得到糟糕的結(jié)果。AI無疑將成為下一個(gè)重要的業(yè)務(wù)差異化因素,但只有那些能夠控制數(shù)據(jù)的公司才會如此。
 
糟糕的數(shù)據(jù),糟糕的AI
 
負(fù)責(zé)任的AI如今是一個(gè)如此時(shí)髦的詞,因?yàn)樵S多公司都有一個(gè)嚴(yán)重的數(shù)據(jù)問題——他們不知道自己擁有什么數(shù)據(jù),這是不安全的。將未知、未管理的數(shù)據(jù)輸入AI系統(tǒng),只會導(dǎo)致數(shù)據(jù)泄露、違反監(jiān)管規(guī)定、錯(cuò)誤的戰(zhàn)略決策、意外的偏見或聲譽(yù)損害。
 
問題是許多公司手頭都有一堆亂七八糟的數(shù)據(jù),他們要么有一個(gè)隨意的戰(zhàn)略,要么根本沒有關(guān)于數(shù)據(jù)治理的戰(zhàn)略,即收集、使用和存儲數(shù)據(jù)的規(guī)則和流程。
 
企業(yè)不會停下來搞清楚他們的數(shù)據(jù)戰(zhàn)略,一心想要追逐更華麗、更創(chuàng)收的項(xiàng)目。然而,當(dāng)公司想要將這些數(shù)據(jù)放在一起——比如說,應(yīng)用在AI工具中——他們沒有辦法這樣做,因?yàn)闆]有任何關(guān)于如何處理數(shù)據(jù)的總體規(guī)則,他們留下了一個(gè)巨大的爛攤子,需要大量的時(shí)間和投資來解決。
 
換句話說,數(shù)據(jù)治理可能看起來并不令人興奮或華而不實(shí),但它構(gòu)成了任何成功的AI項(xiàng)目的基礎(chǔ)。
 
修復(fù)數(shù)據(jù)的實(shí)用方法
 
通過數(shù)據(jù)治理,追溯應(yīng)用于企業(yè)中的所有數(shù)據(jù)是一項(xiàng)艱巨的任務(wù)。謝天謝地,沒有必要花那么大的錢來開始你的下一個(gè)AI項(xiàng)目。這里有一個(gè)務(wù)實(shí)、及時(shí)的方法來修復(fù)你的數(shù)據(jù),利用AI的力量,并在此過程中逐步創(chuàng)造價(jià)值:
 
選擇一個(gè)用例,從為AI挑選一個(gè)用例開始,AI可以提供幫助的主要商業(yè)任務(wù)是什么?你知道你在哪里擁有可以為AI挖掘的專有或第三方數(shù)據(jù)?你希望選擇一個(gè)既不太大也不太小的用例,最好是內(nèi)部的用例。你的第一個(gè)用例還應(yīng)該具有有限的數(shù)據(jù)域要求-換句話說,一個(gè)只需要來自一個(gè)源的數(shù)據(jù)的用例。
 
然后,計(jì)算出你要處理的數(shù)據(jù)的狀態(tài)。在將數(shù)據(jù)輸入AI系統(tǒng)之前,你需要更正哪些內(nèi)容?
 
修復(fù)該用例所需的數(shù)據(jù)。一旦你有了可行的用例并評估了前進(jìn)所需的數(shù)據(jù)狀態(tài),就可以開始清理工作了。你的數(shù)據(jù)不一定要完美才能開始從AI工具中創(chuàng)造價(jià)值,但在利用它之前,你確實(shí)需要了解它的缺陷。
 
你將需要為該單個(gè)用例部署盡可能多的治理和策略,必要的數(shù)據(jù)治理組件包括:
 
·數(shù)據(jù)獲?。耗銓⑷绾螐脑聪到y(tǒng)獲取數(shù)據(jù),并將其存儲在哪里?
 
·數(shù)據(jù)質(zhì)量:你的數(shù)據(jù)有多完整和準(zhǔn)確?這些數(shù)據(jù)是否帶有AI偏見的風(fēng)險(xiǎn)?在將其輸入AI系統(tǒng)之前,你需要將其清理嗎?
 
·數(shù)據(jù)隱私:你的數(shù)據(jù)是否包括私人或受保護(hù)的信息,如健康信息。AI系統(tǒng)會以一種會導(dǎo)致隱私問題的方式將數(shù)據(jù)整合在一起嗎?例如,如果AI向通用客戶記錄中添加信息,使個(gè)人可以以受保護(hù)的方式識別,這稱為編譯分類,需要加以防范。
 
這些要素共同構(gòu)成了數(shù)據(jù)治理、如何獲取數(shù)據(jù)、如何使用數(shù)據(jù)的計(jì)劃,以及防止濫用的適當(dāng)控制和策略。
 
創(chuàng)建你的總體數(shù)據(jù)戰(zhàn)略。在探索初始用例的同時(shí),開始整合總體數(shù)據(jù)框架和策略,這將告訴你如何在整個(gè)企業(yè)中收集、維護(hù)和保護(hù)數(shù)據(jù)。
 
一旦你的第一個(gè)用例完成,選擇另一個(gè)要重點(diǎn)關(guān)注的領(lǐng)域。以第一個(gè)用例的成功和教訓(xùn)為基礎(chǔ)。你需要如何調(diào)整你的數(shù)據(jù)策略?不斷重復(fù),在此過程中清理數(shù)據(jù)。
 
這種方法的口頭禪是,從大處著想,從小處做起。通過在整理企業(yè)數(shù)據(jù)的同時(shí)一次處理一個(gè)用例,你將通過AI逐步創(chuàng)造價(jià)值,同時(shí)構(gòu)建堅(jiān)實(shí)的數(shù)據(jù)治理基礎(chǔ),為未來的任何AI計(jì)劃提供動(dòng)力。
 
關(guān)于企業(yè)網(wǎng)D1net(r5u5c.cn):
 
國內(nèi)主流的to B IT門戶,同時(shí)在運(yùn)營國內(nèi)最大的甲方CIO專家?guī)旌椭橇敵黾吧缃黄脚_-信眾智(www.cioall.com)。同時(shí)運(yùn)營19個(gè)IT行業(yè)公眾號(微信搜索D1net即可關(guān)注)。
 
版權(quán)聲明:本文為企業(yè)網(wǎng)D1Net編譯,轉(zhuǎn)載需在文章開頭注明出處為:企業(yè)網(wǎng)D1Net,如果不注明出處,企業(yè)網(wǎng)D1Net將保留追究其法律責(zé)任的權(quán)利。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號-6京公網(wǎng)安備 11010502049343號