把握數(shù)據(jù),在AI領(lǐng)域取勝的方法
幾年前,Uber的一輛自動(dòng)駕駛汽車撞死了一名在人行橫道外過馬路的行人。哪里出了問題?當(dāng)技術(shù)人員訓(xùn)練汽車識(shí)別行人時(shí),他們大多使用包含人行橫道的圖像,他們無意中教會(huì)了AI系統(tǒng),人行橫道是重要的部分。
雖然大多數(shù)將AI應(yīng)用到他們的運(yùn)營(yíng)中的公司都不會(huì)處理像人命這樣重要的事情,但這里有一個(gè)突出的教訓(xùn):向AI系統(tǒng)提供糟糕的數(shù)據(jù),你會(huì)得到糟糕的結(jié)果。AI無疑將成為下一個(gè)重要的業(yè)務(wù)差異化因素,但只有那些能夠控制數(shù)據(jù)的公司才會(huì)如此。
糟糕的數(shù)據(jù),糟糕的AI
負(fù)責(zé)任的AI如今是一個(gè)如此時(shí)髦的詞,因?yàn)樵S多公司都有一個(gè)嚴(yán)重的數(shù)據(jù)問題——他們不知道自己擁有什么數(shù)據(jù),這是不安全的。將未知、未管理的數(shù)據(jù)輸入AI系統(tǒng),只會(huì)導(dǎo)致數(shù)據(jù)泄露、違反監(jiān)管規(guī)定、錯(cuò)誤的戰(zhàn)略決策、意外的偏見或聲譽(yù)損害。
問題是許多公司手頭都有一堆亂七八糟的數(shù)據(jù),他們要么有一個(gè)隨意的戰(zhàn)略,要么根本沒有關(guān)于數(shù)據(jù)治理的戰(zhàn)略,即收集、使用和存儲(chǔ)數(shù)據(jù)的規(guī)則和流程。
企業(yè)不會(huì)停下來搞清楚他們的數(shù)據(jù)戰(zhàn)略,一心想要追逐更華麗、更創(chuàng)收的項(xiàng)目。然而,當(dāng)公司想要將這些數(shù)據(jù)放在一起——比如說,應(yīng)用在AI工具中——他們沒有辦法這樣做,因?yàn)闆]有任何關(guān)于如何處理數(shù)據(jù)的總體規(guī)則,他們留下了一個(gè)巨大的爛攤子,需要大量的時(shí)間和投資來解決。
換句話說,數(shù)據(jù)治理可能看起來并不令人興奮或華而不實(shí),但它構(gòu)成了任何成功的AI項(xiàng)目的基礎(chǔ)。
修復(fù)數(shù)據(jù)的實(shí)用方法
通過數(shù)據(jù)治理,追溯應(yīng)用于企業(yè)中的所有數(shù)據(jù)是一項(xiàng)艱巨的任務(wù)。謝天謝地,沒有必要花那么大的錢來開始你的下一個(gè)AI項(xiàng)目。這里有一個(gè)務(wù)實(shí)、及時(shí)的方法來修復(fù)你的數(shù)據(jù),利用AI的力量,并在此過程中逐步創(chuàng)造價(jià)值:
選擇一個(gè)用例,從為AI挑選一個(gè)用例開始,AI可以提供幫助的主要商業(yè)任務(wù)是什么?你知道你在哪里擁有可以為AI挖掘的專有或第三方數(shù)據(jù)?你希望選擇一個(gè)既不太大也不太小的用例,最好是內(nèi)部的用例。你的第一個(gè)用例還應(yīng)該具有有限的數(shù)據(jù)域要求-換句話說,一個(gè)只需要來自一個(gè)源的數(shù)據(jù)的用例。
然后,計(jì)算出你要處理的數(shù)據(jù)的狀態(tài)。在將數(shù)據(jù)輸入AI系統(tǒng)之前,你需要更正哪些內(nèi)容?
修復(fù)該用例所需的數(shù)據(jù)。一旦你有了可行的用例并評(píng)估了前進(jìn)所需的數(shù)據(jù)狀態(tài),就可以開始清理工作了。你的數(shù)據(jù)不一定要完美才能開始從AI工具中創(chuàng)造價(jià)值,但在利用它之前,你確實(shí)需要了解它的缺陷。
你將需要為該單個(gè)用例部署盡可能多的治理和策略,必要的數(shù)據(jù)治理組件包括:
數(shù)據(jù)獲?。耗銓⑷绾螐脑聪到y(tǒng)獲取數(shù)據(jù),并將其存儲(chǔ)在哪里?
數(shù)據(jù)質(zhì)量:你的數(shù)據(jù)有多完整和準(zhǔn)確?這些數(shù)據(jù)是否帶有AI偏見的風(fēng)險(xiǎn)?在將其輸入AI系統(tǒng)之前,你需要將其清理嗎?
數(shù)據(jù)隱私:你的數(shù)據(jù)是否包括私人或受保護(hù)的信息,如健康信息。AI系統(tǒng)會(huì)以一種會(huì)導(dǎo)致隱私問題的方式將數(shù)據(jù)整合在一起嗎?例如,如果AI向通用客戶記錄中添加信息,使個(gè)人可以以受保護(hù)的方式識(shí)別,這稱為編譯分類,需要加以防范。
這些要素共同構(gòu)成了數(shù)據(jù)治理、如何獲取數(shù)據(jù)、如何使用數(shù)據(jù)的計(jì)劃,以及防止濫用的適當(dāng)控制和策略。
創(chuàng)建你的總體數(shù)據(jù)戰(zhàn)略。在探索初始用例的同時(shí),開始整合總體數(shù)據(jù)框架和策略,這將告訴你如何在整個(gè)企業(yè)中收集、維護(hù)和保護(hù)數(shù)據(jù)。
一旦你的第一個(gè)用例完成,選擇另一個(gè)要重點(diǎn)關(guān)注的領(lǐng)域。以第一個(gè)用例的成功和教訓(xùn)為基礎(chǔ)。你需要如何調(diào)整你的數(shù)據(jù)策略?不斷重復(fù),在此過程中清理數(shù)據(jù)。
這種方法的口頭禪是,從大處著想,從小處做起。通過在整理企業(yè)數(shù)據(jù)的同時(shí)一次處理一個(gè)用例,你將通過AI逐步創(chuàng)造價(jià)值,同時(shí)構(gòu)建堅(jiān)實(shí)的數(shù)據(jù)治理基礎(chǔ),為未來的任何AI計(jì)劃提供動(dòng)力。
- 上一篇
數(shù)據(jù)湖如何為企業(yè)賦能
數(shù)據(jù)湖可以幫助組織執(zhí)行SQL查詢、大數(shù)據(jù)分析、全文搜索、實(shí)時(shí)分析和機(jī)器學(xué)習(xí)(ML)等分析來發(fā)現(xiàn)見解。調(diào)查結(jié)果顯示,一般企業(yè)的數(shù)據(jù)每年都會(huì)膨脹50%。除了數(shù)據(jù)量之外,這些企業(yè)還管理來自33個(gè)獨(dú)特來源的數(shù)據(jù)。除非他們實(shí)施數(shù)據(jù)湖技術(shù),否則他們會(huì)發(fā)現(xiàn)導(dǎo)航大量和多樣化的數(shù)據(jù)具有挑戰(zhàn)性。
- 下一篇
云計(jì)算對(duì)人工智能的發(fā)展有什么幫助?
近年來,人工智能成為科技領(lǐng)域的熱門話題,被廣泛應(yīng)用于各個(gè)行業(yè),從智能語音助手到自動(dòng)駕駛,從醫(yī)療診斷到智能推薦系統(tǒng),人工智能正以驚人的速度改變著我們的生活。而在人工智能的快速發(fā)展中,云計(jì)算起到了重要的推動(dòng)作用。
相關(guān)資訊
- 帶你了解邊緣云到底是什么云?
- 5G、AI與物聯(lián)網(wǎng):制造業(yè)的變革引擎
- 使用人工智能和機(jī)器學(xué)習(xí)交付類似
- 醫(yī)療保健如何進(jìn)行數(shù)字化轉(zhuǎn)型?
- 邊緣計(jì)算的興起:改變技術(shù)和連接的
- 數(shù)據(jù)驅(qū)動(dòng)成功七步法:轉(zhuǎn)變數(shù)據(jù)管理
- 機(jī)器學(xué)習(xí)系統(tǒng)架構(gòu)的十個(gè)要素
- 為什么世界要適應(yīng)區(qū)塊鏈技術(shù)?
- 如何為人工智能準(zhǔn)備業(yè)務(wù)數(shù)據(jù)
- 大數(shù)據(jù)在智能能源管理中的應(yīng)用與