機(jī)器學(xué)習(xí)與統(tǒng)計(jì)有什么區(qū)別?
我們?nèi)绾晤A(yù)測(cè)和解釋未來(lái)趨勢(shì)和結(jié)果并不是一個(gè)簡(jiǎn)單的過(guò)程。即使擁有世界上最好的意志和數(shù)據(jù)科學(xué)家,它也不會(huì)也不能總是 100% 正確。在當(dāng)今時(shí)代,這通常是機(jī)器學(xué)習(xí)或統(tǒng)計(jì)學(xué)發(fā)揮作用的地方。
歷史一直依賴(lài)人類(lèi)在決策時(shí)檢查和解釋統(tǒng)計(jì)數(shù)據(jù)。不過(guò),現(xiàn)在機(jī)器學(xué)習(xí)的出現(xiàn)使計(jì)算機(jī)成為回答“接下來(lái)會(huì)發(fā)生什么?”這一重要問(wèn)題的核心。
由人工智能 (AI)和分析驅(qū)動(dòng)的模型正在成為常態(tài)。然而,在采用機(jī)器學(xué)習(xí)方法與采用統(tǒng)計(jì)方法的好處之間仍然存在真正的混淆。這些差異甚至延伸到教育途徑和職業(yè)機(jī)會(huì),包括機(jī)器學(xué)習(xí)課程與統(tǒng)計(jì)學(xué)的替代方案。
什么是機(jī)器學(xué)習(xí)?
機(jī)器學(xué)習(xí)使用計(jì)算機(jī)來(lái)識(shí)別數(shù)據(jù)中的模式,而不需要計(jì)算機(jī)遵循明確的指令。相反,他們使用初始算法和模型進(jìn)行編程,并學(xué)習(xí)根據(jù)輸入的數(shù)據(jù)調(diào)整這些算法和模型以提供答案。然而,這也意味著對(duì)結(jié)果的人為控制較少。
TurinTech 的聯(lián)合創(chuàng)始人 Michail Basios 博士說(shuō):“機(jī)器學(xué)習(xí)模型旨在提供準(zhǔn)確的預(yù)測(cè),而無(wú)需顯式編程。機(jī)器學(xué)習(xí)模型可以提供更好的預(yù)測(cè),但更難理解和解釋它們。”
什么是統(tǒng)計(jì)數(shù)據(jù)?
統(tǒng)計(jì)模型根據(jù)數(shù)值數(shù)據(jù)進(jìn)行預(yù)測(cè)。這通常是通過(guò)詢(xún)問(wèn)人們并要求他們做出選擇而獲得的;例如,它是政治和選舉投票的運(yùn)作方式,或消費(fèi)者購(gòu)物調(diào)查。人類(lèi)的參與通常更多地涉及對(duì)這些數(shù)據(jù)的解釋。“雖然一些統(tǒng)計(jì)模型可以做出預(yù)測(cè),”Basios 解釋說(shuō),“但這些模型的準(zhǔn)確性通常不是最好的,因?yàn)樗鼈儫o(wú)法捕捉數(shù)據(jù)之間的復(fù)雜關(guān)系。”
機(jī)器學(xué)習(xí)和統(tǒng)計(jì)之間的主要區(qū)別是什么?
出于機(jī)器學(xué)習(xí)的目的,統(tǒng)計(jì)數(shù)據(jù)將被輸入計(jì)算機(jī),但這兩種方法之間有一個(gè)關(guān)鍵區(qū)別。謝菲爾德大學(xué)教授、Peak Indicators 人工智能和數(shù)據(jù)科學(xué)負(fù)責(zé)人 Paul Clough 表示,這種差異不在于數(shù)據(jù)的分析方式,而在于目標(biāo)或期望的結(jié)果。
Clough 舉了一個(gè)例子,衡量一只母雞吃的雞飼料量與它下的蛋的數(shù)量。“統(tǒng)計(jì)分析旨在解釋飼料量如何影響產(chǎn)蛋數(shù),”他說(shuō)。“預(yù)測(cè)性 [機(jī)器學(xué)習(xí)] 分析將使用這些數(shù)據(jù)來(lái)預(yù)測(cè)農(nóng)民下周將獲得多少雞蛋。”
您什么時(shí)候會(huì)使用機(jī)器學(xué)習(xí)而不是統(tǒng)計(jì)數(shù)據(jù)?
Clough 的雞蛋類(lèi)比有助于進(jìn)一步探索這一點(diǎn)。“機(jī)器學(xué)習(xí)模型不會(huì)告訴你任何關(guān)于經(jīng)營(yíng)一個(gè)更高效的農(nóng)場(chǎng)的信息,”他建議道,“而如果你擁有數(shù)萬(wàn)只雞,統(tǒng)計(jì)模型就會(huì)變得笨拙。”
在查看龐大的數(shù)據(jù)集時(shí),機(jī)器學(xué)習(xí)可以更優(yōu)化。許多人承認(rèn),當(dāng)數(shù)據(jù)水平很高時(shí),統(tǒng)計(jì)數(shù)據(jù)無(wú)法對(duì)數(shù)據(jù)之間的關(guān)系和相關(guān)性進(jìn)行更深入的分析。
它們也不能依賴(lài)于因果關(guān)系、概率和確定性,因?yàn)槲kU(xiǎn)是它們可能被誤解或故意濫用以支持特定論點(diǎn)。正如那句名言所說(shuō):“有謊言,該死的謊言,還有統(tǒng)計(jì)數(shù)據(jù)。”人類(lèi)的參與是統(tǒng)計(jì)中的一個(gè)弱點(diǎn)。
然而,Basios 解釋說(shuō),當(dāng)你理解“變量之間的特定交互作用”和“對(duì)它們的關(guān)系有先驗(yàn)知識(shí)”時(shí),你可以應(yīng)用統(tǒng)計(jì)建模。同時(shí),機(jī)器學(xué)習(xí)可用于實(shí)現(xiàn)“高預(yù)測(cè)準(zhǔn)確性”。
它傾向于更多地“部署”在數(shù)據(jù)源;隨著數(shù)據(jù)的收集和增長(zhǎng),算法會(huì)自動(dòng)開(kāi)始提供情報(bào)。例如,在制造業(yè)中,它可以預(yù)測(cè)機(jī)器何時(shí)需要維護(hù),從而減少中斷。它還可以分析一個(gè)選項(xiàng)與另一個(gè)選項(xiàng)的比較——預(yù)測(cè)哪個(gè)結(jié)果會(huì)更好。
你什么時(shí)候會(huì)選擇統(tǒng)計(jì)而不是機(jī)器學(xué)習(xí)?
Capgemini 智能行業(yè)首席架構(gòu)師 Graham Upton 表示,統(tǒng)計(jì)數(shù)據(jù)對(duì)于理解需要更深入思考的特定問(wèn)題點(diǎn)以及生成指標(biāo)、表格和 KPI 仍然很有用。事實(shí)上,根據(jù)奇點(diǎn)大學(xué) IEEE AI 倫理工程師 Eleanor Watson 的說(shuō)法,統(tǒng)計(jì)是一種以人為中心的方法,很容易解釋?zhuān)鴻C(jī)器學(xué)習(xí)則很難解釋。
盡管機(jī)器學(xué)習(xí)在具有復(fù)雜模式的情況下可能“更強(qiáng)大”——例如,那些變量太多而人類(lèi)無(wú)法管理的情況——人們不應(yīng)該依賴(lài)最強(qiáng)大的工具來(lái)解決問(wèn)題。她警告說(shuō):“當(dāng)優(yōu)秀的老式數(shù)據(jù)科學(xué)成本更低、速度更快時(shí),公司通常會(huì)使用 AI 的手提鉆通過(guò)外科手術(shù)來(lái)解決問(wèn)題。”“數(shù)據(jù)科學(xué)比機(jī)器學(xué)習(xí)更能支撐現(xiàn)代經(jīng)濟(jì),但它仍然是一個(gè)無(wú)名英雄。”
機(jī)器學(xué)習(xí)和統(tǒng)計(jì)學(xué)都有作用嗎?
政府、企業(yè)和組織越來(lái)越依賴(lài)機(jī)器學(xué)習(xí)和傳統(tǒng)統(tǒng)計(jì)數(shù)據(jù)來(lái)幫助他們做出更好更快的決策。但是,每種方法都有其自身的缺點(diǎn)需要考慮。
“統(tǒng)計(jì)模型的預(yù)測(cè)準(zhǔn)確性有限,因?yàn)橛袝r(shí)模型的基本假設(shè)過(guò)于嚴(yán)格,無(wú)法代表現(xiàn)實(shí),”Basios 說(shuō)。“當(dāng)今的企業(yè)正在采用結(jié)合統(tǒng)計(jì)建模和機(jī)器學(xué)習(xí)特征的混合方法,以深入了解底層模型的工作原理并生成準(zhǔn)確的預(yù)測(cè)。”
機(jī)器學(xué)習(xí)和統(tǒng)計(jì)學(xué)的未來(lái)會(huì)怎樣?
Quantellia 首席科學(xué)家 Lorien Pratt 博士強(qiáng)調(diào)說(shuō),決策智能 (DI) 是未來(lái)的理解空間。她解釋說(shuō),它連接了技術(shù)和我們?yōu)闃?gòu)建我們的世界所做的成百上千次的日常決定。
“有一類(lèi)問(wèn)題——從日常業(yè)務(wù)戰(zhàn)略到氣候變化的現(xiàn)實(shí)——涉及無(wú)形資產(chǎn)、復(fù)雜的系統(tǒng)動(dòng)力學(xué)和人機(jī)交互,”她說(shuō)。“機(jī)器學(xué)習(xí)作為人工智能的一種‘增壓’形式,可以消除噪音并產(chǎn)生真正的影響。”
Pratt 繼續(xù)說(shuō)道:“與其從思考我們擁有的數(shù)據(jù)開(kāi)始,關(guān)鍵是首先詢(xún)問(wèn)我們想要什么結(jié)果以及可以采取什么行動(dòng)來(lái)實(shí)現(xiàn)這些結(jié)果,然后將數(shù)據(jù)融入到行動(dòng)中。結(jié)果路徑。”
- 上一篇
什么是松耦合架構(gòu)?
松散耦合架構(gòu)是一種軟件應(yīng)用程序開(kāi)發(fā)模型,其中多個(gè)組件相互連接但彼此不嚴(yán)重依賴(lài)。盡管每個(gè)服務(wù)都是為執(zhí)行單個(gè)任務(wù)而創(chuàng)建的獨(dú)立實(shí)體,但這些組件共同創(chuàng)建了一個(gè)通用網(wǎng)絡(luò)或系統(tǒng)
- 下一篇
大數(shù)據(jù)與數(shù)據(jù)挖掘的區(qū)別
您是否渴望了解大數(shù)據(jù)與數(shù)據(jù)挖掘?大數(shù)據(jù)和數(shù)據(jù)挖掘是兩個(gè)不同的術(shù)語(yǔ),服務(wù)于不同的目的。他們都使用大型數(shù)據(jù)集從混亂的數(shù)據(jù)中提取有意義的見(jiàn)解。世界由大數(shù)據(jù)驅(qū)動(dòng),迫使組織尋求