基于數(shù)據(jù)的決策:使用數(shù)據(jù)庫中的機(jī)器學(xué)習(xí)預(yù)測(cè)未來
在短短幾年內(nèi),機(jī)器學(xué)習(xí)(ML)已經(jīng)成為一項(xiàng)基本技術(shù),公司幾乎在業(yè)務(wù)的每個(gè)方面都部署了這項(xiàng)技術(shù)。以前是財(cái)大氣粗的大型機(jī)構(gòu)的領(lǐng)地,ML市場(chǎng)正在迅速開放。各種生意現(xiàn)在可以利用ML來最大限度地減少重復(fù)的手動(dòng)過程,自動(dòng)化決策制定,并預(yù)測(cè)未來趨勢(shì)。幾乎在任何商業(yè)任務(wù)的每一個(gè)階段,ML都在使流程更智能、更精簡(jiǎn)、更快速。
近年來,技術(shù)進(jìn)步有助于民主化訪問并通過減少獲得ML驅(qū)動(dòng)的預(yù)測(cè)所需的時(shí)間、技能水平和步驟數(shù)量來推動(dòng)ML的采用。增長如此之快,以至于全球ML市場(chǎng)預(yù)計(jì)將從2022年的210億美元增長到2029年的2090億美元。聲明式ML和AutoML等工具正在幫助企業(yè)訪問強(qiáng)大的業(yè)務(wù)關(guān)鍵型預(yù)測(cè)分析。將這些方法向前推進(jìn)一步,數(shù)據(jù)庫內(nèi)ML是一種正在普及的新技術(shù)。它允許企業(yè)輕松地向他們的數(shù)據(jù)提出問題,并使用標(biāo)準(zhǔn)的SQL查詢快速獲得答案。
什么是數(shù)據(jù)庫內(nèi)ML?
傳統(tǒng)上,構(gòu)建ML模型是一項(xiàng)高技能、冗長、資源密集型的工作。ML計(jì)劃的典型時(shí)間框架以月為單位。項(xiàng)目耗時(shí)超過六個(gè)月的情況并不少見,需要花費(fèi)大量時(shí)間從數(shù)據(jù)庫中提取、清理和準(zhǔn)備數(shù)據(jù)。
相比之下,數(shù)據(jù)庫內(nèi)ML將分析引入到數(shù)據(jù)庫中,使企業(yè)能夠獲得您期望從傳統(tǒng)的完全定制的ML模型中獲得的洞察力,但有一些重要的差異。數(shù)據(jù)庫內(nèi)ML獲得這些結(jié)果要快得多(幾天或幾周,而不是幾個(gè)月),因?yàn)閿?shù)據(jù)永遠(yuǎn)不需要離開數(shù)據(jù)庫。另一個(gè)區(qū)別是,數(shù)據(jù)庫內(nèi)建模是使用常規(guī)的、現(xiàn)有的數(shù)據(jù)庫技能(如SQL)來完成的,這使得更廣泛的it團(tuán)隊(duì)更容易處理它。
雖然這是一個(gè)相對(duì)較新的領(lǐng)域,但它現(xiàn)在是GitHub明星代言中增長最快的領(lǐng)域。事實(shí)上,現(xiàn)在所有主要的數(shù)據(jù)庫供應(yīng)商、ML框架、BI工具和筆記本都有數(shù)據(jù)庫內(nèi)ML集成。
企業(yè)如何使用數(shù)據(jù)庫內(nèi)ML?
從人力資源到市場(chǎng)營銷到銷售再到生產(chǎn),在每個(gè)業(yè)務(wù)領(lǐng)域都有使用案例,從數(shù)據(jù)庫中獲得的預(yù)測(cè)正在幫助公司改善客戶體驗(yàn),提高產(chǎn)品個(gè)性化,優(yōu)化客戶終身價(jià)值,增加員工保留率,更準(zhǔn)確地評(píng)估風(fēng)險(xiǎn),并提高工作場(chǎng)所的生產(chǎn)力。
舉一個(gè)生產(chǎn)力軟件領(lǐng)域的例子:Rize是一個(gè)智能時(shí)間跟蹤器,它使用戶在工作中更有生產(chǎn)力和效率,使用數(shù)據(jù)庫內(nèi)ML開發(fā)了一個(gè)強(qiáng)大的功能,在幾周內(nèi)響應(yīng)用戶反饋。由此產(chǎn)生的能力——由ML生成的洞察驅(qū)動(dòng)——提高了客戶保持率和轉(zhuǎn)化率。它還幫助Rize在競(jìng)爭(zhēng)激烈的市場(chǎng)中脫穎而出,鞏固了其作為真正智能時(shí)間跟蹤器的地位。
數(shù)據(jù)庫內(nèi)ML重塑行業(yè)的速度和規(guī)模
盡管這些用例中有許多有利于各個(gè)行業(yè)或地區(qū)的企業(yè),但特定的行業(yè)應(yīng)用正在出現(xiàn),這些應(yīng)用可以實(shí)時(shí)提供未來的見解,其建立成本只是傳統(tǒng)ML算法的一小部分,并開始破壞這些市場(chǎng)中的現(xiàn)有價(jià)值鏈。
金融部門一個(gè)快速實(shí)施傳統(tǒng)ML建模的行業(yè)現(xiàn)在正轉(zhuǎn)向數(shù)據(jù)庫內(nèi)建模以提高敏捷性。金融服務(wù)和金融科技公司正在使用數(shù)據(jù)庫內(nèi)ML來檢測(cè)欺詐、幫助貸款回收、提高信用評(píng)分和批準(zhǔn)貸款。因此,他們能夠更快地對(duì)市場(chǎng)狀況做出反應(yīng),調(diào)整他們提供的服務(wù),甚至開辟新的收入來源。
例如,下一代多家庭租金支付處理平臺(tái)Domuso使用數(shù)據(jù)庫內(nèi)ML每年節(jié)省50萬美元。Domuso培訓(xùn)并部署了一個(gè)數(shù)據(jù)庫內(nèi)ML模型,以準(zhǔn)確預(yù)測(cè)租金付款是否可能因資金不足而被退回。“使用數(shù)據(jù)庫內(nèi)ML,我們可以更快地實(shí)施高級(jí)模型,而且復(fù)雜性更低,”時(shí)任Domuso產(chǎn)品和運(yùn)營副總裁的Sameer Nayyar說。“這對(duì)我們的業(yè)務(wù)產(chǎn)生了積極影響。我們看到兩個(gè)月內(nèi)退款減少了95,000美元,第一年節(jié)省了500,000美元。”此外,隨著新用例的出現(xiàn),Domuso現(xiàn)在能夠在幾周內(nèi)創(chuàng)建和實(shí)現(xiàn)新的ML模型,而不是幾個(gè)月。
零售、快速消費(fèi)品和食品生產(chǎn)等行業(yè)已經(jīng)很快意識(shí)到實(shí)時(shí)預(yù)測(cè)數(shù)據(jù)庫內(nèi)建模,幫助他們響應(yīng)市場(chǎng)條件,提供“即時(shí)”和特定位置的產(chǎn)品。管理庫存、預(yù)測(cè)特定商品的需求、優(yōu)化人員配備水平和預(yù)測(cè)未來價(jià)格只是零售和其他業(yè)務(wù)如何轉(zhuǎn)向數(shù)據(jù)庫內(nèi)ML算法來解決日常挑戰(zhàn)的幾個(gè)例子。
以Journey Foods為例,這是一個(gè)用于食品開發(fā)和創(chuàng)新的供應(yīng)鏈和食品科學(xué)軟件平臺(tái),它使用數(shù)據(jù)庫中的ML來應(yīng)對(duì)不斷變化的配料價(jià)格的挑戰(zhàn)。他們希望利用22,000家供應(yīng)商的130,000種食品原料數(shù)據(jù)庫,預(yù)測(cè)其客戶在一個(gè)月、三個(gè)月、六個(gè)月和12個(gè)月內(nèi)的食品成本。由于配料和供應(yīng)商總是在變化,他們擔(dān)心繪制這些復(fù)雜的“多對(duì)多”關(guān)系所需的預(yù)測(cè)分析需要大量時(shí)間來建立,并且需要持續(xù)的維護(hù)和重新培訓(xùn)。Journey Foods求助于數(shù)據(jù)庫內(nèi)的ML來開發(fā)其成本預(yù)測(cè)模型,從而實(shí)現(xiàn)了對(duì)食品成分的高精度預(yù)測(cè)。與他們最初考慮的本土ML模型相比,這也大大降低了運(yùn)營成本。
提高業(yè)務(wù)靈活性和創(chuàng)新
還有很多特定行業(yè)的例子,但是推動(dòng)這種快速增長的開源運(yùn)動(dòng)的共同因素是速度和規(guī)模。數(shù)據(jù)庫內(nèi)ML使復(fù)雜的預(yù)測(cè)分析可用于任何有數(shù)據(jù)庫的企業(yè)。
例如,在最近的開源數(shù)據(jù)庫內(nèi)ML黑客馬拉松Hacktoberfest上,不斷增長的數(shù)據(jù)庫內(nèi)ML程序員社區(qū)恰當(dāng)?shù)卣故玖藙?chuàng)新的潛力。在活動(dòng)過程中,團(tuán)隊(duì)提交了20多個(gè)新的數(shù)據(jù)庫處理程序,包括與Apache Impala和Solr、PlanetScale和Teradata的連接,以及10多個(gè)新的機(jī)器學(xué)習(xí)處理程序,包括PyCaret、Ray Server和Salesforce。
數(shù)據(jù)庫內(nèi)分析仍處于早期階段。就像更廣泛的人工智能行業(yè)一樣,ML細(xì)分市場(chǎng)對(duì)炒作并不陌生。然而,隨著對(duì)復(fù)雜問題的快速回答不再僅僅是理論上可能的,而是在短期內(nèi)由各種規(guī)模和預(yù)算的企業(yè)可以實(shí)現(xiàn)的,數(shù)據(jù)庫內(nèi)ML值得認(rèn)真考慮。通過切割建立模型所需的時(shí)間通過讓沒有數(shù)據(jù)科學(xué)背景的人來運(yùn)行項(xiàng)目,它大大降低了與預(yù)測(cè)分析相關(guān)的成本?;跀?shù)據(jù)的決策為企業(yè)提供了傳統(tǒng)ML技術(shù)的可行替代方案:在速度和規(guī)模上完全可定制的預(yù)測(cè)能力。
- 上一篇
為什么您還沒有將人工智能應(yīng)用到您的監(jiān)控操作
迄今為止,用于增強(qiáng)業(yè)務(wù)流程、推動(dòng)創(chuàng)新產(chǎn)品和進(jìn)一步自動(dòng)化的人工智能的爆炸幾乎觸及了每個(gè)行業(yè)。以成熟和復(fù)雜著稱的安全領(lǐng)域也不能幸免于人工智能的浪潮。
- 下一篇
組織人才:卓越數(shù)據(jù)中心的回歸
越來越多的組織正在利用卓越數(shù)據(jù)中心和中央數(shù)據(jù)平臺(tái)來降低集中化和分散化固有的風(fēng)險(xiǎn)。了解什么是卓越數(shù)據(jù)中心,以及如何為您的數(shù)據(jù)人才實(shí)施卓越數(shù)據(jù)中心。
相關(guān)資訊
- 企業(yè)是否正在走向認(rèn)知優(yōu)先的未來
- 如何通過物聯(lián)網(wǎng)訪問控制系統(tǒng)
- 數(shù)據(jù)倉庫與數(shù)據(jù)分析架構(gòu):驅(qū)動(dòng)數(shù)據(jù)
- 行業(yè)敦促彌合人工智能性別差距
- 區(qū)塊鏈在發(fā)展智慧城市和物聯(lián)網(wǎng)中
- 物聯(lián)網(wǎng)安全:保護(hù)連接設(shè)備和數(shù)據(jù)的
- 谷歌稱在人工智能領(lǐng)域取得突破,可
- 優(yōu)化物聯(lián)網(wǎng)連接的九大關(guān)鍵要點(diǎn)
- G行數(shù)據(jù)倉庫數(shù)字化運(yùn)維探索實(shí)踐
- 大數(shù)據(jù)在ERP引發(fā)前所未有的增長