人工智能驅(qū)動的知識圖表
知識圖:它是什么、興起和目的
知識圖(KG)是一個(gè)組織的語義網(wǎng)絡(luò),一個(gè)主題,其中節(jié)點(diǎn)被稱為實(shí)體,邊是關(guān)系。它是一個(gè)框架,包含一組相關(guān)但異構(gòu)的數(shù)據(jù),如圖像、聲音、文本、視頻、數(shù)字等。—這給出了語義解釋,并讓研究人員對圖形數(shù)據(jù)運(yùn)行復(fù)雜的算法來產(chǎn)生洞察力。RDF(資源描述框架)三元組存儲是一個(gè)圖形數(shù)據(jù)庫,它將數(shù)據(jù)存儲為對象或RDF三元組的網(wǎng)絡(luò),這些對象或RDF三元組將信息分成主-謂-對象表達(dá)式。
圖論之父、數(shù)學(xué)家萊昂哈德·歐拉用圖計(jì)算了普魯士皇帝訪問柯尼希斯堡的最短距離。隨著大數(shù)據(jù)革命的到來,組織開始超越傳統(tǒng)的關(guān)系數(shù)據(jù)庫,如RDBMS。NoSQL運(yùn)動讓組織可以在數(shù)據(jù)湖中存儲結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。不同類型的數(shù)據(jù)庫,如用于文檔的MongoDB和用于圖形數(shù)據(jù)庫的Neo4j,都具有圖形存儲和處理能力。然而,由于缺乏正式的數(shù)據(jù)模式和一致性來運(yùn)行復(fù)雜的分析模型,他們并沒有擺脫問題。KGs填補(bǔ)了這一空白,并立即成為所有大型組織的核心。
KGs有三重目標(biāo)。首先,KG通過搜索幫助用戶更快更容易地發(fā)現(xiàn)信息。第二,KG在開發(fā)智能推薦引擎時(shí)提供側(cè)面和上下文信息。最后,它可以通過知識圖問答(KGQA)來幫助回答查詢和進(jìn)行預(yù)測。
開發(fā)知識圖表
自動知識獲取和語義映射是開發(fā)知識管理系統(tǒng)的支柱。用于知識獲取的本體工程的過程從本體學(xué)習(xí)開始,本體學(xué)習(xí)旨在自動學(xué)習(xí)相關(guān)概念并建立它們之間的關(guān)系。為了實(shí)現(xiàn)這一點(diǎn),首先分析語料庫以識別搭配,然后檢索語義圖。實(shí)體豐富通過爬行語義數(shù)據(jù)和合并來自相關(guān)本體的新概念而發(fā)生。
集成來自結(jié)構(gòu)化數(shù)據(jù)源的異構(gòu)數(shù)據(jù)需要將本地模式映射到全局模式。Global-as-view (GAV)是一種基于中介的數(shù)據(jù)集成策略,它實(shí)現(xiàn)了全局模式作為源模式的視圖,將全局查詢轉(zhuǎn)換為特定于源的查詢。檢測語義類型是自動語義映射的第一步,接下來是推斷語義關(guān)系。
數(shù)據(jù)最初使用RDF建模,隨后使用RDF模式(RDFS ), Web本體語言(OWL)向模式添加語義。語義信息也可以通過關(guān)系向量以分層的方式映射。圖形神經(jīng)網(wǎng)絡(luò)(GNNs)-像圖形卷積網(wǎng)絡(luò)(GCNs)或門控圖形神經(jīng)網(wǎng)絡(luò)-用于圖形數(shù)據(jù)的對象檢測和圖像分類。
企業(yè)知識圖
當(dāng)今時(shí)代的組織都在追求發(fā)現(xiàn)隱藏的信息,因此他們通過整合、標(biāo)準(zhǔn)化和協(xié)調(diào)將所有孤立的數(shù)據(jù)聯(lián)系在一起。因此,企業(yè)知識圖提供了來自圖中業(yè)務(wù)數(shù)據(jù)的知識的顯式表示。集成數(shù)據(jù)企業(yè)擁有知識網(wǎng)絡(luò)的力量,能夠發(fā)現(xiàn)關(guān)鍵的隱藏模式,從而將其數(shù)據(jù)貨幣化。
真實(shí)世界知識圖
在當(dāng)今世界,我們被數(shù)據(jù)淹沒了。KGs為與多個(gè)應(yīng)用程序連接的數(shù)據(jù)賦予了意義和目的,下面分享了其中的一些應(yīng)用程序。
金融服務(wù)知識圖表
KGs在金融服務(wù)中有廣泛的應(yīng)用,從欺詐檢測和稅務(wù)計(jì)算到財(cái)務(wù)報(bào)告和股票價(jià)格預(yù)測。通過檢查子圖的拓?fù)浣Y(jié)構(gòu),可以很容易地識別由幾個(gè)集體實(shí)施欺詐的人組成的欺詐環(huán)。
股票價(jià)格可以通過聯(lián)系與各個(gè)公司的新聞相關(guān)的情緒來預(yù)測。對沖基金和銀行利用KGs提供的替代數(shù)據(jù)映射現(xiàn)有模型,從而利用KGs進(jìn)行更好的預(yù)測。
醫(yī)學(xué)科學(xué)
生物醫(yī)學(xué)概念和關(guān)系以節(jié)點(diǎn)和邊的形式表示。通過應(yīng)用KGs,醫(yī)學(xué)成像分析可用于疾病分類、疾病藥物治療和分割、報(bào)告生成和圖像檢索。來自統(tǒng)一醫(yī)學(xué)語言系統(tǒng)(UMLS)的文本醫(yī)學(xué)知識(TMK)被分析以生成關(guān)鍵醫(yī)學(xué)見解和個(gè)性化患者報(bào)告。
實(shí)時(shí)供應(yīng)鏈管理
供應(yīng)鏈組織使用KGs來優(yōu)化庫存、補(bǔ)貨、網(wǎng)絡(luò)和分銷管理以及運(yùn)輸管理。連接的供應(yīng)鏈KG從生產(chǎn)的制造KG中獲取輸入,包括人員,加上零售KG,零售KG包括實(shí)時(shí)和預(yù)測需求,以便更好地預(yù)測和管理。
結(jié)論
知識圖具有創(chuàng)建虛擬世界的能力,在虛擬世界中,所有實(shí)體都通過一種已證實(shí)的關(guān)系連接在一起。復(fù)雜的機(jī)器學(xué)習(xí)算法被應(yīng)用來修剪那些關(guān)系概率很小的連接。因此,通過KG可以建立世界上所有對象之間的關(guān)系。
利用所有過去和現(xiàn)在的數(shù)據(jù),KG通過識別模式產(chǎn)生深刻的見解。一公斤也幫助我們預(yù)測未來的所有相關(guān)數(shù)據(jù)導(dǎo)致一種現(xiàn)象。隨著以下道路的分享,未來的KGs可能會更加強(qiáng)大:
- 事物圖表(GoT) –GoT是一個(gè)創(chuàng)新項(xiàng)目,旨在融合物聯(lián)網(wǎng)(IoT)的大容量流數(shù)據(jù)和過去的靜態(tài)數(shù)據(jù)。
- 公斤的量子人工智能 –Quantum AI可以利用量子計(jì)算的能力在KG上運(yùn)行GNNs,并可以獲得超出傳統(tǒng)計(jì)算能力的結(jié)果。
如果這些利益被用于社會福利,一個(gè)所有信息都通過一公斤連接起來的世界將會變得非常美好。KG之上的AI,如果使用意圖正確,會讓世界變得更美好。
