數(shù)據(jù)湖和中央數(shù)據(jù)倉(cāng)庫(kù)的設(shè)計(jì)
設(shè)計(jì)數(shù)據(jù)湖或中央數(shù)據(jù)倉(cāng)庫(kù)是許多大型組織的主要職能,這些組織每天處理數(shù)百萬(wàn)筆交易,并對(duì)這些交易進(jìn)行進(jìn)一步的報(bào)告、預(yù)測(cè)或機(jī)器學(xué)習(xí)項(xiàng)目分析。
為了將所有來(lái)自源系統(tǒng)(我們稱之為“上游”)到其他業(yè)務(wù)應(yīng)用(所謂“下游”)的數(shù)據(jù)點(diǎn)整合在一起,已經(jīng)成為數(shù)據(jù)智能或商業(yè)智能團(tuán)隊(duì)的一個(gè)不同的工程奇跡。在完成所有這些練習(xí)和從上游到下游的緊密依賴后,管理數(shù)據(jù)變得越來(lái)越難以通過(guò)所有數(shù)據(jù)管道進(jìn)行檢查。
在大多數(shù)組織中,我們可以看到以下數(shù)據(jù)流程是從如下所示開(kāi)始的:
新應(yīng)用程序或多或少是按領(lǐng)域驅(qū)動(dòng)設(shè)計(jì),這些應(yīng)用程序與更特定于應(yīng)用程序的數(shù)據(jù)非常緊密,這給數(shù)據(jù)庫(kù)工程團(tuán)隊(duì)帶來(lái)了新的挑戰(zhàn),要為滿足所有方面的目的提供有組織的解決方案,如下所示:
數(shù)據(jù)網(wǎng)格(Data Mesh)具有相同的功能集,以滿足領(lǐng)域驅(qū)動(dòng)的分散化的目的。為了設(shè)計(jì)數(shù)據(jù)網(wǎng)格,強(qiáng)調(diào)遵循4個(gè)原則,并針對(duì)組織中不同團(tuán)隊(duì)提供了不同的責(zé)任。
領(lǐng)域數(shù)據(jù)的所有權(quán)
由于我們采用了領(lǐng)域驅(qū)動(dòng)的分散化方法,因此在數(shù)據(jù)網(wǎng)格中,數(shù)據(jù)圍繞著特定的業(yè)務(wù)領(lǐng)域進(jìn)行拆分,就像我們?cè)谖⒎?wù)中所做的那樣。在數(shù)據(jù)領(lǐng)域中也是如此,將存在一個(gè)負(fù)責(zé)跟蹤活動(dòng)性的數(shù)據(jù)領(lǐng)域團(tuán)隊(duì)。數(shù)據(jù)領(lǐng)域團(tuán)隊(duì)可以使用數(shù)據(jù)創(chuàng)建數(shù)據(jù)產(chǎn)品,其他數(shù)據(jù)領(lǐng)域團(tuán)隊(duì)可以使用這些數(shù)據(jù)產(chǎn)品。
數(shù)據(jù)作為產(chǎn)品
在數(shù)據(jù)網(wǎng)格中,數(shù)據(jù)被視為可以由一個(gè)數(shù)據(jù)領(lǐng)域團(tuán)隊(duì)發(fā)布并可以被另一個(gè)數(shù)據(jù)領(lǐng)域團(tuán)隊(duì)消費(fèi)的產(chǎn)品。數(shù)據(jù)領(lǐng)域團(tuán)隊(duì)必須以產(chǎn)品思維來(lái)考慮數(shù)據(jù),他們對(duì)數(shù)據(jù)質(zhì)量、表示和內(nèi)聚性負(fù)完全責(zé)任。此外,數(shù)據(jù)領(lǐng)域團(tuán)隊(duì)必須與數(shù)據(jù)網(wǎng)格啟用團(tuán)隊(duì)合作,以獲取數(shù)據(jù)產(chǎn)品的資格。
自主驅(qū)動(dòng)的數(shù)據(jù)平臺(tái)
數(shù)據(jù)網(wǎng)格中的所有數(shù)據(jù)都可以在公司內(nèi)部任何地方使用。因此,可以在短時(shí)間內(nèi)創(chuàng)建新的報(bào)告或數(shù)據(jù)產(chǎn)品,并傳播到隨后的數(shù)據(jù)產(chǎn)品。這帶來(lái)了治理問(wèn)題,因?yàn)閿?shù)據(jù)的控制可以通過(guò)治理政策進(jìn)行。
聯(lián)合治理
治理通過(guò)不同的數(shù)據(jù)政策和安全政策進(jìn)行處理,由數(shù)據(jù)領(lǐng)域團(tuán)隊(duì)根據(jù)數(shù)據(jù)發(fā)布和數(shù)據(jù)消費(fèi)受到的不同合同來(lái)執(zhí)行。然而,如果政策未正確定義,治理可能是數(shù)據(jù)的一個(gè)問(wèn)題點(diǎn)。
數(shù)據(jù)網(wǎng)格架構(gòu)
數(shù)據(jù)網(wǎng)格具有多種架構(gòu),可以使用不同的語(yǔ)言和它們的框架進(jìn)行定義。這完全取決于團(tuán)隊(duì)特定的實(shí)現(xiàn),這些實(shí)現(xiàn)用于實(shí)現(xiàn)數(shù)據(jù)產(chǎn)品。
數(shù)據(jù)網(wǎng)格的路線圖可以由不同團(tuán)隊(duì)共同設(shè)計(jì)和實(shí)施。每個(gè)團(tuán)隊(duì)都有維護(hù)數(shù)據(jù)網(wǎng)格的責(zé)任。
數(shù)據(jù)網(wǎng)格啟用團(tuán)隊(duì)
啟用團(tuán)隊(duì)是數(shù)據(jù)網(wǎng)格架構(gòu)的主要團(tuán)隊(duì),用于與數(shù)據(jù)領(lǐng)域團(tuán)隊(duì)進(jìn)行連接。他們?yōu)閿?shù)據(jù)產(chǎn)品創(chuàng)建原型和文檔。他們指導(dǎo)數(shù)據(jù)領(lǐng)域團(tuán)隊(duì)遵循定義的數(shù)據(jù)產(chǎn)品規(guī)則,并幫助他們?yōu)閿?shù)據(jù)網(wǎng)格授予數(shù)據(jù)產(chǎn)品。
(1)數(shù)據(jù)平臺(tái)團(tuán)隊(duì)
平臺(tái)團(tuán)隊(duì)主要維護(hù)基礎(chǔ)設(shè)施,以維護(hù)數(shù)據(jù)對(duì)數(shù)據(jù)網(wǎng)格的可用性。他們用于維護(hù)所有數(shù)據(jù)產(chǎn)品的數(shù)據(jù)目錄。數(shù)據(jù)目錄可以是其他數(shù)據(jù)領(lǐng)域團(tuán)隊(duì)查找數(shù)據(jù)網(wǎng)格并設(shè)計(jì)他們的數(shù)據(jù)產(chǎn)品的元數(shù)據(jù)。數(shù)據(jù)平臺(tái)團(tuán)隊(duì)還擁有數(shù)據(jù)存儲(chǔ)、監(jiān)控和訪問(wèn)數(shù)據(jù)網(wǎng)格的矩陣。
(2)數(shù)據(jù)領(lǐng)域團(tuán)隊(duì)
數(shù)據(jù)領(lǐng)域團(tuán)隊(duì)可以是創(chuàng)建應(yīng)用程序或數(shù)據(jù)產(chǎn)品的工程或開(kāi)發(fā)團(tuán)隊(duì)。數(shù)據(jù)產(chǎn)品是操作數(shù)據(jù)、分析功能和來(lái)自其他數(shù)據(jù)產(chǎn)品的數(shù)據(jù)的組合。其他數(shù)據(jù)產(chǎn)品也可以使用類似的方式。
(3)行業(yè)團(tuán)隊(duì)
行業(yè)團(tuán)隊(duì)擁有數(shù)據(jù)治理政策,并負(fù)責(zé)創(chuàng)建數(shù)據(jù)、安全和其他合規(guī)政策。定義政策有助于定義數(shù)據(jù)網(wǎng)格中數(shù)據(jù)產(chǎn)品的可訪問(wèn)性。
數(shù)據(jù)網(wǎng)格是新的現(xiàn)代化數(shù)據(jù)架構(gòu)模式,可以在不久的將來(lái)在企業(yè)級(jí)別實(shí)施。數(shù)據(jù)網(wǎng)格架構(gòu)中有很多值得探索的地方。
- 上一篇
大數(shù)據(jù)時(shí)代的數(shù)據(jù)集蒸餾,大型數(shù)據(jù)集上的首次成功
11 月 30 日,全球第一所人工智能大學(xué)——穆罕默德·本·扎耶德人工智能大學(xué)(MBZUAI),在 arXiv 預(yù)印平臺(tái)發(fā)布了題為《大數(shù)據(jù)時(shí)代的數(shù)據(jù)集蒸餾》(Dataset Distillation in Large Data Era)的文章。
- 下一篇
人工智能如何實(shí)現(xiàn)文字轉(zhuǎn)圖像的功能?
在當(dāng)今的信息時(shí)代中,人工智能被廣泛應(yīng)用于各個(gè)領(lǐng)域。其中一個(gè)熱門(mén)的應(yīng)用場(chǎng)景就是文字轉(zhuǎn)圖像。你或許會(huì)好奇,人工智能是如何實(shí)現(xiàn)這一功能的呢?1.文字分類與生成模型要實(shí)現(xiàn)文字
相關(guān)資訊
- AI與機(jī)器學(xué)習(xí)集成架構(gòu):實(shí)現(xiàn)智能決
- 工作流數(shù)字化如何影響可持續(xù)性和
- 駕馭自適應(yīng)人工智能:打造企業(yè)未來(lái)
- 物聯(lián)網(wǎng)連接面臨巨大的數(shù)字孿生挑
- 到2028年,醫(yī)療診斷市場(chǎng)的人工智能
- 中小型企業(yè)云安全防范的關(guān)鍵措施
- 人工智能與物聯(lián)網(wǎng)如何賦能供應(yīng)鏈
- 數(shù)字孿生技術(shù)在醫(yī)療行業(yè)變革中的
- 科學(xué)突破可以讓我們更接近有影響
- 七個(gè)領(lǐng)先數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)庫(kù)的深入