數(shù)據(jù)治理,一起要從“源頭”開始!
數(shù)據(jù)治理,一直是數(shù)字化轉(zhuǎn)型工作中非常重要的話題,幾乎承載了數(shù)字化轉(zhuǎn)型戰(zhàn)略中最為重要的任務。
數(shù)據(jù)治理與數(shù)據(jù)管理不同,具有更強的有關數(shù)據(jù)價值開發(fā)的目的性!
1. 大型企業(yè)數(shù)據(jù)治理之困境
數(shù)據(jù)治理,涉及的工作很多,比如數(shù)據(jù)溯源,數(shù)據(jù)異常識別,數(shù)據(jù)整改,數(shù)據(jù)質(zhì)量驗證,數(shù)據(jù)對齊,元數(shù)據(jù)補全,數(shù)據(jù)回收等等。歸根結(jié)底,數(shù)據(jù)治理的目的就是一件事——提高數(shù)據(jù)的可用性。
通過治理,把數(shù)據(jù)的“混亂度”降低,使不可用的數(shù)據(jù)變?yōu)榭捎茫共缓糜玫臄?shù)據(jù)變得好用,使沒意義的數(shù)據(jù)變得有價值。
數(shù)據(jù)治理說起來重要,但是在具體實操中,往往也是讓諸多企業(yè)最為“犯難”,尤其是大型集團型企業(yè),由于業(yè)務規(guī)模龐大,同時歷史包袱很重,經(jīng)常遇到“老業(yè)務治不完,新業(yè)務跟不上”,或是“前治后亂”的困窘。
數(shù)據(jù)治理對于資源的消耗非常大,很多企業(yè)的數(shù)據(jù)治理成效并不明顯,因此數(shù)據(jù)治理活動也是最容易受到“詬病”的數(shù)字化工作之一。
2.數(shù)據(jù)治理的源端管控
狹義的數(shù)據(jù)治理,往往是指對存量數(shù)據(jù)問題進行整改處理,由于企業(yè)的數(shù)據(jù)不斷積累,如果數(shù)據(jù)治理的技術(shù)手段、管理手段不夠先進,很容易收效甚微。
因此,數(shù)據(jù)治理必須要控制住數(shù)據(jù)的“源頭”,在數(shù)據(jù)產(chǎn)生、數(shù)據(jù)錄入的環(huán)節(jié)就做好嚴格的管控。
如果數(shù)據(jù)是系統(tǒng)自動產(chǎn)生的,那么就要結(jié)合新的數(shù)據(jù)標準和規(guī)范,對源端系統(tǒng)進行改造和升級。
如果數(shù)據(jù)是人為手工錄入的,那么就要加強對數(shù)據(jù)責任人的管理,一是在職責上明確每個基層人員的數(shù)據(jù)管理責任,并與考核掛鉤;二是加強對人員錄入信息的數(shù)字化交叉驗證。
還有一些數(shù)據(jù),是通過系統(tǒng)運算生成的,即計算類、報表類的數(shù)據(jù),這些數(shù)據(jù)屬于二次加工數(shù)據(jù),這些數(shù)據(jù)的問題可能在源頭就已經(jīng)被污染了,也可能是計算環(huán)節(jié)出了問題—— 這就要求對數(shù)據(jù)鏈路進行監(jiān)控分析。
一是要保證數(shù)據(jù)鏈路貫通,數(shù)據(jù)同步與融合的相關操作穩(wěn)定,二是要核實數(shù)據(jù)計算邏輯是否正確,是否與最新的業(yè)務口徑保持一致。
3.提升治理技術(shù)尤為重要
除了在源頭控制以外,傳統(tǒng)的事后檢查的治理方式仍然很重要,尤其是針對一些短期內(nèi)無法解決的黑盒系統(tǒng)數(shù)據(jù)進行治理的任務來說。
數(shù)據(jù)治理的基本對象是數(shù)據(jù)質(zhì)量,數(shù)據(jù)質(zhì)量的“六性”包括:完整性、及時性、準確性、一致性、唯一性、有效性。針對這些原則,可以提前制定一定的數(shù)據(jù)質(zhì)量驗證模型,判斷是否滿足這些質(zhì)量約束條件。
通過定期將數(shù)據(jù)質(zhì)量驗證模型的代碼腳本運行于業(yè)務數(shù)據(jù)庫中,可以自動發(fā)現(xiàn)數(shù)據(jù)質(zhì)量缺陷,動態(tài)生成“待處理”的問題數(shù)據(jù)任務工單。
因此,提升數(shù)據(jù)治理技術(shù)本質(zhì)上就是驗證模型的開發(fā),驗證模型有些可以基于經(jīng)驗進行總結(jié),也有些可以構(gòu)建具有概率推斷能力的機器學習模型,或是專門針對治理任務的“專家系統(tǒng)”(Expert System)。
有些數(shù)據(jù)治理任務,在發(fā)現(xiàn)問題數(shù)據(jù)時,需要驗證跨系統(tǒng)、跨表單之間的數(shù)據(jù)關系,為了降低腳本重復運行和數(shù)據(jù)比對的工作量,相關的RPA機器人的設計和開發(fā)也是未來重要的數(shù)據(jù)治理支撐技術(shù)之一。
- 上一篇
預覽數(shù)字前沿:2024年業(yè)務轉(zhuǎn)型的主要趨勢
在新的一年開始之際,我發(fā)現(xiàn)了各種關鍵趨勢,我認為這些趨勢將對業(yè)務增長至關重要。以下是我列出的五大數(shù)字化轉(zhuǎn)型趨勢,你應該遵循并落實到你自己的今年計劃中。
- 下一篇
5G網(wǎng)絡技術(shù)如何重塑互聯(lián)網(wǎng)使用體驗?
隨著科技的飛速發(fā)展,我們已步入了一個全新的5G時代。作為第五代移動通信技術(shù),5G以其超高速率、低時延和大連接數(shù)等特性,正逐漸重塑我們的互聯(lián)網(wǎng)使用體驗。那么,5G網(wǎng)絡技術(shù)究竟如