數(shù)據(jù)分析,根本沒有你想的那么高級!
在數(shù)字化轉(zhuǎn)型工作中,十分強調(diào)通過數(shù)據(jù)科學(xué)技術(shù)來發(fā)揮數(shù)據(jù)的價值,例如通過數(shù)據(jù)分析方法,從數(shù)據(jù)中提取出有價值的業(yè)務(wù)信息,以此來提供有效的業(yè)務(wù)應(yīng)用或業(yè)務(wù)決策。在數(shù)字經(jīng)濟大趨勢下,數(shù)據(jù)分析這件事,突然之間地位得到了前所未有的提升。
當(dāng)前,為了迎合數(shù)字化的迫切需求,數(shù)據(jù)分析似乎成為一種非常有潛力的技術(shù)能力。如果一個業(yè)務(wù)人員懂得如何做好數(shù)據(jù)分析,或者說,掌握更豐富的數(shù)據(jù)分析方法和經(jīng)驗,那么他似乎也更具職場優(yōu)勢。
然而,事實確實是這樣嗎?
在開始從事數(shù)字化轉(zhuǎn)型,或者,牽頭數(shù)字化項目時,經(jīng)常會覺得數(shù)據(jù)分析技術(shù)能力很重要,然而,隨著實踐經(jīng)驗不斷積累,接觸的項目多了,逐漸發(fā)現(xiàn),數(shù)據(jù)分析這件事變得有點“雞肋”。
尤其是在技術(shù)層面,總覺得被一些外在的因素“卡脖子”,由于這些因素的存在,縱然有很多“絕世武功”可以拿出來過招,但似乎很少有機會真正發(fā)揮出這些技術(shù)方面的優(yōu)勢。
因此,最終得到結(jié)論——在數(shù)字化轉(zhuǎn)型工作中,數(shù)據(jù)分析或許并沒有想象的那么高級。
一般來說,數(shù)據(jù)分析有兩種典型的應(yīng)用場景。一是了解現(xiàn)狀,二是發(fā)現(xiàn)未知。
而各種復(fù)雜的數(shù)據(jù)分析技術(shù),以及相應(yīng)的數(shù)據(jù)建模方法,基本上都是為了解決第二類需求,即發(fā)現(xiàn)未知,無論是未知的業(yè)務(wù)知識、規(guī)律,還是未知的猜測場景,或未來趨勢。
比較尷尬的事實是,在企業(yè)數(shù)字化實踐中,我們經(jīng)常發(fā)現(xiàn),大多數(shù)的數(shù)據(jù)是用來解決第一類需求,即了解現(xiàn)狀。
在數(shù)字化應(yīng)用中,往往不需要過多“花哨”的技術(shù)手段,如果你問業(yè)務(wù)人員需要什么,或者問領(lǐng)導(dǎo)想從數(shù)據(jù)中看到什么,大多數(shù)的回答基本上都是——某某數(shù)據(jù)統(tǒng)計結(jié)果能夠及時、準(zhǔn)確地反饋就好了。最多再來個可視化。
不需要建模么?不需要預(yù)測未知么?僅此而已?
當(dāng)然需要,但是這些更高級的需求,其實業(yè)務(wù)部門對“數(shù)字化”的期待并不高。
除了在工業(yè)自動化相關(guān)領(lǐng)域,如智能制造或智慧城市中的全機器驅(qū)動場景,大多數(shù)企業(yè)在從數(shù)據(jù)資源中推斷、判斷業(yè)務(wù)情況,以及進行決策活動,還仍然遵循著傳統(tǒng)的人工方式。
在數(shù)字化建設(shè)中,除了“取數(shù)”、“統(tǒng)計”,對于業(yè)務(wù)人員來說,其他需求似乎都不那么迫切。
在進行業(yè)務(wù)判斷和決策時,采用機器建模的方式,被認(rèn)為不那么可靠。
當(dāng)然,導(dǎo)致這種結(jié)果的原因一方面可能是數(shù)據(jù)科學(xué)家并不那么了解業(yè)務(wù),總是構(gòu)建出華而不實的數(shù)據(jù)模型;另一方面可能對于一些綜合的、“非線性”的業(yè)務(wù)問題,需要考慮的因素和關(guān)系也確實太復(fù)雜,即便是業(yè)務(wù)人員自己,對問題的結(jié)構(gòu)化難度以及建模難度很大。
最終,業(yè)務(wù)人員選擇出靠譜、順手的一種數(shù)字化應(yīng)用模式就是:機器來取數(shù),整合信息,人(靠經(jīng)驗)來進行分析。這時,數(shù)字化應(yīng)用從外表看是在做數(shù)據(jù)分析,而這種分析只是非常淺層的分析,或者說,最多只能算是數(shù)據(jù)查詢、數(shù)據(jù)統(tǒng)計。
最終,數(shù)字化應(yīng)用需求,大多數(shù)都退化為,以“取數(shù)”為中心的數(shù)字化能力建設(shè)。這類需求,在算法上沒什么難度,技術(shù)創(chuàng)新空間不大,而為了保證“取數(shù)”的質(zhì)量,技術(shù)人員又要花費大量的精力對平臺進行性能上的優(yōu)化,這屬于“純粹”工程上的事情,再不然,就是投入更多的人力來進行數(shù)據(jù)治理,保證“取”到的數(shù)據(jù)結(jié)果可靠。
數(shù)據(jù)分析,沒有什么算法,也沒有什么模型。即使有,也只是一些在業(yè)務(wù)上預(yù)定義的函數(shù)、規(guī)則、指標(biāo)。
單純數(shù)據(jù)驅(qū)動的方式得到有價值的結(jié)論,這看似是經(jīng)典的案例場景,但其實卻是數(shù)字化的未來理想狀態(tài),目前在大多數(shù)行業(yè)的數(shù)字產(chǎn)業(yè)實踐中,并不太普及,也不太適用。
未來,數(shù)字化應(yīng)用需要逐漸從以人工分析為主,過渡到以數(shù)據(jù)分析為主的形態(tài),不斷加大自動化、智能化要素比例。很多數(shù)據(jù)分析技術(shù),在數(shù)據(jù)科學(xué)理論上都具有很優(yōu)質(zhì)的應(yīng)用性能基礎(chǔ),因此要創(chuàng)造更有利的條件來促進產(chǎn)業(yè)中的深度數(shù)據(jù)分析活動實踐,具體包括:
- 推動業(yè)務(wù)知識的數(shù)字化編碼,加大數(shù)據(jù)庫、知識庫、案例庫的數(shù)字化建設(shè);
- 以有經(jīng)驗的業(yè)務(wù)人員牽頭,進行產(chǎn)業(yè)數(shù)據(jù)模型的研究和開發(fā);
- 加強數(shù)據(jù)治理工作,逐步提高數(shù)據(jù)資源的可用性;
- 研究具有可解釋性的、更加“魯棒”的數(shù)據(jù)模型,提高數(shù)據(jù)模型的適應(yīng)性、可調(diào)節(jié)性;
- 推動數(shù)據(jù)部門和業(yè)務(wù)部門的工作協(xié)同,推動跨領(lǐng)域之間的數(shù)據(jù)共享和數(shù)據(jù)融合;
- 推動數(shù)據(jù)平臺建設(shè),低代碼平臺建設(shè),降低業(yè)務(wù)人員主動參與數(shù)據(jù)建模與分析的技術(shù)門檻。
- 上一篇
阻礙數(shù)字化轉(zhuǎn)型的五個IT問題
一種激進的現(xiàn)代化策略是實現(xiàn)替代SaaS產(chǎn)品,放棄存儲在遺留IT系統(tǒng)中的大部分歷史數(shù)據(jù)。雖然這種策略很有吸引力,因為它的低成本和推進數(shù)字化轉(zhuǎn)型,但它可能會丟失組織通常低估的數(shù)據(jù)。
- 下一篇
集成大數(shù)據(jù)的三個數(shù)據(jù)管理技巧
分析數(shù)據(jù)管理外包趨勢有助于企業(yè)及其員工做出更好的決策,保護企業(yè)利益相關(guān)者并提高公司的盈利能力。當(dāng)管理來自各種來源的大量結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)并將其用于業(yè)務(wù)利益時,它會派上用場。