從“數(shù)據(jù)科學(xué)”視角,看懂數(shù)字化轉(zhuǎn)型
數(shù)字化轉(zhuǎn)型是數(shù)字經(jīng)濟時代下重要的產(chǎn)業(yè)實踐,其背后有沒有方法論來指導(dǎo)呢?自然是有的。方法論主要來自于三個方面,分別是:業(yè)務(wù)視角、IT視角、數(shù)據(jù)視角。
業(yè)務(wù)視角,不言自明,基礎(chǔ)是傳統(tǒng)的管理學(xué)方法論,既包括企業(yè)的戰(zhàn)略制定、人力資源、財務(wù)管控,也包括一切和數(shù)字化項目實施落地相關(guān)的項目管理活動等。
IT視角,方法論大多來自于傳統(tǒng)信息化建設(shè)相關(guān)的方法沉淀,比如:系統(tǒng)需求分析、系統(tǒng)架構(gòu)設(shè)計、軟件設(shè)計模式、產(chǎn)品設(shè)計、UI/UE設(shè)計等。
數(shù)據(jù)視角,是數(shù)字化建設(shè)獨有的方法論視角,把數(shù)據(jù)作為“本體”,一切活動圍繞數(shù)據(jù)來看待數(shù)字化轉(zhuǎn)型實踐。
通過認識和挖掘數(shù)據(jù)的本質(zhì)、規(guī)律、價值、活動,實現(xiàn)對數(shù)字化轉(zhuǎn)型的系統(tǒng)規(guī)劃并展開具體的方案設(shè)計。
數(shù)據(jù)科學(xué)是關(guān)于數(shù)據(jù)的學(xué)科,數(shù)據(jù)分析、數(shù)據(jù)挖掘、數(shù)據(jù)預(yù)處理、數(shù)據(jù)檢索、數(shù)據(jù)建模、數(shù)據(jù)架構(gòu)設(shè)計都屬于數(shù)據(jù)科學(xué)的技術(shù)細分領(lǐng)域。
數(shù)據(jù)科學(xué)的數(shù)字化視角,是一個理論的觀察視角,從數(shù)據(jù)科學(xué)看數(shù)字化應(yīng)用場景,類似于基于物理公式的視角來看自然界客觀的物理現(xiàn)象,如雷、電、雨、雪 ...
數(shù)據(jù)科學(xué)可以讓“數(shù)字化”活動抽象化、清晰化、本質(zhì)化、結(jié)構(gòu)化,在解決數(shù)字化問題時,通常需要把“業(yè)務(wù)域”中具體的經(jīng)營問題或生產(chǎn)問題動態(tài)映射到“數(shù)據(jù)域”,得到等價的“數(shù)據(jù)科學(xué)問題”,在“數(shù)據(jù)域”中對原問題進行求解。
上述過程,實際上也是廣義上“數(shù)字孿生”想要達到的產(chǎn)業(yè)實踐意義。
值得注意的是,業(yè)務(wù)域問題變成數(shù)據(jù)域問題,總是近似等價的,期間可能要忽略掉很多非數(shù)據(jù)域可描述或定義的“細節(jié)”,比如:外部風(fēng)險、情緒干擾、操作性誤差、系統(tǒng)性誤差、財務(wù)約束、系統(tǒng)性能約束等。
盡管如此,從數(shù)據(jù)科學(xué)的角度來解釋、預(yù)測、控制一項數(shù)字化活動,仍有巨大的借鑒意義:
一是可提供理論上的價值邊界。
站在數(shù)據(jù)科學(xué)的視角,可以借助統(tǒng)計學(xué)、信號學(xué)等基礎(chǔ)學(xué)科理論,清晰地定義和量化從數(shù)據(jù)中產(chǎn)生的價值,了解數(shù)據(jù)價值鏈的形成路徑,評估數(shù)據(jù)給業(yè)務(wù)帶來增長的程度。
例如,采用Value of Information(VoI)分析,一種基于貝葉斯統(tǒng)計框架的量化模型,從不確定性減少的預(yù)期收益方面,評價數(shù)據(jù)收集實驗的必要性和經(jīng)濟性。
在此基礎(chǔ)上,可以有效地評估數(shù)據(jù)的價值潛力,以及數(shù)字化項目在收益上的必要性,更好地開展數(shù)字化項目實施決策。
二是可聚焦業(yè)務(wù)上的實施范疇。
通過把業(yè)務(wù)問題抽象成數(shù)據(jù)問題,對業(yè)務(wù)場景進行建模,尋找“數(shù)據(jù)驅(qū)動”的業(yè)務(wù)解決方案。在數(shù)據(jù)模型圖、數(shù)據(jù)流程圖的基礎(chǔ)之上,可以更清晰、更精準地識別目標業(yè)務(wù)問題關(guān)聯(lián)的核心業(yè)務(wù)域,更加有效地聚焦數(shù)字化項目的重要業(yè)務(wù)范疇。
通過數(shù)據(jù)建模手段,可以構(gòu)建結(jié)構(gòu)化的業(yè)務(wù)條線組織形式,有效地梳理數(shù)字化項目相關(guān)的業(yè)務(wù)單位、部門,以及組織內(nèi)外的重大“干系人”。
在此基礎(chǔ)上,還可以明確地定義業(yè)務(wù)活動中的責(zé)任關(guān)系、利益關(guān)系,開展更為科學(xué)、公平的業(yè)務(wù)決策。
三是可凝練技術(shù)上的求解路線。
有時,很多業(yè)務(wù)問題難以在業(yè)務(wù)域中直接找到解決方案,而通過把業(yè)務(wù)問題轉(zhuǎn)化為等價的數(shù)據(jù)科學(xué)問題,相當于拓展了求解問題的技術(shù)手段,提高了處理業(yè)務(wù)需求的能力上限。
大數(shù)據(jù)的方法可以運用于傳統(tǒng)問題的求解,充分發(fā)揮計算機技術(shù)的強大算力優(yōu)勢,彌補了人在面向信息量大、決策維度復(fù)雜、低延時等場景的復(fù)雜決策問題的能力短板。
例如:通過將非結(jié)構(gòu)化的文本數(shù)據(jù)轉(zhuǎn)化為稠密數(shù)值空間的向量數(shù)據(jù),實現(xiàn)文本信息的深度語義融合與匹配,使得機器可以識別和理解“人”感知不到的信息,并完成在海量數(shù)據(jù)庫中進行內(nèi)容匹配的復(fù)雜任務(wù)。
四是可揭露內(nèi)容上的特殊線索。
數(shù)據(jù)科學(xué)提供了一系列統(tǒng)計函數(shù)和分析模型,通過在數(shù)據(jù)對象上進行各種不同的模式變換操作,可以實現(xiàn)信息的深度線索提取,強化凸顯原先在業(yè)務(wù)域視角中被隱蔽埋藏的信息。
例如,通過離群點分析算法,可以在海量數(shù)據(jù)集中快速識別到與“總體”分布不一致的特殊數(shù)據(jù)樣本,背后可能反映了異常的用戶行為或產(chǎn)品質(zhì)量。
再例如,通過圖數(shù)據(jù)分析,建立業(yè)務(wù)對象之間的關(guān)聯(lián)關(guān)系,在圖上進行路徑挖掘算法,計算識別“長距”節(jié)點,挖掘潛在的語義或社會關(guān)系關(guān)系。
綜上,數(shù)據(jù)科學(xué)可以為業(yè)務(wù)分析提供評價能力、解釋能力、分析能力,以及信息強化能力,基于數(shù)字化的業(yè)務(wù)應(yīng)用也只有在數(shù)據(jù)科學(xué)的加持下,才能真正高效能地釋放數(shù)據(jù)要素綜合價值。