大數(shù)據(jù)成功實施三個V
在全球范圍內(nèi),很多企業(yè)都專注于利用大數(shù)據(jù)的力量。這一過程的第一步通常是理解大數(shù)據(jù)與更傳統(tǒng)的數(shù)據(jù)環(huán)境之間的區(qū)別。調(diào)研機構(gòu)Gartner公司在2012年將大數(shù)據(jù)描述為三個V:數(shù)量(Volume)、速度(Velocity)和多樣性(Variety)。數(shù)量即捕獲數(shù)據(jù)的規(guī)模,是描述大數(shù)據(jù)平臺的關(guān)鍵組成部分。根據(jù)IBM公司最近的一項研究,現(xiàn)在世界上每天產(chǎn)生超過2.5萬億GB的數(shù)據(jù),為大數(shù)據(jù)平臺提供了潛在的海量數(shù)據(jù)。由于移動電話、傳感器和其他連接設(shè)備的快速擴展,產(chǎn)生了源源不斷的數(shù)據(jù)流。速度即捕獲數(shù)據(jù)的頻率將會繼續(xù)增加。大數(shù)據(jù)將我們從一個結(jié)構(gòu)化交易數(shù)據(jù)的世界帶入了一個捕獲各種數(shù)據(jù)的世界,從社交媒體內(nèi)容到可穿戴設(shè)備的健康數(shù)據(jù)。
一旦企業(yè)高管理解了大數(shù)據(jù)與傳統(tǒng)數(shù)據(jù)環(huán)境之間的差異,下一步往往是選擇物理平臺。在20世紀(jì)90年代中期,數(shù)據(jù)倉庫的出現(xiàn)引起了類似的反響。當(dāng)企業(yè)認(rèn)識到需要有一個獨特的信息分析平臺來防止對交易環(huán)境的影響時,焦點立即轉(zhuǎn)移到技術(shù)選擇過程上。在采用大數(shù)據(jù)的這一點上,就像數(shù)據(jù)倉庫的情況一樣,重要的是要避免成為犧牲品。那些在選擇和構(gòu)建大數(shù)據(jù)平臺方面行動太快的組織可能采用了這樣一個策略,“建立它,他們就會來”。與過去失敗的數(shù)據(jù)倉庫項目類似,在沒有首先確定具體業(yè)務(wù)價值的情況下構(gòu)建大數(shù)據(jù)平臺可能會使企業(yè)成為另一個受害者。
最初的三個V是定義大數(shù)據(jù)概念的好方法;然而,在這里考慮在企業(yè)中實施大數(shù)據(jù)的另外三個極其重要的V——價值(value)、有效性(Validity)和活力(Vitality)。為了防止大數(shù)據(jù)平臺建成后不使用的情況,必須提前了解業(yè)務(wù)價值,解決方案的有效性必須健全,以供業(yè)務(wù)采用,最后,企業(yè)必須有生命力來執(zhí)行實施過程。更徹底地檢查每一個領(lǐng)域。
在關(guān)鍵業(yè)務(wù)領(lǐng)域的適當(dāng)支持下,企業(yè)創(chuàng)建一個大數(shù)據(jù)平臺,為每個客戶提取、分析和生成定制策略,有可能帶來巨大的價值。
最近也有一些關(guān)于大數(shù)據(jù)的演講,其中一些公司的主要賣點是,“我們的大數(shù)據(jù)解決方案非常棒,因為用戶可以將所有數(shù)據(jù)加載到低成本的商品服務(wù)器上,磁盤存儲幾乎不需要任何成本,源數(shù)據(jù)存在的任何格式都可以,并且以后可以弄清楚如何使用它”。不要讓這種方法的吸引力導(dǎo)致企業(yè)成為下一個犧牲品。在大數(shù)據(jù)之旅中,一個關(guān)鍵的成功因素始于一個清晰的愿景,即它將如何提供商業(yè)價值。例如,如今可以從車輛上的數(shù)千個傳感器捕獲流數(shù)據(jù),從制動水平到轉(zhuǎn)彎時的行駛速度。如果使用得當(dāng),這些數(shù)據(jù)可以讓保險公司根據(jù)客戶的駕駛行為調(diào)整保單價格。在關(guān)鍵業(yè)務(wù)領(lǐng)域的適當(dāng)支持下,創(chuàng)建一個大數(shù)據(jù)平臺,為每個客戶提取、分析和生成自定義策略,有可能帶來巨大的價值。
建議的下一個重點領(lǐng)域是解決方案的有效性。從技術(shù)上來說,一個適當(dāng)配置的大數(shù)據(jù)平臺可以輕松處理來自幾乎無限數(shù)量的車輛的流傳感器數(shù)據(jù)。因此,可以創(chuàng)建解決方案,并且它有可能推動重要的業(yè)務(wù)價值,但是它有效嗎?在這個示例中的保險公司開始實現(xiàn)這種類型的解決方案之前,必須探索一些領(lǐng)域。在保險公司經(jīng)營的州內(nèi),根據(jù)個人或團體的駕駛模式來定價汽車保險是否合法?負(fù)責(zé)定價的業(yè)務(wù)部門是否有能力設(shè)定和管理這個水平和速度的價格?隨著消費者對隱私的日益關(guān)注,消費者是否會同意這種程度的監(jiān)控,以換取更有針對性的定價?一旦初始解決方案可操作,有效性可能變得更加有趣和重要。通過捕獲大量客戶的驅(qū)動模式,可以確定其他潛在的業(yè)務(wù)價值領(lǐng)域。例如,保險公司將位置和行為數(shù)據(jù)見解出售給其他公司用于基于位置的營銷是否有效?企業(yè)必須解決諸如此類的問題,這些問題超出了大數(shù)據(jù)解決方案的技術(shù)可行性。
最后,企業(yè)必須確定它是否具有實現(xiàn)解決方案的活力。在企業(yè)內(nèi)實施第一個大數(shù)據(jù)解決方案將是困難的。成功將取決于選擇強有力的合作伙伴,對現(xiàn)有資源進行交叉培訓(xùn),并可能增加新資源。目前,熟練的大數(shù)據(jù)資源的可用性是一個挑戰(zhàn)。
大數(shù)據(jù)領(lǐng)域的軟件和應(yīng)用的成熟度正在快速提高,但與標(biāo)準(zhǔn)的數(shù)據(jù)和應(yīng)用開發(fā)解決方案相比,仍有很大的差距。大數(shù)據(jù)解決方案在某些方面類似于電動汽車。電動汽車具有巨大的能源效率、非常高的扭矩和快速的加速,但仍然存在充電站有限、電池成本高、行駛距離問題等痛點。Hadoop等大數(shù)據(jù)平臺已經(jīng)顯示出支持海量數(shù)據(jù)的能力,其結(jié)構(gòu)化和非結(jié)構(gòu)化模塊可以處理大量數(shù)據(jù)。然而,就像電動汽車一樣,這個平臺正在經(jīng)歷一些痛點,比如有限的可用資源、新興的開發(fā)工具,以及對與現(xiàn)有環(huán)境集成的擔(dān)憂。
當(dāng)企業(yè)開始其大數(shù)據(jù)之旅時,利用數(shù)量、速度和多樣性來更好地理解潛力,但不要忘記價值、有效性和活力,因為它們關(guān)系到成功的執(zhí)行。