數(shù)據(jù)分析,高手只比你多做了這一步
很多同學(xué)覺得自己在工作中進(jìn)步很少,拿著數(shù)據(jù),翻來覆去就是同比、環(huán)比,做了兩三年也沒進(jìn)步。在這背后,有個(gè)很大問題是:缺少有業(yè)務(wù)含義的標(biāo)簽積累,導(dǎo)致只會(huì)零散地看數(shù)據(jù),既無法推導(dǎo)有業(yè)務(wù)意義的結(jié)論,也積累不了業(yè)務(wù)分析經(jīng)驗(yàn)。
今天我們就借一個(gè)例子,讓大家看出其中的區(qū)別。諸位坐好扶穩(wěn),我們馬上發(fā)車。
問題場景
某同學(xué)提交了一份店鋪分析報(bào)告,指出:A門店業(yè)績排行靠后,低于其他店,建議搞高。然而沒想到,這么平平無奇一句話,立馬捅了馬蜂窩了。業(yè)務(wù)部門同事開始七嘴八舌地爭論:
甲同事:A是新開門店,不應(yīng)該和其他店這么比,A其實(shí)很好
乙同事:雖然A是新開店,但是A是標(biāo)準(zhǔn)店,不能和mini店比,A其實(shí)不好
丙同事:雖然A是標(biāo)準(zhǔn)店,但A是撿漏店,不能和普通標(biāo)準(zhǔn)店比,A其實(shí)很好
丁同事:雖然A是撿漏店,但是A營銷力度并不低于普通店,A還是不好
戊同事:雖然A營銷力度很大,但是營銷投入并不重,A還是很好
……
大家吵成一團(tuán)。最后總結(jié):“數(shù)據(jù)分析做得不深入,只有數(shù)字沒解讀,要結(jié)合業(yè)務(wù)深入分析”留下做數(shù)據(jù)的同學(xué)在風(fēng)中凌亂:
“你們說的都是啥???”
“我要怎么深入法???”
那么,要怎么深入分析呢?
破局關(guān)鍵:標(biāo)簽的業(yè)務(wù)含義
這里最大的問題,在于業(yè)務(wù)討論的各種細(xì)節(jié),無法直接表示成一個(gè)數(shù)據(jù)指標(biāo),導(dǎo)致量化都做不了,更不要提分析了。而量化業(yè)務(wù)的關(guān)鍵在于貼標(biāo)簽。注意!很多同學(xué)一提標(biāo)簽,本能地想到“性別、年齡、包裝尺寸、包裝顏色”這些數(shù)據(jù)庫里現(xiàn)成的,直接從基礎(chǔ)信息導(dǎo)入的標(biāo)簽。這些基礎(chǔ)標(biāo)簽,大部分時(shí)候沒有直接的業(yè)務(wù)含義,對業(yè)務(wù)解讀能力很弱,需要二次加工才好用。
有業(yè)務(wù)含義的標(biāo)簽,則是直接指向業(yè)務(wù)關(guān)心的問題,對問題指標(biāo)有區(qū)分度,對業(yè)務(wù)行為有指導(dǎo)能力的標(biāo)簽。比如“這個(gè)店長能力不行”,這就是個(gè)有業(yè)務(wù)含義的標(biāo)簽,如果確認(rèn)了能力不行,那下一步就是換店長或者做培訓(xùn),對業(yè)務(wù)行為指導(dǎo)很清晰。這種標(biāo)簽,需要復(fù)雜的轉(zhuǎn)化過程與數(shù)據(jù)驗(yàn)證,不是一蹴而就的。
那么要怎么打呢?一步步來看。
從整理業(yè)務(wù)假設(shè)開始
既然是打業(yè)務(wù)標(biāo)簽,首先就得從整理“影響業(yè)務(wù)指標(biāo)的假設(shè)”開始。這樣打出來的標(biāo)簽才是直接指向業(yè)務(wù)問題的。比如開頭的問題,我們可以根據(jù)業(yè)務(wù)部門七嘴八舌的議論,分別列出:
1、待描述的業(yè)務(wù)對象
2、衡量業(yè)務(wù)對象好壞的指標(biāo)
3、影響指標(biāo)的假設(shè)
4、假設(shè)的影響方向
這樣就有了一張清晰的,待開發(fā)的標(biāo)簽列表:
下一步可以一一進(jìn)行開發(fā)。
先做簡單的標(biāo)簽
在開發(fā)的時(shí)候,先做能用基礎(chǔ)標(biāo)簽+現(xiàn)有數(shù)據(jù)指標(biāo),直接計(jì)算出來的標(biāo)簽。這種標(biāo)簽也被稱作:規(guī)則標(biāo)簽。即業(yè)務(wù)給到計(jì)算規(guī)則后,可以基于基礎(chǔ)標(biāo)簽+現(xiàn)有指標(biāo)直接計(jì)算。這種標(biāo)簽獲得速度快,也容易驗(yàn)證。
比如:是否新開店。理論上只要根據(jù)開店日期做分類即可。比如規(guī)定6個(gè)月及以內(nèi)的都是新開店。那么大于等于7個(gè)月的就是老店,小于等于6個(gè)月的都是新店。
這里有個(gè)關(guān)鍵問題:這個(gè)“6個(gè)月”的標(biāo)準(zhǔn)要怎么來。這里有兩種做法:
第一種,如果業(yè)務(wù)部門有共識(shí)的話,我們可以直接用業(yè)務(wù)的標(biāo)準(zhǔn),比如大家共識(shí)了是6個(gè)月,那就是6個(gè)月。
第二種,業(yè)務(wù)沒有具體數(shù)值的共識(shí),但是有一個(gè)概念,比如:
1、新開店階段,門店閉店概率很高
2、新開店階段,門店?duì)I業(yè)額/訂單量處于上升期
此時(shí),雖然沒有明確標(biāo)準(zhǔn),但是業(yè)務(wù)給出找標(biāo)準(zhǔn)的方法。我們可以統(tǒng)計(jì)所有門店的生命周期數(shù)據(jù),看閉店概率/營業(yè)額/訂單量的拐點(diǎn)在哪里,從而清晰標(biāo)準(zhǔn)。
原則上,即使業(yè)務(wù)口頭給出了第一種標(biāo)準(zhǔn),我也建議大家引導(dǎo)業(yè)務(wù)做出第二種標(biāo)準(zhǔn)。因?yàn)榈诙N才是有業(yè)務(wù)邏輯的標(biāo)準(zhǔn)。萬一哪天不同業(yè)務(wù)部門吵架,或者業(yè)務(wù)換了領(lǐng)導(dǎo),不再認(rèn)可第一種標(biāo)準(zhǔn),第二種標(biāo)準(zhǔn)就是調(diào)整的原則。
類似地,門店面積標(biāo)簽也可以這么打。先列出業(yè)務(wù)假設(shè):
1、門店面積大,對應(yīng)的成本就高
2、營業(yè)面積大,收入也應(yīng)該高。
之后就可以把現(xiàn)有的幾種店面面積列清單,看參數(shù)范圍,做出標(biāo)簽。
這里特別要提醒:很多同學(xué)做標(biāo)簽,不和業(yè)務(wù)溝通,自己憑感覺或者看數(shù)據(jù)分布下判斷,比如怎么區(qū)分新店,丫自己拍個(gè)3個(gè)月……這種閉門造車的結(jié)果,很容易被業(yè)務(wù)挑戰(zhàn),也無法與業(yè)務(wù)場景結(jié)合,最終使標(biāo)簽工作淪為自嗨。
有了簡單標(biāo)簽打底,可以再來處理復(fù)雜標(biāo)簽情況。
常見的復(fù)雜標(biāo)簽
常見復(fù)雜情況一:一個(gè)業(yè)務(wù)問題,需要分幾個(gè)標(biāo)簽來描述。比如“促銷”這個(gè)標(biāo)簽,促銷形式,力度,可能需要分開描述。比如:
1、促銷范圍:參與促銷的商品SKU數(shù)量
2、促銷力度:按原價(jià)折算,用戶拿到優(yōu)惠比例
3、促銷形式:買贈(zèng)、滿減、送禮、加一件……
可能一個(gè)業(yè)務(wù)場景,需要好幾個(gè)標(biāo)簽組合才能說清楚。
常見復(fù)雜情況二:兩個(gè)/多個(gè)基礎(chǔ)標(biāo)簽合并出來的標(biāo)簽(又稱綜合計(jì)算標(biāo)簽)。比如“撿漏店”,潛臺(tái)詞是:這個(gè)店面積很大,但店租比正常低,同時(shí)客流并沒有比正常少很多,因此被我們撿漏了。這個(gè)時(shí)候,撿漏店是有三個(gè)基礎(chǔ)標(biāo)簽拼接出來的。
類似的,比如:“這個(gè)店長能力不行”,怎么證明能力不行,可能得從業(yè)績、工作數(shù)量、個(gè)人履歷好幾個(gè)維度來論證,考察的維度一多,就涉及如何付權(quán)重問題。付權(quán)重本身有一套方法論,同學(xué)們感興趣的話,我稍后單獨(dú)分享。
常見復(fù)雜場景三:標(biāo)簽是預(yù)測未來的情況,并非已發(fā)生的情況,比如我們預(yù)判這個(gè)店是“高潛力門店”,因此要求它表現(xiàn)比普通更好。注意!預(yù)測本身是個(gè)復(fù)雜的活,可以基于規(guī)則判斷,可以建模,建模也有好幾種方式,因此處理起來略復(fù)雜,有興趣的話,也是稍后單獨(dú)分享。
總之,經(jīng)過這么一堆復(fù)雜計(jì)算,現(xiàn)在標(biāo)簽已經(jīng)打好,可以利用分析了。
標(biāo)簽的綜合利用
標(biāo)簽的直接應(yīng)用,就是把復(fù)雜的業(yè)務(wù)問題量化,進(jìn)而進(jìn)行分析和檢驗(yàn)。比如文章開頭那一堆復(fù)雜的業(yè)務(wù)理由,用標(biāo)簽就可以直接做單維度對比,檢驗(yàn)說法。
如果有多個(gè)標(biāo)簽疊加,則可以構(gòu)建復(fù)雜的分析邏輯,一層層進(jìn)行推導(dǎo)。這種復(fù)雜的分析邏輯,就是我們常說的“深入分析”,一般習(xí)慣性,把考慮了很多種情況,稱為“分析全面”,把推導(dǎo)了多少層,稱為“分析深入”。
當(dāng)然,標(biāo)簽不止這一種用法,比如標(biāo)簽可以作為進(jìn)一步建模的特征值,輸入模型做綜合性評估/預(yù)測。很多同學(xué)的評估模型/預(yù)測模型做得不準(zhǔn)確,就是因?yàn)槿鄙贅?biāo)簽積累,直接把幾個(gè)簡單的原始數(shù)據(jù)懟進(jìn)模型。
比如,標(biāo)簽還可以用來推導(dǎo)業(yè)務(wù)行動(dòng)。諸如“店長能力不行”“營銷力度不足”,可以直接導(dǎo)向“我要培訓(xùn)店長”“我要增加營銷投入”這種結(jié)論。
綜上,深入分析、建模、提業(yè)務(wù)建議,標(biāo)簽是很重要的一環(huán)。同學(xué)們可以試著多建有業(yè)務(wù)含義的標(biāo)簽,特別是涉及“盲盒”狀態(tài)的業(yè)務(wù),比如線上廣告投放,線下銷售跟進(jìn),商品選品等,標(biāo)簽的作用更大。
- 上一篇
從超大規(guī)模到混合:釋放云的潛力
盡管超大規(guī)模企業(yè)提供了大量好處,但并非所有事情都適合或適合公共云。在制定云戰(zhàn)略時(shí),組織需要仔細(xì)評估其安全性和合規(guī)性需求,以便了解如何最好地利用公共云。
- 下一篇
應(yīng)該在本地還是在云中運(yùn)行數(shù)據(jù)庫?
云平臺(tái)已成為許多企業(yè)的標(biāo)準(zhǔn) IT 基礎(chǔ)設(shè)施選擇, 云數(shù)據(jù)庫的部署也因此迅速增長。但選擇部署本地?cái)?shù)據(jù)庫還是云數(shù)據(jù)庫可能是一個(gè)艱難的決定。