【SmartM解讀】數據不應只是研發人員或是分析師的專利,產品和運營人員也應該要了解相關的細節,才能在經營的過程中更全盤的了解各項事務。
我胸中有很多付諸筆端的想法在鼓動,雖然在近兩年的工作中,數據化運營是最得心應手的工作,但是寫出來總差那麼一點意思。另外一個角度看,是不夠融會貫通。
於是我希望,在七周成為數據分析師的系列後,把數據化運營作為第二個系列來完成。每次寫文章,對自己也是一種總結和提升。下面是一份「簡略」的大綱,更恰當地說是草稿。當不久的將來開始正式寫作時,肯定會更好。
我們將數據化運營分成四個環節:數據收集、數據加工、數據運營、數據反饋。它是運營和產品視角的閉環。
將閉環簡化成四個模型,那麼它們分別是:
- 數據收集:以用戶和產品的交互為輸入,原始數據(行為、業務、流量、外部)為輸出。
- 數據產品:以原始數據為輸入,以加工數據(標籤、畫像、維度、指標、演算法結果)為輸出。
- 數據運營:以加工數據為輸入,以運營策略(用戶、內容、活動、電商)為輸出。
- 用戶觸達:以運營策略為輸入,以反饋行為(轉化率、點擊率、響應率)為輸出。
數據收集
雖然數據收集是技術的事,但是產品和運營人員也應該瞭解相關的細節。什麼是網頁參數,什麼是服務器日誌,數據是如何被收集起來的。
如果不瞭解,當你問到研發:為什麼這一塊數據沒有收集到啊,研發大哥只會翻一個白眼說:你沒有要求佈置啊。
佈置即是埋點,埋點不是一項新興的技術,它在Web時代就有了。
很多場景中,業務方是埋點需求的發起者。這也是我強調的,運營和產品需要瞭解埋點,否則,這一塊很容易變成坑。
在數據化運營體系,對埋點的要求只會更高。前端埋點、後端埋點、可視化埋點、服務器埋點,各類方式層出不窮。技術問題不需要擔心,擔心的是應用。
雖說,給我一組行為埋點數據,我用Excel也能寫出協同過濾。可如何最大價值的發揮效用,在埋點初期就應該考慮清楚。所以埋點需要花稍微多一點的篇幅介紹。
最後,學會爬蟲,爬蟲是一種高性價比、高體力活的技能。爬蟲有三種主要方式,靜態網頁爬取、JSON/API爬取、動態JS爬取,再加上各種反爬蟲機制的應對。當爬蟲水平能爬取微信和淘寶時,已經是草木竹石皆可為劍了。
利用爬蟲,運營能做很多好玩的事情。比如出現一個熱點新聞,大家馬上抓取相關數據,然後新媒體同學洋洋灑灑一篇文章:《大數據告訴你,XXX是什麼樣的》,《我們分析十萬條影評後,得出這部電影XXX》,《XX網站最火熱的十條內容》。比憋內容好多了。
數據加工
這依舊是技術研發的範疇。
數據加工的業務核心是指標,我們首先得熟悉各種主流指標的含義和應用。
很多產品運營們會問,是否需要理解數據架構?
好消息是並不需要學會。但你總歸要理解一個概念,比如什麼是MapReduce,什麼是離線、什麼是實時、什麼是緩存、什麼是T+1。
這是為了降低溝通成本,也是方便大家理解數據化運營背後的邏輯。為什麼有些報表和數據不能立馬獲取,為什麼有些個性化推薦,如網易雲音樂,只能每天定時更新?
一個好的數據化運營體系,需要業務人員和技術不斷磨合才能搭建起來。此時,你也會是一位合格的數據產品經理了。
一些數據產品的設計邏輯可以選擇性學習,包括用戶畫像、廣告、CRM等。它們在一定程度上是相通的,比如用戶畫像和廣告的人群定向,區別於靜態和動態。
用戶畫像是集大成者的先進應用,不同公司的用戶畫像也不相同。有些用NoSQL、有些則是寬表。用戶畫像應基於業務出發,切記避免形式主義的畫像,你賣保健品的,知道用戶喜歡軍事有什麼用?
機器學習是更先進應用,我認為,產品和運營瞭解些機器學習相關的知識挺有幫助,這是數據化運營的方向之一。
當你理解機器學習/數據挖掘能夠做什麼,你才能與數據、技術配合它落地。永遠別期待數據部門憑空優化業務,他們需要業務部門提供方向和指導。一個懂機器學習的運營,起碼值他們請三頓飯。
話說回來,單純理解,哪怕是一個文科生,一個月也能懂幾個主流的演算法模型了。比如決策樹,就是if-then的集合,非常簡單,因為簡單,所以運算速度快,速度快就可以應用在一些特定的場景,比如新用戶的內容推薦系統。這種理解,有助於設計更好的產品。
所以,得讓產品和運營們,也瞭解起機器學習啊。
數據運營
終於輪到業務的環節,這裡將著重介紹如何將數據轉換成策略。
首先,需要數據化運營的思維。如果運營還是用老虎機、大轉盤、抽寶箱的「三板斧思維」,業務走不長遠。
我曾經說過,運營和Growth Hacker只差一個數據運營的距離。無需特地吹捧國外的增長黑客,只要數據化用的好,人人都是增長黑客。
接下來以實際的工作內容解構數據化運營。
用戶運營的數據化,分為用戶行為和用戶體系。
用戶行為通過埋點數據分析。
桑基圖是最合適的圖表,上圖只是活躍狀態的變化。不妨想一下,同樣的圖表,用來分析用戶在產品上的操作路徑,比如某個功能模塊的使用、退出、跳轉,是否能優化產品呢?
除了行為,還要挖掘用戶數據,之前一篇文章的分層和分群,就是其中之一。另外也包括用戶流失預測等。
活動運營,我準備把流量合併在這塊,因為活動都是Web頁面的形式,兩者的道理是相通的。這塊也有不少專門的技巧。
大家知不知道,微信會在第三方分享出來的web頁面上,打上&from=timeline、groupmessage、singlemessage的參數。分別對應朋友圈分享、群分享、好友分享。大家有沒有研究過,哪些運營活動或者內容,更容易被分享到朋友圈,哪些內容更容易被分享到群?如果加上用戶參數,你還能監控到哪類用戶的分享效果特別好。我就基於此AB測試優化朋友圈的內容點擊率,提高了30%左右。
同樣的,活動運營也能用統計學進行優化,怎麼計算活動中獎的概率模型,預估成本?它是典型的二項分佈。不同的中獎概率,對應什麼樣的用戶數學期望?如何調整概率達到效果最優,玩法也有很多。
內容運營是數據化的一個難點,因為文本很難量化。從大層面考慮,我們能監控輿情數據,而細節,我們將進行文本分析。
不需要專門學會自然語言處理。而是當用戶評論你的產品時,如何判斷他們評論的情緒是積極還是消極?當評論有十萬條時,怎麼去更好的分析?
除了上述最主要的工作內容,我們還要學習商業化運營。這裡的商業運營,是涉及到各類營收、GMV(SmartM註:網站成交金額)的運營策略。包括電商、廣告、會員等。
除了技巧,得花些時間,把策略變成產品和工具。這一塊,就涉及到運營後台/平台的搭建了。
數據反饋
最後就是數據反饋了。
AB測試是數據化運營的大殺器。好的AB測試,需要設計相應的運營策略。如何設置對照組和控制組,如何劃分出流量,怎麼樣的樣本才能滿足置信度的要求。何種手段能夠證明運營策略成功了?
除了AB測試,得繼續熟悉各類反饋指標,點擊率、轉化率、響應率。包括機器學習的精確率、準確率、召回率、AUC和ROC曲線、Lift提升圖。這會把大家的思維,從單純的轉化,帶到更高層的維度。
比如用戶購買商品,轉化率是30%,這是普通運營的視角。數據化運營會怎麼看待這個數據呢?他會把用戶切割到一個維度,叫做購買可能性。比如用戶有90%的可能性購買,用戶有80%的可能性購買,用戶有10%的可能性購買…這些可能性都是機器學習預測出來的概率,不同概率的轉化率不同。最終劃分出一個區間,譬如選擇40%以上可能性的用戶才去做強營銷。
好的運營平台,運營人員會獲得這類基於預測的數據,告訴你用戶對某些運營活動、策略、營銷的響應會怎麼樣,運營人員就基於此選擇用戶,做到性價比最優化。
於此,數據化運營是階段性的結束了,之後則是優化改進策略,作為新的開始。
延伸閱讀
原文出處