2016年8月7日 星期日

車品覺:如何養活數據

圖片來源:甘田文創
作者:車品覺

電商交易量每年增加一倍,但對所積累數據的了解程度是否跟著增加一倍呢?如果電商現在不開始收集數據及應用起用,未來要用數據的時候,就會發現過去的數據已經是一堆垃圾。

許多人已經開始意識到,未來的電商是數據之戰,在這種大數據的背景之下,電商收集數據的邊界在哪裏?又該如何快速運用數據做出正確的商業決策?這是多數電商公司的困擾。

為此,億邦動力網聯系到著名數據分析師車品覺,請他分享在運營數據中不斷思考的經驗總結,以及講述最近在美國Strata Conference與Linkedin前首席科學家Patil交流的心得。


數據是越多越好嗎?

過去,有一個問題一直令我很困惑,現在的企業獲取數據很容易,並且數據的增長速度非常之快,那麽對於公司來說,到底要收集什麽數據呢?收集多少數據?收集數據的邊界在哪裏?

後來在美國遇到Patil,他認為過去收集數據很難,而現在獲取數據資源變得更容易。但是如果收集數據的出發點,不是為了解決問題,那麽收集再多的數據有什麽意思呢?

可是許多公司還有一個疑問是,現在收集數據不難,成本也不高,為什麽不先收集數據再說呢?等以後需要數據來解決問題時再拿出來用也可以。

Patil的答案我也很認同,他勸大家千萬別這麽想,用這樣的理念來設計數據應用肯定會失敗的。數據是沒有邊際的,我為此也痛苦了好一段日子。比如收集一個人的生日,可以精確到幾分幾秒,但這麽精確的數據有什麽應用,能產生什麽價值呢?

事實上,數據是有生命周期的,比如從中國身份證號碼是可以推斷出性別的,但是過幾年如果這個規則變了,導致我們基於數據所做假設和決策依據也就失去了意義(Data Broken)。更何況保存數據及其收集時的背景(Context)也是一件不容易的事情。

所以說,在收集數據的同時,我們必須知道未來可以用來做什麽,今天都想不出來的話,日後就更不容易想出來了。

打一個比方,今天很多電商老板會問重復購買率是多少,於是我們收集數據來計算重復購買率,卻很少想到需要重復購買率來做什麽決定。

這就好比刻舟求劍這個故事,他告訴我們世事在變,我們不能只是機械的套用方法或指標。就像重復購買率有不同的定義,而做不同的決策需要不同定義的重復購買率。如果從一家投資公司的角度來看重復購買率,它想收購A公司,那麽會從重復購買率來看整個A公司的健康程度或用戶質量等。

如果從A公司本身運營的角度來看重復購買率,那麽它更關註的是日、周級別的重復購買率的變化趨勢,或者當月新增客戶有多少人在三個月後的重復購買,從而可以衡量每個月新增及存量客戶的忠誠度和質量,找出改善的空間。知道了以上的背景之後才去選擇用什麽數據不是更靠譜嗎?

數據應用因小而美

從2011年年底,我開始思考怎麽從“用數據”轉變為“養數據”(即數據運營轉變為運營數據),這一段時間我特別為收集什麽樣的數據而煩惱(more data, more problem)。而且,我也曾經想做一個特別大的適合多數人使用的數據應用出來(虛火上升),可是後來發現這在數據應用的起步階段幾乎是不可能的,一是找到可以解決大部分人需求的數據應用不容易,二是支付寶的數據非常豐富,需要考慮的因素很多,因素之間的聯系又很復雜。

所以,我總結,當做數據應用的時候,數據就是等於原材料,當原材料一直處於變化的情況下,做出來的產品很容易出問題。體會數據和應用的關系之後,我最後決定從小角度切入,先做小應用出來(很好的瞄準器)。

這裏說的“小”指的是應用的目標很具體。

打個比方來說,對於一款數據應用,如果我的目的是分辨兩種決策誰更好,差異在哪裏,是很具體的問題。但如果我的目標是想知道如何讓公司贏利,就是一個空泛的目標。

還請註意,“小”不是指數據量。許多人在沒有獲取足夠數據,並且缺乏對數據理解的情況下做判斷,其實是在享受自己的無知。

經過一番周折之後,也是按照小角度切入的想法設計數據應用,小角度切入設計產品可以做到具體和快速,而且可以避免因原材料的變化而導致的問題。

把數據放進“框”之中

此外,還不得不說到一個話題,在大數據的背景下,必須考慮數據之間的關聯性。一個單獨的數據是沒有意義的,要把數據放在一個“數據框架”(情景)裏面看才能看出問題。

為了把問題說得很明白,這裏我拿前陣子一家電商公司找我討論的問題舉例子。這裏不太方便公開這家公司的名稱,暫以A公司代替。

A問我,要不要撤去導航網站的廣告?因為懷疑許多老客戶是從導航網站訪問官網,而不是直接訪問官網。

把這個問題說得再直白點,就是要弄清楚在導航做廣告與A公司的業務關系。

那麽,接下來要觀察用什麽“數據框架”,有助於做決策?

  一、A公司當前的投入產出比

  1、明確導航網站引進來的新、老用戶占比如何?

  2、引入的新、老用戶的投入產出比和轉化率如何?

  3、推斷撤去導航網站,對流失新老用戶的影響?

  二、與競爭對手的博弈

  有一個問題可能會忽略,那就是你不做導航網站廣告,你的對手就會立馬進來。做數據框架的時候,要特別註意框架不是靜態的,而是博弈的,需要把競爭對手因素算進來。

  三、考慮時間因素

  建立框時要考慮時間因素:

  1、 用現在、過去和未來的眼光來審視導航網站,看看導航的質量是不是越來越好

  2、 需要註意的是時間有延遲性,引進來的流量會有一些延遲,在兩三個月後才能知道新用戶的價值(life time value)。

總之,“數據框架”是商業分析師的靈魂所在,從框中找尋問題的關鍵因素及答案。不同的問題有不同的框,不能完全在此全部闡述。

如何用框架來做決定?

對此,我總結了四步走的方法:

第一,首先確定有什麽問題,從解決問題的角度出發收集數據;

第二,把收集的數據整理好,放入一個“數據框架”內
(這個框架是用來幫助決策者做決定的)。

讓決策者用框更清楚地看到數據與決策之間的關系,比如A公司在框架內要知道競爭情況、新老客戶比例情況等因素,以及多種因素互相的關系。

第三,看框架與決策的關系
比如A公司與導航網站有三種選擇,完全不合作,部分合作,全面合作。根據數據框架告訴A公司該怎麽決策。如果發現數據框架與決策不能匹配,就必須返回到第二步。

第四,根據決策做出行動,檢查行動是否達到了目的。
如果行動了發現根本沒達到目的,就要檢討整個鏈條,看問題出在哪裏。是數據有問題嗎?還是因為框架不對?或者是決策不對?是否還有數據沒考慮進去?

所以,又回到之前我老說的話題,不懂商業就別談數據。

想要解決的問題越復雜,框架也越復雜。

而對於現在多數還沒有開始做數據應用的電商公司來說,一開始框架千萬不要太復雜,一定是針對某個需解決的問題開始搭框架,令框架與決策之間的關系非常清楚。

你的問題是什麽,你的decison是什麽,反過來你的框架又該怎麽樣。

從小角度切入,從“小”做起。


原文請見:車品覺:如何養活數據

閱讀更多:《大數據的關鍵思考:行動×多螢×碎片化時代的商業智慧》:有價值才有產值