車品覺老師在其決戰大數據一書中,強調的更多的是一種數據思考方式,書中范例介紹的小偷思維、先開槍后瞄準、CEO關注的三個問題等,都屬于數據思考方式重構解決問題的過程。
全書從為什么大數據說起來容易做起來難出發,以大數據構建未來商業利器結束,總共花費了11個章節,中間穿插著其在阿里的數據實踐經驗,本人結合自己的讀書體會,特將其總結歸納為以下50條:
1、大數據從來都不是免費的午餐,因為數據來源渠道的寬泛,難免出現偏倚誤差。
2、人的斷層是是大數據應用面臨最嚴重的問題,這個斷層包括溝通的斷層、建模的斷層,譬如現在收集數據的人不知道未來使用數據的人要什么?創建模型的人不知道未來數據是否穩定,使用模型的人不知道數據的來龍去脈。
3、從數據化運營到運營數據,是從看到用的過程。這個過程需要主動管理,需要更多的創新,需要學會問問題,問問題的過程就是尋找答案的過程,好的問題就是答案。
4、從商業角度講,大數據的本質就是還原用戶的真實需求。
5、數據價值的如何判定?首先看這個數據與你的目標是否一致,對你的價值是什么?其次看這個數據能否清楚的識別用戶身份,以及反應出的對應的場景。
6、學會雙向思考,關于數據的價值,對于企業而言,是實現企業資源的合理分配,而對于用戶而言,則是對用戶體驗的提升改進,比如個性化的推薦系統就基于此。
7、場景與還原并行,前端還原為消費者場景,后端還原為業務需求。
8、數據的本質是還原,落地可能表現為收集元數據的方法,個人建議初期引入最小數據集的概念。
9、關于數據還原可以從兩方面理解:①對人的行為目的的還原;②對制造原始信息的人的朔源。
10、活的數據才是大數據,這里的活主要從兩方面考量:一是靈活收集數據,抓相關性,比如我們的克強指數;二是靈活動態的數據指標,動態的使用數據,將數據場景化。
11、 移動互聯網時代,無線數據將是大數據的“顛覆者”。這個顛覆主要指無線數據的加入將原有數據的噪音加大,無線數據與原有PC數據的關系處理等。
12、無線數據分為wap和app兩種,而APP的數據收集方式又有兩種:①收集用戶聯網時請求服務器的記錄②用戶行為記錄。
13、 APP對用戶的識別主要基于手機的機器碼,而機器碼在不同系統中也有差異,差異體現在操作系統本身的差異和操作系統版本的差異。
14、 保證PC和無線兩份數據的完整,通過用戶體系將兩份數據關聯起來,就可以在分析過程中用彼此的融合來還原用戶的行為,所以用戶體系的建設在多屏時代尤為重要。
15、 關于數據價值,從數據的角度講,估值就是通過不同的緯度去思考數據的價值。
16、 數據作為一種資產,不同的數據含金量必然不同,自然就會產生不同的價值,與此同時,同樣的數據在不同環境中也會呈現出不同的價值。
17、數據的四種分類:①可再生與不可再生數據;②基礎層、中間層、應用層數據;③不同數據主體對應的主體數據;④隱私與非隱私數據。
18、數據的五種價值:①串聯與識別價值;②描述價值;③時間價值;④預測價值;⑤產出數據價值。
19、 數據分類與數據價值的意義,主要還是體現在數據產品的建立上,其應用思想體現在基礎層-中間層-應用層上。
20、基礎層收集那些數據,如何收集,如何保存等;中間層涉及數據管理與數據框架的搭建,應用層則是八仙過海各顯神通。
21、數據收集的出發點是解決問題,此外數據的生命周期、收集背景都須注意。
22、 用數據是一種方法論,養數據則是一種數據戰略,是基于更深的商業解釋的商業決策。
23、 跳出固有思維圈,從旁觀者角度出發,跳出0或1的選擇,我們可以有第三種選擇。
24、數據應用應該是小而美,而不是大而全。小而美指目標簡單具體。
25、 如何利用數據框架做決策,簡單四步告訴你:①確定問題,從解決問題的角度去收集數據;②整理數據放在一個框架內;③看框架與決策的關系;④根據決策行動,檢查是否達到目的。
26、數據的盲點分為物理盲點和邏輯盲點,物理盲點是我不知道的,邏輯盲點是我知道但沒被挖掘的。
27、 數據也有正負能量,正能量的數據告訴你如何成功,負能量的數據告訴你如何避免失敗。
28、是否看到數據盲點的核心價值是,有沒有看到應該看到的數據,有沒有錯失不應該錯失的數據。
29、數據運營中的常見問題:①堵,日常報表信息量大,難以鋪捉有效信息;②獨,信息分散在不同部門,缺少有效組合;③慢,業務異動的處理往往是自上而下的推動;④漏,關鍵分析成果取得實效,但未實現沉淀。
30、 阿里的大數據實踐一:數據化運營需要和商業咬合的非常緊密,所以數據也是混合在商業里,以假定穩定的方法去做業務上的對比、細分以及趨勢預估。
31、 阿里的大數據實踐二:假定數據是穩定的,意味著習慣于不去尋找一些新數據,用數據拿數據的方法可以將數據化運營和運營數據打通。
32、 阿里數據化運營的內三板斧之混:混出數據,只有具備商業敏感的分析師,才懂得使用什么數據來驅動公司實現經營目標,數據部的人和業務部的人經常混在一起。
33、 阿里數據化運營的內三板斧之通:打通混的數據,通是混、通、曬的關鍵節點,知道帶著業務問題看數據或帶著數據看業務,這就是通。
34、 阿里數據化運營的內三板斧之曬:曬出混和通的數據,數據能不能做到獲取、使用、分享、協調、鏈接、組合之上,讓自己變得超級簡單和便捷,這是數據化管理運營中非常重要的一點。
35、 數據化運營需要有框架可依,做到如何證明業務是好還是不好,而這里的框架就是一個對業務進行指標化的分解,并通過有限多個指標來客觀描述業務的狀況。
36、 阿里運營數據的外三板斧之存:存是數據收集的開始,收集數據不是目的,讓收集起來的數據如何產生價值才是最終目的。
37、 阿里運營數據的外三板斧之管:管是保護好存儲數據,學會用數據產品來解決獲取以及使用數據的問題。
38、 阿里運營數據的外三板斧之用:用是從收集數據到管理數據,在用數據的問題上,數據的分裂和重組,都能做到顛覆性的創新。
39、數據思維之MECE法則,不斷地用邏輯方法將問題進行分解,直到不能分解為止,然后從根本去解決問題。
40、大數據的本質是人,數據研究的極點就是揣測變幻莫測的人性。
41、假定數據是臟的,在處理數據的時候,會像污水處理廠一樣,每一步都問自己幾個為什么。這種情況的出現,到底是因為數據臟了還是因為數據提驗過程中做的不好。
42、 做好數據的質量評分,從反映數據的可信度和質量水平出發。
43、 學會慢慢的淡化數據,數據是有優先級的,在數據中有些是特別核心的,有些即使缺失了也沒問題,所以,我們要學會真正坐下來盤點那些對公司最有價值,對用戶最有價值的數據。
44、數據的標簽化管理,數據的屬性標簽是人類經驗判斷的數據,是數據后的數據。
45、大數據價值的實現在于數據與數據之間的連接。
46、數據的實時化和實時性分層,我們千萬不要把所有能力都用來處理實時化的問題,因為我們依然會有大量的數據需要在恰當的時機處理,有的數據是重要的,但并不緊急。
47、關于數據,未來是人機的結合體。人和機器的結合,或者人和數據的結合將是未來的一種進步模式,人類將通過數據變得更加智能。
48、未來,人身體中流通的不僅是血液,還有數據。
49、 關于數據分析,更準確的說法應該是信息分析,目的是尋找短板,這個短板可能是自己的,也可能是競爭對手的。
50、我們都說數據分析是指導決策的重要依據,但我們用什么來保證分析的正確呢?是不斷的試錯還是考驗我們數據分析師(科學家)分析和利用信息的能力。