成為數據界的偵探--「小數據獵人」讀書心得 (Small Data)




'You see, but you do not observe. The distincion is clear'

Sherlock Holmes Quote

-A Scandal in Bohemia


在這個充滿資訊與數據的時代,統計學的各種方法與原理,普遍的被使用在各種科學領域中 ,甚至我們說 "這整個世界" 是由統計學所建構出來的也不為過。(之前提到過一本「統計,改變了世界」也有提到類似的觀念)


像是我們常常看到網路上有大學/碩士生找網友幫忙填問卷 ,或者是餐廳用餐完後填寫的滿意度調查表,都是統計分析的一部分。(這裡暫時不討論那些隨便做的、無用的、錯誤的分析)


如果你是社會科學相關學系畢業的(像是心理學、社會學、或者像我是公共衛生學系),或者是曾經接觸過統計學,又或者你曾經使用過spss、SAS或是R統計軟體,那你肯定更能理解我所說的。


不過以上所提到的所有方法,其實都只是研究方法中的一部份,我們稱之為量性研究(大部分的數據分析都屬於這部分)。那有量就有質, 然而質性研究則是許多人都忽略的一個重要項目,而這本書在我看來就是在跟讀者強調質性研究的重要性。


我還記得在讀碩士班的時候,我的老師曾經告訴我,所有的量性研究都必須由質性研究開始。這個觀念顛覆了當時我認為數據就是一切、就是證據、就是王道的想法。
質性與量性研究,像是天平的兩邊,應該是互補的


其實質性研究跟量性研究應該是相輔相成的。質性研究用來尋找問題,量性研究用來尋找答案,這兩者缺一不可。


然而現在我們常常還沒有尋找問題,就開始想要找答案。這樣的邏輯雖然看起來很荒謬,但我認為這正反映了一個狀況: "數據的取得過於容易,但人的思考並沒有更加進步"。 我想這也是作者在這個Big data的潮流在世界上盛行時,特地丟出小數據(small data)這個概念的用意。


不論是大數據或小數據,資訊背後的解讀永遠是通往真理的關鍵


開頭的引言,是福爾摩斯對華生說的話,我覺得很適合放在這篇心得文的開頭。這段文字出自"波希米亞醜聞"中,當時福爾摩斯面對久久未見面的華生,一瞬間就推測出了華生最近的生活狀況。華生在驚訝之餘,也詢問福爾摩斯是如何推理出的。這段對話大致如下:

福爾摩斯: 你有多少次,從大廳走到我的房間? 
華生: 應該有上百次了。
福爾摩斯: 那你知道這段距離總共要走幾步嗎?
華生: 要走幾步? 我不知道!
福爾摩斯: 這就對了! !  你看了,但卻沒有觀察(You see, but you do not observe)。我知道是17步,是因為我看的同時也觀察了。

(原文請參考這裡)

以上的對話反映出,很多時候證據放在我們的眼前,我們卻沒有(或無法)認真地觀察。如果連眼前的線索都無法觀察與解讀,那就算有再多的數據也是枉然。而在數據分析中,最有價值的也往往不是單純的數據,而是在解讀數據背後的洞察(insight)


如同作者在書中提到,他走遍世界各地去觀察當地人民的文化、生活、消費習慣。表面上看起來,作者觀察的是當地人民的行為。例如書中提到,作者從觀察印度人廚房的香料和婆媳之間顏色喜好的不同,推論出在印度家庭中實際有購物決定權的人, 進而決定商品包裝的顏色;或是從中國人試新車時用指甲來回摩擦大腿的動作,推論出他們在日常生活中的壓力以及需要"變身"的需求,而在產品體驗中做出和西方國家不同的體驗。
像這些例子,從觀察到思考再到推論,靠的全是作者的洞察能力。這樣的洞察能力,我認為不只是在進行質性研究、觀察問題時用的到, 在進行量化研究、數據分析的時候,一樣能在數據解讀時有很大的幫助。因此,數據重點不在於大或小,而在於解讀與推斷的能力。


這本書大部分的章節,都在描述作者過去的案例。而在最後一段,作者總結了他在進行觀察時會經歷的整個流程,他取名為"7C"


蒐集(Collecting) 如何解讀觀察到的蛛絲馬跡?


線索(Clues) 觀察到什麼獨特的情緒反應 ?


串連(Connecting) 情感行為的結果是什麼?


相關(Correlation) 行為和情感最早在何時出現?


因果(Causation) 他喚起的情感是什麼?


補償(Compensation) 未滿足和未實現的渴求是什麼?


概念(Concept) 有什麼好點子能夠 [補償] 你發覺到的消費慾望?



透過上面所敘述的過程,作者才能將一開始觀察到的大量且複雜的資訊,一步一步梳理成為有用的線索。要培養這樣的能力,需要在日常生活中就隨時將自己的注意力打開,認真的"觀察"生活中的每個小細節,而非單純的"看"過。


 PS. 看完書才發現,"小數據獵人"跟之前讀過的"超級預測"同樣是寶鼎出版社發行的。然後必須要說,這兩本書的翻譯都滿有問題的,要讀的朋友可能要注意一下。(在博客來上這兩本書的書評都有提到翻譯的問題,個人覺得"小數據獵人"的翻譯雖然有些小問題,但整體來說還算算容易讀。"超級預測"的翻譯就真的有點誇張了...)







留言

這個網誌中的熱門文章

Power Pivot & Power Query 在不同介面上的 異與同

Power BI 101 - 新手最常遇到的第一個問題

為什麼我建議安裝 Power BI 英文版?