成為數據界的偵探--「小數據獵人」讀書心得 (Small Data)

'You see, but you do not observe. The distincion is clear' Sherlock Holmes Quote -A Scandal in Bohemia 在這個充滿資訊與數據的時代,統計學的各種方法與原理,普遍的被使用在各種科學領域中 ,甚至我們說 "這整個世界" 是由統計學所建構出來的也不為過。(之前提到過一本 「統計,改變了世界」 也有提到類似的觀念) 像是我們常常看到網路上有大學/碩士生找網友幫忙填問卷 ,或者是餐廳用餐完後填寫的滿意度調查表,都是統計分析的一部分。(這裡暫時不討論那些隨便做的、無用的、錯誤的分析) 如果你是社會科學相關學系畢業的(像是心理學、社會學、或者像我是公共衛生學系),或者是曾經接觸過統計學,又或者你曾經使用過spss、SAS或是R統計軟體,那你肯定更能理解我所說的。 不過以上所提到的所有方法,其實都只是研究方法中的一部份,我們稱之為量性研究(大部分的數據分析都屬於這部分)。那有量就有質, 然而質性研究則是許多人都忽略的一個重要項目,而這本書在我看來就是在跟讀者強調質性研究的重要性。 我還記得在讀碩士班的時候,我的老師曾經告訴我, 所有的量性研究都必須由質性研究開始 。這個觀念顛覆了當時我認為數據就是一切、就是證據、就是王道的想法。 質性與量性研究,像是天平的兩邊,應該是互補的 其實質性研究跟量性研究應該是相輔相成的。質性研究用來尋找問題,量性研究用來尋找答案,這兩者缺一不可。 然而現在我們常常還沒有尋找問題,就開始想要找答案。這樣的邏輯雖然看起來很荒謬,但我認為這正反映了一個狀況: "數據的取得過於容易,但人的思考並沒有更加進步"。 我想這也是作者在這個Big data的潮流在世界上盛行時,特地丟出小數據(small data)這個概念的用意。 不論是大數據或小數據,資訊背後的解讀永遠是通往真理的關鍵 開頭的引言,是福爾摩斯對華生說的話,我覺得很適合放在這篇心得文的開頭。這段文字出自"波希米亞醜聞"中,當時福爾摩斯面對久久未見面的華生,一瞬間就推測出了華生最近的生活狀況。華生在驚訝之餘,也詢問福爾摩斯是如何...