發表文章

Power BI 能解決哪些數據工作上的問題? Power BI 新手村 系列文章

圖片
如果你的工作與數據有關,是否曾經遇到以下的問題?   在資料處理/製作報表的工作中,一定必須做的工作就是 "資料清理" 。 說到資料清理,大部分的人應該都會覺得頭痛,因為這真的是件很煩人、很花時間、卻又不得不做的工作。  但如果我們把寶貴的時間&精力都花在資料清理,那麼能用在解讀報表或制定決策的這些 高價值工作 的時間勢必受到壓縮。  Power BI裡的 Power Query功能則可以輕鬆幫我們搞定這個問題,Power Query能夠將資料清理的所有"步驟"給記錄下來,並直接套用到所有後續新增的資料中。 因此我們只需要在第一次匯入資料時將所有清理資料的步驟執行一遍,後續的新增資料只要按一下"Refresh"就能輕鬆搞定。    以下在會議中的對話,對你來說是否熟悉?  「接下來跟各位報告本年度Q1~Q3的營業額趨勢...」  「我對今年的趨勢有點疑問,能不能將今年的數字跟 前兩年的趨勢 做比較?」  「前兩年的數據資料目前投影片中沒有,會後整理完再提供給您...」  根據多次課程中的調查, 超過50% 的學員曾經在會議報告時被問到 "簡報以外的資訊。"  雖然大部分被問到的問題都不難回答,但總是因為資料沒有先整理好,所以只能在會後再整理與回覆。 如果能在現場直接回答,除了討論能更有效率,也能在 主管心裡留下更好的印象 。 在Power BI的資料結構中,我們會把所有的資料轉換成 "量質" 的型態。只要資料完整,資料庫裡的所有數字都能在幾個拖曳與點選的操作下快速調閱出來。如果操作熟練的話,甚至對方 問題問完的同時,我們就能將算出答案 。     我們過去在數據工作上常常卡關,很多時候是使用的工具限制了我們的想像。 時代在變,數據工作的需求也在改變,但你用的工具有跟著變嗎?  用Power BI解放你對數據工作的想像!

用了Power BI,不做關聯式資料庫到底行不行?

圖片
在課堂上解釋關聯式資料庫時,我舉出關聯式資料庫最重要的兩個好處 : 1. 減少資料庫大小以加快運算速度 2. 減少人為輸入機會以減少人為錯誤。 但仍然有學員在下課空檔拿自己公司的資料來詢問 : 如果目前的資料結構已經相當完整,資料量也還不到需要縮減資料量才能正常運作的大小,是否就不需要做成關聯式資料庫的形式呢 ? 我的答案是 " 看需求而定,可以不用但做了會更好 " 。其實我在最一開始使用 Power BI 時也有這種疑問,因為我其實跟這位學員一樣,即使沒有做成關聯式資料庫,我的資料結構也已經夠完整了。但評估了幾個面向後,最後還是決定花點時間調整成關聯式資料庫的結構。除了上面已經提到的兩點外,下面再分享幾個重點讓各位可以自行評估。 一、是否有 " 有價值 " 的額外資訊可以加入分析 ? 例如在 " 日期維度表 " 中,可以加入財務年 / 季等資訊。在 " 業務維度表 " 中,我可以加上每位業務的所屬分店 / 地區,他的到職日 / 年資 … 等資訊。 二、需分析的資料庫的規模數量有多大 有的公司分工細,每位員工只需要負責單一報表,對這點可能沒什麼感覺。但如果你需要負責較多或較廣的資料面向時,可能會遇到以下的狀況 : 多個明細資料表 共用同個維度資料表,可避免重複工作 從圖中我們可以看到,時常會有不同的報表但有著相同的維度資料。這時如果有一個專屬的維度資料表,一來可以讓各報表共用,省下重複做的力氣外;二來在新增 / 更動維度表中的相關資料時,有統一的維度資料表會大大的降低維護資料所需的時間。 三、是否會有更複雜的資料表結構需要連結 ? 很多時候我們連結的資料表並非只有 " 單一明細資料表 (Fact table)" ;也可能需要連結兩個以上的明細表,或是還有延伸的維度明細表,這時關聯式資料庫就扮演了很重要的角色。 ( 在專業的說法,前者的結構稱為 " 星形結構 " Star schema ;後者的結構則稱為 " 雪花結構 " Snowflake schema 。以個人的實際經驗來說,其實後者出現的頻率比較高。 )

Power BI 更新 重要功能介紹 【2019年 3月~6月】

圖片
各位最近半個月如果有更新 Power BI 的話,一定會發現一個很大的不同 : 「介面的顏色變了 ! 」 雖然介面的顏色改變對操作使用上幾乎沒有影響,但卻是最讓人能夠第一時間感受到不同的地方。最近的 Power BI 除了介面有變之外,還有什麼好用的更新呢 ? 接下來在這邊跟各位分享最近幾個月比較重要的一些更新。 【 M language 介面更新】 2019 年 1 月開始, PBI 陸陸續續開始調整 M language 的編寫環境 "Advance editor" 。這讓過去很多對 M language 感到恐懼的使用者感到歡欣鼓舞。直到四月開始這些功能終於從 preview 階段進入正式階段了 ! 不管是用顏色來區別各種元件的屬性、或是直接跳出可選擇的項目,這些都能幫助使用者更快更方便的完成資料整理。    更方便清楚的M language編輯器 (in advance editor) 【 Power Query 的 資料分析功能 (Data Profiling enhancements) 】 你是否曾因為在 Power Query 中無法看到資料的完整面貌而困擾呢 ? 過去在 Power Query 裡,因為預設只能看到資料的前 999 筆資料。當後面的資料有問題時,我們通常無法第一時間知道 & 處理。導致常常資料分析到才發現有問題,必須再回頭去整理資料的情形。 在我個人的經驗中,反覆的回到 Power Query 中進行資料整理,是我在用 Power BI 分析資料時最浪費時間的一個狀況了。 有了 Data Profiling enhancement 的功能,我們可以在初步整理資料時就快速了解整筆資料的狀況,馬上針對可能需要處理的資料做進一步了解。 有了新的資料檢視功能,可以更快速了解整筆資料的健康狀況 【全新的 Model view ,方便管理過多的 table & measure 】 過去我在使用 Power BI 時,常常會覺得 table & measure 過多難以管理。我嘗試過許多方式、也參考了國外使用者的一些建議,但都覺得不太方便,直到二月的更新終於讓我解脫了。

三步五時就要更新,真的沒問題嗎? 關於Power BI的更新

圖片
「沒事千萬別更新啊 ! 」「每次一更新就會出問題」,類似這樣的說法不知道各位是否經常聽到 ? 在過去不論是討論到電腦軟體或是手機 APP ,我們總是對「更新」這件事情有著不太好的印象,像是介面被改得很不習慣、更新後的問題很多、甚至是原本免費的軟體在更新後就要開始收費等。因此包括我在內,很多人對於「軟體更新」的看法都是「能不更新就不更新」。 剛開始接觸 Power BI 的朋友們應該都會發現一件事 : Power BI 怎麼常常要我更新啊 ? 而且更新的連結總是把我導到 軟體下載頁面 ? 是要我整個軟體重新下載安裝嗎 ? 接下來就跟各位分享 PBI 讓我覺得最棒的一個部分 : 定期更新 ! 首先, Power BI 的更新確實需要重新下載整個安裝檔,但是在安裝時無需將原本的軟體解除安裝,只要直接安裝新下載的檔案即可。 再來,關於更新內容的部分,這也是這篇文章最主要想跟各位分享的 : Power BI 每次的更新都超有用 !!! 下面這張截圖,是 2018 年 12 月的更新內容。各位可以看到更新內容在整個畫面中,用條列式寫得滿滿的,有沒有很豐富的感覺 ? 基本上 PBI 從 2016 年開始,每個月的月中都會發布更新 ( 大約在 10~15 號左右 ) ,每一次的更新內容都是像這樣滿滿一整頁。除了文字解說外,微軟的開發人員也會錄製一段影片,針對每一個更新進行示範與解說,通常一個影片都要 30 分鐘左右才能講完所有更新內容。 你可能會想說,有些軟體的更新也是都寫一大堆字,問題是我每次更新都沒什麼感覺啊。這就要介紹一下 Power BI 的官方論壇了。前一篇文章在介紹 " 使用英文介面 " 時,曾經稍微提過 PBI 的官方論壇可以讓使用者提問 & 討論。但除此之外,其實還有一個很特別的區,叫做 "Power BI Idea" 。 在 Idea 區裡面的所有文章,都是 PBI 的使用者針對軟體使用上遇到的問題,提出 「 使用者希望的解決方法」 。在提出之後,所有使用者就會針對這個想法進行投票。並且微軟負責 Power BI 的開發者或 PM ,也會跳出來針對這個問題進行回覆。告訴大家這個想法是 可行 / 不可行;

為什麼我建議安裝 Power BI 英文版?

圖片
我在上課前的通知,都會建議學員安裝英文版的 Power BI 有些學員會問,為什麼建議使用英文版的介面。是不是中文介面翻譯有問題 ? 還是中文版和英文版操作上會有什麼不同 ? 邊學邊用,方便搜尋資訊 為什麼建議使用英文介面? 我個人在Power BI 的學習與使用上,就像剛開始使用Excel時一樣,常常都是邊學邊用,隨著遇到的新問題,我會透過各種管道尋求解答。 Excel由於已經非常普遍被使用了,因此網路上的中文資訊量非常多,很容易能夠找到中文的解答。但由於 Power BI 還是個很新的產品,目前中文的資訊相當有限 , 能搜尋到的大多是經過翻譯的微軟官方說明文件。官方說明僅有基本的說明資訊 ,且只有針對文字做翻譯,所有的說明圖片都還是英文的。 以我過去的經驗,大部分網路上有用的資訊,都 是由使用者所產生的,像是部落格文章、Youtube影片、論壇上的提問與解答等。目前這類資訊 都還是以英文為主,我個人在遇到問題的時候,基本上也都必須使用英文做搜尋。 然而因為翻譯的問題,很多時候中文介面的名稱並沒有辦法直接轉換成英文。舉例來說, " 交叉分析篩選器 " 就中文直翻的話,篩選器這個東西很多人會聯想到 "filter" 這個字,但事實上英文對應的名稱叫做 "Slicer" ( 如果您是用 "Power BI filter" 這樣的詞在網路上搜尋,會出現的通常會是 DAX 裡面的 filter 函式。 ) Google "power bi filter" 出現的前幾個結果,都是DAX中的filter函式 如同前面所說, PBI 還是個很新的產品,目前每個月也都會釋出一些優化的更新,再有經驗的使用者,也有可能會在使用上遇到問題。因此我認為在一開始就習慣使用英文介面,會讓後續遇到問題及查找資料上輕鬆許多。 方便自訂新量值/欄位 另外,不只是操作介面,我也建議大家在自訂新的量值(measure) 或 欄位(column)時,盡量也用英文來命名。原因有兩個: 1. 目前 Power BI在輸入中文時,如果是用微軟新注音,在還沒完成選字之前是看不到目前打的是什麼字的,這個時常造成我選字的困難。

Power BI 101 - 新手最常遇到的第一個問題

圖片
很 多使用者在學習使用 Power BI 普遍會遇到的第一個問題,就是軟體的 " 名稱混淆 " 。 像是已經報名了 2018 年 9 月份 Power BI 商業分析實戰營 的學員,有些已經開始詢問 : " 我應該用哪個版本的 Excel 才能安裝 Power BI" 、 "Power BI 的版本不同會不會有影響 " 、 "Power Pivot 要安裝嗎 ? 還有沒有其他要安裝的 ?" 其實我自己在剛開始使用 Power BI 時,也因為同樣的問題受到困擾。我想就在這邊一次解釋清楚。 Power BI( 以下簡稱 PBI) 有兩種 : "Excel PBI" & "PBI Desktop" 簡單來說, Excel PBI 算是 PBI Desktop 的前身,由四個依附在 Excel 下的增益集所組成 : Power Pivot, Power Query, Power View, Power Map 。但由於 Excel PBI 的視覺化功能受到諸多限制,因此後來砍掉重練,才演變成 PBI Desktop 這個獨立的軟體。 所以兩者的差異 可以簡單的理解成 : Excel PBI 是 PBI 第一代, PBI Desktop 則是第二代。 PBI Desktop 是現在微軟主力推廣的一款 獨立於 Excel 並且 免費 的軟體。它保留下原本 Excel PBI 中的 Power Query & Power Pivot 兩部分 ( 資料匯入及整理 ) ,並重新開發視覺化報表。由於獨立於 Excel ,因此使用上並不會受到 Excel 的版本影響,甚至電腦上沒有安裝 Excel 照樣可以使用。 至於 PBI Desktop 的版本,目前官方 " 每個月 " 都會發佈PBI的更新,使用者可以很方便的從網站上下載更新。可能很多人會擔心版本差異造成檔案無法正常開啟。不過我到目前為止已經經歷過 10 多次的更新,使用上還不曾遇到過大問題 , 頂多就是檔案中的新功能在舊版軟體無法顯示,只要把軟體更新就一切正常了 。

成為數據界的偵探--「小數據獵人」讀書心得 (Small Data)

圖片
'You see, but you do not observe. The distincion is clear' Sherlock Holmes Quote -A Scandal in Bohemia 在這個充滿資訊與數據的時代,統計學的各種方法與原理,普遍的被使用在各種科學領域中 ,甚至我們說 "這整個世界" 是由統計學所建構出來的也不為過。(之前提到過一本 「統計,改變了世界」 也有提到類似的觀念) 像是我們常常看到網路上有大學/碩士生找網友幫忙填問卷 ,或者是餐廳用餐完後填寫的滿意度調查表,都是統計分析的一部分。(這裡暫時不討論那些隨便做的、無用的、錯誤的分析) 如果你是社會科學相關學系畢業的(像是心理學、社會學、或者像我是公共衛生學系),或者是曾經接觸過統計學,又或者你曾經使用過spss、SAS或是R統計軟體,那你肯定更能理解我所說的。 不過以上所提到的所有方法,其實都只是研究方法中的一部份,我們稱之為量性研究(大部分的數據分析都屬於這部分)。那有量就有質, 然而質性研究則是許多人都忽略的一個重要項目,而這本書在我看來就是在跟讀者強調質性研究的重要性。 我還記得在讀碩士班的時候,我的老師曾經告訴我, 所有的量性研究都必須由質性研究開始 。這個觀念顛覆了當時我認為數據就是一切、就是證據、就是王道的想法。 質性與量性研究,像是天平的兩邊,應該是互補的 其實質性研究跟量性研究應該是相輔相成的。質性研究用來尋找問題,量性研究用來尋找答案,這兩者缺一不可。 然而現在我們常常還沒有尋找問題,就開始想要找答案。這樣的邏輯雖然看起來很荒謬,但我認為這正反映了一個狀況: "數據的取得過於容易,但人的思考並沒有更加進步"。 我想這也是作者在這個Big data的潮流在世界上盛行時,特地丟出小數據(small data)這個概念的用意。 不論是大數據或小數據,資訊背後的解讀永遠是通往真理的關鍵 開頭的引言,是福爾摩斯對華生說的話,我覺得很適合放在這篇心得文的開頭。這段文字出自"波希米亞醜聞"中,當時福爾摩斯面對久久未見面的華生,一瞬間就推測出了華生最近的生活狀況。華生在驚訝之餘,也詢問福爾摩斯是如何