資料視覺化算是現今處理資料的趨勢之一了,平常工作總是受限於Excel的圖表,但其實現今已有很多工具可以創造更多讓excel意想不到的美妙圖表~ Tableau就是其一,有美妙的圖表,就有美妙的心情阿!
現階段Tableau在美國相當流行,主要提供企業做資料圖表視覺化,強調簡易的拖曳方式就可以完成圖表,而且可以處理大量的資料,也可以連動資料庫程式語言系統如SQL、R等軟體,算是相當的強大。
安裝Tableau Public
Tableau有分為專業(Professional)、個人(Personal)、公開版(Public),其中專業版&個人版是要付費的,針對新手如果只是想練習一下感覺,最適合使用的是公開版(Public)。
安裝方式很容易,搜尋"Tableau Public"進入官方網站,輸入email後就會自動下載。
匯入資料
進去Tableau畫面後,可以根據不同的檔案選擇匯入形式,例如是CSV就選擇text file、若是excel形式就直接選擇excel,資料陳列的畫面很快就會出來,這時候可以看到自己的excel有哪些欄位,順便檢查一下有無遺漏。
匯入資料畫面 |
開始小試身手吧~
當資料匯入之後,在Tableau畫面下方的「Data Source」就是剛剛說的資料陳列的地方,只要在旁邊的新增sheet就可以開始簡單的Tableau拖曳之旅。
例如說我現在想要看每個地區(Region)不同品項(Item)的商品數量(Units)多少,原始資料分別有Region、Item、Units三個不同變數,那我就把Region拖曳到Rows那欄,Item拖曳到Column。
這時候表格會出現,但裡面數字還顯示abc,因為我們還沒有告訴Tableau我要加總的是"數量",因此Unit這個變數拖曳到表格裡做加總,馬上就產生一個簡潔清楚的數量品項總計表。
簡單的數量加總 |
想要做圖形變化也不難,像是剛剛那個表格我想要讓他更視覺化,只要按"Ctrl+1"就會出現「Show Me」的圖示,裡面有很多不同種類的表格可以任君選擇,終於開始有點色彩了!。
美化圖表 |
改變顏色、加入標籤
很明顯的改變顏色是在color裡面,但如何操作呢? 首先是要告訴Tableau要改變甚麼變數的顏色,然後把那個變數從左邊的清單中拖曳到color裡面,再點開color裡面的Edit,就可以針對不同的區域調整顏色,讓整體的色系統一按照自己想要的樣子~ 也順眼許多。
改變顏色 |
光是加顏色還不夠容易理解,通常都會加上資料標籤讓圖表的數字更顯而易讀。怎麼加上標籤呢? 最簡單的方法是從左列再拖曳一次變數,例如我要加上數量(Unit)的標籤,那我就從左列再拉一次Unit,只是這次是直接拉近Label~資料標籤就會快速出現啦,這樣閱讀更加簡單。
如果要調整字形,可以直接點選變數按右建用format去做調整,資料標籤也可以變更成貨幣或其他形式。
加入資料標籤 |
如何用Tableau做AB-Testing?
圖表最大的功用,是讓我們用視覺的方式看出比較上的差異,這個在做模型時特別有用。例如說我在幫銀行做甚麼樣的客戶容易流失,有一籃子變數想要先大概看看哪些變數比較有效用,可以在Tableau上做A-B Testing,快速篩選出有用變數。
假設我想先看看不同性別對於銀行流失有甚麼影響,怎麼操作呢? 首先先準備好每個性別裡面,流失跟沒有流失的客戶數量是多少,分別拖曳Gender(性別)/ Exited(是否流失) /Number of Records(有紀錄客戶數)這三個變數。
A/B TESTING: 先拖曳變數 |
可是這樣還不夠清楚,通常比較時會想用百分比去看,這時在SUM(Number of Records)按右鍵,出現一堆選項,選擇「Add Table Calculation」,並將Calculation Type改成「Percent of Total」,Computing Using改成「Table Down」,再微調一下字型就大功告成啦!!
A/B TESTING: 加總並轉換為百分比(%) |
比較表一眼就可以看出,銀行客戶裡面女性流失占比較高! AB-Testing不僅可以用來初步看一下比較結果,也可以順便確認資料裡面是否有奇怪的地方,對一開始整理變數十分有幫助。
A/B TESTING: 可以看出女性客戶流失占比較高 |
做好圖表該如何匯出?
完成了一張精心製作的報表後,該怎麼匯出呢? 若是使用專業或個人版本,可以按右鍵直接copy成image,再貼上文件就可以了,但免費的Public版本有所限制,只能從檔案中存檔到自己的Tableau Public帳號,然後再上去Tableau Public的網站上以圖片方式下載下來...過程有點麻煩,要簡單的話只能Print Screen了。
初探索Tableau感想
牛刀小試的學習了Tableau的介面,雖然公司內部並沒有這樣簡便強大的軟體可以運用,但是可以透過這樣的初步試探思考一下資料視覺化的邏輯。
1. 圖形極簡化,少邊線
我認為Tableau資料視覺化的優點除了操作方便快速以外,最重要的的是Tableau呈現的圖表都給人非常乾淨簡潔之感。
仔細觀察就會發現,Tableau的表格盡量將線條減到最少,表格上的線條、長條圖也不另外做框線,分隔盡量以淺灰淡色呈現,讓主視覺內容變得更明顯。
2. 選色
身為資料視覺化軟體自然不能不重視選色了,Tableau上預訂的顏色皆是精心挑選,就算使用者隨便挑也不會太難看,其中對比色的應用不會讓人覺得太突兀,但顏色跟顏色之間又都具有區別性。
3. 文字處理
以前我在處理文字上的標籤時,總是堅持同一張圖一定要同一顏色,但我發現Tableau會根據不同的背景作不同處理,例如長條圖是藍色,文字標籤就會變白色,同一個圖形長條圖是橘色,文字標籤卻用灰黑色處理,但不會讓人覺得不一致。
推薦學習資源
這堂課是包山包海的資料學習付費課程,不只有Tableau,還有資料分析理論、資料倉儲操作、資料演講心法分享等。
因為它分成四個部分講解,所以Tableau不會講非常深,但以入門來說已經足夠了。老師講解清楚照著操作可以十分容易上手~ 如果對Tableau還想深入學習,也可以參考Kirill老師的其他課程,有針對Tableau做的進階課程版本喔!
Tableau針對他們的軟體其實有出官方學習影片,而且算是非常有系統的規劃,只是影片的數量稍微多了一些,要耐著性子,且必須要先註冊才能看影片。
呂宗學老師的影片不多,不過他主要特別是針對健康相關的數據做出視覺化圖表,可以參考一下數據應用場景,並且有提到視覺化的一些概念~而且是中文的XD
這篇是一位Tableau內部工作者的大陸網友,整理學習Tableau可以參考的書、影片等,算是相當完整的蒐集了Tableau學習資源。
Tableau是新手比較容易上手的軟體,又可以做出賞心悅目的視覺化,而且可以用來檢視資料裡面是否有詭異的數字,一舉多得阿XD
沒有留言:
張貼留言