使用Microsoft Power BI分析Facebook臉書_資料視覺化_Data_Visualization_Data_Mining

powerbi_home資料視覺化是當前資料科學重要的一環,涉及電腦、程式、資料、視覺各個層面的整合。簡單來說,就是透過圖形化工具,從資料當中萃取出精華,再以各類型圖表顯示,達到易讀易懂的目的。資料視覺化並非新事物,在國小數學課本當中,就已教導小朋友如何解讀與應用直方圖、圓餅圖、折線圖等統計圖表,來處理數學問題。資料視覺化在近年備受矚目的原因,乃基於大數據資料蒐集與分析技術的突飛猛進,各方爭相競逐如何快速處理與分析大量資料,產生簡單易懂的圖表結果,而能廣泛應用至各個領域,特別是商務分析。

網路龍頭Google在去年(2016)正式推出免費的資料視覺化工具Data Studio,有別於企業專用的Analytics 360 SuiteData Studio可說是Analytics 360 Suite的精簡版,且能免費提供給個人或小型團隊使用,其染指商務資料蒐集與分析領域的企圖,不言而喻。

而Microsoft(微軟)耕耘商業智能這塊領域,一直是不遺餘力且常有令人驚豔的表現。早在2012年左右,Microsoft雲端實驗室就已經推出過Data Explorer (資料存取增益集),可外掛在Office之下的Excel進行作業,並且與既存的Power Pivot(資料分析增益集)、Power View(資料展示增益集)共同運作。除了Data Explorer已經更名為Power Query,可讓使用者探索、合併與清整各類型的結構與非結構性資料(請參閱:免費程式:Microsoft Power Query for Excel,學習導入資料_Open Data_大數據分析入門),目前微軟更將三者結合為Power BI商業智能應用程式平台,使得人人皆有且熟悉的Excel,搖身一變具備成為同時可執行資料存取分析展示的強大鐵三角功能。

Power BI的功能繁多,本文先從當前主流社群媒體臉書(Facebook)談起。有關擷取臉書資料的討論,我在前文《臉書經營:使用Microsoft Power Query for Excel擷取Facebook頁面資料》已有詳述。但臉書資料的擷取,必須仰賴其API取得權限方可執行。然臉書的API隨著版本更新而內容亦有所變化,前文使用Power Query擷取資料時的API版本為v2.2;但是,臉書目前卻已將此版本給移除了!v2.2版本的API雖仍可使用,但不穩定(實際測試某些粉絲團的資料抓不下來),因此本文在臉書資料擷取的部分,是使用v2.8版本的API,特別在公式的寫法上,與Power Query略有不同,需留意。

只要您是Microsoft的用戶,恭喜您,這套誘人的應用程式不需任何費用,您只需到Microsoft的官網即可免費下載。Power BI整合了桌面版(desktop)、超值版(premium,2017年第二季推出)、手機版(mobile)等形式,透過雲端運算,隨時隨地皆可進行資料分析與視覺化,本文以桌面版為例,官方載點為:https://powerbi.microsoft.com/zh-tw/desktop/

一、下載Power BI Desktop

官方頁面如下圖,請選擇桌面版(Desktop),下載後執行:

powerbi_desktop_home

powerbi_booking


二、擷取臉書資料

(一)連接臉書:在Power BI主畫面點選「取得資料」,拉下選單後找到facebook,點選下方的「連接」按鈕。

powerbi_facebook01


(二)登入臉書帳號:出現「連線到第三方服務」的對話框,點選「繼續」,接著出現輸入臉書使用者名稱(name)或物件辨識碼(id)的對話框。此處必須注意:預設是me,意即自己的臉書帳號,如果要擷取粉絲團資料,則必須輸入該粉絲團的使用者名稱或物件辨識碼,下方「連接」的欄位,若要擷取所有貼文資料,則選擇「貼文」。輸入完成後,系統會請您以帳號登入臉書。至於他人帳號、社團等資料,則因臉書隱私政策有所改變,目前權限均已關閉。有關臉書使用者名稱與物件辨識碼的說明,請參閱前文:《臉書經營:使用Microsoft Power Query for Excel擷取Facebook頁面資料》。

powerbi_facebook02

powerbi_facebook03

powerbi_facebook04


(三)擷取資料:下圖為我自己的臉書資料擷取情形,在「查詢編輯器」的頁面中,資料擷取後仍會有隱藏的欄位,可視需要將其點開,方式請參閱前文:《臉書經營:使用Microsoft Power Query for Excel擷取Facebook頁面資料》。

powerbi_facebook06

powerbi_facebook08


(四)資料轉換:在「查詢編輯器」完成資料整理後,點選左上方「關閉並套用」後,將回到程式主頁面,同時進行資料擷取,視資料量大小決定擷取時間長短。

powerbi_facebook08-1


(五)擷取粉絲團資料:當您擷取自己的臉書資料,程式不會預設下載資料筆數;也就是說,從您開設帳號以來的所有資料都可以擷取下載。但如果是粉絲專頁,預設就會有資料下載筆數的限制,會出現「無法連接」的對話框而無法擷取下載。此時先按下「取消」,再點選上方的「編輯查詢」,此動作的意義是手動打開「查詢編輯器」的頁面,待「查詢編輯器」由新視窗跳出後,在公式欄位的地方,將臉書的API授權連接的語法更改,再按下enter鍵,系統即會開始擷取資料,完成後步驟同(四)。

本文以「玄大新聞」粉絲團為例,系統預設資料上限為100筆(v2.2預設為250筆,v2.8降為100筆),若要擷取粉絲團所有貼文資料,必須將公式改為:

= Facebook.Graph(“https://graph.facebook.com/v2.8/hcunews?fields=feed")

此處v2,8為API版本,hcunews為「玄大新聞」粉絲團的「使用者名稱」,?fields=feed為取得粉絲團所有文章的語法,請特別注意。

同理,若僅需擷取前200筆貼文資料,語法為:?fields=feed.limit(200)

若需擷取1/1-6/1時間內的貼文,語法為:

?fields=feed.since=2017-01-01&until=2017-06-01

若需擷取1/1-6/1內200筆貼文,語法為:

?fields=feed.limit(200)&since=2017-01-01&until=2017-06-01
powerbi_facebook05

powerbi_facebook07

powerbi_facebook09

powerbi_facebook10


三、資料視覺化

(一)資料檢視:前述步驟完成後,回到Power BI的主頁面,點選最左側三個小圖示中間的「資料」,即可檢視所有清整過後的資料。

powerbi_facebook11


(二)產生圖形:在主頁面最右側可看見「欄位」的區塊,列出所有資料的「類目」,包括產生時間、貼文內容、id、按讚者帳號、按讚者名稱、按讚次數…等。這些「類目」均取決於前面資料清整的步驟,哪些欄位要展開、哪些資料保留或刪除。旁邊的「視覺效果」區塊則表列各種不同的圖形展現方式,是資料視覺化最主要的設定點。此處以常見的「群組直條圖」為模板,在白色方格處勾選「貼文內容」為「橫軸」,「按讚次數」為「縱軸」,程式會自動作圖,即可得貼文按讚統計結果。滑鼠移至長條圖形處,還會顯示摘要資訊。

powerbi_facebook12


您應該已經發現:資料視覺化的哲學,就隱藏在看似單純的「橫軸」與「縱軸」上面。換句話說,「橫軸」與「縱軸」有如兩個變項,當您決定了「橫軸」與「縱軸」各自所代表的資料內涵或數值,也就是在探討兩個變項之間,是存在著甚麼樣的關係,絕非僅是求取色彩鮮艷、圖形花俏而已。

以上概略介紹Microsoft Power BI的三大核心:資料擷取、分析、視覺化等功能,在當前大數據方法當道,微軟意圖雄霸商業智能,無所不用其極籠絡使用者的苦心,著實令我體驗深刻。

文末,我想強調:即使Power BI功能強大且便利,然而毫無頭緒又漫無目的亂抓資料,甚至期待程式能夠自動告訴我們發現了甚麼,儘管資料龐大,也只是大量的垃圾而已。我們仍然要回歸到「資料」的來源(代表甚麼)、「資料」的類目(探討甚麼)和「資料」的類型(名類、次序、等距、等比)上面去思考:到底我們需要甚麼樣的資料?去哪裡找這些資料?這些資料能夠解釋些甚麼?以及如何讓這些資料有意義又淺顯易懂。無論我們是否使用大數據方法,這些應是資料蒐集與處理的基本要求。

有關Microsoft Power BI的其他應用,限於篇幅,將為大家持續介紹。

參考資料

教學課程:使用Power BI Desktop的Facebook分析

廣告

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com 標誌

您的留言將使用 WordPress.com 帳號。 登出 /  變更 )

Google+ photo

您的留言將使用 Google+ 帳號。 登出 /  變更 )

Twitter picture

您的留言將使用 Twitter 帳號。 登出 /  變更 )

Facebook照片

您的留言將使用 Facebook 帳號。 登出 /  變更 )

連結到 %s