2020年11月23日 星期一

【像極了愛情的大數據】大數據就像青少年間的性愛,每個人都在討論,但誰也沒有認真正瞭解!文/恆逸資深講師 吳翠鳳

Big Data is like teenage sex: everyone talks about it, nobody really knows how to do it, everyone thinks everyone else is doing it, so everyone claims they are doing it.

Dan Ariely – Professor of Psychology & Behavioral Economics


【大數據就像青少年間的性愛,每個人都在談論著它,但卻沒有人真正的了解它!每個人都覺得其他人有在做,所以便堅稱自己也做了 】,這是杜克大學的心理學與行為經濟學教授 - 丹·艾瑞里(Dan Ariely)在2013年對大數據下的註解。但是經過多年的翻滾後,那個曾經懵懂無知的青少年對於情愛的瞭解也逐漸成熟及穩定,而大數據想當然而也不遑多讓的與其互爭鋒頭。但問題是,每家企業一定要進行大數據嗎?大數據對企業有什麼好處呢?大數據的目標又是什麼呢?


大數據的目標是要將數據變小及將其視覺化,以便閱讀者容易解讀及決策。至於大數據是否一定需要或其好處為何?我們藉由下列案例來窺知一二,下面(圖一)表格便是公司將業務員今年與去年的業績數據記錄轉化為小數據彙總後之數字,若長官想瞭解每位業務員的表現,單從數字大小來看是不夠客觀的,畢竟每個人進入公司的時間長短是不一樣的,所以,我們希望藉由資料視覺化來展現業務員的表現,以讓主管清楚明瞭各業務員真實現況。


業務員姓名

去年業績

今年業績

今年業績目標

黎國明

6,568,670

9,265,014

10,000,000

劉天王

9,132,352

7,303,396

10,000,000

趙飛燕

8,438,299

5,852,528

9,000,000

蘇涵蘊

7,923,448

8,659,306

8,750,000

陳季暄

6,626,376

7,377,814

8,000,000

林美麗

6,964,457

7,060,029

7,850,000

張瑾雯

6,621,766

10,105,162

7,450,000

郭國臹

6,157,253

6,893,412

6,650,000

孟庭亭

7,777,570

6,093,676

6,000,000



作者建議上述資料應採用的資料視覺化之數據分析結果,透過(圖二)的上半部可看出今年業績比去年業績好的業務員有哪些人,而圖的左半部則可瞭解到今年有達成業績指標的有哪些業務員,換句話說愈左上角的業務員便是我們的MVP(Most Valuable Person),愈右下角的業務員應該是會被提出檢討及改進的人員,至於右上角及左下角就是此次進行數據分析額外得到的Bonus,原來這家公司業務經理的眼中釘是「黎國明」,護短的對象是「孟庭亭」,換句話說,這家業務經理是男性的機率頗大。呵,是不是發現原來大數據做的好,還可以兼做算命的工作;是的,當您可以跟數據對話時,企業不為人知的秘密便會自動浮現。至於身為公司的CEO看到此圖,接下來該採取什麼行動來挽留「黎國明」,亦或是該如何防止同樣的情境再次發生,這就暫不在此討論。不過,要可以做出類似下圖的大數據工具有那些呢?
 
(圖二)

目前進行大數據分析可使用的工具正是百家爭鳴的狀態,而下面(圖三)則是當前較為琅琅上口的數據分析工具的投入研究時間長短與商業價值提升之多寡的比較,所以該選擇哪個工具做為企業大數據的入幕之賓呢?
 
(圖三)

從圖中不難看出企業的短期首選似乎應為Power BI、Tableau或Qlikview,因為其可在較短的投入時間下得到較快的商業價值提升,但就長期來看,以乎R與Python才是首選;看來若想立馬看到些成效,我們就得先從Power BI、Tableau或Qlikview三者選個功能完整且有效的工具來當數據分析的主角!從(圖四)兩圖可做為您選擇上的參考。
  


(圖四)

由上面2019及2020兩年Gartner所發表的數據分析及商業智慧平台之魔法象限來看,不難看出目前微軟的解決方案在功能的完整性及執行能力上都居於領先地位;在此再偷偷告訴讀者一個小秘密,那就是目前微軟的解決方案在領導者區塊中算是CP值較高的。所以,我們就來看看這個高材生目前在數據分析解決方案提出的架構圖。
 
(圖五)

從(圖五)的架構圖不難發現Power BI Desktop是負責數據分析報表的創作,此時有人就會提出這個疑問:『有了Power BI Desktop,是不是就不需要Excel』,哦哦!答案當然是NO!因為Excel除了可以進行數據分析的工作外,它還是企業用來製作表格文件的必用工具,同時Excel還可用來製作表單、當作科學用計算器來進行複雜的計算、甚至還有人拿來畫畫,如果碰到重覆性的處理作業時,我們還可以拿出最後必殺絕招 - VBA巨集。

同時,微軟當時在設計及發展Power BI Desktop這個工具組時,有給設計此工具的程式開發人員一個設計目標,那就是要讓分析者在其現有的 "熟悉技術" 下,可以很容易且快速的上手Power BI Desktop,而這個 "熟悉技術" 指的就是Excel!當您開始使用Power BI Desktop這個工具時,您將會發現它的操作觀念處處都延續了Excel的靈魂及思想。

當要進行數據分析這個工作時,千萬不要有單一工具走遍天下的想法。我們應該要瞭解不同層級的大數據工具之目標與其優缺點,然後取其長處使用,以建置企業所需的數據分析之解決方案。所以,即使Python及R可能要花較長的時間研究才能提升商業價值,但因為Power BI這類的工具都是現成的套裝軟體,它沒有辦法完成的進階的功能,還可藉由R及Python這類的程式語言依企業所需加以延展大數據分析的功能。

Big Data從哪來的??

維多.麥爾荀伯格 (Viktor Mayer-Schönberger),他是大數據 (Big data: a revolution that will transform how we live, work, and think) 一書的作者,也就是從他開始,big data 這個名詞廣為流傳。維多他在牛津大學網路研究所任教,研究領域為網路治理和管制。

21世紀最性感的工作-資料科學師

被《哈佛商業評論》譽為21世紀最性感(Sexiest)的工作-資料科學師,平均年新13.2萬美元,遠遠超過蘋果等大型科技公司的資深工程師!根據美國商業智慧軟體公司SiSense調查研究指出,資訊分析相關人才起薪約為年薪5.5萬美元,換句話說,相較美國大學畢業生平均年薪為4.76萬美元,高出7400美元,而最高薪的資料科學家,平均年薪為13.2萬美元,打敗一票如蘋果、高通等大型科技公司的高階工程師

推薦課程

為了讓有意瞭解數據分析的人可以快速進入這個領域,我們設計了以下的學習路徑,希望學習者可以對微軟在數據分析的解決方案有個通盤的瞭解。

Excel商業數據分析系列

💡商業數據分析-Excel 2021 資料建置、統計與函數應用

活用函數以對任何統計工作迎刃而解,重塑Excel使用觀念,提升資料處理效率

💡商業數據分析-Excel 2021 資料彙整、過濾突顯與公式優化

製作出動態的資料表,方便日後維護、調整及分析








微軟資料科學家系列課程



0 意見:

張貼留言