2021年11月8日 星期一

資料分析課程詳細解說!用Python來做資料分析、機器學習、深度學習、人工智慧


資料演化的過程,大概可以分成下列的步驟:

資料(data) :有可能是內部或外部蒐集的資料,內部資料如人員名冊、物料清單、檢驗記錄等它也可經由分類、計算、更正、彙整、與文字化等方式,外部資料則如網路非結構化的資料等。

資訊(information) :屬經過有系統分析整理資料,會成為可由使用者解釋的特定訊息。資訊可採用文字、數字、語音、圖形、影像等不同的型態呈現,也可透過文件或視訊系統來傳送,提供接收者或使用資訊 的人調整他對事情的看法,更進而影響他的判斷與行為。

知識(knowledge) :知識是源於資訊比較、歸納、分析、整合成為對特定領域專業化的認知,它是人的心智活動的結果,具有強大的力量以產生巨大的企業價值。它是以法規、政策、程序書、作業規定等形態呈現。資訊轉變成知識的過程中,需要人們親自參與。

智慧(Wisdom):是一種分析、判斷、創造、思考的能力,或聰明才智。


人工智慧、機器學習 、深度學習

人工智慧(AI)是最古老但目前仍尚未被攻克的難關,最早可追溯到1950年代人們便開始發展人工智慧,目前最常用來達到人工智慧的方法,就是機器學習。也可以說機器學習就是達到人工智慧的手段。

而機器學習領域則有許多演算法的流派,目前知名度最廣泛的就是深度學習,深度學習是一種以神經網路為基礎的機器學習技術最終都是希望能達到AI人工智慧的目的。




用Python學習資料分析

Python 是一種直譯式 (interpreted)、開放原始碼、物件導向的語言。由於它是一種直譯式語言,因此它的程式碼在由 Python 虛擬機器執行之前,會先轉換成位元碼 (bytecode)。
Python 有幾項特點讓它成為機器學習的首選:

1.大量現成可用的強大套件。有些是專為機器學習所開發的套件,例如:numpy、scipy 和 panda。
2.可以很容易地快速建立原型 (prototyping)。
3.有各式各樣的協作工具可用。
4.從特徵截取、建立模型,一路到更新機器學習解決方案,資料科學家都能使用 Python 來作業,不必在不同階段變換不同的語言。



恆逸 Python資料分析 系列課程介紹

課程並沒有一定的先後順序,而是依照需求來做選擇。


蒐集資料到資訊整理的階段
【Pysp】 爬蟲與社群聆聽視覺化分析實務課程-使用Python,主要學習網路爬蟲、撰寫爬蟲腳本,配視覺化開發工具的HTML5作為呈現結果,打造Social Listening社群聆聽技術能力。

資訊處理、分析階段:
【BDPy】 Python與資料處理實戰演練,學習處理各種來源的資訊,使用Scala和Python處理Spark與非關聯式資料的內容,並且透過map/reduce作處理整理出有用的資訊。

【PyPD】 Python資料分析工具-使用Matplotlib、Numpy、Pandas,較適合針對既有資料,使用Python的Pandas、Matplotlib、NumPy模組對資料進行探索式分析。包含資料蒐集、清理、分析、視覺化等步驟,一步步地將資料精煉為資訊,再由資訊中提取出知識。

提取知識階段:
【PNLP】Python中文自然語言NLP深度學習專家課程,建議先上過第一階段的爬蟲課程,接續這堂課則著重在中文情感分析,資料萃取轉置工程、學會應用資料處理的Python套件。【PGGD】Python圖資料庫與知識圖譜開發實務,則是針對教您學會什麼是圖數據庫、NOSQL、設置Neo4j開發與伺服器環境、深入思考的複雜查詢與圖形操作可用性,建立知識圖譜網頁並提供查詢。

【PYML】Python機器學習-使用Scikit-Learn,廣泛的了解各種機器學習演算法的理論基礎,根據不同場景選擇正確的機器學習演算法。【PyKT】Python與機器學習深度學習-使用Keras與TensorFlow是從機器學習的原理應用出發,說明如何用Keras/TensorFlow作類神經網路的模型建立與使用。

智慧階段:
【AIOCV】AI電腦視覺OpenCV課程,是使用行之有年的影像處理函式庫OpenCV,除了用在傳統的影像應用程式之外,更被用於各式的深度學習,特別是跟影像相關的議題上,建立電腦視覺的基礎。






0 意見:

張貼留言