※02/28(和平紀念日假期),前述日期均停課,課程已順延。
課程內容
想成為一位資料科學家,必須對原始資料先有基本的認識,可以透過不同的視覺化圖型達到對資料分佈、趨勢、品質以及深入的了解。所以本課程將著重於四大重點:
(1)資料處理的各式技巧
(2)統計基礎概念以及
(3)繪製各式不同的統計圖表並解析
(4)整合強化物件導向的撰寫,同時可以達到程式重複使用(reuse)的目地。
報名此課程,需具備Python程式基礎能力者。如果尚未具有Python撰寫者,建議先修習【Python基礎程式設計--邁向人工智慧的利器】
課程內容 |
使用pandas模組,針對不同資料格式的匯入、匯出,資料清除處理、篩選方式、Pivot與Un-Pivot轉換技巧。 |
基本統計學的介紹,集中趨勢與離散趨勢的介紹,以強化圖型的了解與應用。 |
利用matplotlib、seaborn、plotly各式模組交互使用,繪製出各式各樣的統計圖表以及解析,包括常見的histgram、bar plot、pie plot、scatter plot、bubble plot、box whisker plot、heat-map、tree-map以及sankey plot。 |
強調物件導向的使用,將已經撰寫好的程式改寫成物件導向,讓程式的重複使用性提高,也利用撰寫過程中體會物件導向的重要性。 |
