本課程涵蓋NumPy數值計算、Matplotlib數據可視化、pandas統計分析、使用pandas進行數據預處理。同時也有大量的實操練習,鞏固學習效果。
1.有python基礎
2.有一定的數據基礎
掌握數據分析的流程
掌握python數據分析核心庫的使用,如numpy、pandas、matplotlib
了解常用數據分析(挖掘)算法的原理,熟悉機器學習的各個環節,并能利用相應的算法建模
熟練使用sk-learn進行數據挖掘
章節 |
主要授課內容 |
|
|
|
Python數據分析概述 |
1.數據分析的概念、流程、應用場景 2.數據分析常用的工具、python數據分析的優勢、常用類庫的介紹 3.Jupyter Notebook的安裝及使用 |
|
|
Numpy數值計算基礎 |
1.ndarray的創建、訪問、常用屬性 2.矩陣的創建 3.通用函數ufunc 4.廣播機制 5.數學知識 6.簡單統計分析,讀寫文件、排序、去重、常用統計函數 |
|
Pandas統計分析基礎 |
1.Series常用操作 2.DataFrame常用操作 3.讀寫不同數據源 4.數據過濾與轉換 5.時間序列操作 6.分組與聚合 7.透視與交叉表 |
|
|
利用pandas進行數據預處理 |
1.合并數據,堆疊合并、主鍵合并、重疊合并 2.清洗數據,處理重復值、缺失值、異常值的處理 3.標準化數據,離差標準化、標準差標準化、小數定標標準化 4.轉化數據 ,類別型特征處理為啞變量,連續性特征離散化處理 |
|
|
數據可視化 |
1.數據可視化概述 2.常用圖表,如柱狀圖、餅狀圖、直方圖、箱線圖等的介紹 3.matplotlib繪圖基礎,如基礎語法、rc參數、標簽刻度、子圖等 4.matplotlib繪圖實戰 5.pandas繪圖實戰 |
|
|
機器學習與挖掘建模 |
1.機器學習概述 2.機器學習分類 3.機器學習流程 4.機器學習評估 5.經典機器學習算法原理剖析,如 knn、kmeans、樸素貝葉斯、決策樹、線性回歸、邏輯回歸、支持向量機、關系分析等 6.關聯規則算法 7.時序模式 8.物體推薦算法 9.使用sk-learn建模,括數據集劃分、數據預處理、模型訓練、模型評估等 |
|
|
數據分析與挖掘實戰案例 |
1.招聘網站需求分析 2.航空機構客戶價值分析 3.財政收入預測分析 4.二手房房價分析 |