课程目录:Python数据挖掘应用培训

4401 人关注
(78637/99817)
课程大纲:

      Python数据挖掘应用培训

 

 

 

第一阶段: Python 基础精要,零基础也能学会

1. 语法初步

2. 列表、字符串和元组

3. 集合与字典

4. 条件和循环语句

5. 若干重要内置函数应用

6. 文件操作

7. 函数及其应用

8. 正则表达式

9. 数据库和 Python

10.排序算法、 动态规划算法、递归算法等算法

 

第二阶段:numpy、pandas等进行数据清洗和整理,充分统计分析数据

1. 整理数据(切片、产生随机数、复制、广播、排序等)

2. 数据索引和选择的各种方法

3. 数据的分组、分割、合并、变形

4. 缺失值和空值的数据处理

5. 时间序列数据处理、建模和预测(ARIMA)

6. 含中文数据的处理

7. 数据去重、去离群值

8. R语言和Python(pandas)数据整理和建模的比较

9. 描述统计和推论统计分析

 

第三阶段:Python机器学习算法和数据挖掘案例实战

1. 文本挖掘原理和案例(Logistic 回归模型对文本的分类)

2. 预测分析核心算法(图片的K-means聚类分析)

3. 机器学习经典算法(图片的识别和分类:PCA建模)

4. 概率统计(二维手写数字识别 KNN方法)

5. 数据可视化(推荐系统和精准营销 近邻方法、协同过滤)

6. 金融建模分析(数据可视化的各种情形)

7. 客户画像和精准营销(新闻的文本分类 TF-IDF准则、旅游新闻个性化推荐)

8. 算法和模型的优化(手写识别)

9. 模型精度评估和提升(朴素贝叶斯决策)

10.特征选取的方法(酒的品质分类预测)

11.佳K-means分类数(机器学习的格点搜索和参数寻优)

12.交叉验证(惩罚线性回归分类器)

13.不平衡数据处理(使用支持向量机识别和分类)

14.XGBoost 使用案例 (金融时间序列预测)

15.贝叶斯分析(机器集成学习算法)

16.逼近和优化 (随机模拟)

17.自然语言概率图模型(用户流失预警)

18 马尔科夫&蒙特卡罗(量化投资实战)