Python数据挖掘应用培训
第一阶段: Python 基础精要,零基础也能学会
1. 语法初步
2. 列表、字符串和元组
3. 集合与字典
4. 条件和循环语句
5. 若干重要内置函数应用
6. 文件操作
7. 函数及其应用
8. 正则表达式
9. 数据库和 Python
10.排序算法、 动态规划算法、递归算法等算法
第二阶段:numpy、pandas等进行数据清洗和整理,充分统计分析数据
1. 整理数据(切片、产生随机数、复制、广播、排序等)
2. 数据索引和选择的各种方法
3. 数据的分组、分割、合并、变形
4. 缺失值和空值的数据处理
5. 时间序列数据处理、建模和预测(ARIMA)
6. 含中文数据的处理
7. 数据去重、去离群值
8. R语言和Python(pandas)数据整理和建模的比较
9. 描述统计和推论统计分析
第三阶段:Python机器学习算法和数据挖掘案例实战
1. 文本挖掘原理和案例(Logistic 回归模型对文本的分类)
2. 预测分析核心算法(图片的K-means聚类分析)
3. 机器学习经典算法(图片的识别和分类:PCA建模)
4. 概率统计(二维手写数字识别 KNN方法)
5. 数据可视化(推荐系统和精准营销 近邻方法、协同过滤)
6. 金融建模分析(数据可视化的各种情形)
7. 客户画像和精准营销(新闻的文本分类 TF-IDF准则、旅游新闻个性化推荐)
8. 算法和模型的优化(手写识别)
9. 模型精度评估和提升(朴素贝叶斯决策)
10.特征选取的方法(酒的品质分类预测)
11.佳K-means分类数(机器学习的格点搜索和参数寻优)
12.交叉验证(惩罚线性回归分类器)
13.不平衡数据处理(使用支持向量机识别和分类)
14.XGBoost 使用案例 (金融时间序列预测)
15.贝叶斯分析(机器集成学习算法)
16.逼近和优化 (随机模拟)
17.自然语言概率图模型(用户流失预警)
18 马尔科夫&蒙特卡罗(量化投资实战)