课程目录: Python数据分析从入门到机器培训
4401 人关注
(78637/99817)
课程大纲:

        Python数据分析从入门到机器培训

 

 

 

章节1:课程知识体系及搭建运行环境
1课程知识体系介绍和Anaconda的安装
2Jupyter Notebook使用介绍
3文本课程PPT
章节2:Python科学计算基础——Numpy
4Ndarray数组的创建
5Numpy的数据类型
6数组的切片和索引
7Numpy广播与数组操作
8数组合并与通用函数
9Numpy的统计函数
10Numpy随机数、逻辑运算与数据存取
章节3:Python数据可视化
11Matplotlib绘制基本图形
12设置图表的线型和标签
13设置图例和刻度
14绘制多图
15箱型图、直方图和饼图
16面向对象绘图
章节4:Pandas基础试看
17Python数据结构——认识Seires
18Python数据结构——认识DataFrame
19DataFrame添加删除数据及运算特点
20数据排序
21数据观察和汇总统计方法
22数据加载与存储
23合并数据集
24数据清理:重复值、缺失值、异常值
25字符串处理与应用函数处理数据
26布尔过滤与数据离散化
章节5:Pandas基础实例
27文本课程数据集下载
28数据分析实例:知乎用户数据分析
29数据分析实例:空难数据预处理
30数据分析实例:向量化运算、成员关系判断与布尔过滤
章节6:Pandas高级应用
31Pandas绘图
32数据聚合与分组运算
33数据分析实例:小费数据集
章节7:Pandas进阶实例
34链家成交数据分析——读取与合并
35链家成交数据分析——数据转换与离散化分析
36链家成交数据分析——分组运算与布尔过滤
37链家成交数据分析——透视表
38链家成交数据分析——分组运算应用自定义函数
章节8:Pandas时间序列
39时间序列基础——认识时间索引、创建时间序列
40时间序列基础——时间序列的索引与重采样
41时间序列分析实例——中国铁建股票分析
章节9:机器学习基础
42机器学习的定义与分类
43线性回归和机器学习的一般步骤
44线性回归模型的评价
45多元回归模型简介
46多元回归模型的建立与评价
47多元回归模型的改进
48K均值聚类算法的解析
49K-means聚类的代码实现
50小麦数据集应用聚类算法
51逻辑回归算法简介
52德国信用卡欺诈数据分类
章节10:机器学习综合实例——房产价格预测
53房产价格预测模型——数据预处理
54房产价格预测模型——一元回归
55房产价格预测模型——多项式回归
56房产价格预测模型——模型的评价
57房产价格预测模型——从数据出发的模型选择
章节11:机器学习综合实例——房产估价模型
58房产估价模型-数据预处理-数据和特征选取
59房产估价模型-数据预处理-字符串处理
60房产估价模型-数据预处理-独特编码
61房产估价模型-数据预处理-特殊编码形式
62房产估价模型-多元回归建模
63房产估价模型-模型的评价与使用模型
章节12:房产价格聚类模型
64K均值聚类的不足与劣势
65DBSCAN算法原理介绍
66DBSCAN算法的具体应用
章节13:房产价格增幅预测模型(投资前景预测模型)
67房产价格增幅预测——时间序列的处理
68房产价格增幅预测——时间序列的处理
69房产价格增幅预测——小区数据选取
70房产价格增幅预测——选取特征数据(一)
71房产价格增幅预测——选取特征数据(二)
72房产价格增幅预测——划分训练数据和测试数据
73房产价格增幅预测——建立预测模型
74房产价格增幅预测——模型的改进与特征选取
章节14:深入机器学习理论基础
75认识过拟合和欠拟合
76决策树算法原理
77决策树算法应用-泰坦尼克数据的预处理
78决策树模型的建立以及参数的选择
79交叉验证和多参数的选择
80随机森林算法的原理
81随机森林算法的代码实现
82支持向量机算法原理
83使用SVM模型解决德国信用卡数据分类问题
章节15:协同过滤推荐算法
84协同过滤的基本原理
85余弦相似度的计算(一)
86余弦相似度的计算(二)
87文本电影推荐练习作业
88基于项目的协同过滤
章节16:附属章节:电影推荐作业
89电影推荐实例——数据读取与选择
90电影推荐——计算相似的用户
91电影推荐——预测推荐的电影
章节17:自然语言处理
92自然语言处理 tf-idf 算法简介
93随机森林算法处理多分类问题回顾
94航空公司twitter评论数据预处理
95文本分类的模型实现和优化
96朴素贝叶斯算法原理
97朴素贝叶斯算法解决文本分类实例
98模型的评价-查准率、召回率、F1-score及混淆矩阵