Python及数据分析培训大纲
1.Python概览
1.1为什么使用Python
1.2重要的Python库
NumPy
Pandas
SciPy
Matplotlib
1.3IPython
1.4 Python IDE的下载与安装
2.Python语言快速入门
2.1Python解释器
2.2语言设计特点
2.3对象的调用和属性
2.4import引入
2.5数据类型
2.6控制流
2.7数据结构和序列
2.8函数
2.9 文件和操作系统
3.IPython使用
3.1启动和运行
3.2对象内省
3.3异常和跟踪
3.4与操作系统交互
3.5测试代码执行时间
3.6IPython HTML Notebook
3.7利用IPython提高代码效率的几点提示
4.NumPy 4.1ndarray多维数组对象处理与运算
4.2元素级数组函数
4.3利用数组进行数据处理
4.4利用数组进行输入和输出
4.5线性代数
4.6随机数生成
5.Pandas 5.1Pandas数据结构介绍
5.2基本功能
5.3汇总和计算描述统计
5.4处理缺失数据
6.Pandas数据加载和存储
6.1读写结构化数据
6.2读写非结构化数据
6.3使用HTML和Web API
6.4使用数据库
7.Pandas数据预处理
7.1合并数据集(以merge和append为主)
7.2重塑和轴向旋转
7.3数据清洗
7.4字符串操作
8.Pandas数据聚合与分组运算 8.1GroupBy技术
8.2数据聚合
8.3分组运算和转换
8.4透视表和交叉表
9.绘图与可视化 9.1Matplotlib基本操作
9.2Pandas中的绘图函数
10.时间序列
10.1日期和时间数据类型及工具
10.2 时间数据处理
10.3 时期及其算术运算
10.4 时间序列绘图
10.5 移动窗口函数
11.Python在金融数据中的应用
11.1常见的金融数据处理与分析
11.2 Pyfolio资产组合表现与风险分析
11.3 Zipline历史数据回溯分析
12.大数据平台的搭建和应用
12.1Hadoop和MapReduce
12.2 Spark
12.3 PySpark及MLlib
12.4【案例与演示】
13.Scikit-Learn机器学习
13.1数据预处理
13.2 变量升维和降维
13.3 模型训练
13.4模型选择和调参
13.5 模型评估指标 |