SAS电商数据挖掘培训
1.数据挖掘与统计分析:
1.1 验证性还是探索性
1.2 问题如何量化
1.3 数据量(行、质量、列、重复利用) ;
1.4 时间、精确度与商业价值的折中
1.5 模型的相关性侧重
1.6 分析流程中侧重点的转移
1.7 图表与报告展示
1.8 SEMMA 分析流程——sample、explore、modify、model、assess
2.数据挖掘软件简介
2.1 sas(em) 、spss(modeler)
2.2 python、weka、intelligent miner
2.3 r、sqlserver、hadoop
3. 数据源:访问数据库及其不同文件格式
3.1 访问文本、Excel 文件
3.2 访问常用统计软件的文件格式
3.3 访问数据库(Oracle、mysql 等)
3.4SAS 数据源 DMDB;
4. RFM 价值模型;
4.1 直方图或散点图描述数据;
4.2 抽样:限制样本量;
4.3 分箱:数据离散化;
4.4 图形(热图)与制表:对 RFM 结果进行评价。
5. 预测分析:DM 回归与 logistic、神经网络、决策树;
5.1 案例 1:库存的优化方案(DM 回归和神经网络)
5.2 案例 2:客户流失模型(神经网络)
5.3 案例 3:客户重构分析(logistic)
5.4 案例 4:基于订购行为的营销分析(决策树)
6. 关联分析:购物篮分析
6.1 案例 1:购物篮分析及商品优结构特征优化;
6.2 案例 2:购物序列分析及购买推断;
7. 市场细分:聚类分析
7.1 案例 1:细分客户特征及异常检测
7.2 案例 2:大样本之两步聚类
8. 组合模型:评价及整合分析
8.1 案例 1:用户行为偏好的组合预测;
8.2 案例 2:用户行为偏好的模型整合分析;