📚 课程介绍
本课程通过实战项目,深入讲解Python3在数据分析和挖掘建模中的应用,涵盖数据预处理、探索分析、模型评估等多个方面,适合有一定编程基础的数据分析爱好者。
📋 学习前提
1. Python基础(了解Python编程语言的基本语法和结构) 2. NumPy和Pandas库基础(熟悉Python的数据处理库,用于数据清洗和转换) 3. Matplotlib和Seaborn库基础(了解Python的数据可视化库,用于数据可视化)
📖 课程目录
第1章 课程介绍
1-1 课程导学
1-2 数据分析概述
第2章 数据获取
2-1 数据仓库
2-2 监测与抓取
2-3 填写、埋点、日志、计算
2-4 数据学习网站
第3章 单因子探索分析与可视化
3-1 数据案例介绍
3-2 集中趋势,离中趋势
3-3 数据分布–偏态与峰度
3-4 抽样理论
3-5 编码实现(基于python2.7)
3-6 数据分类
3-7 异常值分析
3-8 对比分析
3-9 结构分析
3-10 分布分析
3-11 Satisfaction Level的分析
3-12 LastEvaluation的分析
3-13 NumberProject的分析
3-14 AverageMonthlyHours的分析
3-15 TimeSpendCompany的分析
3-16 WorkAccident的分析
3-17 Left的分析
3-18 PromotionLast5Years的分析
3-19 Salary的分析
3-20 Department的分析
3-21 简单对比分析操作
3-22 可视化-柱状图
3-23 可视化-直方图
3-24 可视化-箱线图
3-25 可视化-折线图
3-26 可视化-饼图
3-27 本章小结
第4章 多因子探索分析
4-1 假设检验
4-2 卡方检验
4-3 方差检验
4-4 相关系数
4-5 线性回归
4-6 主成分分析
4-7 编码实现
4-8 交叉分析方法与实现
4-9 分组分析方法与实现
4-10 相关分析与实现
4-11 因子分析与实现
4-12 本章小结
第5章 预处理理论
5-1 特征工程概述
5-2 数据样本采集
5-3 异常值处理
5-4 标注
5-5 特征选择
5-6 特征变换-对指化
5-7 特征变换-离散化
5-8 特征变换-归一化与标准化
5-9 特征变换-数值化
5-10 特征变换-正规化
5-11 特征降维-LDA
5-12 特征衍生
5-13 HR表的特征预处理-1
5-14 HR表的特征预处理-2
5-15 本章小结
第6章 挖掘建模
6-1 机器学习与数据建模
6-2 训练集、验证集、测试集
6-3 分类-KNN
6-4 分类-朴素贝叶斯
6-5 分类-决策树
6-6 分类-支持向量机
6-7 分类-集成-随机森林
6-8 分类-集成-Adaboost
6-9 回归-线性回归
6-10 回归-分类-逻辑回归
6-11 回归-分类-人工神经网络-1
6-12 回归-分类-人工神经网络-2
6-13 回归-回归树与提升树
6-14 聚类-Kmeans-1
6-15 聚类-Kmeans-2
6-16 聚类-DBSCAN
6-17 聚类-层次聚类
6-18 聚类-图分裂
6-19 关联-关联规则-1
6-20 关联-关联规则-2
6-21 半监督-标签传播算法
6-22 本章小结
第7章 模型评估
7-1 分类评估-混淆矩阵
7-2 分类评估-ROC、AUC、提升图与KS图
7-3 回归评估
7-4 非监督评估
第8章 总结与展望
8-1 课程回顾与多角度看数据分析
8-2 大数据与学习这门课后还能干什么_音频
