【课程特色】
1、针对零基础开发、运维、运营等人员,本课程从Python数据分析基本知识、基础概念和基本技能讲起,涵盖Python数据挖掘流程、Python数据挖掘算法、Python数据表现能力到分析应用实战。通过知识讲解、课堂练习、技巧培养、实操验证和案例分析,由浅入深、由易到难、由理论到实践、由方法到案例,层层递进,课程回归到以学员能力提升为目标中来,内容注重基础教学、案例分析与经验传授,并结合学员工作情况进行内化,重点突出落地执行。
2、授课将紧密结合开发实战特点,将知识技能与开发结合到实践案例中,因材施教、贴合实际,帮助学员扎实掌握Python数据分析挖掘技能并提升实践操作能力。
【课程目标】
1、掌握Python数据挖掘流程,了解Python数据挖掘一般步骤。
2、掌握Python数据挖掘算法,了解Python数据分析挖掘工具的使用,提升问题解决能力。
3、增强Python数据表现能力,了解基本Python数据画图技巧。
4、实战应用,有效应对工作中的数据分析挖掘问题。
5、统一使用Python3进行授课。
【实施方式】专题讲授、案例分析、实操演练、经验分享等
【课程对象】一线开发、运维、运营以及新入职员工等
【课程时长】4天,7课时/天
【课程大纲】
1、Python数据挖掘基础
1.1、数据挖掘的基本任务
1.2、数据挖掘建模过程
▪ 定义挖掘目标
▪ 数据取样
▪ 数据探索
▪ 数据预处理
▪ 挖掘建模
▪ 模型评价
1.3 常用的数据挖掘建模工具
▪ 数据挖掘工具的重要性
▪ 常见数据挖掘工具
2、 Python数据分析简介
2.1、搭建Python开发平台
▪ 选择Python版本
▪ 运行操作系统
▪ 开发平台搭建
▪ Anaconda安装
▪ Pycharm开发环境
2.2、Numpy工具
▪ ndarray数组
▪ 数组索引和切片
▪ 数组的运算
▪ 数组的存取
▪ 实战:图像变换
2.3、Pandas工具
▪ pandas数据结构
▪ pandas索引操作
▪ pandas数据运算
▪ 层次化索引
▪ pandas可视化
▪ 综合示例—小费数据集
3、数据探索
3.1、数据质量分析
▪ 缺失值分析
▪ 异常值分析
▪ 一致性分析
3.2、数据特征分析
▪ 分布分析
▪ 对比分析
▪ 统计量分析
▪ 周期性分析
▪ 贡献度分析
▪ 相关性分析
3.3、Python主要数据探索函数
▪ 基本统计特征函数
▪ 拓展统计特征函数
▪ 统计作图函数
4、数据预处理
4.1、数据清洗
▪ 缺失值处理
▪ 异常值处理
4.2、数据集成
▪ 实体识别
▪ 冗余属性识别
4.3、数据变换
▪ 简单函数变换
▪ 规范化
▪ 连续属性离散化
▪ 属性构造
4.4、数据规约
▪ 属性规约
▪ 数值规约
5、数据挖掘算法
5.1、分类与预测
▪ 实现过程
▪ 常用的分类与预测算法
▪ 回归分析
▪ 决策树
▪ 人工神经网络
▪ 分类与预测算法评价
▪ Python分类预测模型特点
5.2、聚类分析
▪ 常用聚类分析算法
▪ K-Means聚类算法
▪ 聚类分析算法评价
▪ Python主要聚类分析算法
5.3、关联规则
▪ 常用关联规则算法
▪ Apriori算法
5.4、时序模式
▪ 时间序列算法
▪ 时间序列的预处理
▪ 平稳时间序列分析
▪ 非平稳时间序列分析
▪ Python主要时序模式算法
5.5、离群点检测
▪ 离群点检测方法
▪ 基于模型的离群点检测方法
▪ 基于聚类的离群点检测方法
6、电力窃漏电用户自动识别
6.1、背景与挖掘目标
6.2、分析方法与过程
▪ 数据抽取
▪ 数据探索分析
▪ 数据预处理
▪ 构建专家样本
▪ 模型构建
7、基于基站定位数据的商圈分析
7.1、背景与挖掘目标
7.2分析方法与过程
▪ 数据抽取
▪ 数据探索分析
▪ 数据预处理
▪ 模型构建
8、运营商用户流失分析
8.1、背景与挖掘目标
8.2分析方法与过程
▪ 数据抽取
▪ 数据探索分析
▪ 数据预处理
▪ 模型构建
授课老师
朱旭振 IT与数据分析实战专家
常驻地:北京
邀请老师授课:13439064501 陈助理

