张老师——《Python编程从入门到进阶》
一、课程背景
Python自诞生以来就受到了程序员和编程爱好者的追捧和青睐,在“程序猿”界Python是除了Java、C/C++/C#外最受欢迎的语言。近年来Python凭借其强大的扩展性和丰富的第三方模块,在办公自动化领域异军突起、大展拳脚,许多非编程的职场人士纷纷加入Python的学习队伍中。
Python的语法简洁易懂、容易理解和上手,因而想要入门编程,Python是最好的选择。同时对于职场中的非编程人员,将Python应用于日常办公中,通过Python和它强大的第三方模块操控电脑、操控办公软件,能够帮助大家摆脱机械性和重复性的繁琐事务,极大提高工作的效率,助力职场人士从容面对数字时代的挑战。同时,在数据分析领域,Python语言以其简单易用、拥有优秀好用的第三方库和数据分析的完整框架而深受数据分析人员的青睐。可以说,Python 已经当仁不让地成为了数据分析人员的一把“利器”。
一、课程收益
通过本课程学习,达到如下目的:
² 了解Python使用场景,能够搭建自己的编程开发环境。
² 掌握Python编程的基础语法知识、精髓及编程思想。
² 掌握常用的第三方扩展库的使用,特别是文件夹处理、word excel ppt文件处理;
² 学会使用Python提升职场常见办公场景的工作效率,如邮件自动化、网络爬虫。
² 了解Numpy库多维数组的创建、切片和索引方法,以及数组的运算和存取。
² 学会使用Pandas库完成数据的导入导出、数据整理和数据多角度分析的方法。
² 学习正则表达式及如何爬取网络数据进行数据分析。
² 学会使用Matplotlib模块绘制常用图表和高大上图表,以及如何与EXCEL联动;
² 了解机器学习概念,会使用Sklearn模块进行线性回归、逻辑回归的分析方法。
² 能结合课程学习到的方法和工具对本职工作中遇到的场景进行针对性分析。
一、培训对象
本课程适用于有一定office软件操作技能,需要进一步提升工作效率的办公人员,以及从事数据分析或与数据分析工作相关的职场人士。
课程大纲
第一章 Python环境搭建
*搭建自己的Python编程开发环境。
1、认识Python与环境搭建
1) What——什么是Python
展开全文
2) Who——谁在使用Python
3) Who——为什么选择学习Python
4) How——如何学习Python
5) Anaconda如何下载、安装与配置
6) IDLE VS Jupyter Notebook VS Spyder
7) Jupyter Notebook开发环境如何运行——编写自己的第一个Python代码
8) Spyder开发环境如何运行——编写自己的第二个Python代码
1、Python初体验——十秒钟快速创建100个Excel工作薄并统一命名
1) Spyder界面介绍
2) Python文件的打开、编辑与保存
3) 案例:认识一下Python代码的整体构成
2、模块的类别、安装、导入
² 内置模块
² 第三方模块
² 用PIP命令安装、卸载、升级模块
² Import语句导入模块
² From语句导入模块
实战:搭建并配置自己的Python运行环境。
第二章 Python编程基础
*掌握Python编程思想、编程语句、数据结构。
1、语法特点
² 缩进
² 注释
² PEP8编写规范
2、变量
² 变量的赋值
² 变量命名规则
3、数据类型
² 数值型:整型与浮点型
² 字符型:字符型的定义
² 逻辑型:1和0,或TRUE和FALSE
² 数据类型的查询:TYPE函数
² 数据类型的运算:数值型/字符型/逻辑型如何运算
² 数据类型的转换:Str()函数、int()函数、float()函数
3、数据结构
² 列表(LIST):如何定义/访问/增加/修改/删除
² 字典(DICTIONARY):如何定义/访问/增加/修改/删除
² 元组:如何定义/访问
² 集合:如何定义/访问
4、流程控制语句
² If语句——选择结构
² For语句——循环结构
² While语句——循环结构
² 循环结构中的break语句和continue语句
² 控制语句的嵌套
5、函数
² 常用内置函数:print()input()replace()/strip()/split()open()……
² 如何自定义函数:def语句
6、编程中的异常处理
练习:基本Python编程语句实战操作。
第三章 Python自动化办公基础
*学习Python中常用的模块,了解其应用场景,掌握其实现过程。
1、文件操作
² 打开文件
² 读取文件
² 写入文件
² 关闭文件
2、路径和文件夹操作
² 绝对路径VS相对路径
² 写入路径的三种方法对比
² 列出指定路径下文件夹包含的文件名称
² 分离文件主名和扩展名
² 重命名文件和文件夹
7、数据导入和整理操作——Pandas
1) 数据结构
² 序列(Series)
² 数据框(DateFrame)
2) 文件读写
² CSV文件的读取和导出
² Excel文件的读取和导出
3) 数据清洗
² 重复值处理
² 数据类型转换
² 字段拆分
² 数据选取与筛选
4) 数据合并
² 字段合并
² 追加合并
² 匹配合并
5) 数据计算
² 四则运算
² 时间计算
² 数据分组
第四章 Python自动化办公进阶
*实操内容,学员动手实操完成下述工作中常见的办公场景需求。
1、文件夹管理
6) 自动获取文件夹中所有文件的名称
7) 文件夹内容自动分类整理
8) 自动清理文件夹中的重复文件
9) 自动按照日期对图片进行分类并放置的不同文件夹中
8、文件合并、加密与转换(PDF/WORD/PPT)
1) 批量合并PDF文件
2) 批量加密PDF文件
3) 批量为PDF文件添加水印
4) 批量生成多份WORD文档(邮件合并)
5) 将WORD文档批量转换为PDF文件
6) 批量提取PPT中的文字
7) 批量提取PPT中的图片
8) 如何将PPT导出为图片和PDF
9、批量处理工作薄/工作表/行/列(EXCEL)
1) 批量新建、保存、关闭工作薄
2) 批量打开一个文件夹下的所有工作薄
3) 批量重命名一个工作薄中的工作表名称
4) 批量打印工作薄中的指定工作表/指定页
5) 按条件将EXCEL中的多个工作表合并为一个工作表
6) 按条件将EXCEL中的一个工作表拆分为多个工作薄
7) 精确调整工作薄中所有工作表的行高和列宽
8) 批量提取一个工作薄中所有工作表的特定数据
10、数据可视化呈现
1) 在Python中制作简单图表
² 条形图
² 饼图
2) 导入Excel数据制作简单图表
² 散点图
² 面积图
² 图表保存回Excel
3) 制作组合图表
² 双折线图
4) 设置图表相关元素
² 标题、图例、数据标签
第五章 Python邮件自动化
*学习如何使用Python代码操控邮箱
1、电子邮箱设置
11、利用yagmail库发送邮件基础操作
² 账户设置
² 正文设置
² 发送设置
12、利用yagmail库发送邮件高级操作
² 插入图片
² 插入附件
² 插入链接
² 多个收件人
² 发网页型正文
² 定时发送邮件
13、利用Imbox库获取邮件高级操作
² 获取邮件主题、发件人、收件人
² 自动删除邮件、归档邮件
² 自动下载附件
14、学习keyring库保护邮件授权码
第六章 数据分析理念
*了解数据分析的方法、工具和流程。
1、什么是数据分析?
² 概念与目的
发现数据规律——找到可行方案——指导管理决策。
² 数据分析三阶段
描述性分析,发生了何事
诊断性分析,为何发生
预测性分析,将发生何事
15、数据分析方法
² 对比分析
² 同比分析
² 环比分析
² 回归分析
² 聚类分析
² 时间序列分析
16、数据分析的工具
² 常规工具VS高大上工具
17、数据分析流程
1) 步骤1:明确目的
² 确定分析目的:要解决什么样的业务问题
² 确定分析思路:分解业务问题,构建分析框架
2) 步骤2:数据收集
² 明确收集数据范围
² 确定收集来源
² 确定收集方法
3) 步骤3:数据预处理
² 数据质量评估
² 数据清洗、数据处理和变量处理
4) 步骤4:数据分析
² 选择合适的分析方法
² 构建合适的分析模型
² 选择合适的分析工具
5) 步骤5:数据展示
² 选择恰当的图表
² 选择合适的可视化工具
6) 步骤6:报表撰写
² 选择报告种类
² 完整的报告结构
第七章 NumPy入门与实战
*学习NumPy库对多维数组的创建、切片和索引方法,以及数组的运算和存取。
1、ndarray多维数组
² 创建ndarray多维数组
² Ndarray的对象属性、数据类型及变换
18、数组的索引和切片
² 数组索引方法
² 数组切片方法
19、数组的运
² 数组和标量间的运算
² 数组的条件逻辑运算
² 统计运算
² 数组内如何排序
第八章 Pandas数据预处理
*学习Pandas库和xlwing库对文件的读写操作、数据整理的方法。
1、读、写数据
² 读、写数据库数据
² 读、写网页
20、数据操作
² 数据的增、删、改、查
² NaN数据处理
² 时间数据的处理
² 数据的抽取:字段拆分、记录抽取、随机抽样
21、数据的预处理
² 处理缺失值
² 去除重复数据
² 处理异常值
² 合并数据:追加合并、匹配合并
² 数据标准化:0-1标准化
案例实操:超市交易数据清洗。
第九章 Pandas数据分析
*学习Pandas中常用的数据分析方法。
1、数据的分组与聚合
² 数据分组
² 数据聚合
22、基础数据分析方法
² 批量升序/降序排序一个工作薄中的所有工作表
² 使用描述统计呈现数据的相关指标(如平均值、极值、%分位值、峰度系数、偏度系数等)
23、进阶数据分析方法
² 制作数据透视表进行交叉分析
² 分组对比分析(定性分组与定量分组)
² 使用相关系数判断数据的相关性
24、时间序列分析
² Datetime模块的时间数据类型
² 如何把字符型转为时间型数据
² 时间序列如何索引和切片数据
² 如何创建介于某时间区间的时间数据(天/月/固定天数)
案例实操:查看超市交易数据员工业绩波动、分析员工业绩。
第十章 Matplotlib模块数据可视化
*学习常用图表的绘制,以及如何与EXCEL联动。
1、制作简单图表
² 条形图
² 饼图
² 折线图
² 柱形图
25、导入Excel数据制作简单图表
² 散点图
² 面积图
² 箱形图
² 图表保存回Excel
26、制作组合图表
² 双折线图
27、设置图表相关元素
² 标题、图例、数据标签
28、绘图区域切分为多个空间
29、模块的交互使用
² Xlwings模块与pandas模块的交互
² Xlwings模块与matplotlib模块的交互
30、可视化模块拓展
² Seaborn模块可视化制作分类图
² Pyecharts模块制作箱线图
案例实操:绘制图表并在EXCEL文件中自动呈现
第十一章 爬取网络数据
*学习正则表达式及如何爬取网络数据进行数据分析。
1、认识网页结构和网页源代码
² 查看源代码
² 查看网页结构(区块/列表/标题/链接/元素)
31、正则表达式
² 认识普通字符和元字符
² 使用正则表达式提取数据
32、Request模块获取网页源代码
33、Selenium模块获取网页源代码
34、Selenium模块模拟鼠标和键盘操作
35、爬虫实战:
² 爬取某网站图书销量排行榜数据并分析
² 爬取某网站关于某关键词的实时新闻数据
² 爬取新闻热点排行榜
案例实操:引导学员自行寻找网站数据进行爬取
第十二章 Sklearn机器学习实战
*了解机器学习概念,掌握线性回归、逻辑回归的分析方法。
1、机器学习基本概念
36、机器学习库sklearn简介.
² 扩展库sklearn常用模块与对象.
² 选择合适的模型和算法
37、线性回归算法的原理与应用
² 线性回归模型的原理.
² sklearn中线性回归模型的简单应用+
² 岭回归的基本原理与sklearn实现
² 使用线性回归模型预测儿童身高
38、逻辑回归算法的原理与应用
² ..逻辑回归算法的原理与应用sklear实现
² 使用逻辑回归算法预测.考试能否及格
39、朴素贝叶斯算法的原理与应用
² 基本概念..
² 朴素贝叶斯算法分类的原理与sklearn实现
² 使用朴素贝叶斯算法对中文邮件进行分类...
40、案例:
使用线性回归分析对销售收入进行分析和预测
41、案例:
使用Pandas、sklearn模块对客户价值进行分析
约课交流v:jingwei_zhong
评论