本书主要介绍了Excel 2021与Python和Power Bi Desktop相结合进行数据的采集、运算、分析、大数据处理及可视化等方面的内容,主要包括数据输入、图表设计、函数、名称、数据表结构变换、表格与结构化引用、数据模型、Python编程基础、爬虫程序、数据仓库、M语言、DAX语言等基础知识;数据排序、查找、透视、筛选、迷你图、切片器、分类汇总、数据建模等数据管理功能;采集文本数据、数据库数据和网页数据的方法;使用Python批量操作数据的方法,Power Query数据清洗与整合、Power Pivot数据建模与分析、Power View数据可视化等大数据处理方面的内容。 本书通俗易懂,内容翔实,重视知识性和实用性的结合,每章配有相应的习题,可作为高等学校数据科学(大数据)、经济管理、财政金融、统计、文秘等专业数据分析课程的教材,也可作为计算机应用和办公自动化方面的培训教材或参考用书。
李昌兵,工学博士,硕士生导师,教授。2007年12月毕业于重庆大学控制理论与控制工程专业,并获得工学博士学位;现任教于重庆邮电大学经济管理学院。中国系统工程学会会员。主要从事机器学习与自然语言处理、大数据分析及挖掘、复杂网络分析及优化等领域的研究。主持和参与了国家和省部级各类项目10余项。在《Intelligent Decision Technologies》、《系统工程理论与实践》、《系统工程学报》、《系统仿真学报》、《计算机集成制造系统》等国内外重要学术刊物上发表学术论文 40 余篇,其中SCI及EI检索10篇,CSSCI期刊10余篇。《控制与决策》、《通信学报》、《重庆邮电大学学报》审稿人。参编专著及教材5部,获各级教学成果奖3项。
第1章 Excel应用基础 1
1.1 工作表、单元格、公式和引用 1
1.1.1 Excel的数据组织和文件格式 1
1.1.2 模板、用户界面和工作表结构 2
1.1.3 工作表、单元格操作基础 4
1.1.4 公式和运算符 8
1.1.5 单元格引用 9
1.2 数据输入和编辑基础 12
1.2.1 Excel的数据类型 13
1.2.2 基本数据类型的输入 13
1.2.3 使用Tab键和Enter键输入选定区域的数据 16
1.2.4 输入相同数据 16
1.3 编号的输入 18
1.3.1 连续编号的输入 18
1.3.2 使用自定义格式产生特殊编号 19
1.3.3 超长数字编号的输入 20
1.3.4 使用“&”组合多个单元格数据 21
1.4 使用下拉列表输入数据 22
1.4.1 使用数据验证功能创建数据输入下拉列表 22
1.4.2 使用快捷菜单从下拉列表中进行数据输入 23
1.4.3 使用组合框创建下拉列表 23
1.4.4 使用数据验证功能创建二级下拉列表 24
1.5 设置受限输入数据 25
1.6 使用填充序列输入数据 27
1.6.1 内置序列的输入 27
1.6.2 自定义序列 28
1.7 行列转置输入 29
1.8 使用随机函数产生批量仿真数据 29
1.9 编辑工作表数据 30
1.10 数据格式化 33
1.10.1 格式化数字 33
1.10.2 文本格式化函数TEXT 37
1.10.3 格式化日期和时间 39
1.10.4 条件格式 40
小结 46
习题1 47
第2章 函数 51
2.1 名称 51
2.1.1 名称的定义 51
2.1.2 名称应用举例 54
2.2 函数简介 55
2.3 逻辑函数 57
2.3.1 比较运算和逻辑运算 57
2.3.2 条件函数IF 58
2.4 常用的统计函数 61
2.4.1 汇总求和函数 61
2.4.2 平均值函数 62
2.4.3 统计个数的函数 64
2.4.4 计算最值、中值、众数、百分比和排名的函数 65
2.5 数学和三角函数 68
2.6 日期及时间函数 70
2.6.1 Excel的日期系统 70
2.6.2 YEAR、MONTH、DAY、NOW和TODAY函数 70
2.6.3 WEEKDAY和NETWORKDAYS函数 71
2.6.4 EDATE、YEARFRAC和DATEDIF函数 71
2.6.5 日期函数举例——计算工龄、小时加班工资 72
2.7 常用文本函数 74
2.7.1 文本转换与合并函数 74
2.7.2 文本子串提取函数 76
2.7.3 文本重复、清理和替换
函数 77
2.8 错误信息函数 79
2.8.1 Excel的常见错误信息 79
2.8.2 错误信息函数 80
小结 82
习题2 82
第3章 动态报表与数据查找 85
3.1 表格与动态报表 85
3.1.1 表格概述 86
3.1.2 结构化引用和动态报表 88
3.1.3 删除重复数据 91
3.1.4 查询不同工作表中的数据 91
3.2 D函数与动态报表 92
3.2.1 D函数简介 92
3.2.2 D函数与表结合构造动态数据分析报表 93
3.2.3 使用D函数进行查找统计 95
3.3 查找与引用函数 96
3.3.1 使用行、列计算函数定位与提取数据 96
3.3.2 使用INDIRECT函数和名称查询其他工作表中的数据 98
3.3.3 使用ADDRESS函数和OFFSET函数进行定位查找与数据提取 99
3.3.4 使用CHOOSE函数进行值查询 102
3.3.5 使用MATCH函数和INDEX函数构造灵活多样的查询 103
3.3.6 使用LOOKUP函数查找不同工作表中的数据 106
3.3.7 使用VLOOKUP函数进行表查找 107
3.3.8 使用XLOOKUP函数查询数据行 112
3.4 文本比对和查找 113
3.5 使用SQL查询工作表数据 114
3.5.1 Excel SQL查询基础 115
3.5.2 SQL条件查询和多表查询 117
3.5.3 使用SQL进行分组统计查询 118
3.5.4 使用SQL从重复数据中提取不重复数据 120
3.6 数据提取与表格结构转换 121
3.6.1 随机编排座次表问题 121
3.6.2 提取间隔数据行问题 123
3.6.3 数据表行列转换问题 125
小结 127
习题3 127
第4章 数据管理与数据透视表基础 132
4.1 数据排序 132
4.1.1 排序规则 132
4.1.2 数字排序 133
4.1.3 汉字与字符排序 133
4.1.4 多关键字排序 134
4.2 数据筛选 135
4.2.1 自动筛选 135
4.2.2 高级筛选 137
4.3 数据分类汇总 140
4.4 数据透视表 143
4.4.1 数据透视表概述 143
4.4.2 建立数据透视表 144
4.4.3 建立多字段数据透视表 147
4.4.4 修改汇总函数并多次透视同一字段 147
4.4.5 修改透视表数据的显示方式 148
4.4.6 显示数据项的明细数据 149
4.4.7 按年、季、月对时间进行分组透视 149
4.4.8 筛选器在数据透视表和数据透视图中的应用 151
4.5 合并计算与多工作簿、工作表汇总 152
4.5.1 多工作簿中不同结构数据表的合并计算 152
4.5.2 同一工作簿中结构相同的多工作表汇总 154
4.5.3 数据链接与多工作簿汇总 155
小结 156
习题4 157
第5章 使用Python提高数据处理效率 159
5.1 Python编程基础 159
5.1.1 Python概述 159
5.1.2 Python编程环境搭建 160
5.1.3 数据类型、变量、表达式、赋值语句和切片 164
5.1.4 Python语句 172
5.1.5 函数 177
5.2 使用Python批量操作工作簿 178
5.2.1 基础知识 178
5.2.2 批量创建、更名和查找工作簿 180
5.3 使用Python批量操作工作表 182
5.3.1 基础知识 182
5.3.2 批量创建、添加和更名工作表 183
5.3.3 批量复制工作表 185
5.3.4 批量拆分每个工作表 189
5.4 使用Python批量操作单元格、行、列、区域和表 190
5.4.1 基础知识 190
5.4.2 批量读取、插入、修改工作表的单元格、行和列数据 191
5.5 Python批量格式化工作表、单元格 193
5.5.1 基础知识 193
5.5.2 批量添加网格线、合并单元格、设置行列字体和颜色 195
5.6 Python批量操作工作表数据 197
5.6.1 基础知识 197
5.6.2 使用Pandas读写Excel文件 203
5.6.3 使用Python批量合并工作表 207
5.6.4 拆分工作表并批量创建工作簿和工作表 211
5.6.5 使用Python批量计算多工作簿多工作表的数据 212
5.7 Python批量操作图表 217
5.7.1 基础知识 217
5.7.2 使用Matplotlib批量绘制图表 218
小结 220
习题5 220
第6章 数据采集与转换 224
6.1 数据采集与转换概述 224
6.2 文本数据采集 225
6.3 数据库数据采集 229
6.3.1 数据库采集的基本方法 230
6.3.2 Excel与Access的数据交互 230
6.3.3 使用Power Query采集数据库中的表 233
6.3.4 使用Python采集数据库中的表 238
6.4 网络数据采集 239
6.4.1 网络爬虫基本知识 239
6.4.2 使用Excel爬取网页表格数据 246
6.4.3 使用Python爬取网页数据 252
小结 259
习题6 259
第7章 数据清洗、转换与Power Query 263
7.1 商业智能数据分析 263
7.2 Power Query概述 264
7.3 Power Query应用基础 266
7.3.1 将查询表返回到Excel工作表中的基本过程 266
7.3.2 Power Query功能界面简介 267
7.3.3 Power Query操作基础 268
7.4 数据清洗的基本操作 271
7.5 数据合并 277
7.5.1 合并同一工作簿中结构相同的工作表 278
7.5.2 合并同一文件夹中结构相同的所有文件 280
7.5.3 使用追加查询功能合并结构相同的工作表 283
7.5.4 横向合并具有共同字段不同结构的数据表 285
7.6 数据表结构变换 290
7.6.1 理解透视列和逆透视列 290
7.6.2 将二维表转换为一维表 292
7.6.3 将一维表转换为多类型报表 293
7.7 筛选、条件列和分组运算 299
7.7.1 数据筛选 299
7.7.2 条件列 301
7.7.3 分组运算 302
7.8 M语言简介 303
7.8.1 M语言入门基础 303
7.8.2 表结构在M函数中的引用 306
7.8.3 M函数对象与学习方法 309
7.8.4 M语言应用案例 309
小结 314
习题7 315
第8章 数据建模与分析Power Pivot 317
8.1 Power Pivot基础 317
8.1.1 Power Pivot与Pivot 317
8.1.2 操作Power Pivot的基本过程 318
8.1.3 Power Pivot的基本操作 322
8.2 Power Pivot数据建模 325
8.2.1 关系数据模型 325
8.2.2 数据仓库模型 329
8.2.3 人力资源建模示例 330
8.3 DAX语言 335
8.3.1 DAX公式初体验 336
8.3.2 上下文:度量公式的运算基础 337
8.3.3 DAX语言基础 339
8.4 DAX函数 342
8.4.1 DAX函数与Excel函数的关系 342
8.4.2 日期和时间函数 344
8.4.3 数学和三角函数 346
8.4.4 文本函数和统计函数 348
8.4.5 逻辑函数和信息函数 348
8.5 筛选器函数和计算器函数 349
8.5.1 筛选器函数概述 350
8.5.2 Related和RelatedTable函数 351
8.5.3 Calculate函数 351
8.5.4 Calculate函数、度量值与上下文转换 353
8.5.5 Filter筛选器 355
8.5.6 All、AllSelected和AllExcept函数 358
8.5.7 唯一值、X函数与数据透视表“总计”不等的处理 360
8.6 RankX、TopN函数和排名 363
8.7 时间智能函数和人力资源分析模型中的度量公式 365
8.7.1 常用的时间智能函数 365
8.7.2 人力资源分析模型中的度量公式 367
小结 369
习题8 370
第9章 图表与数据可视化 371
9.1 Excel图表基础 371
9.1.1 认识Excel图表 371
9.1.2 图表设计功能简介 372
9.1.3 图表格式化 375
9.2 图表建立的一般过程 377
9.2.1 插入初始图表 378
9.2.2 图表设计 378
9.3 图表类型与基本用法 384
9.4 迷你图 388
9.5 图表设计技术基础 389
9.5.1 图表类型选择 389
9.5.2 数据表设计 391
9.5.3 使用格式化添加涨/跌柱线、垂直线、系列线和高低点连线 396
9.6 图表应用基础 397
9.6.1 使用树状图和旭日图进行经营分析 397
9.6.2 使用漏斗图分析商业过程中的流失率 398
9.6.3 使用瀑布图分析成本、工资结构 398
9.6.4 使用分析工具库中的直方图进行质量分析 399
9.6.5 使用甘特图进行项目进度管理 401
9.7 Power BI Desktop与数据可视化 403
9.7.1 数据可视化与Power View 403
9.7.2 Power View图表 404
9.7.3 Power View仪表板 404
9.8 人力资源分析模型可视化案例 407
小结 411
习题9 412
参考文献