为什么要学习数据分析
以往在增量时代,每天都有新的领域、新的市场被开发。尤其是在互联网、电商等领域的红利期,似乎只要做好单点的突破就能获得市场。在那个时代,业务运营主要依 靠经验和直觉驱动。例如跨境电商领域初期,凭借世界工厂平台的优势,国内厂家只需 基于经验选品即可大卖。
但是随着规则的成熟,更多玩家的进入,市场从蓝海变为红海,进入存量期,仅靠 经验驱动的增长模式不再有效。还是拿跨境电商举例:由于卖家剧增,海外市场饱和, 跨境电商进入存量运营时代,已经不存在绝对的蓝海市场,每个细分领域都有许多竞争对手。
此时,要求商家从粗放运营转为精细化运营,由经验驱动转为数据驱动,而这个转变中最重要的一点就是数据,也就是用数据分析报告决定市场是否值得投入,用数据选 品,用数据做经营分析,用数据管理库存。
从这个角度来看,数据分析已然成为了大数据时代各个岗位的通用能力。因此,为 了保持竞争力,任何人都有必要用数据分析能力武装自己:利用数据思维分析问题,依 靠数据支撑决策。
如何开始 数据分析师胜任力模型
由于数据分析是一门综合学科,相关的知识点繁杂不一,许多初学者会有一种 不知如何开始的迷茫感。
大家都知道《西游记》中孙悟空会 72 般变化,《列仙传》中给出的神仙也是 72 位, 传说中黄帝战蚩尤也是经过了 72 战才胜利。可见人们对72这个数字的认知和接受 程度较深。
因此,有多年数据分析工作经验的笔者团队汇总并撰写了 72 个数据分析核心问题, 沉淀出了完整的数据分析能力知识体系,帮助读者全面认识数据分析。
下图是数据分析师胜任力模型,包括底层认知、业务场景、能力三板斧三个部分: 首先,底层认知是对数据的基本认知,强调数据思维的应用。 其次,业务场景指的是只有对业务有足够的理解,才能开展分析工作,而这里
包括了用户、产品、场景三个方面。 最后,才是硬实力对应的能力三板斧,包括工具技术、项目能力、思维方法。
底层认知、业务场景、能力三板斧共同铸造了完整的数据分析能力,相辅相成,而 本书则是围绕着它们展开介绍。
本书内容介绍
1. 底层认知
本书第 1 章主要讲解数据分析中的底层认知。 在建立数据分析思维之前,应该先在底层认知达成共识。什么是认知?是对事物底层逻辑的了解,是对世界万物的判断。认知的本质就是做决定,也就是说,为了帮助判 断数据分析中每个决策的有效性(选择什么指标、分析方法?接下来做什么?等等), 需要先建立底层认知。
本书第 1 章通过 11 个问题对数据分析的底层认知进行详细的讨论。这一步,我们 需要对数据分析的概念进行讨论:数据分析是什么?数据分析的价值点在哪里?
(1)数据分析是什么?
大家在求职过程中会发现,同样是数据分析师岗位,但是面试的内容千差万别,有 考查机器学习、统计学等专业能力的,也有考查市场 / 行业分析的,还有考查产品分析 的。此时就有读者问,这些真的是数据分析该做的吗?
我们从字面上拆解,数据分析 = 数据 分析,进一步拆解: 数据能力 = 统计学 机器学习 建模能力 工具使用 …… 分析能力 = 经营分析 用户分析 产品分析 ……
这就是认知上的偏差:当一些读者认为数据分析就是用 Excel 做表、用 Python 写脚 本、用机器学习建模时,其实求职市场对数据分析师的要求更为完整。
既然说数据分析 = 数据 分析,那分析的本质是什么?当我们在谈论分析时, 一般会谈论以下几点:
●发生了什么追溯过去,了解真相。
●为什么发生洞察事物发生的本质,寻找根源。
●未来可能发生什么掌握事物发展的规律,预测未来。
●我们该怎么做基于已经知道的发生了什么 为什么会发生未来可能发生什么的分析,确定可以采取的措施。
分析的本质,即面临各种问题时,能通过数据找到问题,准确地定位问题,准确地
找到问题产生的原因,为下一步的改进找到机会点,也就是所谓的数据驱动。
在数据分析相关岗位求职的过程中,读者会发现有许多不同的职位名称,这些职位
有什么区别联系?详细内容可参阅 第6问:数据分析领域主要的岗位有哪些?
回过头来看,数据分析到底是什么?笔者团队认为,数据分析是一个利用数据能力
做分析的过程:发现问题,分析原因,然后给出落地建议。这还是一个解构的过程:
从整体到局部,从一般到特殊,从面到线到点,不断下钻剖析,找到具体可落地的点。
同时,也是从业务到数据,再回到业务的过程:起点是业务需求,需要专业分析师转换为数据问题,最终的分析结论需要回到业务场景中落地。
在这个过程中,数据分析师需要借助指标,甚至是多指标编制的指标体系进行业务洞察。本书第3、4问将围绕指标展开论述。
(2)数据分析的价值点在哪里?
社群中,经常会看到关于数据分析师价值的讨论:数据分析师天花板很低。还有一些劝退数据分析的文章。这些脱离场景、只讲问题不讲解决方案的内容除了徒增焦虑外,别无用处。
为了更好地了解数据分析的定位,有必要对其起源进行讨论,只有了解为什么市场会产生数据分析师岗位的需求,才能清楚这个岗位在业务运营中的作用定位。(详细内容可参阅第2问:数据分析是怎么来的?)
在业务运营中,定位是重要的起点,理解数据分析价值在企业如何落地,能帮助读者解疑答惑。(详细内容可参阅第9问:数据分析的产出价值是什么?)
2.业务场景
前面,我们讨论过数据分析是一个从业务需求出发再回归业务的过程。从这个角度做定义的目的是强调业务场景的重要性:脱离业务场景的分析往往无法落地。
根据业务经验,笔者团队总结了一套便于理解的模型:业务场景 = 用户 产品 场景。
也就是说,要理解业务,就要了解用户,熟悉产品,明确分析所处的场景。它们决定了分析的目标、处理逻辑以及落地建议。
此部分在第60~63问有更详细的介绍。
3.能力三板斧
对数据分析有了底层认知、了解业务场景后,就需要有看得见、摸得着的招式来行动:通过思维方法、工具技术和项目能力这三板斧组成不同的招式以应对多变的问题。
经常看到有人说数据分析如做饭,如果是这样的话,工具技术就是铲子、铁锅、勺子等器皿,思维方法就是切配、烹饪、打荷等手法,项目能力则是最后的装盘上菜。
(1)思维方法。
本书第2章主要讲解数据分析中的思维方法。
很多人学做饭,可能是因为在抖音或B站看到某个美食视频,然后就开始按照视频展示的步骤备料烹饪。这个过程,也就是数据分析中学习思维方法的过程。数据分析要先有思维方法,才能谈得上分析。
刚开始学做饭时,通常先学基础的煎、炒、炸、烤、煮、蒸、焖、拌等烹饪方式。
这些基础的能力在数据分析中就是统计学、相关分析、归因分析等通用分析思维。
正如美食有八大菜系,分别满足不同地域人群的口味,数据分析在不同场景下,也有不同的分析招式来满足不同的业务需求:
●用户分析:同期群分析、漏斗分析、RFM用户分层模型等;
●产品分析:竞品分析、帕累托分析等;
●商业分析: PEST分析、SWOT分析等;
●……
(2)工具技术。
本书第3章主要讲解数据分析中的工具技术。
习得了做饭的方法后,就可以选择几件趁手的器皿,来提高烹饪效率。之所以不是先选择器皿再研究做饭流程,是因为工具始终是工具,完成同一个目标或许有多种工具可以实现,再不济用原始的土灶也能烧饭。对于部分复杂的烹饪需求,则需要选择特定
的器皿才能完成。
对于初学者而言,建议学习高性价比的分析工具,如Excel、SQL、Python、PowerBI等。
(3)项目能力。
本书第4章主要讲解数据分析中的项目落地。
菜做好后一定要及时出锅、装盘、上菜,项目能力强调的是数据分析项目在业务侧的落地。理论的分析方法如何在业务场景中落地赋能,如何体现数据价值,这是很多企业数据团队在讨论的课题。
首先,理解并刻意练习落地思维对数据分析价值的体现大有裨益(第54~57问)。
其次,学习实际场景中数据分析如何落地驱动业务的案例,能为实操提供参考(第64~67问)。
数据分析项目价值落地的最后一公里是报告呈现,学会用数据讲故事,横向跨部门沟通、向上汇报都依赖结构化思维,报告呈现(第68~70问)会有详细的讨论。
小结
本书定位于数据分析的知识框架,更多是横向地补充知识范围,故因篇幅所限,单个知识的纵向深度无法穷尽,但本书已经针对各知识点的核心及高频问题进行回答。在阅读的过程中,倘若对某个知识点有深入学习、探索实践应用的进一步需求,读者可以通过知乎等平台补充学习,在本书的基础上,针对核心方法论,对技术工具做延伸的阅读学习。
此外,笔者团队准备了一份与本书搭配使用的小册子,请扫码获取。本书勘误、知识加餐等内容也会放在小册子中。
可以关注笔者团队的微信公众号:木木自由、数据分析星球、饼干哥哥数据分析,这三个公众号专注于数据分析思维、方法、工具、项目能力及案例的分享。
作者
第 1 章 底层认知
1.1 基础认知
第 1 问:数据分析怎么学?本书学习指南 / 2
第 2 问:数据分析是怎么来的?数据分析极简发展史 / 4
第 3 问:什么是数据指标? / 6
第 4 问:常见的指标有哪些? / 9
第 5 问:对于数据分析领域,统计学要学到什么程度? / 10
第 6 问:数据分析领域主要的岗位有哪些? / 13
1.2 底层逻辑 / 17
第 7 问:如何建立完整有效的数据指标体系? / 17
第 8 问:数据指标体系如何应用?数据监控体系 / 21
第 9 问:数据分析的产出价值是什么? / 24
第 10 问:数据分析的常见陷阱有哪些? / 26
第 11 问:如何让数据驱动业务?数据分析流程 / 28
第 2 章 思维方法 / 32
2.1 数据思维 / 33
第 12 问:什么是数据思维? / 33
第 13 问:怎么使用数据思维? / 35
第 14 问:怎么训练数据思维? / 38
2.2 通用分析方法 / 41
第 15 问:什么是数据异常分析? / 41
第 16 问:什么是描述性分析? / 43
第 17 问:什么是对比分析? / 46
第 18 问:什么是细分分析? / 48
第 19 问:什么是归因分析? / 52
第 20 问:什么是预测分析? / 56
第 21 问:什么是相关性分析? / 58
第 22 问:什么是二八定律 / 帕累托定律分析? / 61
2.3 商业分析方法 / 63
第 23 问:什么是 PEST 分析? / 63
第 24 问:什么是 SWOT 分析? / 65
第 25 问:什么是逻辑树分析? / 68
第 26 问:什么是STP 4P分析? / 71
第 27 问:什么是波士顿矩阵分析? / 73
第 28 问:什么是 5W2H 分析? / 77
2.4 产品分析方法 / 79
第 29 问:什么是生命周期分析? / 80
第 30 问:什么是 AB 测试分析? / 83
第 31 问:什么是竞品分析? / 88
2.5 用户分析方法 / 90
第 32 问:什么是用户画像分析? / 90
第 33 问:什么是漏斗分析? / 96
第 34 问:什么是 RFM 用户分层分析? / 100
第 35 问:什么是同期群分析? / 104
第 3 章 工具技术 / 107
第 36 问:分析工具如何选?常用场景说明 / 108
3.1 Excel / 109
第 37 问:用 Excel 做数据分析够吗? Excel 的学习路径 / 109
第 38 问:Excel 中有哪些重要的函数或功能?Excel 高频常用函数介绍 / 110
第 39 问:如何用 Excel 做数据分析?Excel 透视表最全指南 / 114
3.2 SQL / 127
第 40 问:什么是 SQL ?SQL 的学习路径 / 127
第 41 问:SQL 基础操作有哪些? / 129
第 42 问:SQL 有哪些高频函数? / 130
第 43 问:SQL 的表连接该如何做? / 130
第 44 问:什么是 SQL 的窗口函数? / 137
第 45 问:SQL 要学习到什么程度?SQL 在数据分析中落地 / 147
3.3 Python / 151
第 46 问:什么是 Python ?Python 的介绍与开始 / 151
第 47 问:Python 基础语法有哪些? / 152
第 48 问:Python 数据分析工具包 Pandas 是什么? / 160
第 49 问:Python 数据可视化工具包 Matplotlib 是什么? / 177
第 50 问:Pandas 如何解决业务问题?数据分析流程详解 / 183
3.4 PowerBI / 195
第 51 问:什么是商业智能?商业智能与 PowerBI 入门 / 195
第 52 问:PowerBI 的核心概念有哪些?一文看懂 PowerBI 运行逻辑 / 198
第 53 问:如何用 PowerBI 做数据分析?PowerBI 完整数据分析流程案例 / 208
第 4 章 项目落地 / 222
4.1 落地思维 / 223
第 54 问:数据分析的结果该如何落地? / 223
第 55 问:数据分析没有思路怎么办?数据分析中以终为始的思考逻辑 / 226
第 56 问:如何从不同层次理解业务?数据分析中点线面体的思考逻辑 / 229
第 57 问:数据分析怎么做才有价值?数据分析中的目标管理 / 231
4.2 理解业务本质 / 235
第 58 问:常说的业务场景是什么?从营销角度出发构建业务场景模型 / 235
第 59 问:零售行业常说的人货场是什么?从人货场模型看落地场景中的数据
分析 / 240
第 60 问:如何深入理解业务?利用点线面思维构建业务模型 / 242
第 61 问:如何梳理业务流程?从线的层次思考业务 / 245
第 62 问:如何看懂公司的商业模式?从面的层次思考业务 / 250
第 63 问:从战略层次全局看待业务?从体的层次思考业务 / 254
4.3 互联网产品数据分析实践 / 258
第 64 问:如何分析用户行为数据?还原实际业务中的落地分析流程 / 258
第 65 问:如何定义问题?AARRR 模型中获取阶段的落地分析 / 263
第 66 问:如何形成分析思路?AARRR 模型中促活阶段的落地分析 / 268
第 67 问:如何给落地建议?AARRR 模型中留存阶段的落地分析 / 274
4.4 报告呈现 / 279
第 68 问:为什么要做数据分析报告?向上汇报与横向沟通 / 279
第 69 问:如何用数据来讲故事?报告结构与金字塔原理 / 281
第 70 问:如何制作一个图表?数据可视化的逻辑 / 284
4.5 项目复现实战 / 287
第 71 问:游戏行业,如何分析活动? / 287
第 5 章 展望 / 298
第 72 问:数据分析师的前景及如何成长? / 299