近几年,数据分析、人工智能、大数据平台等概念十分火爆,有些人感叹:虽然学会了调用软件算法库文件,在面对真实的业务问题时却不知道从哪里下手;虽然接触了一个又一个能做数据分析的软件工具,真要处理一个业务问题时,却发现自己需要什么样的数据反而成了第一道门槛……“道不远人”,好的东西不应该只作为高深莫测的内容让人敬而远之。本书将数据分析的思维作为主干,衔接数据分析的各个环节,辅之以案例,帮助读者建立体系化的数据分析知识,使数据分析成为一个普通技能,在工作和生活中发挥分析并解决问题的作用,最终实现“人人可做数据分析”。
于琪,东南大学软件工程硕士,本科就读于山东大学电气自动化专业。工作十多年一直在工业领域做研发、项目经理、产品经理,曾带领团队开发过产线管理系统、仓储物资管理系统等智能制造领域的方案组件,深入调研过电子、机加工、重型器械、医药化工等行业,给很多企业做过实施方案,深知制造企业的痛点、难点和解决方法。现任西门子中国研究院先进制造自动化方向研发总监。
第1章 绪论 001
1.1 数据分析话题的“树模型”知识框架 001
1.2 数据分析话题同样存在“量变引起质变”的问题 004
1.3 数据分析与其他学科的关系 006
第2章 数据采集、存储与整理 008
2.1 什么是数据,数字就是数据吗 009
2.2 不同的应用场景对应不同的数据采集方式 010
2.3 工业协议采集数据 011
2.4 网页埋点采集数据 014
2.5 数据库及合并表单 017
2.6 数据清洗 022
2.7 数据整理,多维度拆解 026
2.8 数据集 035
2.9 数据估算 042
第3章 大数据平台架构 045
3.1 大数据时代的传统数据处理方法 046
3.2 大数据架构 048
3.3 大数据平台的数据采集、处理、输出与展示 056
3.4 大数据平台不是核心 064
第4章 数据思维之基础问题 065
4.1 数据算法VS数据应用 065
4.2 AI高大上,传统手段失效了吗 067
4.3 以前常用的一些方法论,如5W2H法不灵了 068
4.4 信息摘要的敏感性,抓重点的能力 070
4.5 物联网等技术的发展催生了新的数据应用场景 071
4.6 对数据分析的预期,要有合理的参照系 072
第5章 数据思维之数据素养 074
5.1 数字时代,数据素养是重要的技能 074
5.2 把一个具体业务问题转化成一个数据可分析问题 076
5.3 层层拆解,才见真章 081
5.4 细致拆解与辛普森悖论 084
5.5 减熵:把事情流程化,把关系图谱化 086
5.6 指标思维 090
第6章 常见的数据分析综合方法 096
6.1 针对业务问题的“假设检验” 096
6.2 分类利器:波士顿矩阵与RFM模型 100
6.3 行动步骤利器:AARRR模型与UJM模型 109
6.4 业务分析框架OSM 113
6.5 成交总额GMV 116
第7章 数据可视化 120
7.1 数据可视化的意义:探索性分析 120
7.2 常见的数据可视化图表 122
7.3 数据可视化举例 125
第8章 人工智能与传统数据分析的关系 130
8.1 数据分析、传统算法、人工智能之间的范畴关系 131
8.2 目标的一致性及适用场景的区别 132
8.3 以统计为主的传统数据分析及其工具 134
8.4 机器学习 139
第9章 数据驱动运营 147
9.1 不同业务层次都有哪些数据分析需求 147
9.2 不同行业领域都有些哪些数据分析需求 148
9.3 数据驱动运营概述 150
9.4 牛刀小试的一个例子 156
9.5 数据分析与公司战略地图 161
参考文献 168