《大数据分析》旨在为组织采用大数据技术提供一系列实施策略,建立一个坚实的基础,即,总体上把握大数据能是什么,为什么大数据能增值,哪种类型的问题适合用大数据方法,以及如何合理规划去确定需求,如何在机构中安排合适的人力,如何进行系统集成策划。
另一方面,《大数据分析》不是介绍如何做大数据应用开发的,如MapReduce编程、Hadoop实现等,但各章都会提供一个概述,来说明采用大数据的生态系统相关内容或采用大数据的过程。
导语
在技术方面,似乎是“风水轮流转”,至少以我的经验看来,它确实是这样。最近,“大数据”和“大数据分析”的概念已经变得无处不在——据说要访问一个Web站点,打开一份报纸,或阅读一本杂志,都会提及一个或两个诸如此类的短语。然而大数据所包含的大规模并行处理、海量数据存储、数据分布、高速网络、高性能计算、任务和线程管理以及数据挖掘和分析等都不是新的技术。
我的职业生涯的第一阶段是在20世纪80年代末和90年代初,那时我作为软件开发人员,为某公司超级计算机做编程语言编译器。大多数这样的高端系统是多处理器系统,采用大规模并行处理,由大数据集(按那时的标准)驱动。我的具体职责是查看代码优化,工作重点是提升处理器的数据带宽和充分利用系统中设计和安装的多级内存。有趣的是,大部分用于硬件设计和软件开发的架构和技术都不是新的,多来自早期的超级计算机的贡献,如在20世纪70年代初开发的第一个大规模并行计算系统IlliacIV。
这就是大数据现象让我如此着迷的原因:不是新技术的出现,而是已知的技术最终如何成为主流。当20年前的前沿技术,其技术细节定期地出现在《纽约时报》《华尔街日报》和《经济学人》杂志上时,你就会知道它终于到来了。采用新技术面临的挑战
很多人对新技术有天然的喜好——总有一种直觉就是最新最闪亮的“银弹”不仅会解决组织中存在的所有问题,而且还能成为完善整个组织的一条金币铸造流。同时,在那些不适应新技术变革的组织中,有被抛弃的挥之不去的恐惧——即使起初新技术没有明确的价值取向,如果他们不采用,将会远远落在后面。
第1章 大数据分析的市场和业务驱动力
1.1 区分大数据的炒作和现实
1.2 理解业务驱动因素
1.3 降低准入门槛
1.4 注意事项
1.5 思考练习
第2章 适用大数据分析的业务问题
2.1 反对炒作:组织适应能力
2.2 大数据价值带来的提升
2.3 大数据用例
2.4 大数据应用的特点
2.5 大数据价值的感知和量化
2.6 关于价值的进一步思考
2.7 思考练习
第3章 实现大数据分析的组织合作
3.1 两个关键问题
3.2 大数据分析和报告的历史视角
3.3 文化冲突的挑战
3.4 采用大数据技术的考虑因素
3.5 合适的决策人
3.6 组织协调的角色
3.7 思考练习
第4章 制定企业集成大数据分析的战略
4.1 决定采用大数据技术的内容、方式和时机
4.2 采用大数据技术的战略规划
4.3 规范征求业务用户需求的做法
4.4 采用新技术的可接受性:明确用或不用的原则
4.5 为可扩展性准备数据环境
4.6 促进数据重用
4.7 建立适当的监督和管理
4.8 为主流技术提供管理过程
4.9 企业集成的考虑事项
4.10 思考练习
第5章 大数据分析的数据治理策略与过程
5.1 数据治理的演变
5.2 大数据和数据治理
5.3 与大数据集的区别
5.4 大数据监管的5个关键理念
5.4.1 管理使用者数据预期
5.4.2 确定数据质量的关键维度
5.4.3 实体提取的元数据和参考数据的一致性
5.4.4 重新调整用途和重新解释
5.4.5 数据充实和强化
5.5 考虑事项
5.6 思考练习
……
第6章 大数据管理的高性能设备
第7章 大数据工具和技术
第8章 大数据应用开发
第9章 大数据的NoSQL数据管理
第10章 大数据图分析
第11章 开发大数据路线图