数据挖掘技术与应用(第2版)(高等院校信息管理与信息系统专业系列教材)
定 价:35 元
- 作者:陈燕
- 出版时间:2016/7/8
- ISBN:9787302432494
- 出 版 社:清华大学出版社
- 中图法分类:TP274
- 页码:248
- 纸张:胶版纸
- 版次:2
- 开本:16K
本书系统地阐述了数据挖掘产生的背景、技术、多种相关方法及具体应用,主要内容包括数据挖掘概述,数据采集、集成与预处理技术,多维数据分析与组织,预测模型研究与应用,关联规则模型及应用,聚类分析方法与应用,粗糙集方法与应用,遗传算法与应用,基于模糊理论的模型与应用,灰色系统理论与方法,基于数据挖掘的知识推理。 本书可作为管理科学与工程、信息科学与技术、应用数学等相关专业高年级本科生和研究生的数据仓库、数据挖掘及知识管理等相关课程的教材或参考资料,也可用来帮助相关的专业研究人员提升数据挖掘的技巧和开拓新的研究方向。
(1)将多种数据挖掘理论与经典算法相结合;
(2)将对数据挖掘模型的细致讲解与具体算例相结合;
(3)将数据挖据的一般算法与新颖改进相结合;
(4)将数据挖掘在传统领域与交通、物流等特色领域的应用相结合。
第1章数据挖掘概述1
1.1数据仓库和数据挖掘定义与解释1
1.1.1数据仓库的定义与解释1
1.1.2数据挖掘的定义与解释1
1.2数据仓库系统的相关技术3
1.2.1数据仓库系统相关技术之间的关系3
1.2.2数据仓库系统模式7
1.3数据仓库系统中多维数据组织的形式化定义与描述9
1.4数据挖掘方法与研究体系16
1.4.1数据挖掘系统的发展与结构16
1.4.2数据挖掘的相关技术与工具17
1.4.3数据挖掘应用及发展24
1.5商务智能系统定义与构成26
1.6小结28
思考题28
第2章数据采集、集成与预处理技术29
2.1数据采集的对象29
2.2数据集成技术与方法32
2.2.13G与MIS的集成模式33
2.2.2异构数据集成的设计与实现35
2.3数据预处理技术与方法36
2.3.1数据清理的方法36
2.3.2数据融合的方法37
2.3.3数据变换的方法38
2.3.4数据归约的方法39
2.4基于样本数据划分的通用数据挖掘模型系统40
2.5中间件技术41
2.5.1中间件技术的定义与作用41
2.5.2中间件技术在数据仓库系统中数据采集的应用45
2.6小结57
思考题57
第3章多维数据分析与组织58
3.1多维数据分析概述58
3.1.1联机分析处理的定义和特点58
3.1.2联机分析处理的评价准则59
3.1.3多维数据分析的主要概念60
3.2多维数据模型与结构61
3.2.1多维数据的概念模型61
3.2.2多维数据的逻辑模型63
3.2.3多维数据的物理模型65
3.3多维数据分析应用与工具68
3.3.1多维数据分析的基本操作68
3.3.2多维数据分析的工具及特点69
3.4从联机分析处理到联机分析挖掘71
3.4.1联机分析挖掘形成原因71
3.4.2联机分析挖掘概念及特征71
3.5小结73
思考题73
第4章预测模型研究与应用74
4.1预测模型的基础理论74
4.1.1预测方法的分类74
4.1.2预测方法的一般步骤74
4.2回归分析预测模型75
4.2.1一元线性回归预测模型75
4.2.2多元线性回归预测模型79
4.2.3非线性回归预测模型85
4.3趋势外推预测模型88
4.3.1佩尔预测模型88
4.3.2龚珀兹预测模型91
4.3.3林德诺预测模型94
4.4时间序列预测模型97
4.4.1移动平均预测模型97
4.4.2指数平滑预测模型98
4.4.3季节指数预测模型104
4.5基于神经网络的预测模型107
4.6马尔可夫预测模型118
4.7小结121
思考题121
第5章关联规则模型及应用123
5.1关联规则的基础理论123
5.1.1关联规则的定义与解释123
5.1.2关联规则在知识管理过程中的作用123
5.2Apriori关联规则算法125
5.2.1关联规则算法的相关概念125
5.2.2关联规则算法的流程126
5.2.3基于Apriori算法的关联规则算例127
5.3改进的Apriori关联规则方法128
5.3.1动态存储空间的构建128
5.3.2快速产生强项集的算法流程129
5.3.3改进算法的时间复杂性分析130
5.4Apriori关联规则方法的实例131
5.5小结138
思考题138
第6章聚类分析方法与应用139
6.1聚类分析的基础理论139
6.1.1聚类分析的定义139
6.1.2对聚类算法性能的要求139
6.2聚类分析的方法140
6.2.1基于划分的聚类方法140
6.2.2基于层次的聚类方法141
6.2.3基于密度的聚类方法142
6.2.4基于网格的聚类方法143
6.2.5基于模型的聚类方法143
6.3应用聚类分析方法145
6.3.1kmeans聚类方法145
6.3.2kmedoids聚类方法146
6.3.3AGNES聚类方法149
6.3.4DIANA聚类方法150
6.3.5DBSCAN聚类方法152
6.4小结154
思考题154
第7章粗糙集方法与应用155
7.1粗糙集理论背景介绍155
7.1.1粗糙集的含义155
7.1.2粗糙集的应用及与其他领域的结合155
7.2粗糙集基本理论158
7.2.1知识与不可分辨关系158
7.2.2不精确范畴、近似与粗糙集159
7.2.3粗糙集的精度和粗糙度160
7.2.4粗糙集的粗等价和粗包含161
7.3基于粗糙集的属性约简161
7.3.1知识的约简和核162
7.3.2知识的依赖性度量和属性的重要度164
7.4基于粗糙集的决策知识表示165
7.4.1基于粗糙集的决策知识表示方法165
7.4.2粗糙集在规则提取中的应用算例167
7.5小结168
思考题168
第8章遗传算法与应用169
8.1遗传算法基础理论169
8.1.1遗传算法概述169
8.1.2遗传算法特点170
8.2遗传算法的应用领域和研究方向170
8.2.1遗传算法的应用领域170
8.2.2遗传算法的研究方向173
8.3遗传算法的基础知识174
8.3.1遗传算法的相关概念174
8.3.2遗传算法的编码规则174
8.3.3遗传算法的主要算子176
8.3.4遗传算法的适应度函数180
8.4遗传算法计算过程和应用181
8.4.1遗传算法计算过程181
8.4.2遗传算法参数选择181
8.4.3遗传算法实例应用182
8.5小结186
思考题186
第9章基于模糊理论的模型与应用187
9.1层次分析法187
9.1.1层次分析法的计算步骤187
9.1.2层次分析法应用实例190
9.2模糊层次分析法192
9.2.1模糊层次分析法的步骤193
9.2.2模糊层次分析法应用实例193
9.3模糊综合评判法196
9.3.1模糊综合评判法的原理与步骤196
9.3.2模糊综合评判法应用实例199
9.4模糊聚类分析方法201
9.4.1模糊聚类方法介绍201
9.4.2模糊聚类算法应用202
9.5小结203
思考题203
第10章灰色系统理论与方法204
10.1灰色系统的基础理论204
10.1.1灰色系统理论介绍204
10.1.2灰色系统的特点205
10.1.3灰色系统建模与适用范围205
10.2灰色预测模型207
10.2.1建立灰色预测模型208
10.2.2灰色预测模型实例209
10.3灰色聚类分析211
10.3.1基于灰色关联度的聚类分析212
10.3.2基于灰色白化权函数的聚类方法216
10.4灰色综合评价法220
10.4.1多层次灰色综合评价方法计算步骤220
10.4.2多层次灰色综合评价方法应用案例222
10.5小结226
思考题226
第11章基于数据挖掘的知识推理227
11.1知识推理的分类227
11.1.1非单调推理227
11.1.2非确定性推理227
11.1.3基于规则的推理232
11.1.4基于案例的推理233
11.2基于数据挖掘方法的知识推理234
11.2.1基于决策树的知识推理234
11.2.2基于关联规则的知识推理239
11.2.3基于粗糙集的知识推理239
11.3小结240
思考题240
参考文献241