数据仓库与数据挖掘应用教程/21世纪高等学校电子商务专业规划教材
内容简介:
本书以SQL Server分析服务为环境介绍数据仓库和数据挖掘应用技术,包括数据仓库和数据挖掘概述、OLAP和多维数据模型、数据仓库设计和SQL Server数据仓库开发实例、关联分析算法、决策树分类算法、贝叶斯分类算法、神经网络算法、回归分析算法、时间序列分析和聚类算法。
本书内容翔实,循序渐进地介绍各个知识点,并提供全面而丰富的教学资源,可作为各类高等院校计算机及相关专业“数据仓库和数据挖掘应用技术”和“SQL Server高级应用”课程的教学用书,也适合计算机应用人员和计算机爱好者参考。
目录:
第1章数据仓库和数据挖掘概述
1.1数据仓库概述
1.1.1数据仓库的定义
1.1.2数据仓库与操作型数据库的关系
1.1.3数据仓库的应用
1.2数据仓库系统及开发工具
1.2.1数据仓库系统的组成
1.2.2数据仓库系统开发工具
1.3商业智能和数据仓库
1.3.1什么是商业智能
1.3.2商业智能和数据仓库的关系
1.4数据挖掘概述
1.4.1数据挖掘的定义
1.4.2数据挖掘的主要任务
1.4.3数据挖掘的对象
1.4.4数据挖掘的知识表示
1.4.5数据挖掘与数据仓库及OLAP的关系
1.4.6数据挖掘的应用
1.5数据挖掘过程
1.5.1数据挖掘步骤
1.5.2数据清理
1.5.3数据集成
1.5.4数据变换
1.5.5数据归约
1.5.6离散化和概念分层生成
1.5.7数据挖掘的算法
练习题
第2章OLAP和多维数据模型
2.1OLAP概述
2.1.1什么是OLAP
2.1.2OLAP和OLTP的区别
2.1.3数据仓库与OLAP的关系
2.2多维数据模型
2.2.1多维数据模型的相关概念
2.2.2OLAP的基本分析操作
2.2.3多维数据模型的实现途径
2.3数据仓库的维度建模
2.3.1数据仓库建模概述
2.3.2星形模型
2.3.3雪花模型
2.3.4事实星座模型
练习题
第3章数据仓库设计
3.1数据仓库设计概述
3.1.1数据仓库设计原则
3.1.2建立数据仓库系统的两种模式
3.1.3数据仓库设计过程
3.2数据仓库规划与需求分析
3.2.1数据仓库规划
3.2.2数据仓库需求分析
3.3数据仓库建模
3.3.1数据仓库建模的主要工作
3.3.2维表设计
3.3.3事实表设计
3.4数据仓库物理模型设计
3.4.1确定数据的存储结构
3.4.2确定索引策略
3.4.3确定存储分配
3.5数据仓库部署与维护
3.5.1数据仓库的部署
3.5.2数据仓库的维护
练习题
第4章SQLServer数据仓库开发实例
4.1OnRetDW系统需求分析
4.1.1OnRetDW系统的主题
4.1.2OnRetDW系统的功能
4.2OnRetDW的建模
4.2.1维表设计
4.2.2事实表设计
4.3数据抽取工具设计
4.4基于SQL Server 2012设计OnRetDW
4.4.1创建数据仓库OnRetDW项目
4.4.2创建数据源
4.4.3创建数据源视图
4.4.4创建维表
4.4.5创建多维数据集
4.4.6部署SDWS
4.4.7浏览已部署的多维数据集
4.5MDX简介*
4.5.1MDX语言概述
4.5.2执行MDX查询
4.5.3多维数据查询
练习题
上机实验题
第5章关联分析算法
5.1关联分析概述
5.1.1什么是关联分析
5.1.2事务数据库
5.1.3关联规则及其度量
5.1.4频繁项集
5.1.5挖掘关联规则的基本过程
5.2Apriori算法
5.2.1Apriori性质
5.2.2Apriori算法求频繁项集
5.2.3由频繁项集产生强关联规则
5.3SQL Server挖掘关联规则
5.3.1创建DMK数据库
5.3.2建立关联挖掘项目
5.3.3部署关联挖掘项目并浏览结果
5.4电子商务数据的关联规则挖掘
5.4.1创建OnRetDMK数据库
5.4.2数据加载功能设计
5.4.3建立关联挖掘项目
5.4.4部署关联挖掘项目并浏览结果
练习题
上机实验题
第6章决策树分类算法
6.1分类过程
6.1.1分类概述
6.1.2分类过程的学习阶段
6.1.3分类过程的分类阶段
6.2决策树分类
6.2.1决策树
6.2.2建立决策树的ID3算法
6.3SQL Server决策树分类
6.3.1建立数据表
6.3.2建立决策树分类挖掘模型
6.3.3浏览决策树模型和分类预测
6.4电子商务数据的决策树分类
6.4.1创建OnRetDMK.DST数据表
6.4.2数据加载功能设计
6.4.3建立决策树分类模型
6.4.4浏览决策树
练习题
上机实验题
第7章贝叶斯分类算法
7.1贝叶斯分类概述
7.1.1贝叶斯定理
7.1.2贝叶斯信念网络
7.2朴素贝叶斯分类
7.2.1朴素贝叶斯分类原理
7.2.2朴素贝叶斯分类算法
7.3SQL Server朴素贝叶斯分类
7.3.1建立朴素贝叶斯分类挖掘模型
7.3.2浏览朴素贝叶斯分类模型和分类预测
7.4电子商务数据的贝叶斯分类
7.4.1建立朴素贝叶斯分类挖掘模型
7.4.2浏览挖掘结果及分析
练习题
上机实验题
第8章神经网络算法
8.1人工神经网络概述
8.1.1人工神经元
8.1.2人工神经网络
8.1.3神经网络应用
8.2用于分类的前馈神经网络
8.2.1前馈神经网络的学习过程
8.2.2前馈神经网络用于分类的算法
8.3SQL Server神经网络分类
8.3.1建立神经网络分类挖掘模型
8.3.2浏览神经网络分类模型和分类预测
8.4电子商务数据的神经网络分类
8.4.1建立神经网络分类挖掘模型
8.4.2浏览挖掘结果及分析
练习题
上机实验题
第9章回归分析算法
9.1回归分析概述
9.2线性回归分析
9.2.1一元线性回归分析
9.2.2多元线性回归分析
9.2.3SQL Server线性回归分析
9.3非线性回归分析
9.3.1非线性回归分析的处理方法
9.3.2可转换成线性回归的非线性回归
9.3.3不可变换成线性回归的非线性回归分析*
9.4逻辑回归分析
9.4.1逻辑回归原理
9.4.2逻辑回归模型
9.4.3SQL Server逻辑回归分析
9.5电子商务数据的逻辑回归分析
9.5.1建立逻辑回归挖掘模型
9.5.2浏览挖掘结果及分析
练习题
上机实验题
第10章时间序列分析
10.1时间序列分析概述
10.1.1什么是时间序列和时间序列分析
10.1.2时间序列的分类和平稳性判断
10.1.3时间序列建模的两种基本假设
10.1.4回归分析与时间序列分析
10.2确定性时间序列分析
10.2.1移动平均模型
10.2.2指数平滑模型
10.3随机时间序列模型*
10.3.1随机时间序列模型概述
10.3.2自回归模型AR(p)
10.4SQL Server时间序列分析
10.4.1建立数据表
10.4.2建立时间序列分析模型
10.4.3浏览时间序列分析模型
10.5电子商务数据的时间序列分析
10.5.1创建OnRetDMK.TS数据表
10.5.2数据加载功能设计
10.5.3建立时间序列分析模型
10.5.4浏览时间序列分析模型
练习题
上机实验题
第11章聚类算法
11.1聚类概述
11.1.1什么是聚类
11.1.2相似性度量
11.1.3聚类过程
11.1.4常见的聚类算法
11.1.5聚类分析的应用
11.2k均值算法及其应用
11.2.1k均值算法
11.2.2SQL Server的k均值算法应用
11.3EM算法及其应用
11.3.1EM算法
11.3.2SQL Server中EM算法
11.4电子商务数据的聚类分析
11.4.1建立聚类挖掘模型
11.4.2两种算法结果的比较
11.5Microsoft顺序分析和聚类分析算法*
11.5.1Microsoft顺序分析和聚类分析算法概述
11.5.2Microsoft顺序分析和聚类分析算法的应用
练习题
上机实验题
附录A部分练习题参考答案
第1章
第2章
第3章
第4章
第5章
第6章
第7章
第8章
第9章
第10章
第11章
附录B上机实验题参考答案
第4章
第5章
第6章
第7章
第8章
第9章
第10章
第11章
附录C书中数据库和包含的数据表
1. OnRet数据库
2. SDW数据库
3. OnRetDMK数据库
4. DMK数据库
参考文献