简介
在数据处理和统计分析领域,SAS软件被誉为标准软件,在我国广泛应用于医学、农林、财经、社会科学、行政管理等众多领域。本书分为11章讲解SAS统计分析相关知识,全面透彻地讲解统计分析与数据挖掘技术,内容包括数据预处理、数据的描述、统计推断、相关与回归分析、因子分析、聚类分析与判别分析、列联分析与对应分析、定性数据分析和时间序列分析。
本书实用性强,避免复杂的数学公式推导,并且通过菜单和编程两种方式实现统计分析和得到结论的全部过程。
本书既可作为高等院校本科生和研究生的统计学教材,又可以作为管理、金融、医学领域进行数据分析的自学教材,同时还可以作为从事数据分析与数据管理的研究人员的参考用书。
目录
第1章 数据预处理
1.1 SAS环境与操作界面
1.2 SAS编程基础
1.2.1 SAS编程语言的基本结构
1.2.2 SAS结构化编程语句
1.3 SAS的数据处理对象
1.3.1 SAS数据库和SAS数据集
1.3.2 SAS系统的外部数据文件
1.4 数据预处理原理和基本方法
1.4.1 数据整理
1.4.2 数据分拆与合并
1.4.3 数据清洗
1.4.4 数据变换
1.5 本章小结
第2章 数据的描述
2.1 统计图
2.1.1 直方图
2.1.2 条形图
2.1.3 线图
2.1.4 散点图
2.1.5 饼图
2.1.6 盒式图
2.1.7 茎叶图
2.2 统计量
2.2.1 集中趋势
2.2.2 离散程度
2.2.3 分布形状
2.2.4 利用菜单和程序进行详细的描述统计分析
2.3 统计表
2.3.1 统计表的基本要素
2.3.2 用TABULATE过程绘制统计表
2.4 数据分布
2.4.1 总体分布
2.4.2 样本分布
2.4.3 抽样分布
2.5 本章小结
第3章 简单统计推断
3.1 简单统计推断的基本原理
3.1.1 参数估计
3.1.2 假设检验
3.2 单总体参数的估计及假设检验
3.2.1 单总体的参数估计
3.2.2 单总体参数的假设检验
3.3 两总体参数的估计及假设检验
3.3.1 独立样本的参数估计和检验
3.3.2 成对样本的参数估计和检验
3.4 本章小结
第4章 方差分析
4.1 方差分析的基本原理
4.2 单因素方差分析
4.2.1 单因素方差分析与方差同质性检验
4.2.2 方差分析的多重比较
4.2.3 方差分析模型的参数估计和预测
4.3 多因素方差分析
4.3.1 只考虑主效应的多因素方差分析
4.3.2 存在交互效应的多因素方差分析
4.4 协方差分析
4.5 本章小结
第5章 非参数检验
5.1 非参数检验的基本问题
5.2 单样本非参数检验
5.2.1 单样本均值的Wilcoxon符号秩检验
5.2.2 单样本的Kolmogorov-Smirnov检验
5.3 两个样本的非参数检验
5.3.1 两个独立样本中位数比较的Wilcoxon秩和检验
5.3.2 两个独立样本分布的Kolmogorov-Smirnov检验
5.3.3 成对样本中位数的Wilcoxon符号秩检验
5.4 多个样本的非参数检验
5.4.1 多个独立样本位置的Kruskal-Wallis检验
5.4.2 多个独立样本位置的Jonckheere-Terpstra检验
5.4.3 多个独立样本中位数的Brown-Mood检验
5.5 本章小结
第6章 相关与回归分析
6.1 相关分析
6.1.1 简单相关分析
6.1.2 偏相关分析
6.1.3 等级相关分析
6.2 典型相关分析
6.2.1 典型相关分析基本原理
6.2.2 典型相关系数的显著性检验
6.2.3 典型相关的冗余分析
6.3 线性回归分析
6.3.1 回归分析的基本原理
6.3.2 一元线性回归分析
6.3.3 多元线性回归分析
6.4 定性自变量回归分析
6.4.1 虚拟变量的设定
6.4.2 含有虚拟变量的回归分析
6.5 本章小结
第7章 因子分析
7.1 数据降维
7.1.1 数据降维的基本问题
7.1.2 数据降维的基本原理
7.2 主成分分析
7.2.1 主成分分析的基本概念与原理
7.2.2 主成分分析的基本步骤和过程
7.3 因子分析
7.3.1 因子分析的基本原理
7.3.2 因子分析的基本步骤和过程
7.4 本章小结
第8章 聚类分析与判别分析
8.1 聚类分析的基本原理
8.1.1 分类的基本原则
8.1.2 单一指标的系统聚类过程
8.1.3 多指标的系统聚类过程
8.2 聚类分析的步骤和过程
8.2.1 系统聚类
8.2.2 快速聚类
8.2.3 变量聚类
8.3 判别分析的基本原理
8.4 判别分析的步骤和过程
8.4.1 距离判别
8.4.2 Bayes判别
8.4.3 Fisher判别
8.4.4 逐步判别
8.5 本章小结
第9章 列联分析与对应分析
9.1 列联分析
9.1.1 列联表
9.1.2 列联表的分布
9.1.3 χ2分布与χ2检验
9.1.4 列联表中的关联度分析
9.1.5 χ2分布的期望值准则
9.2 对应分析
9.2.1 对应分析的基本思想
9.2.2 对应分析的步骤和过程
9.3 本章小结
第10章 离散因变量模型
10.1 线性概率模型
10.2 二元选择模型
10.2.1 线性概率模型的缺陷与改进
10.2.2 二元选择模型的基本原理
10.2.3 BINARY PROBIT模型
10.2.4 BINARY LOGIT模型
10.3 多重选择模型
10.3.1 多重选择模型的基本原理
10.3.2 ORDINAL PROBIT模型
10.3.3 ORDINAL LOGIT模型
10.3.4 MULTINOMIAL LOGIT模型
10.4 计数模型
10.4.1 POISSON 回归模型的基本原理
10.4.2 POISSON回归模型的分析过程和步骤
10.5 本章小结
第11章 时间序列分析
11.1 时间序列的基本问题
11.1.1 时间序列的组成部分
11.1.2 时间序列的平稳性
11.2 ARIMA模型的分析过程
11.2.1 ARIMA模型
11.2.2 ARMA模型的识别、估计与预测
11.2.3 利用SAS时间序列预测系统进行菜单操作
11.3 本章小结