i
IBM SPSS Ad
19
vanced Statistics
Note: Before using this information and the product it supports, read the general
information under Notices第 143 页码.
This document contains proprietary information of SPSS Inc, an IBM Company. It
is provided under a license agreement and is protected by copyright law. The
information contained in this publication does not include any product warranties,
and any statements provided in this manual should not be interpreted as such.
When you send information to IBM or SPSS, you grant IBM and SPSS a nonexclusive
right to use or distribute the information in any way it believes appropriate
without incurring any obligation to you.
© Copyright SPSS Inc. 1989, 2010.
IBM® SPSS® Statistics 是一种用于分析数据的综合系统。Advanced Statistics 可选附
加模块提供本手册中描述的其他分析方法。此 Advanced Statistics 附加模块必须与
SPSS Statistics Core 系统一起使用,并已完全集成到了该系统中。
关于 SPSS Inc.,IBM 下属公司
SPSS Inc. 是一家 IBM 下属公司,它也是全球领先的预测分析软件和解决方案提供商。
该公司拥有全面的产品系列,涵盖数据收集、统计量、建模和部署,通过在业务流程
中嵌入分析技术,收集人们的态度与看法,预测未来客户交互结果,然后针对这些深
入见解采取相应行动。SPSS Inc. 解决方案着眼于整合分析技术、IT 基础设施和业务
流程,以帮助达成整个企业内相互关联的业务目标。全球各地的众多企业、政府和学
术机构客户依靠 SPSS Inc. 技术在吸引、留住和发展客户方面取得竞争优势,同时减
少欺诈并缓解风险。SPSS Inc. 在 2009 年 10 月被 IBM 并购。有关更多信息,请访问
http://www.spss.com。
前言
技术支持
客户服务
培训讲座
我们提供有“技术支持”以维护客户。客户可就 SPSS Inc. 产品使
用或某一受支持硬件环境的安装帮助寻求技术支持。要获得“技术支
持”,请访问 SPSS Inc. 网站 http://support.spss.com ,或通过网站
http://support.spss.com/default.asp?refpage=contactus.asp 找到当地办事处。在请
求协助时,请准备好您和您组织的 ID 以及支持协议。
如果对发货或帐户存在任何问题,请联系您当地的办事处,联系方式列在 Web 站点中,
网址为 http://www.spss.com/worldwide。请先准备好您的序列号以供识别。
SPSS Inc. 提供公开的以及现场的培训讲座。所有讲座都是以实践小组为特色的。讲座
将定期在各大城市开展。关于这些讲座的更多信息,请联系您本地的办事处,联系方式
列在 Web 站点上,网址为 http://www.spss.com/worldwide。
© Copyright SPSS Inc. 1989, 2010
iii
附加出版物
SPSS Statistics:数据分析指南、SPSS Statistics:Statistical Procedures Companion
和 SPSS Statistics:Advanced Statistical Procedures Companion(由 Marija Norušis
编写,并已由 Prenti
Statistics Base 模块、Advanced Statistics 模块和 回归模块中的统计过程。无论您是
刚开始从事数据分析工作,还是已准备好使用高级应用程序,这些书籍都将帮助您最有
效地利用在 IBM® SP
内容和示例章节,请参阅作者的网站: http://www.norusis.com
ce Hall 出版)作为建议的补充材料提供。这些出版物涵盖 SPSS
SS® Statistics 产品中找到的功能。有关其他信息,包括出版物的
iv
1
Advanced Statistics 简介 1
2
GLM 多变量分析 2
GLM多变量:模型 ................................ 4
构建项 ................................... 4
平方和 ................................... 5
GLM多变量:对比 ................................ 6
对比类型 .................................. 6
GLM 多变量:轮廓图 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
GLM 多变量:两两比较 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
GLM:保存 .................................... 9
GLM多变量:选项 ............................... 11
GLM 命令的附加功能 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
内容
3
GLM 重复测量 13
GLM 重复测量定义因子 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
GLM 重复测量:模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
构建项 .................................. 17
平方和 .................................. 18
GLM 重复测量:对比 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
对比类型 ................................. 19
GLM 重复测量:轮廓图 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
GLM 重复测量:两两比较 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
GLM 重复测量:保存 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
GLM 重复测量:选项 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
GLM 命令的附加功能 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
4
方差成分分析 26
方差成分:模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
构建项 .................................. 28
v
方差成分:选项 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
平方和(方差成分) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
方差成分:保存到新文件 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
VARCOMP 命令的附加功能 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
5
线性混合模型 31
线性混合模型:选择主体/重复变量 . . . . . . . . . . . . . . . . . . . . . . . 33
线性混合模型:固定效应 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
构建非嵌套项 ............................... 34
建立嵌套项 ................................ 35
平方和 .................................. 35
线性混合模型:随机效果 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
线性混合模型:估计 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
线性混合模型:统计 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
线性混合模型:EM 均值 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
线性混合模型:保存 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
MIXED 命令的附加功能 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
6
广义线性模型 42
广义线性模型响应 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
广义线性模型:参考类别 . . . . . . . . . . . . . . . . . . . . . . . . . . 47
广义线性模型:预测变量
广义线性模型:选项 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
广义线性模型:模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
广义线性模型:估计 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
广义线性模型:初始值 . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
广义线性模型:统计量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
广义线性模型:EM 均值 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
广义线性模型:保存 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
广义线性模型:导出 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
GENLIN 命令的附加功能. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
7
广义估计方程 62
广义估计方程:模型类型
............................ 48
............................ 65
vi
广义估计方程:响应 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
广义估计方程:参考类别 . . . . . . . . . . . . . . . . . . . . . . . . . . 69
广义估计方程:预测变量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
广义估计方程:选项 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
广义估计方程:模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
广义估计方程:估计 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
广义估计方程:初始值 . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
广义估计方程:统计量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
广义估计方程:EM 均值 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
广义估计方程:保存 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
广义估计方程:导出 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
GENLIN 命令的附加功能. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
8
广义线性混合模型 84
获取广义线性混合模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
目标 ..................................... 87
固定效应 ................................... 89
添加自定义项 ............................... 90
随机效应 ................................... 91
随机效应块 ................................ 92
权重和偏移量 ................................. 94
构建选项 ................................... 95
估算的均值 .................................. 96
保存 ..................................... 98
模型视图 ................................... 99
模型摘要 ................................. 99
数据结构 ................................. 99
按已观测进行预测 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
分类.................................... 99
固定效应 ................................. 100
固定系数 ................................. 100
随机效应协方差 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
协方差参数 ................................ 101
估算的均值:显著效应 . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
估算的均值:自定义效应 . . . . . . . . . . . . . . . . . . . . . . . . . . 102
vii
9
模型选择对数线性分析 103
对数线性分析:定义范围 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
对数线性分析:模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
构建项 .................................. 105
模型选择对数线性分析:选项 . . . . . . . . . . . . . . . . . . . . . . . . . 106
HILOGLINEAR 命令的附加功能 . . . . . . . . . . . . . . . . . . . . . . . . . . 106
10
一般对数线性分析 107
一般对数线性分析模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
构建项 .................................. 109
一般对数线性分析:选项 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
一般对数线性分析:保存 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
GENLOG 命令的附加功能. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
11
Logit 对数线性分析
Logit 对数线性分析:模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
构建项 .................................. 114
Logit 对数线性分析:选项 . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
Logit 对数线性分析:保存 . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
GENLOG 命令的附加功能. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
12
寿命表 117
寿命表:为状态变量定义事件 . . . . . . . . . . . . . . . . . . . . . . . . . 118
寿命表:定义范围 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
寿命表:选项 ................................. 119
SURVIVAL 命令的附加功能 . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
13
Kaplan-Meier 生存分析 121
Kaplan-Meier:为状态变量定义事件 . . . . . . . . . . . . . . . . . . . . . . 122
Kaplan-Meier:比较因子水平 . . . . . . . . . . . . . . . . . . . . . . . . . . 123
112
viii
Kaplan-Meier:保存新变量........................... 123
Kaplan-Meier:选项 .............................. 124
KM 命令的附加功能 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124
14
Cox 回归分析 126
Cox 回归:定义分类变量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
Cox回归:图 ................................. 129
Cox 回归:保存新变量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
Cox回归:选项 ................................ 131
Cox 回归:为状态变量定义事件 . . . . . . . . . . . . . . . . . . . . . . . . . 131
COXREG 命令的附加功能. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
15
计算依时协变量 133
计算依时协变量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133
带依时协变量的 Cox 回归的附加功能 . . . . . . . . . . . . . . . . . . . . 134
附录
A
分类变量编码设计 135
偏差 ..................................... 135
简单散点图 .................................. 136
Helmert.................................... 136
差分 ..................................... 137
多项式 .................................... 137
重复 ..................................... 138
特殊 ..................................... 138
指示符 .................................... 139
ix
B
协方差结构 140
C Notices 143
索引 146
x
Advanced Statistics 简介
Advanced Statistics 选项提供的过程可以提供比 Statistics Base 选项更高级的建
模选项。
“GLM 多变量”对“GLM 单变量”提供的一般线性模型进行了扩展,以允许使用多个
因变量。更进一步的扩展“GLM 重复测量”允许重复度量多个因变量。
“方差成分分析”是将因变量的变异性分解为固定和随机成分的特定工具。
“线性混合模型”对一般线性模型进行了扩展,因此允许数据表现出相关的和不
恒定的变异性。因此,线性混合模型提供了不仅能够就数据的均值还能够就其
方差和协方差建模的灵活性。
“广义线性模型”(GZLM) 放宽了误差项的正态假设,仅要求因变量通过转换或关
联函数与预测变量线性相关。“广义估计方程”(GEE) 对 GZLM 进行了扩展,以允
许重复度量。
“一般对数线性分析”允许您为交叉分类计数数据拟合模型,“模型选择对数
线性分析”可帮助您在模型间选择。
“Logit 对数线性分析”允许您拟合对数线性模型来分析分类因变量与一个或多
个分类预测变量之间的关系。
“生存”分析通过“寿命表”提供,用于检查时间事件变量的分布,可能按因子变
量水平分析;“Kaplan-Meier”生存分析用于检查时间事件变量的分布,可能按因
子变量水平分析,或按分层变量水平产生单独的分析;“Cox 回归”用于根据给定
协变量的值对指定事件的时间建模。
章
1
© Copyright SPSS Inc. 1989, 2010
1
GLM 多变量分析
“GLM 多变量”过程通过一个或多个因子变量或协变量为多个因变量提供回归分析和
方差分析。因子变量将总体划分成组。通过使用此一般线性模型过程,您可以检验关
于因子变量对因变量联合分布的各个分组的均值的效应的原假设。可以调查因子之间
的交互以及单个因子的效应。另外,还可以包含协变量的效应以及协变量与因子的交
互。对于回归分析,自变量(预测变量)指定为协变量。
平衡与非平衡模型均可进行检验。如果模型中的每个单元包含相同的个案数,则设计
是平衡的。在多变量模型中,模型中的效应引起的平方和以及误差平方和以矩阵形式表
示,而不是以单变量分析中的标量形式表示。这些矩阵称为 SSCP(平方和与叉积)矩
阵。如果指定了多个因变量,则提供使用 Pillai 的轨迹、Wilks 的 lambda、Hotelling
的轨迹、Roy 的最大根条件以及近似 F 统计量的多变量方差分析,同时还提供每个因变
量的单变量方差分析。除了检验假设,“GLM 多变量”过程还生成参数估计。
常用的先验对比可用于执行假设检验。另外,在整体的 F 检验已显示显著性之后,可
以使用两两比较检验评估指定均值之间的差值。估计边际均值为模型中的单元提供了预
测均值估计值,且这些均值的轮廓图(交互图)允许您轻松对其中一些关系进行可视
化。单独为每个因变量执行两两多重比较检验。
残差、预测值、Cook 距离以及杠杆值可以另存为数据文件中检查假设的新变量。另外
还提供残差 SSCP 矩阵(残差的平方和与叉积的方形矩阵)、残差协方差矩阵(残差
SSCP 矩阵除以残差的自由度)和残差相关矩阵(残差协方差矩阵的标准化形式)。
WLS 权重允许您指定一个变量,用来针对加权最小平方 (WLS) 分析为观察值赋予不同
权重,这样也许可以补偿测量的不同精确度。
章
2
示例。 某塑料制造商要测量塑料膜的三种属性:抗扯强度、光泽度和不透明度。厂商
使用两种挤出速度和添加剂量进行了尝试,并对挤出速度和添加剂量的各种组合度量
了这三种属性。厂商发现挤出速度和添加剂量单独产生的结果很明显,但这两种因子
的交互作用并不明显。
方法。类型 I、类型 II、类型 III 和类型 IV 的平方和可用来评估不同的假设。类
型 III 是缺省值。
统计量。两两比较范围检验和多重比较:最小显著性差异、Bonferroni、Sidak、
Scheffé、Ryan-Einot-Gabriel-Welsch 多重 F、Ryan-Einot-Gabriel-Welsch 多范围、
Student-Newman-Keuls、Tukey’s 真实显著性差异、Tukey 的 b、Duncan、Hochberg’s
GT2、Gabriel、Waller-Duncan t 检验、Dunnett(单侧和双侧)、Tamhane’s T2、
Dunnett’s T3、Games-Howell 和 Dunnett’s C。描述统计:所有单元中所有因变量的
观察均值、标准差和计数;Levene 的方差齐性检验;对因变量协方差矩阵的齐性 Box
的 M 检验以及 Bartlett 的球形度检验。
图。分布-水平图、残差图以及轮廓图(交互)。
数据。因变量应是定量的。因子应是分类因子,可以具有数
是与因变量相关的定量变量。
© Copyright SPSS Inc. 1989, 2010
字值或字符串值。协变量
2
GLM 多变量分析
假设。对于因变量,数据是来自多变量正态总体的随机向量样本;在总体中,所有单
元的方差-协方差矩阵均相同。尽管数据应对称,但方差分析对于偏离正态性是稳健
的。要检查假设,您可以使用方差齐性检验(包括 Box 的 M 检验)和分布-水平图。
您还可以检查残差和残差图。
相关过程。在进行方差分析之前使用“探索”过程来检查数据。对于单个因变量,
请使用“GLM 单变量”。如果您针对每个主体的多种情况度量相同的因变量,请使
用“GLM 重复测量”。
获取 GLM 多变量表
E 从菜单中选择:
分析 > 一般线性模型 > 多变量...
图片 2-1
“多变量”对话框
3
E 请选择至少两
个因变量。
或者,您也可以指定“固定因子”、“协变量”和“WLS 权重”。
4
章2
GLM 多变量:模型
图片 2-2
“多变量:模型”对话框
构建项
指定模型。全因子模型包含所有因子主效应、所有协变量主效应以及所有因子间交互。
它不包含协变量交互。选择
定制可以仅指定其中一部分的交互或指定因子协变量交
互。必须指定要包含在模型中的所有项。
因子与协变量。列出因子与协变量。
模型。模型取决于数据的性质。选择定制之后,您可以选择分析中感兴趣的主效应
和交互效应。
平方和。计算平方和的方法。对于没有缺失单元的平衡或非平衡模型,类型 III 平
方和方法最常用。
在模型中包含截距。模型中通常包含截距。如果您可以假设数据穿过原点,则可以排
除截距。
对于选定因子和协变量:
交互。创建所有选定变量的最高级交互项。这是缺省值。
主效应。为每个选定的变量创建主效应项。
所有二阶。创建选定变量的所有可能的二阶交互。
所有三阶。创建选定变量的所有可能的三阶交互。
所有四阶。创建选定变量的所有可能的四阶交互。
所有五阶。创建选定变量的所有可能的五阶交互。
平方和
5
GLM 多变量分析
对于该模型,您可以选择平方和类型。类型 III 最常用,并且是缺省类型。
类型 I。此方法也称为平方和分级解构法。在模型中,每一项只针对它前面的那项进行
调整。类型 I 平方和常用于:
平衡 ANOVA 模型,其中任何主效应在任何一阶交互效应之前指定,任何一阶交互效
应在任何二阶交互效应之前指定,依此类推。
多项式回归模型,其中任何低阶项在任何高阶项之前指定。
纯嵌套模型,其中第一个指定的效应嵌套在第二个指定的效应中,第二个指定的效应
嵌套在第三个指定的效应中,依此类推。(此嵌套形式只能通过使用语法来指定。)
类型 II。此方法在为所有其它“相应的”效应进行调节的模型中计算某个效应的平
方和。相应的效应是指,与所有效应(不包含正被检查的效应)相对应的效应。类型
II 平方和方法常用于:
平衡 ANOVA 模型。
任何只有主要因子效应的模型。
任何回归模型。
纯嵌套设计。(此嵌套形式能通过使用语法来指定。)
类型 III。缺省类型。此方法在设计中通过以下形式计算某个效应的平方和:为任何
不包含该效应的其他效应,以及任何与包含该效应正交的效应(如果存在)调整的平
方和。类型 III 平方和具有一个主要优点,那就是只要可估计性的一般形式保持不
变,平方和对于单元频率就保持不变。因此,我们常认为此类平方和对于不带缺失单元
格的不平衡模型有用。在不带缺失单元的因子设计中,此方法等同于 Yates 加权均值
平方方法。类型 III 平方和法常用于:
任何在类型 I 和类型 II 中列出的模型。
任何不带空白单元的平衡或非平衡模型。
类型 IV。此方法针对存在缺失单元的情况设计。对于设计中的任何效应 F,如果任何
其它效应中不包含 F,则类型 IV = 类型 III = 类型 II。当 F 包含在其它效应中时,
则类型 IV 将 F 中的参数中正在进行的对比相等地分配到所有较高水平的效应。类
型 IV 平方和法常用于:
任何在类型 I 和类型 II 中列出的模型。
任何带有空白单元的平衡或非平衡模型。
6
章2
GLM 多变量:对比
图片 2-3
“多变量: 对比”对话框
“对比”用于检验效应水平之间是否存在显著性差异。您可以为模型中的每个因子指定
一个对比。对比代表参数的线性组合。
假设检验基于原假设 LBM = 0,其中 L 是对比系数矩阵,M 是恒等矩阵,该矩阵的维数
等于因变量的个数,B 是参数矢量。当指定对比之后,创建一个 L 矩阵,使得与因子对
应的列与对比匹配。对剩余的列进行调整,使 L 矩阵可以估计。
除了使用 F 统计量的单变量检验和基于跨所有因变量的对比差分的 Student 的 t 分布
的 Bonferroni 型同时置信区间以外,还提供使用 Pillai 的轨迹、Wilks 的 lambda、
Hotelling 的轨迹以及 Roy 的最大根条件的多变量检验。
可用对比有偏移对比、简单对比、差分对比、Helmert 对比、重复对比和多项式对
比。对于偏移对比和简单对比,您可以选择参考类别是最后一个类别还是第一个类别。
对比类型
偏差。将每个水平(参考类别除外)的均值与所有水平的均值(总均值)进行比较。
因子的水平可以为任何顺序。
简单。将每个水平的均值与指定水平的均值进行比较。当存在控制组时,此类对比很
有用。可以选择第一个或最后一个类别作为参考类别。
差分。将每个水平的均值(第一个水平除外)与前面水平的均值进行比较。(有时候称
为逆 Helmert 对比。)
Helmert。将因子的每个水平的均值(最后一个水平除外)与后面水平的均值进行比较。
重复。将每个水平的均值(最后一个水平除外)与后一个水平的均值进行比较。
多项式。比较线性作用、二次作用、三次作用等等。第一自由度包含跨所有类别的线性
效应;第二自由度包含二次效应,依此类推。这些对比常常用来估计多项式趋势。
GLM 多变量:轮廓图
图片 2-4
“多变量: 轮廓图”对话框
7
GLM 多变量分析
轮廓图(交互图)对
于比较模型中的边际均值是有用的。轮廓图是一个线图,其中每个
点表示因子的一个水平上的估计因变量边际均值(已针对任何协变量进行调整)。第二
个因子的水平可用来绘制分离线。第三个因子中的每个水平可用来创建分离图。所有因
子都可用于图。为
每个因变量创建轮廓图。
单因子的轮廓图显示估计边际均值是沿水平增加还是减小。对于两个或更多因子,
平行线表示因子之间没有交互,这意味着您只能调查一个因子的水平。不平行的线
则表示交互。
图片 2-5
不平行图(左)和平行图(右)
在通过为水平
轴选择因子,以及通过为分离线和分离图选择因子(后者可选)指定了图
之后,该图必须添加到“图”列表中。
8
章2
GLM 多变量:两两比较
图片 2-6
“多变量:观察到的均值的两两比较”对话框
两两比较检验。 一旦确定均值间存在差值,两两范围检验和成对多重比较就可以确定哪
些均值存在差值了。对未调整的值进行比较。单独为每个因变量执行两两比较检验。
Bonferroni 和 Tukey’s 真实显著性差异检验是常用的多重比较检验。Bonferroni 检
验基于 Student 的 t 统计量,它针对已进行多重比较这一事实调整观察的显著性水平。
Sidak 的 t 检验也调整显著性水平,并提供比 Bonferroni 检验更严密的界限。Tukey’s
真实显著性差异检验使用 Student 化的范围统计量在组之间进行所有成对比较,并将试
验误差率设置为所有成对比较的集合的误差率。当检验大量均值对时,Tukey’s 真实显
著性差异检验比 Bonferroni 检验更有效。对于少量的对,Bonferroni 更有效。
Hochberg’s GT2 类似于 Tukey’s 真实显著性差异检验,但使用了 Student 化的最大
值模数。通常 Tukey 的检验更有效。Gabriel 的成对比较检验也使用 Student 化的最大
值模数,在单元格尺寸不等的情况下通常比 Hochberg’s GT2 更有效。当单元大小变化
过大时,Gabriel 检验可能会变得随意。
Dunnett 的成对多重比较 t 检验将一组处理与单个控制均值进行比较。最后一个类别
是缺省的控制类别。另外,您还可以选择第一个类别。您还可以选择双侧或单侧检验。
要检验因子的任何水平(控制类别除外)的均值是否不等于控制类别的均值,请使用双
侧检验。要检验因子的任何水平的均值是否小于控制类别的均值,请选择
地,要检验因子的任何水平的均值是否大于控制类别的均值,请选择
<控制。类似
>控制。
Ryan、Einot、Gabriel 和 Welsch (R-E-G-W) 开发了两个多重逐步降低范围检验。多
重逐步降低过程首先检验所有均值是否相等。如果不是所有的均值均相等,则检验一
部分均值的相等性。R-E-G-W F 基于 F 检验,而 R-E-G-W Q 基于 Student 化的范围。
这些检验要比 Duncan 的多范围检验和 Student-Newman-Keuls(也是多重逐步下降过
程)有效,但对于不相等的单元大小则不推荐使用它们。
GLM 多变量分析
当方差不等时,使用 Tamhane’s T2(基于 t 检验的保守成对比较检验)、Dunnett’s
T3(基于 Student 化的最大模数的成对比较检验)、Games-Howell 成对比较检验(有时
是随意的)或者 Dunnett’s C(基于 Student 化的范围的成对比较检验)。
Duncan 的多范围检验、Student-Newman-Keuls (S-N-K)和Tukey 的 b 是排列组均值等
级的范围检验,并计算范围值。这些检验的使用频率不如先前讨论的检验。
Waller-Duncan t 检验使用 Bayesian 方法。当样本大小不相等时,此范围检验使用
样本大小的调和均值。
Scheffé 检验的显著性水平可允许要检验的组均值的所有可能的线性组合,而不仅仅
是此功能中可用的成对比较。其结果是,Scheffé 检验常常比其他检验更保守,这意味
着对于显著性,需要均值之间有更大的差别。
最小显著性差异 (LSD) 成对多重比较检验等同于所有组对之间的多重个别 t 检验。此
检验的缺点是,不进行任何尝试来为多重比较调整观察到的显著性水平。
显示的检验。为 LSD、Sidak、Bonferroni、Games-Howell、Tamhane’s T2 和 T3、
Dunnett’s C 以及 Dunnett’s T3 提供成对比较。为 S-N-K、Tukey 的 b、Duncan、
R-E-G-W F、R-E-G-W Q 以及 Waller 提供范围检验的均一子集。Tukey’s 真实显著性差
异检验、Hochberg’s GT2、Gabriel 的检验以及 Scheffé 的检验既是多重比较检验,
同时也是多范围检验。
9
GLM: 保存
图片 2-7
保存对话框
您可以在数据编辑器中将模型预测的值、残差和相关测量另存为新变量。这些变量中
有许多可用于检查关于数据的假设。要保存供另一 IBM® SPSS® Statistics 会话中
使用的值,您必须保存当前数据文件。
预测值。模型为每个个案预测的值。
未标准化. 模型为因变量预测的值。
10
章2
加权. 加权未标准化预测值。仅在之前已选择了 WLS 变量的情况下可用。
标准误. 对于自变量具有相同值的个案所对应的因变量均值标准差的估计。
诊断。标识以下个案的测量:自变量的值具有不寻常组合的个案,以及可能对模型
产生很大影响的个案。
Cook 距离. 在特定个案从回归系数的计算中排除的情况下,所有个案的残差变化
幅度的测量。较大的 Cook 距离表明从回归统计量的计算中排除个案之后,系数
会发生根本变化。
杠杆值. 未居中的杠杆值。每个观察值对模型拟合的相对影响。
残差。未标准化残差是因变量的实际值减去由模型预测的值。还提供标准化残差、
Student 化的残差以及剔除残差。如果选择了 WLS 变量,则提供加权的未标准化残差。
未标准化. 观察值与模型预测值之间的差。
加权. 加权未标准化残差。仅在之前已选择了 WLS 变量的情况下可用。
标准化. 残差除以其标准差的估计。标准化残差也称为 Pearson 残差,它的均
值为 0,标准差为 1。
学生化. 残差除以其随个案变化的标准差的估计,这取决于每个个案的自变量
值与自变量均值之间的距离。
删除. 当某个案从回归系数的计算中排除时,该个案的残差。它是因变量的值和
调整预测值之间的差。
系数统计。将模型中的参数估计值的协方差矩阵写入当前会话中的新数据集,或写入外
部 SPSS Statistics 数据文件。而且,对于每个因变量,将存在一行参数估计值、一行
与参数估计值对应的 t 统计量的显著性值以及一行残差自由度。对于多变量模型,每一
个因变量都存在类似的行。您可以在读取矩阵文件的其他过程中使用此矩阵文件。
GLM 多变量:选项
图片 2-8
“多变量:选项”对话框
11
GLM 多变量分析
此对话框中有一些可选统计量。统计量是使用固定效应模型计算的。
估计边际均值。选择您需要的单元中的总体边际均值估计的因子和交互作用。为协变量
(如果存在)调整这些均值。仅当指定了定制模型时交互才可用。
比较主效应。 对于主体间和主体内因子,为模型中的任何主效应提供估计边际均
值未修正的成对比较。只有在“显示以下项的均值”列表中选择了主效应的情况
下,此项才可用。
置信区间调节。 选择最小显著性差异 (LSD)、Bonferroni 或对置信区间和显著性的
Sidak 调整。此项只有在选择了
输出。选择描述统计以生成所有单元中的所有因变量的观察到的均值、标准差和计数。
功效估计给出了每个作用和每个参数估计值的偏 eta 方值。eta 方统计量描述总变异
比较主作用的情况下才可用。
性中可归因于某个因子的部分。当基于观察到的值设置备用假设时,选择检验效能 可
获取检验的效能。选择
参数估计可为每个检验生成参数估计值、标准误、t 检验、置
信区间和检验效能。可以显示假设和误差 SSCP 矩阵 以及残差 SSCP 矩阵 加上残差协方差
矩阵的 Bartlett 球形度检验。
齐性检验为跨主体间因子所有水平组合的每个因变量生成 Levene 的方差齐性检验(仅
对于主体间因子)。另外,齐性检验包含对因变量协方差矩阵的齐性 Box M 检验,这些因
变量跨主体间因子的所有水平组合。分布-水平图和残差图选项对于检查关于数据的假设
很有用。如果不存在任何因子,则禁用此项。选择
准化残差图。这些图对于调查方差相等的假设很有用。选择
残差图为每个因变量生成观察-预测-标
缺乏拟合优度检验以检查因变
12
章2
量和自变量之间的关系是否能由模型充分地描述。常规可估计函数 允许您基于常规可估计
函数构造定制的假设检验。任何对比系数矩阵中的行均是常规可估计函数的线性组合。
显著性水平。您可能想要调整用在两两比较检验中的显著性水平,以及用于构造置信
区间的置信度。指定的值还用于计算检验的检验效能。如果指定了显著性水平,则相
关联的置信区间度会显示在对话框中。
GLM 命令的附加功能
这些功能可以适用于单变量、多变量或重复测量分析。使用命令语法语言还可以:
在设计中指定嵌套效应(使用 DESIGN 子命令)。
指定效应对比效应的线性组合或一个值的检验(使用 TEST 子命令)。
指定多个对比(使用 CONTRAST 子命令)。
包括用户缺失值(使用 MISSING 子命令)。
指定 EPS 标准(使用 CRITERIA 子命令)。
构造定制的 L 矩阵、M 矩阵或 K 矩阵(使用 LMATRIX、 MMATRIX 或 KMATRIX 子命令)。
为偏移对比或简单对比指定中间参考类别(使用 CONTRAST 子命令)。
为多项式对比指定矩阵(使用 CONTRAST 子命令)。
为两两比较指定误差项(使用 POSTHOC 子命令)。
为因子列表中的任何因子或因子之间的因子交互计算估计边际均值(使用 EMMEANS 子
命令)。
为临时变量指定名称(使用 SAVE 子命令)。
构造相关矩阵数据文件(使用 OUTFILE 子命令)。
构造包含主体间 ANOVA 表中的统计量的矩阵数据文件(使用 OUTFILE 子命令)。
将设计矩阵保存到新的数据文件(使用 OUTFILE 子命令)。
请参见命令语法参考以获取完整的语法信息。
GLM 重复测量
“GLM 重复测量”过程在对每个主体或个案多次执行相同的测量时提供方差分析。如果
指定了主体间因子,这些因子会将总体划分成组。通过使用此一般线性模型过程,您可
以检验关于主体间因子和主体内因子的效应的原假设。可以调查因子之间的交互以及单
个因子的效应。另外,还可以包含常数协变量的效应以及协变量与主体间因子的交互。
在双重多变量重复测量设计中,因变量表示主体内因子不同水平的多个变量的测量。
例如,您可能在三个不同的时间对每个主体同时测量了脉搏和呼吸。
“GLM 重复测量”过程提供了对重复测量数据的单变量和多变量分析。平衡与非平
衡模型均可进行检验。如果模型中的每个单元包含相同的个案数,则设计是平衡的。
在多变量模型中,模型中的效应引起的平方和以及误差平方和以矩阵形式表示,而不
是以单变量分析中的标量形式表示。这些矩阵称为 SSCP(平方和与叉积)矩阵。除
了检验假设,“GLM 重复测量”过程还生成参数估计。
常用的先验对比可用于对主体间因子执行假设检验。另外,在整体的 F 检验已显示
显著性之后,可以使用两两比较检验评估指定均值之间的差值。估计边际均值为模型
中的单元提供了预测均值估计值,且这些均值的轮廓图(交互图)允许您轻松对其中
一些关系进行可视化。
残差、预测值、Cook 距离以及杠杆值可以另存为数据文件中检查假设的新变量。另外
还提供残差 SSCP 矩阵(残差的平方和与叉积的方形矩阵)、残差协方差矩阵(残差
SSCP 矩阵除以残差的自由度)和残差相关矩阵(残差协方差矩阵的标准化形式)。
WLS 权重允许您指定一个变量,用来针对加权最小平方 (WLS) 分析为观察值赋予不同
权重,这样也许可以补偿测量的不同精确度。
章
3
示例。根据学生的焦虑程度检验的得分将十二个学生分配到高或低焦虑程度组。焦虑
等级被认为是主体间因子,因为它会将主体划分成组。让每个学生进行四个学习任务
试验,并记录每次试验中所犯错误的个数。每次试验的错误都记录在单独的变量中,
并使用四个试验的四个水平定义主体内因子(试验)。试验的效果很明显,而试验与
焦虑的交互则不明显。
方法。类型 I、类型 II、类型 III 和类型 IV 的平方和可用来评估不同的假设。类
型 III 是缺省值。
统计量。两两比较范围检验和多重比较(对于主体间因子):最小显著性
差异、Bonferroni、Sidak、Scheffé、Ryan-Einot-Gabriel-Welsch 多重 F、
Ryan-Einot-Gabriel-Welsch 多范围、Student-Newman-Keuls、Tukey’s 真实显著性差
异、Tukey 的 b、Duncan、Hochberg’s GT2、Gabriel、Waller-Duncan t 检验、Dunnett
(单侧和双侧)、Tamhane’s T2、Dunnett’s T3、Games-Howell 和 Dunnett’s C。描
述统计:所有单元中所有因变量的观察均值、标准差和计数;Levene 的方差齐性检验;
对因变量协方差矩阵的齐性 Box 的 M 检验以及 Mauchly 球形度检验。
图。分布-水平图、残差图以及轮廓图(交互)。
© Copyright SPSS Inc. 1989, 2010
13
14
章3
数据。因变量应是定量的。主体间因子将样本划分为离散的子组,例如男性和女性。这
些因子应是分类因子,可以具有数字值或字符串值。主体内因子是在“重复测量定义因
子”对话框中定义的。协变量是与因变量相关的定量变量。对于重复测量分析,这些数
据在每个主体内变量水平都应该保持不变。
数据文件中应该为主体的每组测量包含一组变量。该组变量为组中的每次重复测
量包含一个变量。为水平数等于重复次数的组定义一个主体内因子。例如,进行权重
测量可能需要不同的天数。如果在五天内测量相同的属性,则主体内因子可以指定为
day,并且该因子具有五个水平。
对于多个主体内因子,每个主体的测量次数均等于每个因子的水平数的乘积。例
如,如果四天内在每天的三个不同时间进行测量,则每个主体的总测量次数为 12。主
体内因子可指定为 day(4) 和 time(3)。
假设。重复测量分析可通过两种方式完成,即单变量和多变量。
单变量方法(也称为分割图或混合模型方法)将因变量视为对主体内因子的水平的
响应。主体测量应为来自多变量正态分布的样本,方差-协方差矩阵在主体间效应形
成的单元内应该都相同。有些假设是针对因变量的方差-协方差矩阵的。如果方差-协
方差矩阵是圆形的,单变量方法中使用的 F 统计量的有效性就可以得到保证(Huynh
and Mandeville,1979 年)。
要检验此假设,可以使用 Mauchly 球形度检验,该方法会对进行了正交标准化转换的
因变量的方差-协方差矩阵执行球形度检验。对于重复测量分析,Mauchly 检验会自动显
示。对于较小的样本,此检验表现的功能并不十分强大。对于较大的样本,此检验的效
果可能显而易见,即使是在偏差对结果的影响很小的情况下也不例外。如果检验的显著
性很大,则可采用球形度假设。不过,在显著性不大并且似乎违反了球形度假设的情况
下,可以对分子和分母自由度进行一定的调整,以便验证单变量 F 统计量。“GLM 重复
测量”过程中存在三个对此调整的估计值,称为 epsilon。分子和分母自由度都必须
乘以 epsilon,并使用新的自由度估计 F 比的显著性。
多变量方法将主体测量视为来自多变量正态分布的样本,方差-协方差矩阵在主体间
效应形成的单元内应该都相同。要检验方差-协方差矩阵是否在所有单元内都相同,
可以使用 Box M 检验。
相关过程。在进行方差分析之前使用“探索”过程来检查数据。如果不 存在对每个
主体的重复测量,则请使用“GLM 单变量”或“GLM 多变量”。如果每个主体仅存在
两个测量(例如检验前和检验后测量),并且不存在主体间因子,则可以使用“配
对样本 T 检验”过程。
获取 GLM 重复测量
E 从菜单中选择:
分析 > 一般线性模型 > 重复测量...
图片 3-1
“重复测量定义因子”对话框
15
GLM 重复测量
E 群体内部因子名称及其级别数。
E 单击 添加 。
E 对每个主体内因子重复这些步骤。
为双重多变量重复测量设计定义测量因子:
E 键入测量名称。
E 单击 添加 。
在定义完所有因子
E 单击 定义 。
和测量后:
16
章3
图片 3-2
“重复测量”对话框
E 在列表上选择一个与群体内部因子(也可能是测量)的每个组合对应的因变量。
要更改变量位置,请使用向上和向下箭头。
要更改群体内部因子,可在不关闭主对话框的情况下重新打开“重复测量定义因
子”对话框。或者,您也可以指定主体间因子和协变量。
GLM 重复测量定义因子
“GLM 重复测量”可分析表示相同属性的不同测量的相关因变量的分组。此对话框使
您可以定义一个或多个主体内因子以便在“GLM 重复测量”中使用。请参阅第 15 页
码中的图片 3-1. 注意,指定主体内因子的顺序非常重要。每个因子都构成前一个因
子内的一个水平。
要使用“重复测量”,必须正确设置数据。您必须在此对话框中定义主体内因子。注
意,这些因子不是数据内的现有变量,而是在这里定义的因子。
示例。在减肥研究中,假设要连续五周每周测量几个人的体重。在数据文件中,每个人
就是一个主体或者个案。每周测量到的体重都记录在 weight1、weight2 等变量中。每
个人的性别则记录在其他变量中。通过定义主体内因子可以将为每个主体重复测量的体
重分组。该因子可命名为 week,并将其定义为具有五个水平。在主对话框中,变量
weight1 到 weight5 用于指定 week 的五个水平。数据文件中将女性和男性分组的变量
(gender) 可以指定为主体间因子以便研究男性和女性的差别。
测量。如果每次就多个测量对主体进行检验,请定义测量。例如,可以在一周的每一天
对每个主体的脉搏和呼吸比率进行测量。这些测量不作为变量保存在数据文件中,但是
在此处定义。具有多个测量的模型有时称为双重多变量重复测量模型。
GLM 重复测量:模型
图片 3-3
“重复测量:模型”对话框
17
GLM 重复测量
构建项
指定模型。全因子模型包含所有因子主效应、所有协变量主效应以及所有因子间交互。
它不包含协变量交互。选择定制 可以仅指定其中一部分的交互或指定因子协变量交
互。必须指定要包含在模型中的所有项。
主体间。列出主体间因子与协变量。
模型。模型取决于数据的性质。选择定制后,您可以选择分析中感兴趣的主体内效应和
交互以及主体间效应和交互。
平方和。计算主体间模型的平方和的方法。对于没有缺失单元的平衡或非平衡主体间模
型,类型 III 平方和法最常用。
对于选定因子和协变量:
交互。创建所有选定变量的最高级交互项。这是缺省值。
主效应。为每个选定的变量创建主效应项。
所有二阶。创建选定变量的所有可能的二阶交互。
18
章3
平方和
所有三阶。创建选定变量的所有可能的三阶交互。
所有四阶。创建选定变量的所有可能的四阶交互。
所有五阶。创建选定变量的所有可能的五阶交互。
对于该模型,您可以选择平方和类型。类型 III 最常用,并且是缺省类型。
类型 I。此方法也称为平方和分级解构法。在模型中,每一项只针对它前面的那项进行
调整。类型 I 平方和常用于:
平衡 ANOVA 模型,其中任何主效应在任何一阶交互效应之前指定,任何一阶交互效
应在任何二阶交互效应之前指定,依此类推。
多项式回归模型,其中任何低阶项在任何高阶项之前指定。
纯嵌套模型,其中第一个指定的效应嵌套在第二个指定的效应中,第二个指定的效应
嵌套在第三个指定的效应中,依此类推。(此嵌套形式只能通过使用语法来指定。)
类型 II。此方法在为所有其它“相应的”效应进行调节的模型中计算某个效应的平
方和。相应的效应是指,与所有效应(不包含正被检查的效应)相对应的效应。类型
II 平方和方法常用于:
平衡 ANOVA 模型。
任何只有主要因子效应的模型。
任何回归模型。
纯嵌套设计。(此嵌套形式能通过使用语法来指定。)
类型 III。缺省类型。此方法在设计中通过以下形式计算某个效应的平方和:为任何
不包含该效应的其他效应,以及任何与包含该效应正交的效应(如果存在)调整的平
方和。类型 III 平方和具有一个主要优点,那就是只要可估计性的一般形式保持不
变,平方和对于单元频率就保持不变。因此,我们常认为此类平方和对于不带缺失单元
格的不平衡模型有用。在不带缺失单元的因子设计中,此方法等同于 Yates 加权均值
平方方法。类型 III 平方和法常用于:
任何在类型 I 和类型 II 中列出的模型。
任何不带空白单元的平衡或非平衡模型。
类型 IV。此方法针对存在缺失单元的情况设计。对于设计中的任何效应 F,如果任何
其它效应中不包含 F,则类型 IV = 类型 III = 类型 II。当 F 包含在其它效应中时,
则类型 IV 将 F 中的参数中正在进行的对比相等地分配到所有较高水平的效应。类
型 IV 平方和法常用于:
任何在类型 I 和类型 II 中列出的模型。
任何带有空白单元的平衡或非平衡模型。
GLM 重复测量:对比
图片 3-4
“重复测量:对比”对话框
使用对比可以检验主体间因子的水平之间的差别。您可以为模型中的每个主体间因子指
定一个对比。对比代表参数的线性组合。
假设检验基于原假设 LBM =0,其中L 是对比系数矩阵,B 是参数矢量,M 是对应
于因变量的平均转换的平均矩阵。可以通过选择“重复测量: 选项”对话框中的
显示此转换矩阵。例如,如果有四个因变量和四个水平的主体内因子,且多项式
矩阵
对比(缺省值)用于主体内因子,则 M 矩阵将为 (0.5 0.5 0.5 0.5)’。当指定对
比之后,创建一个 L 矩阵,使得与主体间因子对应的列与对比匹配。对剩余的列进
行调整,使 L 矩阵可以估计。
可用对比有偏移对比、简单对比、差分对比、Helmert 对比、重复对比和多项式对
比。对于偏移对比和简单对比,您可以选择参考类别是最后一个类别还是第一个类别。
必须为主体内因子选择一个除
19
GLM 重复测量
转换
无之外的对比系数。
对比类型
偏差。将每个水平(参考类别除外)的均值与所有水平的均值(总均值)进行比较。
因子的水平可以为任何顺序。
简单。将每个水平的均值与指定水平的均值进行比较。当存在控制组时,此类对比很
有用。可以选择第一个或最后一个类别作为参考类别。
差分。将每个水平的均值(第一个水平除外)与前面水平的均值进行比较。(有时候称
为逆 Helmert 对比。)
Helmert。将因子的每个水平的均值(最后一个水平除外)与后面水平的均值进行比较。
重复。将每个水平的均值(最后一个水平除外)与后一个水平的均值进行比较。
多项式。比较线性作用、二次作用、三次作用等等。第一自由度包含跨所有类别的线性
效应;第二自由度包含二次效应,依此类推。这些对比常常用来估计多项式趋势。
20
章3
GLM 重复测量:轮廓图
图片 3-5
“重复测量: 轮廓图”对话框
轮廓图(交互图)对
于比较模型中的边际均值是有用的。轮廓图是一个线图,其中每个点
表示因子的一个水平上的估计因变量边际均值(已针对任何协变量进行调整)。第二个
因子的水平可用来绘制分离线。第三个因子中的每个水平可用来创建分离图。所有因子
都可用于图。为每
个因变量创建轮廓图。主体间因子和主体内因子都可用在轮廓图中。
单因子的轮廓图显示估计边际均值是沿水平增加还是减小。对于两个或更多因子,
平行线表示因子之间没有交互,这意味着您只能调查一个因子的水平。不平行的线
则表示交互。
图片 3-6
不平行图(左)和平行图(右)
在通过为水平
轴选择因子,以及通过为分离线和分离图选择因子(后者可选)指定了图
之后,该图必须添加到“图”列表中。