统计 联系客服

发布时间 : 星期日 文章统计更新完毕开始阅读423156317fd5360cba1adbd4

第1篇 统计初体验——基本操作入门

(4)正态性检验表,如表3-7所示。

表3-7 正态性检验表

总分 .142 Kolmogorov-Smirnova 统计量 df 35 Sig. .071 统计量 .933 Shapiro-Wilk df 35 Sig. .033 a. Lilliefors 显著水平修正

表3-7是借助统计方法对本组数据进行正态性检验的结果。从结果中可以看出,两种正态检验法检验得到的结果显著性水平分别为0.071和0.033,均未到达0.05显著性水平,因此可以说本组数据呈正态分布。

(5)总分的标准Q-Q图:SPSS输出的正态分布概率图也可以用来检验数据的正态性。如图3-24所示,图中呈现的一条45°对角线为理论的正态累积概率分布线,另有一条由小圆圈构成的实际的累积概率分布线,通过将两者进行比较可以看出,本例中数据基本分布于直线附近,总分情况近似呈正态分布。

图3-24 总分的标准Q-Q图

(6)总分的趋降标准Q-Q图:为了更细致、更精确地观察,可以进一步通过趋降标准Q-Q图来进行表示,如图3-25所示。该图反映的是正态分布的理论值与实际观测值之差的分布情况。若数据较均匀的分布于直线Y=0上下,则数据的分布呈正态。

(7)茎叶图:如图3-26所示,是SPSS输出的总分变量的茎叶图。在本图中,分为三列,第一列为Frequency(频数),与同行的Leaf(叶)的位数一致。Stem(茎)的部分代表了观测值的整数部分,Leaf(叶)的部分代表了观测值的小数部分。另外,依据图下10.00,Stem的部分数字1代表10。方的报告Stem width(茎宽):可以得知,依据Each leaf:1 case(s)可以知道,叶的部分每一个数字对应了一个观测值的小数部分。从图3-26中可

·66 ·

第3章 基本统计分析

以看出,本变量所有原始观测值及其频数等都通过茎叶图得到了表示。

图3-25 总分的趋降标准Q-Q图

(8)直方图:SPSS输出的直方图如图3-27所示,表示每一分数段的变量值分布频数情况。

总分 Stem-and-Leaf Plot Frequency Stem & Leaf 1.00 0 . 5 7.00 1 . 0024679 9.00 2 . 011233468 4.00 3 . 0023 4.00 4 . 1369 7.00 5 . 0344468 .00 6 2.00 7 . 45 1.00 8 . 8 Stem width: 10.00 Each leaf: 1 case(s)

图3-26 总分的茎叶图 图3-27 总分的直方图

(9)箱图:如图3-28所示为SPSS结果输出中的箱图。图中底部和顶端的线段分别

表示数据的最小值和最大值,箱子内的中间线段表示总分的中位数。由于中位数在箱子 常值。

·67·

中间偏底部,表明总分变量的数据分布呈正偏态。且由图可以看出,本组数据可能无异

第1篇 统计初体验——基本操作入门

图3-28 总分的箱图

3.5 交叉列联表分析

交叉列联表分析是一种主要适用于对两个或两个以上分类变量的描述及推断的统计分析过程。例如,一项研究中调查了“80后”与“90后”大学生的感恩心理状况,其中个人信息包括性别、出生年份、独生子女否等一些分类变量。如对其中的分类变量形成两两或多个变量间的频数分布表,即可通过“交叉表”过程形成二维或者多维列联表。此外,

还可以通过此过程中的各种度量指标,对列联表中的变量两两进行独立性或相关性的检验。

3.5.1 交叉列联表分析的主要功能

“交叉表”过程的显著特色是可以产生二维或多维列联表,并提供了两两变量间的各

种度量和相关检验。此过程不仅包括描述统计功能,提供了诸如各行列汇总指标的百分数指标、期望次数等,还提供了各种统计推断过程,包括独立性检验及各种相关性指标及其检验等。在SPSS软件中,交叉列联表分析对应于其中的“分析”︱“描述统计”︱“交叉表”过程。

3.5.2 交叉列联表分析的操作过程

在SPSS中交叉列联表分析的操作过程如下。 (1)建立并打开数据文件。

(2)打开交叉列联表分析对话框:在SPSS中,选择“分析”︱“描述统计”︱“交叉表”命令,打开“交叉表”主对话框,如图3-29所示。

·68 ·

第3章 基本统计分析

(3)选择变量:在如图3-29所呈现的对话框中,左侧为源变量列表框,右侧为“行”变量列表框、“列”变量列表框和“层”变量列表框。当进行二维列联表分析时,只需选择行变量和列变量进入对应列表框即可。 “层”变量列表框用于放置分层变量。当要进行三维以上列联表分析时,可将其他变量选入“层”变量列表框中。若仅有一个层变量,则直接选入此列表框中,此时会按照此变量的几种分类情况分别对行列变量进行分析。若在此列表框中选入多个变量,则分别依据这些变量进行分层分析。

另外,在其下方还有“上一张”和“下一张”两个按钮。如进行不同变量组合的分层分析,则可以先选择一个变量至列表框,然后单击“下一张”按钮,此时“层”变量列表框进入第二层,再选入第二个分层变量即可。单击“上一张”按钮,可以回到上一层列表框。

(4)选择复选项:“交叉表”主对话框的左下角,有两个复选项。

图3-29 “交叉表”主对话框

? “显示复式条形图”复选框:在结果中

输出各个变量不同取值情况下的复式频数条形图,可以反映出列联表中各单元格内的频数。

? “取消表格”复选框:不在结果中输出

交叉列联表的表格。

图3-30 “精确检验”对话框

(5)选择精确检验的方法。

在此对话框的右侧有5个按钮,依次为“精确”、“统计量”、“单元格”、“格式”和“Bootstrap”按钮。下面将具体介绍各个按钮的功能。

单击“精确”按钮,打开如图3-30所示的“精确检验”对话框。

“精确检验”对话框中提供了3种不同的检验行列变量相关性的方法。

? “仅渐进法”单选按钮:为SPSS默认的选项。用于大样本的具有渐进分布的数据,

只能计算出近似的显著性水平。

? Monte Carlo单选按钮:用蒙特卡罗法计算确切显著性水平。这是一种较有效的计

算确切显著性水平的方法,不需要数据具有渐进分布的假设。此方法默认样本数为10000,置信水平为99%,可以对此进行更改。

? “精确”单选按钮:是确切概率法。下方可以选择“每个检验的时间限制”复选框,

可以定义时间限制。系统默认为5分钟,即5分钟检验会自动停止。 对此对话框选择完毕后,单击“继续”按钮,则返回“交叉表”主对话框。

(6)选择统计量:单击“统计量”按钮,打开“统计量”对话框,如图3-31所示。 在“交叉表:统计量”对话框中,可对想要输出的统计量进行选择。在此对话框中提

·69·