典型相关分析在STATA中的实现和案例 联系客服

发布时间 : 星期四 文章典型相关分析在STATA中的实现和案例更新完毕开始阅读68ef076930126edb6f1aff00bed5b9f3f80f7213

x3 | 0.0002 -0.0083 -0.0010 0.0047 x4 | 0.0013 0.0011 -0.0034 -0.0045 ------------------------------------------------------

Raw coefficients for the second variable set

| 1 2 3 4 -------------+---------------------------------------- x5 | 0.0008 0.0009 -0.0017 -0.0003 x6 | 0.0026 -0.0090 -0.0054 0.0021 x7 | -0.0004 0.0014 0.0014 -0.0010 x8 | 0.0007 0.0107 -0.0022 0.0173 x9 | -0.0001 -0.0070 0.0146 0.0112 x10 | 0.0005 0.0027 -0.0008 -0.0082 x11 | 0.0015 -0.0012 -0.0129 -0.0043 x12 | 0.0033 0.0005 0.0084 -0.0400 ------------------------------------------------------

---------------------------------------------------------------------------- Canonical correlations:

0.9728 0.8003 0.6015 0.4944

---------------------------------------------------------------------------- Tests of significance of all canonical correlations

Statistic df1 df2 F Prob>F Wilks' lambda .00931766 32 71.6637 5.7184 0.0000 a Pillai's trace 2.19298 32 88 3.3374 0.0000 a Lawley-Hotelling trace 20.2776 32 70 11.0893 0.0000 a Roy's largest root 17.6057 8 22 48.4158 0.0000 u ---------------------------------------------------------------------------- e = exact, a = approximate, u = upper bound on F

从运行结果,我们可以得到各个变量对典型变量的影响,即表现为在典型变量式子中观察变量的系数值,以及典型相关系数和典型相关的显著性检验。在该运行中,不没有对数据进行标准转化的,因此从它们的系数的相对大小我们不可以判别出在对应的典型变量中,哪个观察变量影响的大小。

接下来我们通过加入选项stdcoef进行运行,对数据进行标准转化,结果如下:

. canon (x1-x4) (x5-x12),stdcoef

Canonical correlation analysis Number of obs = 31

Standardized coefficients for the first variable set

| 1 2 3 4 -------------+---------------------------------------- x1 | 0.6268 1.6301 1.1789 0.2129 x2 | 0.2488 -0.3015 0.5362 -0.8347 x3 | 0.0541 -2.0198 -0.2406 1.1362 x4 | 0.4072 0.3299 -1.0587 -1.3981 ------------------------------------------------------

Standardized coefficients for the second variable set

| 1 2 3 4 -------------+---------------------------------------- x5 | 0.4477 0.5054 -0.9698 -0.1982 x6 | 0.2856 -0.9707 -0.5840 0.2249 x7 | -0.1190 0.4806 0.4722 -0.3243 x8 | 0.0667 0.9983 -0.2082 1.6067 x9 | -0.0213 -1.3904 2.8847 2.2177 x10 | 0.1118 0.5533 -0.1706 -1.6961 x11 | 0.2202 -0.1724 -1.8828 -0.6265 x12 | 0.1149 0.0164 0.2906 -1.3862 ------------------------------------------------------

---------------------------------------------------------------------------- Canonical correlations:

0.9728 0.8003 0.6015 0.4944

---------------------------------------------------------------------------- Tests of significance of all canonical correlations

Statistic df1 df2 F Prob>F Wilks' lambda .00931766 32 71.6637 5.7184 0.0000 a Pillai's trace 2.19298 32 88 3.3374 0.0000 a Lawley-Hotelling trace 20.2776 32 70 11.0893 0.0000 a Roy's largest root 17.6057 8 22 48.4158 0.0000 u ---------------------------------------------------------------------------- e = exact, a = approximate, u = upper bound on F

在标准化数据情形下得出来的运行结果,我们可以直接根据在对应的典型相关变量中观察变量的大小来判断对典型相关变量的影响。对比上面两种运行结果,我们可以看到除了典型相关变量中观察变量的大小变化外,其它的结果都是一样的。因此,在实际情况中,当遇到那些观察变量大小差别太大时候,我们就要将这些观察变量的数据标准化,以消除变量量纲的影响。

序号 1 典型相关系数 表:典型相关系数及典型变量 典 型 变 量 U1=0.6268X1+0.2488X2+0.0541X3+0.4072X4 V1=0.4477X5+0.2856X6-0.1190X7+0.0667+X8-0.0213X9 0.1118X10+0.2202X11+0.1149X12 ???1=0.9728 ? 2 U2=1.6301X1-0.3015X2-2.0198X3+0.3299X4 V2=0.5054X5-0.9707 X6+0.4806X7+0.9983 X8-1.3904X9 +0.5533X10-0.1724X11+0.0164X12 ???2=0.8003 ?3 U3=1.1789X1+0.5362X2-0.2406X3-1.0587X4 V3=-0.9698X5-0.5840X6+0.4722X7-0.2082X8 +2.8847X9-0.1706X10-1.8828 X11+0.2906X12 ???3=0.6015 ? 4 U4=0.2129X1-0.8347X2+1.1362X3-1.3981X4 V4=-0.1982X5+0.2249X6-0.3243X7+1.6067X8 +2.2177X9-1.6961X10-0.6265X11-1.3862X12 ???3=0.4944 ?结果分析:第一对典型变量中,U1主要受工资性收入和转移性收入影响,V1主要受食品支出和衣着支出;第二对典型变量中,U2主要受工资性收入和财产性

???收入,V2主要受衣着支出、家庭设备及服务支出和交通和通讯支出;第三对典型变量中,U3主要受工资性收入和转移性收入,V3主要受食品支出、交通和通讯支出和医疗保健支出。

在检验过程中,我们可以检验各个观察变量的之间的相关系数以及与其对应的典型变量的相关系数。

. estat correlations

???Correlations for variable list 1