应用多元统计分析课后答案_朱建平版 联系客服

发布时间 : 星期四 文章应用多元统计分析课后答案_朱建平版更新完毕开始阅读728ede922af90242a995e545

49 9 0 81 25 4 0

注:计算方法,其他以此类推。

中最小元素是=4 于是将,聚为一类,记为

计算样本距离阵

0

16 0

64 16 0

中最小元素是 于是将,聚为一类,记为

因此,

第六章

6.1 试述主成分分析的基本思想。

答:我们处理的问题多是多指标变量问题,由于多个变量之间往往存在着一定程度的相关性,人们希望能通过线性组合的方式从这些指标中尽可能快的提取信息。当第一个组合不能提取更多信息时,再考虑第二个线性组合。继续这个过程,直到提取的信息与原指标差不多时为止。这就是主成分分析的基本思想。 6.2 主成分分析的作用体现在何处?

答:一般说来,在主成分分析适用的场合,用较少的主成分就可以得到较多的信息量。以各个主成分为分量,就得到一个更低维的随机向量;主成分分析的作用就是在降低数据“维数”的同时又保留了原数据的大部分信息。

6.3 简述主成分分析中累积贡献率的具体含义。 答:主成分分析把

p个原始变量

X1,X2,?,Xp的总方差

tr(Σ)分解成了p个相互独立的变量

Y1,Y2,?,Yp的方差之和

??k?1pk。主成分分析的目的是减少变量的个数,所以一般不会使用所有p个主成分

的,忽略一些带有较小方差的主成分将不会给总方差带来太大的影响。这里我们称?k??k??k?1pk 为第k个主成分

Yk的贡献率。第一主成分的贡献率最大,这表明Y1?T1?X综合原始变量

X1,X2,?,Xp的能力

mk?1最强,而Y2,Y3,?,Yp的综合能力依次递减。若只取m(?p)个主成分,则称????mk成分Y1,?,Ym的累计贡献率,累计贡献率表明Y1,?,Ym综合累计贡献率达到一个较高的百分数(如85%以上)。

6.4 在主成分分析中“原变量方差之和等于新的变量的方差之和”是否正确? 说明理由。 答:这个说法是正确的。

??k?1pk 为主

X1,X2,?,Xp的能力。通常取m,使得

即原变量方差之和等于新的变量的方差之和

6.5 试述根据协差阵进行主成分分析和根据相关阵进行主成分分析的区别。

答:从相关阵求得的主成分与协差阵求得的主成分一般情况是不相同的。从协方差矩阵出发的,其结果受变量单位的影响。主成分倾向于多归纳方差大的变量的信息,对于方差小的变量就可能体现得不够,也存在“大数吃小数”的问题。实际表明,这种差异有时很大。我们认为,如果各指标之间的数量级相差悬殊,特别是各指标有不同的物理量纲的话,较为合理的做法是使用R代替∑。对于研究经济问题所涉及的变量单位大都不统一,采用R代替∑后,可以看作是用标准化的数据做分析,这样使得主成分有现实经济意义,不仅便于剖析实际问题,又可以避免突出数值大的变量。

6.6 已知X=()’的协差阵为 试进行主成分分析。

解:=0

计算得,

同理,计算得 易知

相互正交

时,

单位化向量得,

,

综上所述,

第一主成分为

第二主成分为

第三主成分为

6.7 设X=()’的协方差阵(p为

, 0

证明:为最大特征根,其对应的主成分为 。

证明:

=

=

,

为最大特征根

当时,

=

,所以,

第七章

7.1 试述因子分析与主成分分析的联系与区别。

答:因子分析与主成分分析的联系是:①两种分析方法都是一种降维、简化数据的技术。②两种分析的求解过程是类似的,都是从一个协方差阵出发,利用特征值、特征向量求解。因子分析可以说是主成分分析的姐妹篇,将主成分分析向前推进一步便导致因子分析。因子分析也可以说成是主成分分析的逆问题。如果说主成分分析是将原指标综合、归纳,那么因子分析可以说是将原指标给予分解、演绎。

因子分析与主成分分析的主要区别是:主成分分析本质上是一种线性变换,将原始坐标变换到变异程度大的方向上为止,突出数据变异的方向,归纳重要信息。而因子分析是从显在变量去提炼潜在因子的过程。此外,主成分分析不需要构造分析模型而因子分析要构造因子模型。 7.2 因子分析主要可应用于哪些方面?

答:因子分析是一种通过显在变量测评潜在变量,通过具体指标测评抽象因子的统计分析方法。目前因子分析在心理学、社会学、经济学等学科中都有重要的应用。具体来说,①因子分析可以用于分类。如用考试分数将学生的学习状况予以分类;用空气中各种成分的比例对空气的优劣予以分类等等②因子分析可以用于探索潜在因素。即是探索未能观察的或不能观测的的潜在因素是什么,起的作用如何等。对我们进一步研究与探讨指示方向。在社会调查分析中十分常用。③因子分析的另一个作用是用于时空分解。如研究几个不同地点的不同日期的气象状况,就用因子分析将时间因素引起的变化和空间因素引起的变化分离开来从而判断各自的影响和变化规律。 7.3 简述因子模型

中载荷矩阵A的统计意义。