第八章 假设检验 联系客服

发布时间 : 星期六 文章第八章 假设检验更新完毕开始阅读7fd57f61ddccda38376baff2

§8.3总体分布的假设检验

上一节中我们讨论了关于正态总体分布中的未知参数的假设检验,在这些假设检验中总体分布的类型是已知的。然而在很多情况下总体分布的类型是未知的,这时就需要根据样

2

本所提供的信息对总体分布的种种假设进行检验。总体分布假设检验的方法有许多种,χ

2

检验法是一种常用的方法。由于所用的统计量是由皮尔逊首先提出的,故χ检验法也称为

2

皮尔逊χ拟合检验。

总体分布假设检验问题的一般提法是,在显著性水平α下,检验统计假设: H0:F(x)?F0(x),H1:F(x)?F0(x)

其中F(x)为总体X的未知的待检验分布函数,F0(x)为一个已知的或仅含几个未知参数的分布函数。

利用χ

2

检验法检验假设H0时,要求F0(x)的形式及其中的参数都是已知的。实际上

F0(x)中的参数值往往未知,这时要用最似然法先估计未知参数,然后再作检验。

χ

2

拟合检验法的基本思想是:把随机试验的结果全体Ω分成k个互不相容的事件

?i=P(Ai),i=1,2,?,k,显然,在nA1,A2,?,AK,则在假设H0成立的条件下,我们可以计算出p?i有差次独立试验中,事件Ai的频率wi(Ai)=fi/n, fi为事件Ai出现的次数,频率wi与概率p异。一般情况下,在大样本情形时,若H0为真,这种差异不会太大,因此,当这种差异显

著时,我们有理由怀疑原假设H0的正确性。由此,皮尔逊设计出统计量

?i)2(fi?np χ??

?inpi?12k?i叫理论频数。统计量χ称为皮尔?i为理论概率,np其中:fi为实际观察值的频数,p2

逊统计量。根据皮尔逊-费歇(Fisher)定理,从H0出发,在大样本情况下,皮尔逊统计量

2服从或近似服从卡方分,χ~χα(k?r?1)。其中r为F0(x)中未知参数的个数。所以我们

2可以根据统计量的值和χ分布的临界值判断原假设H0是否成立。综上所述,分布假设检验的一般步骤为:

1°作统计假设

H0 F(x)=F0(x)

2°将区间(-∞,+∞)分成k个互不相交的区间[yi-1,yi),i=1,2,?,k,一般y0取-∞,yk取+∞,且要求每个区间至少包含5个样本值,否则应适当合并区间,以两足这个要求。

2

?i. ?i=F0(yi)-F0(yi-1),i=1,2,?,k.并计算出理论频数np3°计算理论概率p4°计算样本观察值x1,x2,?,xn在每个区间[yi,yi+1]中的频数fi.

?i)2(fi?np?i代入χ??5°将fi和np

?inpi?12k26°将χ2和χα(k?r?1)比较,决定是拒绝还是接受H0。

例8.10 根据某地区随机抽取的200株落叶松胸径资料,如下表,检验该地区的蔽叶松胸径是否服从正态分布?

胸径分组 组中值xi 株数fi 10-14 14-18 18-22 22-26 26-30 30-34 34-38 38-42 12 3 16 14 2

总和 200 20 22 24 52 28 59 32 31 36 15 40 4 解:正态分布有两个参数μ,σ未知,需用样本特征数代替。所以先计算样本平均数和方差的无偏估计。

18182x??xifi ?26.46,s?(xi?x)2fi?33.072 ?n?1i?1ni?11°作统计假设

H0:总体服从正态分布N(26.46,33.072)

2°正态分布的随机变量取值为(-∞,+∞),把它分成6个互不相交的区间:(-∞,,18),[18,22],?,(38,+∞)

?i=F0(yi)-F0(yi-1),i=1,2,?,k. 3°利用正态分布表计算各区间上的理论概率p18?26.46?1?F(y1)?0.06944 F(y1)??()??(?1.48)?0.06944,p33.072F(y2)??(F(y3)??(F(y4)??(F(y5)??(22?26.46?2?F(y2)-F(y1)?0.14826 )??(?0.78)?0.2177,p33.07226?26.46?3?F(y3)-F(y2)?0.2504 )??(?0.08)?0.4681,p33.07230?26.46?4?F(y4)-F(y3)?0.2643 )??(0.62)?0.7324,p33.07234?26.46?5?F(y5)-F(y4)?0.1742 )??(1.32)?0.9066,p33.072F(y6)??(???26.46?6?F(y6)-F(y5)?0.0934 )??(??)?1,p33.07228?i)2(fi?np?i代入χ??4°将fi和np

?npii?1胸径分组 株数fi (-∞,18) [18,22) (22,26) (26,30) 17 22 52 59 (30,34) (34,+∞) 31 19 ?i p0.06944 0.14826 0.2504 0.2643 0.1742 0.0934 ?i np13.888 29.652 50.08 52.86 34.84 18.68 ?i)2 (fi-np9.6845 58.5531 3.6864 37.6996 14.7456 0.1024 ?i)2/(fi-np0.6973 1.9747 0.0757 0.7132 0.4232 0.0055 ?i np

所以, χ2?0.6973?1.9747?0.0757?0.7132?0.4232?0.0055=3.8896

225° 由α=0.05及k?r?1=6-2-1=3查表得,χ0.05(3) =7.8147.因为?<χ0.05(3),所

2以不能推翻假设。

例8.11 对某系统2004年的职工抽样调查,获得日人均收入的资料如下: 日人均收入(元) 人数 <40 5 [40,60) [60,80) [80,100) 16 40 27 ?100 12 计算100人的日人均收入x?72.3,样本方差S2=202。问该系统职工的日人均收入是否服从正态分布N(72.3,202)?

解 令日人均收入为X,假设X~N(μ,σ2),参数μ和σ2未知,已知由样本估计

??72.3,σ?2?202,这也是μ和σ2的极大似然估计值,按收入水平分成五类,先计算相应μ?i: 的pF(y1)??(40?72.3?1?F(y1)?0.0531 )??(?1.615)?0.0531,p2060?72.3?2?F(y2)-F(y1)?0.2161 )??(?0.615)?0.2692,p2080?72.3?3?F(y3)-F(y2)?0.3806 )??(0.385)?0.6498,p20F(y2)??(F(y3)??(日人均收入(元) 户数fi <40 5 [40,60) [60,80) 16 40 [80,100) 27 ?100 12 ?i np5.31 21.61 38.06 26.56 8.46

?i)2 (fi-np0.0961 31.4721 3.7636 0.1936 12.5136

?i ?i)2/np(fi-np0.0181 1.4564 0.0989 0.0073 1.4813

100?72.3?4?F(y4)-F(y3)?0.2656 F(y4)??()??(?1.385)?0.9154,p20?5?1-F(y4)?0.0846 p(1)统计假设H0:X~N(72.3,202)。

(2)对水平α=0.05,查自由度5-2-1=2(k=5,r=2)的x2-分布得临界值?0.05(2)?5.99 (3)统计量x2的观测值:

2?i)2(fi?np=0.0181+1.4564+0.0989+0.0073+1.4813=3.062 χ???inpi?025