最新2020高中数学 第3章 统计案例 3.1 独立性检验教学案 苏教版选修2-3 联系客服

发布时间 : 星期一 文章最新2020高中数学 第3章 统计案例 3.1 独立性检验教学案 苏教版选修2-3更新完毕开始阅读46a4e5835dbfc77da26925c52cc58bd6318693df

3.1 独立性检验

1.2×2列联表的定义

对于两个研究对象Ⅰ和Ⅱ,Ⅰ有两类取值,即类A和类B;Ⅱ也有两类取值,即类1和类2.这些取值可用下面的2×2列联表表示.

2

.χ统计量的求法

n(ad-bc)

公式χ=.

(a+c)(b+d)(a+b)(c+d)

2

2

2

3.独立性检验的概念

2

用统计量χ研究两变量是否有关的方法称为独立性检验. 4.独立性检验的步骤

要判断“Ⅰ与Ⅱ有关系”,可按下面的步骤进行: (1)提出假设H0:Ⅰ与Ⅱ没有关系;

22

(2)根据2×2列联表及χ公式,计算χ的值; (3)查对临界值,作出判断. 其中临界值如表所示: P(χ≥x0) χ0 20.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 10.828 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 2 表示在H0成立的情况下,事件“χ≥x0”发生的概率. 5.变量独立性判断的依据

2

(1)如果χ>10.828时,那么有99.9%的把握认为“Ⅰ与Ⅱ有关系”;

2

(2)如果χ>6.635时,那么有99%的把握认为“Ⅰ与Ⅱ有关系”;

2

(3)如果χ>2.706时,那么有90%的把握认为“Ⅰ与Ⅱ有关系”;

2

(4)如果χ≤2.706时,那么就认为没有充分的证据显示“Ⅰ与Ⅱ有关系”,但也不能

1

作出结论“H0成立”,即Ⅰ与Ⅱ没有关系.

1.在2×2列联表中,通常要求a,b,c,d的值均不小于5.

2.表中|ad-bc|越小,Ⅰ与Ⅱ关系越弱;|ad-bc|越大,Ⅰ与Ⅱ关系越强.同时要记准表中a,b,c,d四个数据是交叉相乘然后再作差取绝对值,一定不要乘错.

3.表中类A与类B,以及类1与类2的关系:对于对象Ⅰ来说,类A与类B是对立的,也就是说类A发生,类B一定不发生,类A不发生,则类B一定发生;同样对于对象Ⅱ来说,类1与类2的关系也是如此.

[例1] 在一项有关医疗保健的社会调查中,发现调查的男性为530人,女性为670人,其中男性中喜欢吃甜食的为117人,女性中喜欢吃甜食的为492人,请作出性别与喜欢吃甜食的列联表.

[思路点拨] 在2×2列联表中,共有两类变量,每一类变量都有两个不同的取值,然后找出相应的数据,列表即可.

[精解详析] 作列联表如下:

男 女 合计 喜欢甜食 117 492 609 不喜欢甜食 413 178 591 合计 530 670 1 200

[一点通] 分清类别是列联表的作表关键步骤.表中排成两行两列的数据是调查得来的结果.

1.下面是2×2列联表: x1 x2 合计 y1 a 2 b y2 21 25 46 合计 73 27

则表中a,b的值分别为________,________.

解析:∵a+21=73,∴a=52.又∵a+2=b,∴b=54.

2

答案:52 54

2.某学校对高三学生作一项调查后发现:在平时的模拟考试中,性格内向的426名学生中有332名在考前心情紧张,性格外向的594名学生中在考前心情紧张的有213人 .作出2×2列联表.

解:作列联表如下: 考前心情紧张 考前心情不紧张 合计

性格内向 332 94 426 性格外向 213 381 594 合计 545 475 1 020

[例2] 下表是某地区的一种传染病与饮用水的调查表:

干净水 不干净水 合计 得病 52 94 146 不得病 466 218 684 合计 518 312 830

(1)这种传染病是否与饮用水的卫生程度有关,请说明理由;

(2)若饮用干净水得病5人,不得病50人,饮用不干净水得病9人,不得病22人.按此样本数据分析这种疾病是否与饮用水有关,并比较两种样本在反映总体时的差异.

2

[思路点拨] (1)根据表中的信息计算χ的值,并根据临界值表来分析相关性的大小,对于(2)要列出2×2列联表,方法同(1).

[精解详析] (1)假设H0:传染病与饮用水无关.把表中数据代入公式,得

830×(52×218-466×94)χ=≈54.21,

146×684×518×312

2

2

因为当H0成立时,χ≥10.828的概率约为0.001,

所以我们有99.9%的把握认为该地区这种传染病与饮用不干净水有关. (2)依题意得2×2列联表:

2

干净水 不干净水 合计

得病 5 9 14 2

不得病 50 22 72 合计 55 31 86 86×(5×22-50×9)

此时,χ=≈5.785.

14×72×55×31

2

由于5.785>2.706,

所以我们有90%的把握认为该种疾病与饮用不干净水有关.

两个样本都能统计得到传染病与饮用不干净水有关这一相同结论,但(1)中我们有99.9%的把握肯定结论的正确性,(2)中我们只有90%的把握肯定.

2

[一点通] 解决独立性检验问题的基本步骤是:①指出相关数据,作列联表;②求χ

3

的值;③判断可能性,注意与临界值作比较,得出事件有关的可能性大小.

3.某保健药品,在广告中宣传:“在服用该药品的105人中有100人未患A疾病”.经调查发现,在不使用该药品的418人中仅有18人患A疾病,请用所学知识分析该药品对患A疾病是否有效?

解:依题意得2×2的列联表:

使用 不使用 合计 患病 5 18 23 不患病 100 400 500 合计 105 418 523

要判断该药品对患A疾病是否有效,即进行独立性检验提出假设H0:该药品对患A疾病没有效.

根据列联表中的数据可以求得

523×(5×400-100×18)χ=≈0.041 45<0.455,

23×500×418×105

2

2

而查表可知P(χ≥0.455)≈0.5,故没有充分的理由认为该保健药品对预防A疾病有效.

4.在国家未实施西部开发战略前,一新闻单位在应届大学毕业生中随机抽取1 000人问卷,只有80人志愿加入西部建设.而国家实施西部开发战略后,随机抽取1 200名应届大学毕业生问卷,有400人志愿加入国家西部建设.实施西部开发战略是否对应届大学毕业生的选择产生了影响?

解:依题意,得2×2列联表: 2

开发战略公布前 开发战略公布后 合计 志愿者 80 400 480 非志愿者 920 800 1 720 合计 1 000 1 200 2 200

提出假设H0:实施西部开发战略的公布对应届大学毕业生的选择没有产生影响,根据列联表中的数据,可以求得

2 200×(80×800-920×400)χ=≈205.22.

480×1 720×1 000×1 200

2

2

因为当H0成立时,χ≥10.828的概率约为0.001,所以有99.9%的所握认为西部开发战略的实施对应届大学毕业生的选择产生了影响.

独立性检验的基本思想与反证法的思想比较

反证法 要证明结论A 在A不成立的前提下进行推理 推出矛盾意味着结论A成立 没有找到矛盾,不能对A下任何结论,即反

2

独立性检验 要确认“两个对象有关系” 假设该结论不成立,即假设结论“两个对象2没有关系”成立,在该假设下计算χ 由观测数据计算得到的χ的观测值很大,则在一定可信程度上说明假设不合理 根据随机变量χ的含义,可以通过概率P(χ2224