发布时间 : 星期四 文章(新人教A版)2020版高考数学大一轮复习第九章统计第3节变量间的相关关系与统计案例讲义理更新完毕开始阅读ad3dcf4ff9c75fbfc77da26925c52cc58bd69092
C.③④ D.②③
(2)甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r与残差平方和m如下表:
r m 甲 0.82 106 乙 0.78 115 丙 0.69 124 丁 0.85 103 则哪位同学的试验结果体现A,B两变量有更强的线性相关性( ) A.甲
B.乙
C.丙
D.丁
解析 (1)由散点图知③中的点都分布在一条直线附近.④中的点都分布在一条曲线附近,所以③④中的两个变量具有相关关系.
(2)在验证两个变量之间的线性相关关系时,相关系数的绝对值越接近于1,相关性越强,在四个选项中只有丁的相关系数最大;残差平方和越小,相关性越强,只有丁的残差平方和最小,综上可知丁的试验结果体现了A,B两变量有更强的线性相关性. 答案 (1)C (2)D
规律方法 1.散点图中如果所有的样本点都落在某一函数的曲线附近,变量之间就有相关关系.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系.若点散布在从左下角到右上角的区域,则正相关.
2.利用相关系数判定,当|r|越趋近于1相关性越强.当残差平方和越小,相关指数R2越大,相关性越强.若r>0,则正相关;r<0时,则负相关.
^
^
3.线性回归直线方程中:b>0时,正相关;b<0时,负相关.
【训练1】 (1)已知变量x和y满足关系y=-0.1x+1,变量y与z正相关.下列结论中正确的是( ) A.x与y正相关,x与z负相关 B.x与y正相关,x与z正相关 C.x与y负相关,x与z负相关 D.x与y负相关,x与z正相关
(2)x和y的散点图如图所示,则下列说法中所有正确命题的序号为________.
①x,y是负相关关系;
5
②在该相关关系中,若用y=c1e
2
则R21>R2;
c2x
拟合时的相关指数为
^^^
2
R1,用y=bx+a拟合时的相关指数为
R22,
③x,y之间不能建立线性回归方程.
解析 (1)由y=-0.1x+1,知x与y负相关,即y随x的增大而减小,又y与z正相关,所以z随y的增大而增大,减小而减小,所以z随x的增大而减小,x与z负相关.
(2)在散点图中,点散布在从左上角到右下角的区域,因此x,y是负相关关系,故①正确;由散点图知用y=c1e
c2x
2
拟合比用y=bx+a拟合效果要好,则R21>R2,故②正确;x,y之间可以建立线性回
^
^
^
归方程,但拟合效果不好,故③错误. 答案 (1)C (2)①② 考点二 线性回归方程及应用
【例2】 (2019·日照调研)某地随着经济的发展,居民收入逐年增长,下表是该地一建设银行连续五年的储蓄存款(年底余额),如下表1:
年份x 储蓄存款y(千亿元) 2013 5 表1
为了研究计算的方便,工作人员将上表的数据进行了处理,t=x-2 012,z=y-5得到下表2:
时间代号t Z 1 0 2 1 表2
(1)求z关于t的线性回归方程;
(2)通过(1)中的方程,求出y关于x的回归方程;
(3)用所求回归方程预测到2022年年底,该地储蓄存款额可达多少?
^
^
^
2014 6 2015 7 2016 8 2017 10 3 2 4 3 5 5 (附:对于线性回归方程y=bx+a,
n^
-
-
其中b=
i=1
∑xiyi-nx·y
n2
∑x2i-nxi=1
-
^
-
^-
,a=y-bx)
5i=1
5i=1
解 (1)t=3,z=2.2,∑tizi=45,∑t2i=55,
^
--
b=
^
45-5×3×2.2
=1.2,
55-5×9
-
^-
a=z-bt=2.2-3×1.2=-1.4,
6
^
所以z=1.2t-1.4.
^
(2)将t=x-2 012,z=y-5,代入z=1.2t-1.4,
^
得y-5=1.2(x-2 012)-1.4,即y=1.2x-2 410.8.
^
(3)因为y=1.2×2 022-2 410.8=15.6,
所以预测到2022年年底,该地储蓄存款额可达15.6千亿元.
^
^
规律方法 1.(1)正确理解计算b,a的公式和准确的计算是求线性回归方程的关键.
^
^
^
-
-
(2)回归直线方程y=bx+a必过样本点中心(x,y).
2.(1)在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程来估计和预测.
(2)对于非线性回归分析问题,应先进行变量代换, 求出代换后的回归直线方程,再求非线性回归方程.
【训练2】 (2018·全国Ⅱ卷)如图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.
为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据
^
2000年至2016年的数据(时间变量t的值依次为1,2,…,17)建立模型①:y=-30.4+13.5t;根
^
据2010年至2016年的数据(时间变量t的值依次为1,2,…,7)建立模型②:y=99+17.5t. (1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由.
^
解 (1)利用模型①,该地区2018年的环境基础设施投资额的预测值为y=-30.4+13.5×19=226.1(亿元).
利用模型②,该地区2018年的环境基础设施投资额的预测值为
^
y=99+17.5×9=256.5(亿元).
7
(2)利用模型②得到的预测值更可靠. 理由如下:
(ⅰ)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=-30.4+13.5t上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利
^
用2010年至2016年的数据建立的线性模型y=99+17.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.
(ⅱ)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.
以上给出了2种理由,考生答出其中任意一种或其他合理理由均可得分. 考点三 独立性检验
【例3】 (2019·湖南长沙雅礼中学、河南省实验中学联考)环境问题是当今世界共同关注的问题,我国环保总局根据空气污染指数PM2.5浓度,制定了空气质量标准:
空气污染(0,50] 指数 空气质量优 等级 某市政府为了打造美丽城市,节能减排,从2010年开始考察了连续六年11月份的空气污染指数,绘制了频率分布直方图,经过分析研究,决定从2016年11月1日起在空气质量重度污染和严重污染的日子对机动车辆限号出行,即车牌尾号为单号的车辆单号出行,车牌尾号为双号的车辆双号出行(尾号是字母的,前13个视为单号,后13个视为双号).王先生有一辆车,若11月份被限行的概率为0.05.
良 轻度污染 中度污染 重度污染 严重污染 (50,100] (100,150] (150,200] (200,300] (300,+∞)
(1)求频率分布直方图中m的值;
8