医学统计 联系客服

发布时间 : 星期三 文章医学统计更新完毕开始阅读6d7538dc69dc5022aaea00fe

名解

1.总体:根据研究目的所确定的同质观察单位的全体。 2.样本:从总体中随机抽取的部分个体。

3.统计量:描述某样本特征的指标称为总体参数,简称参数。

4.小概率事件:当某事件发生的可能性很小且概率大于等于0.05或0.01时,统计学通常称为该事件为小概率事件。

5.小概率事件的原理:该事件发生的可能性很小,认为其在一次抽样中不可能发生。

6.参考值范围:有称正常值范围。医学上常把绝大多数正常人的某指标值范围称为该指标的正常值范围。

7.随机:即机会均等,是为了保证样本对总体的代表性、可靠性,使各对比组间在大量不可控制的非处理因素的分布方面尽量保持均衡一致,而采取的一种统计学措施,包括抽样随机、分组随机、实验室顺序随机。

8.四分位数间距:上四分位数与下四分位数之差,即Q=QU-QL。 9.变异系数(CV):亦称为离散系数,为标准差与均数之比,常用百分数表示。

CV?S?100%。 X10.统计推断:通过样本的信息判断总体的特征的过程。内容包括参数估计和假设检验。 11.变量:由于个体的特征或指标存在个体差异,观察结果在测试前不能准确预测,故称为随机变量,简称变量。变量的取值称为变量值或观察值。 变量分类:(1)数值变量或定量变量(计量资料) 体重、身长、母亲年龄 (2)分类变量

1)无序分类(计数资料) 性别、血型 2)有序分类(等级资料) 母亲文化水平

12.抽样误差:由于个体变异的存在,由样本引起的样本统计量与总体参数间的差异。

13.区间估计:是按一定的概率或可信度(1??)用一个区间估计总体参数所在范围,这个范围称作可信度为1??的可信度,又称为置信区间。

14.参数统计:样本所来自的总体分布已知,参数未知,统计推断的目的是利用样本资料,对这些未知的参数进行估计和检验的统计推断方法。

15.非参数统计:样本所来自的总体分布不能确定,这时参数统计方法不使用,需要借助于另一种不依靠总体分布形式,即适用于任意分布的统计方法。 16.秩次:全部观察值按某种顺序排列的位序。 17.秩和:同组秩次之和。 问答

1.集中位置和离散趋势的描述指标(特点和适用范围) 集中位置:

(1)算术均数, 适用于单峰对称分布资料

(2)几何均数,适合于作对数变换后单峰对称分布资料 (3)中位数和百分位数,适用于任何分布的资料 离散趋势

(1)极差 (2)四分位数间距 (3)标准差 (4)方差 (5)变异系数 2.用于相对数注意点

(1)计算相对数的分母不宜过小。 (2)分析时不能以构成比代替率。

(3)对观察单位数不等的几个率,不能直接相加求其平均率。

(4)对比时应注意资料的可行性。

(5)两对或多对相对数指标进行比较时,应考虑抽样误差,进行假设检验,而并不能仅凭有关的相对数数值大小轻易地作出结论。 3.正态分布的特点

(1)正态分布是一单峰分布,高峰位置在均数。 (2)正态分布以均数为中心,左右完全对称。

(3)正态分布取决于两个参数,即均数?和标准差?,?是位置参数和变异度参数,?为形态参数。

(4)有些指标不服从正态分布,但通过适当的变换后服从正态分布。 (5)正态分布曲线的面积分布是有规律的。 4.参考值范围确定原则

(1)选定同质的正常人作为研究对象。 (2)控制检测误差。 (3)判断是否分组。 (4)单、双侧问题。 (5)选择百分界值。 (6)确定可以范围。 5.t分布的特征

(1)t分布为一簇单峰分布曲线。 (2)t分布以0为中心,左右对称。

(3)t分布与自由度v有关,自由度越小,t分布的锋越低,而两侧尾部翘得越高;自由度逐渐增大时,t分布逐渐逼近标准正态分布;当自由度为无穷大时,t分布就是标准正态分布。

6.可信度的两个要素:可靠性、精确性。

7.t检验的应用条件:独立性、正态性、方差齐性。 8.

?2检验的基本思想

检验实际频率和理论频数的温和程度。如果H0成立,则实际频数与理论频数应该比较接近。如果实际频数与理论频数相差较大,超出了抽样误差所能解释的范围,则可以认为H0假设不成立,即两样本对应的总体率不等。

9.四格表?值的应用条件(不同情况下两率比较的方法) (1)n>40,且T>5时,用未校正的

?22检验公式。

?2(2)n>40,且任一理论频率T有140,且T>5时Fisher精确概率计算法。

(3)n<=40或T<=1时,易用Fisher精确概率计算法。 10.检验假设的步骤

(1)建立检验假设,确定检验水平。 H0: H1:

?=0.05。

(2)计算检验统计量。

检验公式或用

(3)确定P值。 (4)作出结论。

若P<=?,拒绝H0,接受H1,差异有统计学意义; 若P>?,不拒绝H0,差异无统计学意义。 11.频数表和频数图的分析 (1)观察有无可疑值。

(2)便于进一步计算有关的统计指标并进行有关的统计分析。 (3)考察分布的类型。 (4)考察分布的特征。 个人觉得重要 1.医学统计学

2.频率分布图的用途: (1)揭示资料的分布类型

(2)看出频率分布的两个重要特征

(3)容易发现一些特大或者特小的可疑值 3.界值?双u0.05=1.96

4.均数为0,标准差为1的正态分布,这种正态分布称为标准正态分布。 5.标准误与标准差的关系

区别 标准差 s 标准误 sx 意义 个体变异 统计量的抽样误差 用途 正常值范围 总体均数的可信区间

(x±1.96s) ( x±t , s x) 与n关系 n s趋于稳定 n sx趋于 0

联系 1.两者都是变异指标,说明个体之间的变异用标准差,说明统计量之间的变异用标准误。

2.当样本含量不变时,标准差大,标准误亦大,均数的标准差与标准误成正比。 6.Ⅰ型错误和Ⅱ型错误 假设检验的结果有两种:

(1) 当拒绝 H0 时, 可能犯错误,可能拒绝了实际上成立的H0, 称为 ? 类错误( “弃真”的错误 ),称为“假阳性”,其概率大小用 α 表示。

(2)当不能拒绝 H0 时,也可能犯错误,没有拒绝实际上不成立的H0 , 这类称为 II 类错误( ”存伪”的错误), 称为“假阴性”,其概率大小用 β 表示, β值一般不能确切的知道。

由样本推断的结果

真实结果 拒绝H0 不拒绝H0 H0成立 Ⅰ型错误 a 推断正确(1-a ) H0不成立 推断正确(1-b) Ⅱ型错误b (1-a)即可信度(confidence level)

(1-b)即把握度(power of a test):两总体确有差别,被检出有差别的能力 7.非参数检验的优点:

⑴不论样本所来自的总体分布的形式如何,甚至是未知,都能适用 ⑵某些非参数方法计算简便,因此在急需获得初步结果时采用 ⑶易于理解和掌握

⑷可用于不能或未加精确测量的资料,如等级资料 非参数检验的缺点:

⑴对适宜用参数方法的资料,若用非参数法处理,常损失部分信息,降低效率

⑵虽然许多非参数法计算简单,但不少问题的计算仍嫌繁杂 8.x2统计量的特征: ①x2≥0

②x2值的大小反映了实际频数与理论频数的吻合程度。

③x2值的大小与格子数有关,格子数越多,则自由度ν越大,x2值也越大。 自由度 ?=(行数-1)(列数-1) 四格表 ?=(2-1)(2-1)=1 9.注意事项:

(1. 对R×C表,若较多格子(1/5)的理论频数小于5或有一个格子的理论频数小于1,则易犯第一类错误。

出现某些格子中理论频数过小时怎么办? 1)增大样本含量(最好!)

2)删去该格所在的行或列(丢失信息!)

3)根据专业知识将该格所在行或列与别的行或列合并。(丢失信息!损害样本的随机性) (2. 单向有序资料不能用x2检验,应该用后面的非参数检验方法,如秩和检验等。

(3. 行×列表资料的x2检验结果有统计学意义时对于所得结果的解释必须谨慎,只能认为各总体率(或总体构成比)之间总的来说有差别,但不能说明它们彼此都有差别。若要进一步解决此问题,可用x2分割法。

10.直线相关:当一个变量X由小到大,另一个变量Y亦相应地由小到大,或由大到小,而同时,两个变量的散点图呈直线趋势,说明两变量间有直线关系。