人教B版选修(1-2)1.1《独立性检验》word同步测试(2)

浅谈独立性检验在数学解题中的应用 山东省枣庄市第二中学 (277400) 张慧敏 2 独立性检验就是利用随机变量 K 来确定在多大程度上可以认为“两个分类变量有关系” 的方法称为两个分类变量的独立性检验.独立性检验的基本思想类似于反证法.要确认“两 个分类变量有关系”这一结论成立的可信程度,首先假设该结论不成立,即假设结论“两个 分类变量没有关系”成立,在该假设下构造的随机变量 K2 应该很小.如果由观测数据计算 得到的 K 解的观测值 K 很大,则在一定程度上说明假设不合理. 若要推断的论述为 H1 : “X 与 Y 有关系” , 可以按如下步骤判断结论 H1 成立的可能性: (1)通过三维柱形图和二维条形图,可以粗略地判断两个分类变量是否有关系,但是这 种判断无法精确地给出所得结论的可靠程度. ①在三维柱形图中, 主对角线上两个柱形高度 的乘积 ad 与副对角线上两个柱形高度的乘积 bc 相差越大, H1 成立的可能性就越大。 ②在二维条形图中, 可以估计满足条件 X= x1 的个体中具有 Y=y1 的个体所占的比例 x1 x2 总计 y1 a c a+c y2 b d b+d 总计 a+b c+d a+b+c+d 2 a ,也可以估 a?b 计满足条 件 X= x2 的 个体中 具有 Y=y1 的个 体所占 的比例 c .两个比例的值相差越大,H1 成立的可能性就越大. c?d (2)可以利用独立性检验来考察两个分类变量是否有关系 ,并且能较精确地给出这种判 断的可靠程度 .具体做法是: 根据观测数据计算由 K2 = n(ad ? bc) 2 (其中 (a ? c)(a ? b)(c ? d )(b ? d ) n=a+b+c+d)给出的检验随机变量 K2 的值 K,其值越大,说明“X 与 Y 有关系”成立的可能性 越大.当得到的观测数据 a,b,c,d 都不小于 5 时,可以通过查阅下表来确定结论“X 与 Y 有关系”的可信程度. (K2 ≥k) 0.50 P k 0.455 0.40 0.708 0.25 1.323 0.15 2.072 0.10 2.706 0.05 3.841 0.025 5.024 0.010 6.635 0.005 7.879 0.001 10.828 说明:当观测数据 a,b,c,d 中有小于 5 的数时,需采用很复杂的精确的检验方法。 题型一.独立性检验的概念及方法 所谓独立性检验,就是根据采集的样本数据,利用公式计算 K2 的值,比较 K2 与临界值 的大小关系,来判定 A 与 B 是否无关问题,是一种假设检验. 例 1.在独立性检验中,选用 K2 作统计量,当 K2 满足条件_ 时,我们有 99%的把 握说明事件 A 与 B 有关. 解析:当 K2 >10.828 时,有 99.9%的把握认为 A 与 B 有关系;当 K2 > 6.635 时,有 99%的把握认为 A 与 B 有关系.所以填:K2 >6.635. 题型三:独立性检验的应用 独立性检验在生物统计、医学统计等学科中有广泛的应用,在处理社会调查问题时,也 常常用到独立性检验, 在 2×2 列联表中, 通过计算 K 与临界值的大小, 推断事件是否独立. 具 2 体步骤: (1)采集样本数据.(2)根据公式计算 K 的观测值.(3)作统计判断. 例 2.某科技小组的活动记录显示,过去的 10 项活动都在星期一、三或五. (1)你能否判定科技小组的活动日有规定? (2)你能否判定科技小组星期二不活动? 解:(1)假设科技小组的活动日无规定,而周一至周日七天每天都可 能活动, 则 10 2 次活动都在周一、周三或周五的概率为( 假设是错误的,即活动日是有规定的. 3 10 ) ≈0.000209041,它是一个小概率事件,因此原 7 6 10 ) ≈0.2141,这不是小概率 7 (2)计算“10 次活动都不在星期二”这一事件的概率为( 事件,所以不能判定星期二不活动. 例 3. 打鼾不仅影响别人休息, 而且可能与患某种疾病有芜下表是一次调查所得的数据, 试问:每一晚都打鼾与患心脏病有关系吗?有多大的把握认为你的结论成立? 解:假设“每一晚都打鼾与患心脏病没有关系” ,由题意可知:a=30,b=224,c=24, d=1355,a+b=254,c +d=1379,a+c =54,b+d=1579,n =1633.代人公式 因为 K ≈68.033>10.828, 所以我们有 99.9%的把握认为每一晚都打鼾与患心脏病有关 系. 注意 :我们都有较大的把握认为 结论成立.但我们所说的“每一晚都打鼾与患心脏病 有关”或“患慢性气管炎与吸烟习惯有关”指的都是统计上的关系,不要误以为这里面存在 因果关系,具体到某一个每一晚都打鼾的人,并不能说他一定患有心脏病,从列联表中也可 以看出,每一晚都打鼾的 人群中,患心脏病的概率也只有 2 30 ,稍微超过了十分之一, 254 至于他患不患心脏病,应该由医学检查来确定,这已经不是统计学研究的范畴了. 例 4. 有甲、乙两个班级进行一门课程的考试,按照学生考试成绩优秀和不优秀统计 成绩后,得到下表,请画出列联表的二维条形图,并通过图形判断成绩与班级是否有关,利 用列联表的独立性检验估计判断“成绩与班级有关”犯错误的概率. 解:根据列联表的数据,作出二维条形图,如下图所示. 从条形图中可以看出,甲班学生中优秀的人数的比例数为 数的比例数为 10 .乙班中学生优秀的人 45 7 , 二者差别不是很大,因此我们可以认为优秀与所在班级没有关系 45 用独立性检验来判断:由题意知 a=l0,b=35,c=7,d=38,a+b=45,c+d=45,a+c =17,b +d=73,n=90,代入公式 因为 0.65<2.706. 所以我们没有理由认为成绩优秀与所在班级有关系,我们可以断言 “成绩与班级有关”犯错误的概率超过 10%. 解题心得:用

相关文档

人教B版选修(1-2)1.1《独立性检验》同步测试(1)
人教B版选修(1-2)《独立性检验》同步测试
人教B版选修(1-2)第一章《统计案例》word同步测试(1)
人教B版选修(1-2)1.1《独立性检验》word教案(1)
人教B版选修(1-2)4.1《流程图》word同步测试(2)
人教B版选修(1-2)4.1《流程图》word同步测试(6)
人教B版选修(1-2)第一章《统计案例》word同步测试(4)
人教B版选修(1-2)4.1《流程图》word同步测试(7)
人教B版选修(1-2)第一章《统计案例》word同步测试(3)
人教B版选修(1-2)4.1《流程图》word同步测试(5)
电脑版