湖北省宜昌市窑湾中学高中数学选修2-3学案(无答案)3.1 独立性检验

§3.1 独立性检验(1) 教学目标 (1)通过对典型案例的探究,了解独立性检验(只要求 2 ? 2 列联表)的基本思想、方法及初步 应用; (2)经历由实际问题建立数学模型的过程,体会其基本方法. 教学重点、难点:独立性检验的基本方法是重点.基本思想的领会及方法应用是难点. 教学过程 一.问题情境 1. 某医疗机构为了了解呼吸道疾病与吸烟是否有关,进行了一次抽样调查,共调查了 515 个成年 人,其中吸烟者 220 人,不吸烟者 295 人.调查结果是:吸烟的 220 人中有 37 人患呼吸道疾病 (简称患病),183 人未患呼吸道疾病(简称未患病);不吸烟的 295 人中有 21 人患病,274 人未患病. 问题:根据这些数据能否断定“患呼吸道疾病与吸烟有关”? 二.学生活动 为了研究这个问题, (1)引导学生将上述数据用下表来表示: 患病 吸烟 不吸烟 合计 37 21 58 未患病 183 274 457 合计 220 295 515 (2)估计吸烟者与不吸烟者患病的可能性差异: 在吸烟的人中,有 37 21 ? 16.82% 的人患病,在不吸烟的人中,有 ? 7.12% 的人患病. 220 295 问题:由上述结论能否得出患病与吸烟有关?把握有多大? 三.建构数学 1.独立性检验: (1)假设 H 0 :患病与吸烟没有关系. 若将表中“观测值”用字母表示,则得下表: 患病 吸烟 未患病 合计 a b a?b 不吸烟 合计 c d c?d a?c b?d a?b?c?d (近似的判断方法:设 n ? a ? b ? c ? d ,如果 H 0 成立,则在吸烟的人中患病的比例与 不 吸 烟 的 人 中 患 病 的 比 例 应 差 不 多 , 由 此 可 得 a c ? , 即 a?b c?d a( c ? d )? c ( ? a )b ? a?d ,因此, ? b 0 c | ad ? bc | 越小,患病与吸烟之间的关系越弱,否 则,关系越强. ) 设n ? a?b?c?d , 在假设 H 0 成立的条件下, 可以通过求 “吸烟且患病” 、 “吸烟但未患病” 、 “不吸烟但患病” 、 “不吸烟且未患病”的概率(观测频率) ,将各种人群的估计人数用 a, b, c, d , n 表示出来. 例如: “吸烟且患病”的估计人数为 n ? P ( AB ) ? n ? a?b a?c ? ; n n a?b b?d ? “吸烟但未患病” 的估计人数为 n ? P ( AB ) ? n ? ; n n c?d a?c ? “不吸烟但患病”的估计人数为 n ? P ( AB ) ? n ? ; n n c?d b?d ? “不吸烟且未患病”的估计人数为 n ? P( AB ) ? n ? . n n 如果实际观测值与假设求得的估计值相差不大,就可以认为所给数据(观测值)不能否定假设 H 0 .否则,应认为假设 H 0 不能接受,即可作出与假设 H 0 相反的结论. (2)卡方统计量: 为了消除样本对上式的影响,通常用卡方统计量(χ ? ? 卡方 χ 统计量公式: 2 2 (观测值 ? 预期值)2 预期值 )来进行估计. a?b a?c ? ? a?b b?d ? ? ? ? ?a ? n? ? ?b ? n? ? n n ? ? n n ? ? 2 ? χ ? a?b a?c a?b b?d n? ? n? ? n n n n c?d a?c? ? c?d b?d ? ? ? ? ?c ? n? ? ?d ? n? ? n n ? ? n n ? ? ? ? c?d a?c c?d b?d n? ? n? ? n n n n 2 2 2 2 n ? ad ? bc ? ? (其中 n ? a ? b ? c ? d ) ? a ? b ?? c ? d ?? a ? c ?? b ? d ? 2 由此若 H 0 成立,即患病与吸烟没有关系,则 χ2 的值应该很小.把 a ? 37, b ? 183, c ? 21, d ? 274 代入计算得 χ2 ? 11.8634 ,统计学中有明确的结论,在 H 0 成立的情况下,随机事件 “ ? 2 ? 6.635 ” 发生的概率约为 0.01 ,即 P( ? 2 ? 6.635) 0.01 ? ,也就是说,在 H 0 成立的情况下,对统计量 χ2 进行多次观测,观测值超过 6.635 的频率约为 0.01 .由此,我们有 99%的把握认为 H 0 不成立, 即有 99%的把握认为“患病与吸烟有关系”. 象以上这种用 ? 2 统计量研究吸烟与患呼吸道疾病是否有关等问题的方法称为独立性检验. 说明: (1)估计吸烟者与不吸烟者患病的可能性差异是用频率估计概率,利用 χ2 进行独立性检验,可 以对推断的正确性的概率作出估计,观测数据 a, b, c, d 取值越大,效果越好.在实际应用中, 当 a, b, c, d 均不小于 5,近似的效果才可接受. (2)这里所说的“呼吸道疾病与吸烟有关系”是一种统计关系,这种关系是指“抽烟的人患呼 吸道疾病的可能性(风险)更大”,而不是说“抽烟的人一定患呼吸道疾病”. (3)在假设 H 0 下统计量 χ2 应该很小,如果由观测数据计算得到 χ2 的观测值很大,则在一定程 度上说明假设不合理(即统计量 χ2 越大,“两个分类变量有关系”的可能性就越大). 2.独立性检验的一般步骤: 一般地,对于两个研究对象Ⅰ和Ⅱ,Ⅰ有两类取值:类 A 和类 B (如吸烟与不吸烟),Ⅱ 也有两类取值:类 1 和类 2 (如患呼吸道疾病与不患呼吸道疾病),得到如下表所示: Ⅱ 类1 类A Ⅰ 类B 合计 推断“Ⅰ和Ⅱ有关系”的步骤为: 类2 合计 a b a?b c d b?d c?d a?b?c?d a?c 第一步,提出假设 H 0 :两个分类变量Ⅰ和Ⅱ没有关系; 第二步,根

相关文档

湖北省宜昌市窑湾中学高中数学选修2-3学案(无答案)2.2.2事件的相互独立性
湖北省宜昌市窑湾中学高中数学选修2-3学案(无答案)2.1.1离散型随机变量
湖北省宜昌市窑湾中学高中数学选修2-3学案(无答案)2.4正态分布
湖北省宜昌市窑湾中学高中数学选修2-3学案(无答案)1.3.1二项式定理
湖北省宜昌市窑湾中学高中数学选修1-2学案(无答案)1.2 独立性检验的基本思想及其初步应用
湖北省宜昌市窑湾中学高中数学选修2-3学案(无答案)2.2.1条件概率
湖北省宜昌市窑湾中学高中数学选修1-2学案(无答案)第一章 统计案例
湖北省宜昌市窑湾中学高中数学选修2-3学案:2-2-1条件概率 精品
湖北省宜昌市窑湾中学高中数学选修1-2学案(无答案)3.1.2复数的几何意义
湖北省宜昌市窑湾中学高中数学选修2-1学案(无答案)1.1命题及其关系
电脑版