第4章拟合优度检验§4.1拟合优度检验的一般原理§4.2 二项分布拟合优度检验§4.3 独立性检验三、拟合优度检验的步骤(一)建立假设。无效假设H0表示总体服从设定的分布,或者两个变量相互独立;备择假设HA表示总体不服从设定的分布,或者两个变量彼此相关。(二)确定显著性水平。常用α=0.05或α=0.01。(三)计算统计量。在无效假设为正确的假定下,计算x2值(四)统计推断。按自由度查附表6 得到χ2α,v值,根据所得概率值大小推断无效假设是否正确,从而决定接受还是拒绝H0。例4.1 纯合的黄圆豌豆与绿皱豌豆杂交,F1代自交,F2代性状分离数目如下:表4-1黄圆与绿皱豌豆杂交F2代性状的分离Y-R-(黄圆) Y-rr(黄皱) yyR-(绿圆) yyrr(绿皱)总计315 101 108 32 556 问是否符合自由组合定律?§4.1拟合优度检验的一般原理一、拟合优度检验的含义拟合优度检验(goodness of fit test)是用来检验实际观测数与依照某种假设,或者模型计算出来的理论数之间的一致性,以便判断该假设,或者模型是否与观测数相配合。二、拟合优度检验的类型适合性检验:检验观测数与理论数之间的一致性。独立性检验:通过检验观测数与理论数之间的一致性来判断事件之间的独立性。§4.2 二项分布拟合优度检验二项分布拟合优度检验是一种适合性检验(test for goodness of fit),是利用样本信息对总体分布做出推断,检验总体是否服从二项分布。方法是把样本分成k个互斥的类,然后根据要检验的理论分布算出每一类的理论频数,再将实际的观察频数与理论频数进行比较。本节只介绍总体参数φ已知时二项分布拟合优度检验的方法。解:(一)建立假设。H0:O-T=0,无效假设F2性状分离比为9:3:3:1;备择假设HA:O-T≠0。(二)确定显著性水平。α=0.05(三)计算统计量当性状间相互独立时,根据孟德尔自由组合定律,F2代的表型可由二项分布给出。记显性性状出现的概率为φ,φ=3/4。因一种表型是由一对等位基因决定的,两对基因自由组合时,根据二项展开式:可以得出理论分离比为:1表4-2 黄圆与绿皱豌豆杂交F2代性状分离的χ2值计算 实际观测数(0) 理论频率(p) 理论数(T) Y-R-(黄圆) Y-rr(黄皱) yyR-(绿圆) yyrr(绿皱)315 101 108 32 9/16 3/16 3/16 1/16 312.75 104.25 104.25 34.75 (4)统计推断df=k-1=4-1=3,实得χ2=0.470 < χ20.05,3=7.815,P>0.05,则接受H0,F2性状分离比为9:3:3:1,即两对性状的分离符合自由组合定律。O-T 2.25 -3.25 3.75 -2.75 (O-T)2 5.0625 10.5625 14.0625 7.5625 (O-T)2/T 0.016 0.101 0.135 0.218 Σ[(O-T)2/T ] χ2 =0.016+0.101+0.135+0.218=0.470 例4.2用正常翅的野生型果蝇(vg+vg+)与残翅(vgvg)的果蝇杂交,F1代均表现为正常翅(vg+vg)。F1代自交(vg+vg×vg+vg)所得F2代中包括311个正常翅(vg+vg+和vg+vg)和81个残翅(vgvg)。问这一分离比是否符合孟德尔3:1的理论比。表4-3 正常翅与残翅果蝇杂交F2代性状分离的χ2值计算 正常翅 残翅 总数 实际观测数(0) 311 81 392 理论频率(p) 3/4 1/4 理论数(T) 294 98 392 O-T 17 -17 ∣O-T∣-0.5 16.5 16.5 (∣O-T∣-0.5)2 272.25 272.25 (∣O-T∣-0.5)2/T 0.926 2.7778 Σ[(∣O-T∣-0.5)2/T ] χ2c =0.926+2.778=3.704 解:(一)建立假设。H0:O-T=0,无效假设正常翅与残翅的分离比符合孟德尔3:1理论比;备择假设HA:O-T≠0。(二)确定显著性水平。α=0.05(三)计算统计量根据孟德尔分离定律,F2代的表型可由二项分布给出。记显性性状出现的概率为φ,φ=3/4,隐性性状出现的概率为1/4。计算理论值,填入表4-3。df=k-1=2-1=1,故需用矫正公式:χ2c=Σ(4)统计推断df=k-1=2-1=1,实得χ2c=3.074< χ20.05,3=3.841,P>0.05,则接受H0,即正常翅与残翅的分离比符合孟德尔3:1理论比。2§4.3独立性检验独立性检验(test of independence)用于检验事件间的独立性或者检验处理之间的差异显著性。χ2进行独立性检验的无效假设H0:两个变量相互独立,备择假设HA:两个变量彼此相关。列联表(conringencytable):将所得次数资料按2个变量作两向分组,排列成相依表。2×2列联表df=(2-1)(2-1)=1r×c列联表df=(r-1)(c-1)例4.3 不同给药方式与给药效果的统计结果见表4-4。表4-4 给药方式与给药效果的2×2联列表给药方式 有效(A) 无效(A) 总数 有效率(%)口服(B) 58 40 98 59.2 注射(B) 64 31 95 67.4 总 数 122 71 193 问口服给药与注射给药的效果有无显著差异?(三)计算统计量根据概率乘法法则,若事件A和事件B是相互独立的,两事件同时出现的概率等于分别出现时概率的乘积,即P(AB)=P(A)P(B)故理论数T1=98/193×122/193×193=(98×122)/193=61.95以此类推T2=(98×71)/193=36.05T3=(95×122)/193=60.05T4=(95×71)/193=34.95一、2×2列联表的独立性检验2×2列联表是指横行和纵行皆分为两组的资料。在做独立性检验时,其df=(2-1)(2-1)=1,故计算x2值时需作连续性矫正。解:(一)建立假设无效假设H0:O-T=0(药有效或无效与给药方式无关联,HA:O-T≠0。(二)确定显著性水平α=0.05(四)统计推断表4-5 2×2联列表理论数的计算给药方式 有效(A)无效(A) 总数 有效率(%)口服(B)58(61.95)40(36.05) 98 59.2 注射(B)64(60.05)31(34.95) 95 67.4 总 数 122 71 193 df=(2-1)(2-1)=1,用χ2的矫正公式计算:χ2c=Σ[(∣O-T∣-0.5)2/T ]= [(| 58-61.95 | -0.5)2/61.95] + [(| 40-36.05 | -0.5)2/36.05] +[(| 64-60.05 | -0.5)2/60.05]+[(| 31-34.95 | -0.5)2/34.95]= 0.192+0.330+0.198+0.341= 1.061查附表6,χ20.05,1=3.841,现实得χ2c=1.061< χ20.05,1=3.841,P>0.05,接受H0,即口服给药与注射给药效果没有显著不同。3二、r×c列联表的独立性检验若横行分r组,纵行分c组,且r≥3,c≥3,则为r×c相依表。对r×c表作独立性检验时,其df=(r-1)(c-1),计算x2值不需要连续性矫正。(一)建立假设H0:水稻叶片衰老情况与灌溉方式无关;HA:水稻叶片衰老情况与灌溉方式有关。(二)确定显著性水平α=0.05(三)计算统计量根据H0的假定,计算各组格观察次数相应理论次数:如与146相应的E=(481×160)/547=140.69,与183相应的E=(481×205)/547=180.26,……,所得结果填于表4-7内。(四)统计推断根据可得χ2=(146−140.69)2(7−8.78)2(140.698.78+Λ…+16−11.98)2+11.98=5.62df=(3-1)(3-1)=4,查附表6χ20.05,4=9.488,现χ2=5.62<χ20.05,4=9.488,P>0.05,故应接受H0,即不同灌溉方式对水稻叶片的衰老情况没有显著影响。例4.4 表4-6为不同灌溉方式下水稻叶片衰老情况的调查资料,试检验水稻叶片衰老情况是否与灌溉方式有关。表4-6 水稻在不同灌溉方式下叶片的衰老情况灌溉方式绿叶数黄叶数枯叶数总计深水1467 7160浅水1838 13205湿润1521416182总计4813036547表4-7 水稻在不同灌溉方式下叶片的衰老情况灌溉方式绿叶数黄叶数枯叶数总计深水146 (140.69)7 (8.78)7 (10.53)160浅水183 (180.26)8 (11.24)13 (13.49)205湿润152 (160.04)14 (9.98)16 (11.98)182总计4813036547本章要点1 掌握χ2检验的基本方法2 熟悉拟合优度检验的方法3 熟悉独立性检验的方法4课堂练习一大豆花色一对表1大豆花色一对等位基因遗传的适合性测验等位基因的遗传研花色F2代实际株数究,在F2获得表1紫色208所列分离株数。问白色81这一资料的实际观察比例是否符合于总数2893∶1的理论比值。课堂练习二用近视灵保健液和离子眼药水治疗学生近视眼得到以下结果:用近视灵保健液治疗共60只眼睛,其中51只眼睛有效;用离子眼药水治疗共66只眼睛,其中44只有效;问:两种药物对治疗近视眼的效果差异是否显著?5