您的当前位置:首页正文

相关分析 实验报告

来源:个人技术集锦


评分

实验报告

课程名称 生物医学统计分析 实验名称 相关分析 专业班级 姓 名 学 号 实验日期 实验地点

生物医学统计分析 2015—2016学年度第 2 学期

一、 实验目的 学会利用两个变量间的线性相关分析法、两个等级(秩)变量间的相关分析法及偏关分析法对数据进行相关分析。 二、实验环境 1、硬件配置:处理器:Intel(R) Core(TM) i7-3770 CPU @3.40GHz 3.40GHz 安装内存(RAM):4.00GB 系统类型:64位操作系统 2、软件环境:IBM SPSS Statistics 19.0软件 三、实验内容 (包括本实验要完成的实验问题及需要的相关知识简单概述) (1)课本第七章的例7.1-7.5运行一遍,注意理解结果; (2)然后将实验指导书上的例1-2运行一遍,注意理解结果。 三、实验结果与分析 例7.1 输出结果: 表1 摄食量与耗氧率的描述性统计量 摄食量 耗氧量 均值 45.00 621.650 标准差 18.708 68.4752 N 6 6 表2 摄食量与耗氧率的相关分析结果表 摄食量 Pearson 相关性 显著性(双侧) N 耗氧量 Pearson 相关性 显著性(双侧) N **. 在 .01 水平(双侧)上显著相关 摄食量 1 耗氧量 .990 .000 6 ** 6 .990 .000 6 **1 6 分析:1)本实验主要是为了研究摄食量与耗氧率之间的关系,而我们所研究的摄食量这一自变量只存在等数量间隔的差异,并不强调顺序,是定距变量,因此我们选用定距分析; 2)表1为是分析变量的基本统计量,包括两变量的均数、标准差和观测样本数。摄食量: x45.00,s18.708。耗氧量:x621.650,s68.4752。 3)表2给出的是相关系数及其检验结果。其中r0.990,P0.0000.01说明两变量 第2页 共10页

生物医学统计分析 间存在极显著的高度正相关关系,即耗氧率随着摄食量的增加而增加;

4)定距变量可以转化为定序变量,因此在本实验中计算相关系数r时所选取的Pearson方法也可以换成Kendall的tau-b和Spearman两种方法;

5)“按对排除个案”选项表示在计算某个统计量时,从这个变量中排除有缺省值的观测,因此本实验选择该选项进行计算两变量间的基本统计量;

6)在SPSS输出的结果中,相关系数肩标“*”为P0.05,表明在两变量差异显著的情况下所得出的值;肩标“**”为P0.01,表明在两变量差异极显著的情况下所显示的值;

7)实验中应注意由于我们事先并不知道所研究的变量间是否存在相关关系,因此我们需选择双侧检验。

例7.2

输出结果:

表3 甲、乙的相关分析结果表

Kendall 的 au_b

相关系数 Sig.(双侧)

N

相关系数 Sig.(双侧)

N

Spearman 的 rho

相关系数 Sig.(双侧)

N

相关系数 Sig.(双侧)

N

*. 在置信度(双测)为 0.05 时,相关性是显著的。 **. 在置信度(双测)为 0.01 时,相关性是显著的。

甲 1.000 . 10 .732 .010 10 1.000 . 10 .799 .00 10

***

乙 .732 .010 10 1.000 . 10 .799 .006 10 1.000 . 10

***

分析:1)本实验主要是为了研究甲、乙评委在对奶牛外貌的评分上是否具有一致性,且研究的

甲、乙两个变量均属于有序分类,因此我们选用秩序分析;

2)表3是甲、乙两个评委对奶牛等级评定的Kendall τ秩相关分析与Spearman秩相关分析结

果。其中Kendall τ秩相关系数r0.732,P0.010.05,说明该秩分数间具有显著的正相关关系;Spearman相关系数r0799,P0.0060.01,说明该秩分数间具有极显著的正相关关系。因此由两种方法所得出的结论可知两个评委的评定等级具有显著的一致性;

3)定序变量不可以转化为定距变量,因此在本实验中计算相关系数r时所选取的Kendall

的tau-b和Spearman两种方法不能换成Pearson方法。

4)实验中应注意由于我们事先并不知道所研究的变量间是否存在相关关系,因此我们需

第3页 共10页

生物医学统计分析 选择双侧检验。

例7.3

输出结果:

表4 肉色评分和PH值得相关分析结果

Spearman 的 rho

肉色评分

相关系数 Sig.(双侧)

N

PH

相关系数 Sig.(双侧)

N

**. 在置信度(双测)为 0.01 时,相关性是显著的。

肉色评分 1.000 . 8 .848 .008 8

**

PH .848 .008 8 .000 . 8

**

分析:1)本实验主要研究肉色与PH值的大小顺序是否相关,由于所研究的PH值这一变量为连续

型变量,即定距变量,且肉色评分为定序变量,因此我们选用秩序分析中的Spearman方法进行相关分析;

2)表4为肉色评分与PH值的Spearman秩相关分析结果。其r0.848,P0.0080.01,

说明金华猪肉色与PH值的大小顺序存在极显著的高度正相关关系,即金华猪的肉色随着PH值的大小顺序的增加而增加;

3)本实验由于掺入了定距变量,因此不能选用Kendall方法,因为Kendall的tau-b方法只适

用于研究的两个变量均属于定序变量。

4)实验中应注意由于我们事先并不知道所研究的变量间是否存在相关关系,因此我们需

选择双侧检验。

例7.4

输出结果:

表5 描述性统计量

穗数x1 粒数x2 产量y

均值 31.600 63.438 512.77

标准差 2.6093 4.9658 24.280

N 13 13 13

表6 三变量的两两相关系数

穗数x1

Pearson 相关性 显著性(双侧)

穗数x1 1

粒数x2 -.717 .006

**

产量y .627 .022

*

第4页 共10页

生物医学统计分析 N 粒数x2 Pearson 相关性 显著性(双侧) N 产量y Pearson 相关性 显著性(双侧) N **. 在 .01 水平(双侧)上显著相关。 *. 在 0.05 水平(双侧)上显著相关。 13 -.717 .006 13 .627 .022 13 ***13 1 13 .013 .96 13 1 13 .013 .967 13 13 分析:1)本实验主要是研究每667m2穗数、每穗粒数和每667m2稻谷产量间的关系,由于含有3 个变量,因此我们进行的是多个变量间的相关分析,但由于多个变量间的两两相关分析 类似于两个变量间的分析,因此我们还是选择双变量间的定距分析; 2)表5为三变量的基本统计量。包括样本的均数、标准差和样本例数。穗数x1:x31.600 s2.6093,粒数x2:产量y: x63.438,x512.77,s4.9658,s24.280。 3)表6为三变量的两两相关分析结果。其中穗数x1与粒数x2的相关系数r0.717, P0.0060.01,说明穗数x1与粒数x2存在极显著的中度线性负相关关系,即粒数随着穗数的增加而减少;穗数x1与产量y相关系数r0.627,P0.0220.05,说明穗数x1与产量y存在显著的中度线性正相关关系,即产量随着穗数的增加而增加;粒数x2与产量y的相关系数r0.013,P0.9670.05,说明粒数x2与产量y之间的相关性并不显著; 4)实验中应注意由于我们事先并不知道所研究的变量间是否存在相关关系,因此我们需选择双侧检验。 例7.5 输出结果: 表7 三变量的描述性统计量 鱼产量y 投饵量x1 放养量x2 均值 8.744 9.919 2.463 标准差 1.8533 2.0766 .5123 N 16 16 16 表8 控制放养量x2的偏相关分析结果 控制变量 -无- a鱼产量 相关性 显著性(双侧) df 1.000 . 0 .332 投饵量x1 .32 .209 14 1.000 放养量x2 .561 .024 14 -.394 鱼产量y 投饵量x1 相关性 第5页 共10页

生物医学统计分析 显著性(双侧)

df

放养量x2

相关性 显著性(双侧)

df

放养量x2

鱼产量y

相关性 显著性(双侧)

df

投饵量x1

相关性 显著性(双侧)

df

a. 单元格包含零阶 (Pearson) 相关。

.209 14 .561 .024 14 1.000 . 0 .727 .002 13

. 0 -.394 .131 14 .727 .02 13 1.00 . 0

.131 14 1.000 . 0

表9 控制投饵量x1的偏相关分析结果 控制变量

投饵量x1

鱼产量y

相关性 显著性(双侧)

df

放养量x2

相关性 显著性(双侧)

df

鱼产量y 1.000 . 0 .798 .000 13

放养量x2 .798 .000 13 1.000 . 0

表10 控制鱼产量y的偏相关分析结果 控制变量

鱼产量y

投饵量x1

相关性 显著性(双侧)

df

放养量x2

相关性 显著性(双侧)

df

投饵量x1 1.000 . 0 -.743 .001 13

放养量x2 -.743 .001 13 1.000 . 0

表11 简单相关系数和偏相关系数的比较

简单相关系数

偏相关系数

r120.394 r1y0.332 r2y0.561*

r12.y0.743** r1y.20.727**

r2y.10.798**

第6页 共10页

生物医学统计分析 分析: 1)本实验主要是研究鱼产量和投饵量、放养量之间的相关关系,而投饵量和放养量都有可能与鱼产量存在相关关系,因此我们选择偏相关分析方法控制其中一个变量以消除该变量的影响,以此来找出其他两变量之间单纯的相关关系; 2)表7为三变量的基本分析统计量。包括样本的均数、标准差和例数; 3)表8的上方给出的是三个变量间的简单相关分析,其中鱼产量y与放养量x2的相关系数r2y0.561*,P0.0240.05,说明鱼产量与放养量间存在显著的线性正相关关系;而鱼产量y与投饵量x1的相关系数r1y0.332,P0.2090.05,说明鱼产量与投饵量之间不存在线性相关关系;而从表8的下方给出的偏相关系数可知,当控制了放养量x2影响后所得出的鱼产量y和投饵量x1的偏相关系数r1y.20.727**, P0.0020.01,说明鱼产量与投饵量之间存在极显著的中度线性正相关关系,即鱼产量会随着投饵量的增加而增加; 4)表9为控制投饵量x1影响后的偏相关分析结果。其中鱼产量y与放养量x2的相关系数r2yr2y.10.798**,p0.0000.01,说明鱼产量与放养量之间存在极显著的中度线性正相关关系;而未控制前两者的相关系数r2y0.561*,P0.05,两者只达到显著水平; 5)表10为控制鱼产量的影响后投饵量与放养量的偏相关分析结果。其中r12.y0.743** P0.0010.01,说明投饵量与放养量之间存在极显著的线性负相关关系,而为控制前两者的相关系数r120.394,P0.1310.05,说明两者不存在线性相关关系; 6)表11为简单相关分析和偏相关分析的比较数据,从中我们可以看出:在涉及多个变量的相关分析中,简单相关系数与偏相关系数数据可能会相差很多,实际上有时也可能存在正负差异。这是因为:在多个变量的资料中,两个变量之间的简单相关系数没有消除其他变量的影响,往往混有其他变量的效应。当其他变量与它呈正相关时,便混入正效应,简单系数会高于偏相关系数;当其他变量与它呈负相关时,便混入负效应,简单相关系数会低于偏相关系数。因此,简单相关系数往往不能反映两个变量之间真实的线性相关关系。而偏相关系数消除了其他变量取值的影响,能排除假象,反映两个变量间的真实关系; 7)实验中应注意由于我们事先并不知道所研究的变量间是否存在相关关系,因此我们需选择双侧检验。 例1 输出结果: 表12 描述性统计量 发硒 血硒 均值 75.40 10.80 标准差 12.295 3.327 N 10 10 表13 发硒和血硒的相关分析结果 发硒 Pearson 相关性 发硒 1 血硒 .872 ** 第7页 共10页

生物医学统计分析 显著性(双侧) 平方与叉积的和 协方差 N 血硒 Pearson 相关性 显著性(双侧) 平方与叉积的和 协方差 N **. 在 .01 水平(双侧)上显著相关。 1360.400 151.156 10 .872 .001 320.800 35.644 10 **.001 320.800 35.644 10 1 99.600 11.067 10 分析: 1)本实验主要研究发硒与血硒之间的相关关系,且两变量都属于连续型变量,因此我们选用定距分析法来研究它们之间的相关关系; 2)表12为发硒和血硒两变量的基本分析统计量。包括样本的例数、均数和标准差; 3)表13为发硒和血硒的相关分析结果。包括了发硒和血硒的平方与叉积的和、协方差和样本例数,且其中发硒与血硒的相关系数r0.872,P0.0010.01,说明发硒与血硒间存在极显著的线性高度正相关关系,即头发中的硒含量会随着全血中的硒含量的增加而增加,因此若是在体检时我们可以利用检验头发中的硒含量来推测出血液中的硒含量; 4)定距变量可以转化为定序变量,因此在本实验中计算相关系数r时所选取的Pearson方法也可以换成Kendall的tau-b和Spearman两种方法。 例2 输出结果: 表14 描述性统计量 肺活量 身高 体重 均值 2206.897 152.576 37.652 标准差 448.5541 8.3622 5.7455 N 29 29 29 表15 控制体重的偏相关分析结果 控制变量 -无- a肺活量 相关性 显著性(双侧) df 1.000 . 0 .588 .001 身高 .588 .001 27 1.000 . 体重 .613 .000 27 .719 .000 肺活量 身高 相关性 显著性(双侧) 第8页 共10页

生物医学统计分析 df 体重 相关性 显著性(双侧) df 体重 肺活量 相关性 显著性(双侧) df 身高 相关性 显著性(双侧) df a. 单元格包含零阶 (Pearson) 相关。 27 .613 .000 27 1.000 . 0 .269 .167 26 0 .719 .000 27 .269 .167 26 1.000 . 0 27 1.000 . 0 表16 控制身高影响后体重和肺活量的偏相关分析结果 控制变量 身高 肺活量 相关性 显著性(双侧) df 体重 相关性 显著性(双侧) df 肺活量 1.000 . 0 .337 .079 26 体重 .337 .079 26 1.000 . 0 分析:1)本实验主要研究肺活量与体重、身高之间的相关关系,而身高和体重都有可能与鱼产量存在相关关系,因此我们选择偏相关分析方法控制其中一个变量以消除该变量的影响,以此来找出其他两变量之间单纯的相关关系; 2)表14为三变量的基本分析统计量输出结果。包括样本的例数、均数和标准差; 3)表15的上方给出的是三个变量间的简单相关分析,其中如果不控制体重的影响,则身高和肺活量的相关系数r0.588,P0.0010.01,说明肺活量与身高之间存在极显著的线性正相关关系,且其决定系数r20.345744;而表15的下方给出的是控制体重影响后肺活量与身高的相关系数r0.269,P0.1670.05,说明肺活量和身高之间并不存在线性相关关系,且其决定系数r20.072361。经过计算,我们可以得出肺活量与身高的相关有27.3383%是由体重协同作用而产生的。 4)表16是控制身高影响后体重和肺活量的偏相关分析结果。其中体重和肺活量的相关系数r0.337,P0.0790.05,说明体重与肺活量之间不存在线性相关关系,且其决定系数r20.113569;而从表15我们可知在不控制身高影响的体重和肺活量的相关系数r0.613,P0.000,说明体重和肺活量之间存在极显著的线性正相关关系,且其决定系数r20.375769。经计算,我们可以得知体重与肺活量的相关有26.22%是由身高协同作用而产生的; 5)根据表15和表16中的数据分析结果,我们可以看出:尽管肺活量与身高和体重均有关系,但如果仅仅研究其中一个变量与肺活量的相关关系时,肺活量与身高的相关有27.3383%是由体重协同作用而产生的;体重与肺活量的相关有26.22%是由身高协同作 第9页 共10页

生物医学统计分析 用而产生的。两者相比较下,研究体重的意义会更大点; 6)实验中应注意由于我们事先并不知道所研究的变量间是否存在相关关系,因此我们需选择双侧检验。 五、实验小结: (包括主要实验问题的最终结果描述、详细的收获体会,待解决的问题等) 在此次实验中,由于实验内容更贴近生活应用,因此比起上学期,我们更容易领悟该程序的表达,只是在细节方面还是很容易出错,甚至不容易拐过弯来。但经过此次实验,我们懂得要学着从复杂的程序中剥茧抽丝,把程序尽可能的简单化。 在实验中应注意的点: 1、如果我们事先并不知道所研究的变量间是否存在相关关系,我们就需要选择双侧检验; 2、定距变量可以转化为定序变量,定序变量不可以转化为定距变量,因此在选择分析的方法上应注意其不可逆性; 3、对于多变量的相关分析,如果需要考虑其中两个变量间真实的相关关系时,必须采用偏相关分析才能得出正确的结论。 手写签名:

第10页 共10页

因篇幅问题不能全部显示,请点此查看更多更全内容