您的当前位置:首页正文

二分类变量相关性分析spss_SPSS分析技术:两个定类变量的相关系数(1)

2024-11-08 来源:个人技术集锦

基础准备

前面草堂君给大家详细介绍了各种相关系数种类,不同的相关系数用来表示不同类型变量之间的相关关系强弱,大家可以点击下方文章链接回顾:

  • 统计理论深度阅读:相关系数家谱(第一部)

  • 统计理论深度阅读:相关系数家谱(第二部)

接下来草堂君将给大家详细介绍不同相关系数的实际应用场景以及如何使用统计软件进行计算。知其然知其所以然,才能融会贯通和触类旁通。

相关分析的作用

开始正式文章前,草堂君先帮大家回顾一下相关分析的作用。相关分析能够得到两个结果,一个是显著性结果(p值),表示两个(组)变量是否是显著性相关;另一个相关系数,它用来表示两个变量的相关强度有多强,一般相关系数都在-1~1之间,越接近1和-1代表相关强度越强(正向和负向),越接近0,代表强度越弱。

相关系数越接近0,显著性(p值)约大,一般大于0.05(当然常用的显著性水平还有0.1、0.01和0.001)就认为两个变量没有显著性相关了;相关系数越接近-1或1,显著性(p值)越小,一般小于0.05就认为两个变量显著性相关了。

两个分类变量的相关系数

根据草堂君前面的介绍,适用于两个分类变量的相关系数有Phi系数、列联系数C(矫正列联系数C*)、Tshuprow‘s T系数、Cramer’s V系数、Theil‘s U系数和lambda系数。其中,Phi系数适用于2*2列联表;列联系数C和Tshuprow’s T适用于n*n列联表;Cramer’s V、lambda和Theil‘s U适用于n*m列联表。

如上表所示,因为红色字体的四个相关系数都是基于卡方值设计的,所以今天草堂君先介绍前四种相关系数以及它们的案例应用和分析过程。

Phi系数

首先回顾Phi系数的计算公式,如下所示。从公式可知,Phi系数对卡方值进行了样本量修正,表示为平均到每个样本上的平均比率差异有多少,平均差异越大,Phi系数越大,表示两个定类型变量不是独立无关的,也就是两个定类型变量越相关。需要注意,如果

显示全文