您的当前位置:首页正文

基于因子分析和聚类分析的学生网络学习行为研究

2023-09-24 来源:个人技术集锦
理论研究·

10.3969/j.issn.1671-489X.2019.18.003

基于因子分析和聚类分析的

*

学生网络学习行为研究

◆王坚 张媛媛 柴艳妹

摘 要 对学生的网络行为进行研究,首先获取具有典型意义的观测指标构成原始数据集,通过因子分析,提取出能够客观反映学习特征的两个公共因子,并依据不同学生的因子得分进行聚类分析,通过分析结果可以看出,学生网络学习具有群体性的特征。此外,重点讨论未来的改进重点和实施依据。关键词 学习分析;因子分析;聚类分析;网络学习行为中图分类号:G645 文献标识码:B文章编号:1671-489X(2019)18-0003-03

Analysis of Students’ Online Learning Behavior based on Factor Analysis and Cluster Analysis//WANG Jian, ZHANG Yuanyuan, CHAI Yanmei

Abstract In this paper, the network behavior of students is studied. Firstly, the original data set is made up of typical observation indi-cators. Through factor analysis, the common factors that can objec- ect the characteristics of learning are extracted. According tively refl

to the factor scores of different students, clustering analysis is carried out. Through the analysis results, it can be seen that students’ network learning has the characteristics of group. This paper also focuses on discussing the future improvement emphasis and imple-mentation basis.

Key words learning analysis; factor analysis; cluster analysis; on-line learning behavior

理,这些都对自身的适应能力和自控能力提出较高的要求,也对教学的组织和引导有着更大的期待。

学习分析是近年来教育技术领域迅速崛起的热点问题,它的出现也推动了教育信息化的浪潮[2]。它从网络入手学习的过程数据,特别是学生的行为数据,采用先进的分析方法和分析工具,如数据挖掘和可视化方法等,对学生在学习过程中遇到的问题进行诊断,并对学习结果做出预测,从而有针对性地优化和增强教学效果[3-4]。

学生的网络学习行为所产生的行为数据间往往具有很强的相关性,运用因子分析方法,可以从多维的特征数据中抽取出因子组合,这些因子不能直接从原始数据中获取,但可以通过转换矩阵等工具计算得到[5]。本文采用因子分析的方法来客观反映学生学习行为特征和本质,并利用因子分析的结果对学生行为进行聚类分析[6-7],对学生样本按照其行为的近似程度,实施无监督的分类过程,对聚类结果进行判别,可以进一步确定导致不同学习行为特征的关键要素,关注学生切实需求,改进教学方法。

2 研究背景

大学计算机基础作为中央财经大学的计算机公共基础课,在培养学生计算思维、提升学生数字素养方面有着重要的作用。在课程教学实践过程中引入混合式教学的理念,即学生的主要学习行为依靠网络教学平台来完成,包括视频学习、在线练习、在线测试、在线讨论等多个环节,同时辅以线下的难点授课、课程答疑、小组讨论、作业评价等项内容,如图1所示。

从图1中可以看出,网络平台中一系列的教学内容、教学环节和教学元素,精心组织和建设后,以包括音视频在内的多种媒介形式展示给学生,供其自主学习。本研究选取2017年参与该混合式教学的219名学生作为研究对象,课程开设周期为15周,以每位学生初次登录到最后登录平台期间所产生的记录数据为主要分析对象,共设计八个观察指标,能够从整体反映学生学习的个性化特征,通过网

1 引言

通过网络平台进行学习,具有学习资源丰富、学生主体性强、交互独特及学习时空灵活的特点

[1]

。与传统教学

模式面对面的交流不同,学生的学习行为更多是源于自发,学习过程由学生自主确定学习步调。学生由于个性特征、学习背景、对待课程态度、网络学习认知以及与其他学生互动程度的不同,其学习行为表现也有较大的差异性。在不同情境下,同一学生个体受到个人兴趣、状态等多方面特征的影响,获得感也有所不同,有时甚至会产生惰性心

*项目来源:中央财经大学课程教学团队建设项目“计算机公共基础课教学团队”(项目编号:011459014008/032);中央财经大学教学改革基金项目“基于混合学习理念的在线课程教育模式应用研究”;中央财经大学2017年度校级精品实验项目“计算机应用基础综合创新实验开发”。

作者:王坚,中央财经大学,副教授,研究方向为计算机应用、计算机教育;张媛媛、柴艳妹,中央财经大学(100081)。

2019年9月下 第18期(总第468期)

- 3 -·理论研究 

课程导入个变量都可以表示成公共因子的线性函数与特殊因子之和,即Xi=ai1F1+ai2F2+…+aimFm+εi(i=1,2,…,n)。其中F1,F2,…,Fm为公共因子,εi为指标Xi所对应的特殊因子,表示原始变量中所特有的部分。在原变量X和因子F可以自主学习资料阅读视频学习混合式学习框架课堂辅导课程准备通过转换矩阵A建立关联,表示为:X=AF+ε。其中:面授答疑课程练习单元测试网络答疑课堂讨论论坛讨论为了能够对学生学习行为进行综合分析,采用因子分析对有关指标特征进行降维,即学生的学习行为可以通过少数几个公共因子来进行解释。表2给出KMO检验统计量与Bartlett’s球形检验结果。KMO统计量等于0.894,Bartlett’s球形检验的值为0.000,这些也都说明本例中的数据比较适合进行因子分析。表2 KMO和Bartlett’s球形检验作业评价综合测试课程反馈知识建构任务驱动案例学习创新实验协作学习课程总体评价 学习行为网络资源学习图1 混合式教学框架 KMO检验 .894Bartlett’s球形检验近似卡方1312.990自由度28显著性.000表1 学生网络学习行为观测指标观测指标登录平台时长(X1)观看视频时长(X2)登录平台频次(X3)观看视频频次(X4)交流与协作阶段性检测参与答疑次数(X5)参与论坛交互次数(X6)练习完成比(X7)测试完成比(X8)指标说明学生登录平台时间之和学生观看教学视频时间之和学生登录平台次数/周学生观看视频次数/周学生参与线上或线下的答疑次数之和学生在论坛发帖提问和参与讨论次数之和学生练习完成量/总练习量学生测试完成量/总测试量的总方差解释表,根据表3中给出因子分析各个阶段的总方差解释表,根据可以提取出两个公共因特征值大于1的主成分提取原则,可以提取出两个公共因子已经可以解释原始变子。从表3中可以看出,前两个因子已经可以解释原始变分的信息,即所有学生量73.341%的方差,已经包含大部分的信息,即所有学生行表征。公因子经过旋行为指标可以用这两个公共因子进行表征。公因子经过旋累积方差贡献率并没有转后的方差贡献有所变化,但总的累积方差贡献率并没有差异性有所减小。改变,依然是73.341%,而因子间的差异性有所减小。阵,从表中可以看出,表4给出旋转后的因子载荷矩阵,从表中可以看出,X2、X4、X3、X5、X6上有较大载荷,第一个公共因子在指标X1、可以归为一类。从指标说明这六个指标有较强的相关性,可以归为一类。从指标习参与程度,因此可以类型来看,这六个指标属于在线学习参与程度,因此可以表3 总方差解释提取载荷平方和总计4.8571.011

方差百分比60.707%12.634%

累积络后台获取相关日志文件,构成初步数据集,如表1所示。成自主掌握有关知识点的重要环节,因此,研究中用学生观分在网络平台学习过程中,对于视频课件的学习是学生 总计方差百分比56.381%16.960%

旋转载荷平方和累积56.381%73.341%

看视频的学习时长和学生在线学习时长共同来反映每位学生利用网络教学资源进行学习的时间长度;登录平台频次、观看视频频次以每周为单位,统计学生利用教学资源的次数,用来反映时间频度;在交流与协作类指标中,主要包括学生参与答疑次数(线上/线下)、参与论坛讨论交互次数等;而阶段性检测指标主要考量学生的阶段性学习成果,包括练习完成比、测试完成比等。

12

60.707%4.51073.341%1.357

表4 旋转后因子矩阵

1

X1X2X4X3X5X6X8X7

.942.933.901.817.789.775.090.204

2.232.195.051.209.163.181.832.684

表5 成分得分系数矩阵

1

F1F2F3F4F5F6F7F8

.208.214.179.238.182.174-.097-.162

2.002-.030.009-.155-.027-.008.582.744

3 学习行为因子分析

因子分析(Factor Analysis)也称降维分析,其基本思想是根据变量之间的相关强度对变量进行分组组合,组内变量相关性较强,组间变量相关性较弱。每一组变量代表一个不可直接观测的潜在变量,即公共因子。公共因子可以看作所有指标的共同影响因素,通过因子分析,每一

2019年9月下 第18期(总第468期)

- 4 -把第一个因子命名为学习参与因子。第二个公共因子在指标X8、X7上有较大载荷,同样可以归为一类。这两个指标同属学习检测指标,因此可以把第二个因子命名为课程测试因子。

表5是因子得分矩阵,依据表5可得到各公共因子的得分表达式:

F1=0.208X1+0.214X2+0.179X3+0.238X4+0.182X5+0.174X6- 0.097X7-0.162X8

F2=0.002X1-0.03X2+0.009X3-0.155X4-0.027X5-0.008X6+ 0.582X7+0.744X8

4 学习行为聚类分析

聚类分析(Cluster Analysis)是研究指标分类问题的一种多元统计方法,不同学生的学习行为具有相似性,通过归类研究,有助于了解和分析不同分类群体的特征。

K-Means聚类算法是目前常用的一种聚类算法,需要首先确定类别数和对应的初始聚类中心,按最小距离原则将各特征值分配到某一类别中,之后不断地计算各个类别中心和调整各特征的类别,以各特征到类别中心的距离平方之和最小作为最终收敛之和最小作为最终收敛判定依据

[7]

本文采用K-Means算法进行聚类分析,利用进行因子分析过程中产生的所有分析过程中产生的所有学生的公共因子作为输入特征,产生聚类结果如表6和表7所示,所有学生被分成三类。

表6 最终聚类中心表7 每个类别中的学生数目

聚类聚类学生数123194F11.08-.092-.89

253F2

.61

-1.25

.55

3

72

第一类学生普遍具第一类学生普遍具有在线时间长、学习内容具有连贯性的特征,其在线学习性的特征,其在线学习参与度高,具有自我约束机制,通过测试、练习积极提升练习积极提升自己的知识掌握能力。还可以判断出,这部分学生具有相当的这部分学生具有相当的主动性,乐于交流和相互学习。同时,这类学生在所有学生样这类学生在所有学生样本中占比最高,表明网络平台课程环节的设置能够与大多环节的设置能够与大多数的学生需求相匹配。第二类学生网络学第二类学生网络学习的参与度和自主性最差,对课程学习参与程度不能达到课程基本要求,同时对练习、测试环节的关注程度也比较低,不能适应网络学习中自我约束、自我激励的要求,在学习主动性上亟待提高,必要时可以通过积极有效的手段进行干预。

第三类学生通过练习、测试等环节进行学习的积极性较高,而对在线课程的学习投入方面相对不足。这部分学生喜欢有激励的学习环节,更愿通过做题的方式来快速提升自己;对在线学习的其他环节重视度不高。对于这部分学生,着重需要通过增强网络教学的吸引力,以更加灵活多样的方式来鼓励他们重视学习过程。

从聚类整体结果可以看出,当学生处于第一类别时,能够很好地利用现有网络平台的教学资源,其学习效果整

理论研究·

体较好,可以考虑引入适当的激励措施,保持其对网络平台参与的热情和自我把控;当学生处于第二类和第三类时,应及时给予相应的辅助手段,如增强定向辅导或实时沟通,促进学习态度和学习行为的有效转换;特别是对处于第二类别学生,要及时发出学业预警,进行关注。

5 研究结论

本文应用统计方法,通过对不同类型学生群体的行为特征进行分析,可以看出,学生大多能够适应和参与网络学习过程的构建,但仍然有部分学生兴趣不足,需要给予他们更好的沉浸式体验、更多的学习获得感,在平台的建设和设置过程中也需要增强灵活性和自适应能力。未来的工作重点将是以学生兴趣为着眼点,改善学习环境,帮助学生获得感的增强。

同时,本文所使用的学习行为特征,还是以学生的学习过程为主,但学生的学习习惯的养成和学习成绩的获得往往还受到学生的个性化因素的影响,如学生的学习态度、接受能力、情绪因素等,将这些因素结合起来,有助于更好地对学生群体进行分析。此外,本文中采取的聚类方式是事先确定了学生类别的,但实际中学生群体的划分是动态变化的,捕捉这种动态,有助于对实际学习过程的评判。而且单个学生群体的构成和演化有着一定的内在规律,个体的学习行为和群体的学习表征存在某种联系,对每一个群体,需要分析哪一个学生或者哪一些学生构成了核心,每一个人的学习行为是如何影响整个群体的学习过程的。

从增强学习效果的角度,因子分析和聚类分析等方法仅仅是提供了入口,除了及时了解和分析学生行为特征外,还要根据其学习记录,如观看视频情况、作业情况和测试情况,针对不同群体学生的学习规律做好资源服务和内容推送,满足其阶段性需求,同时对未来的学习路径和学习效果进行预测,实现智能追踪,创建自适应的学习系统。参考文献

[1]邱晓辉.网络学习者信息加工学习行为的分析及研究[D].武汉:华中师范大学,2008.

[2]刘清堂,王洋,雷诗捷,等.教育大数据视角下的学习分析应用研究与思考[J].远程教育杂志,2017,35(3):71-77.

[3]郭炯,郑晓俊.基于大数据的学习分析研究综述[J].中国电化教育,2017(1):121-130.

[4]EDUCAUSE, The New Media Consortium. Learning Analytics[R].The Horizon Report 2011 edition.[5]贾丽艳,杜强.SPSS统计分析标准教程[M].北京:人民邮电出版社,2010:299.

[6]常浩,逯纪美.多元统计分析在大学生综合素质评价中的应用[J].数理统计与管理,2010,29(4):754-760.[7]孙吉贵,刘杰,赵连宇.聚类算法研究[J].软件学报,2008,19(1):48-61.

2019年9月下 第18期(总第468期)

- 5 -

因篇幅问题不能全部显示,请点此查看更多更全内容