1、教育统计学的内容主要包括:描述统计与推断统计
2、测量结果能在其上取定数值的量尺,从量化水平高低的角度可分为:名义量尺、顺序量尺、等距量尺与比率量尺。在名义量尺上所指定的数字,只具有类别标志的意义,而无性质优劣,分量多寡的意义。顺序量尺上的数字量化水平则较高,有优劣、大小、先后之别,如学业成绩评定优劣。等距量尺上的数字量化水平又更高,这种数字是单位相等但零点可任意指定的线性连续体系上的值,如温度、可比可加。比率量尺是一种有绝对零点的,等单位的线性连续体系。如身高、体重等。能加、减、乘、除
3、测量工作按一定的规则进行,体现为三种东西即:测量工具、施测和评分的程序与要求、结果解释参照系或参照物
4、心理测量跟物理测量的两点突出差异:一间接性;二要抽样进行
5、数据的种类①从数据来源分成计数数据、测量评估数据和人工编码数据②根据数据所反映的变量的性质分分为称名变量数据、顺序变量数据、等距变量和比率变量数据
6、顺序变量数据之间虽有次序与等级关系,但不具有相等单位,也不具有绝对的数量大小和零点。因此只能进行顺序递推运算,不能做加减乘除运算。等距变量不能用乘、除法运算来反映两个数据之间的倍比关系,能做加减运算。比率变量数据可以进行加、减、乘、除运算
7、数据三个特点①数据的离散性②数据的变异性③数据的规律性
8、统计一批数据的次数分布两种方法:一、按不同的测量值逐点统计次数;二、为了简缩数据以区间跨度来统计次数。如分数段统计
9、编制简单次数分布步骤①求全距②定组数③定组距④写组限⑤求组中值⑥归类划记⑦登记次数
10、相对次数分布表主要能反映各组数据的百分比结构 11、累积次数分布表还分成“以下”累积次数分布表与“以上”累积次数分布表两种。“以下”累积其目的在于反映位于某个分数“以下”的累积次数共有多少
12、次数分布图两种表达方式:次数直方图和次数多边图22、等级相关适用的几种情况①两列观测数据都是顺序变量
数据,或一列是顺序变量数据,另一列是连续变量的数据。如对学生的绘画、体育测试成绩排名就属顺序变量数据②两个连续变量的观测数据,其中有一列或两列数据的获得主要依靠非测量方法进行粗略评估得到。如语文基础知识水平可测验加以测量但学生的课文朗读水平却只能根据若干准则由老师给予大体的评估。点双列相关适用于双变量数据中,有一列数据是连续变量数据,如体重、身高以及许多测验与考试的分数;另一列数据是二分类的称名变量数据,如性别
23、原始分数的意义必须要跟一定的参照物(系统)作比较,才能真正明确起来。原始分数意义的参照物大体有两类,一是其他被试
的测值,即其他被试在所测特性上的普遍水平或水平分布状态;二是社会在所测特性上的客观要求,即被试在所测特性上发展应该达到程度的标准
24、常模总是指某一具体测验(不能简单地看成是其名称所指特性)上的常模。常模总是特定的、具体的,是就一定人群在具体测验上的表现来说的。常模又可分为发展常模与组内常模两大类。发展常模又有年龄常模与年级常模之别,组内常模又有百分等级常模与标准分数常模之别
25、历史上第一个提出常模这一科学概念的是法国心理学家比纳。他最早建立了智力测验的年龄常模。发展常模就是某类个体正常发展进程各特定阶段的一般水平
26、智商(IQ)=智力年龄/生理年龄×100
27、组内常模又可分为百分等级常模与标准分数常模两个类别。一个分数的百分等级,就是该分数在所属分数组中,取值比它小的分数个数占该分数组总个数的百分数。百分等级值只有可比性而无可加性,不能累加求和与进一步求平均;这是百分等级常模的一个局限所在
28、一个测验分数的标准分数,就是以它所属分数组的标准差为单位的,对它所属分数组的平均数的距离
29、难度指数(p)取值越大并不意味着项目越难,而是越易;指数p的数字值与其代表的含义,方向恰好相反
30、三种偏态分布:如果一个测验对某一被试团体来说,难度相对显得大,那么,被试团体中大多数人就会得低分,被试总分分布就会形成正偏态分布;如果一个测验对某一被试团体来说,难度相对显得小,被试团体中就会有很多人得高分,总分分布就会形成负偏态;假定被试团体在某一特定方面,其水平分布事实上是呈正态分布的,若测验项目的难度确能做到对这个被试团体来说是恰当的,那么对这个团体施测这一测验,所得被试测验总分分布自然也会呈正态分布
31、“高、低分组求得分率差”的办法就是将全体被试按总分多寡加以排队,然后取得分最多的27%的被试作为“高分组”,得分最少的27%的被试作为“低分组”,最后求这两个组上项目得分率(通过率)的差来作为区分度指数的取值
31、人们就使用两个平行形式测验来测查同一批被试,这样也可获得同一批被试的两批独立测值,从而通过求相关系数,估出测验的信度32、效度验证工作大体分为三类即内容效度、效标关联效度和
结构效度。效标关联效度又包含“并存”效度和“预测”效度这两个小类别
33、测验即使相当有效,效度系数rXY的取值也很少能超过0.70,一般取值能达到0.40就相当不错了
34、根据课堂教学运用测验的一般顺序来分可把学业成就测验分成安臵性测验、形成性测验、诊断性测验和终结性测验。根据解释测验分数的方法不同可把学业成就测验分成常模参照测验和标准参照测验两类。根据成就测验的实施方式与测验载体,我们把成就测验分成口头测验、纸笔测验和操作测验
35、纸笔测验优点①提高测验的效率,即同时可以进行大团体的测验②便于完整记录学生在题目作答上的反应③便于施测和评分过程的规范化和标准化从而提高学业成就测验的信度与效度④便于对测验中答题信息的分析研究
36、课堂成就测验特点①简易性②灵活性③随意性④测量性能较差
37、对教育目标分类的认识:布卢姆认为作为完整的教育目标应当包括三个主要的领域:认知领域、情感领域和动作技能领域。布卢姆把认知领域中的行为目标分为六个不同的层次,它们依次是知识(识记)、领会、应用、分析、综合和评价①知识:回忆或辨认某些
特定的事实②领会:初步理解材料的意义③应用:能够运用已学过的材料④分析:把事物整体分解为部分,以便了解整体与部分以及部分与部分之间的关系⑤综合:把各个部分有机地组织成一个整体的能力⑥评价:根据一定的标准对事物的价值作出合乎逻辑的判断,如对小说、诗歌、电影、哲学流派、环保方案、测验设计等作出价值判断的行为与能力
38、我国教育工作者提出目标层次分为识记、理解(领会)、简单应用和综合应用这四个层次
39、学业测验中考试题目类型分为客观题、主观题
40、客观题:有一些考试题目,如果评分规则一旦明确下来,只要依照这些规则,无论谁去评分,都会得出相同的分数,典型的客观题类型常见的有填空题、简答题、是非题、匹配题、单项选择题或多项选择题等。简答题和填空题适合于测量相对简单的学习成就。是非题这种题型的缺陷也是明显的,一是容易猜测,(猜对的可能性有50%),二是适合于用是非题来测量的学习成就其范围有限。多项选择题更适合于测量具有较复杂结构的学习成就
41、主观题型如论述题、证明题、计算题、作图题、
作文题等
42、心理测验主要用途①人才选拔②人员安臵与人事管理③临床心理学研究④学校心理服务⑤建立和检验假设43、智力测验在国内常见①比纳智力测验②斯坦福—比纳智力测验③韦克斯勒智力测验④瑞文标准推理测验和⑤中小学生团体智力筛选测验
44、吉尔福特认为,发散思维所表现出来的一个人的外在的行为,即代表这个人的创造力
45、发散性思维在行为上表现三种基本特征:流畅性、变通性、独特性
46、人格测验的方法与类型主要有自陈量表法、投射测验法、情境测验法、评定量表法
47、客观世界中发生的各种现象分为两类:确定性现象不确定性现象
48、按照概率的定义,概率的取值范围在区间[0,1]上,如某个事件概率为1,表示该事件肯定发生,这样的事件称为必然事件,在实际研究中更多事件的概率介于0与1之间,人们把发生概率很小的事件,如概率小于0.05,或0.01,称为小概率事件
49、一个离散性随机变量的概率分布是指这个随机变量所有取值点的概率的分布情况。一个连续性随机变量的概率分布是指这个随机变量所有取值区间上概率取值的分布情况
50、从形态看,正态分布是一条单峰、对称呈钟形的曲线,其对称轴为过x=u的纵线。曲线在X=u点取得最大值。从x=u点开始,曲线向正负两个方向递减延伸,不断向X轴逼近,但永不与X轴相交。一个随机变量服从正态分布的最大特点是其取值在平均数附近的概率很大,而取值离平均数越远,其概率越小。在这许许多多的正态分布中有平均数为0、标准差为1的正态分布可以作为正态分布的一个典型代表,其他各种正态分布都可以通过一定的数学方法与它相互转化
51、在标准正态分布中,夹中间面积90%的两个Z值分别为±1.96;夹中间面积99%的两个Z值分别为±2.58
52、统计学中,推断统计的直接操作对象是总体的一个样本,但其推断的却是总体的各种特征。影响样本对总体代表性的因素主要有三①总体本身的离散性②所抽取样本容量的大小③对总体代表性强弱的因素是抽样方法
53、随机抽样方法①简单随机抽样②分层抽样③分阶段抽样④等
距抽样
54、随机抽样方法原则①机会均等②相互独立。简单随机抽样最常见的形式就是抽签。较严谨的简单随机抽样是借助随机数码表而作的随机抽样
55、分层抽样的实质就是将总体各部分按其容量在总体规模中的比分派到样本结构中去,然后进行抽样。所以分层抽样是分两步进行①按比例求出各部分入样元素数②各部分按要求的人样数用简单随机抽样的方法产生入样元素,最终合成总样本。分阶段抽样实际上进行两次抽样,第一次是以“部分”为元素进行抽样,然后再在人样的这些“部分”中抽取入样元素。等距抽样的第一步也是首先对总体所有元素编号,所编号码应该是连续有序的。第二步计算每相邻两入样元素的间隔距离。第三步是在第一间隔中随机确定第一个入样元素的号码,比如说取定为00003。第四步则开始抽取入样元素
56、要认识抽样分布必须学会识别三种分布:总体分布、子样分布和抽样分布
57、α值常取0.05和0.01两个水平,偶而也有取0.001的。在假设检验中,α的取值越小,称此假设检验的显著性水平越高
58、统计假设检验中使用的假设有两种,一种称为虚无假设,一种称为备择假设。统计假设检验中冒犯I型错误的概率大小就等于显著性水平α值的大小,β同时也是犯 Ⅱ型错误的概率值符号。Ⅱ型错误称为β错误,影响Ⅱ型错误概率大小的因素有三个。第一因素是客观的真值与假设的伪值两者之间的差异。第二因素是α值的大小。α值越大,犯Ⅱ型错误的概率就越小,α值越小,β就越大。第三因素是样本容量。样本容量越大,犯Ⅱ型错误的概率就越小;样本容量越小,犯Ⅱ型错误的概率就越大
59、如果检验的目的是为了判断某个总体参数是否等于某个定值,或者是为了推断某两个总体参数是否相等,则应该使用双侧检验。如果检验的目的是为了推断某个总体参数是否大于或是否小于某个定值,或者是为了推断某两个总体参数之间有无大于或小于的关系
60、X1平均数-X2平均数的抽样分布形态以及它的各种参数
估计公式主要受到四个因素的影响。第一是受到两个总体是否相关的影响,第二是受到两个总体分布是否正态的影响,第三是受到两个总体方差是否已知以及是否相等的影响,第四是受到所抽样本容量的影响
61、把人按四种气质类型统计人数;学习成绩按优、良、中、差分类统计;对某项改革措施按所持赞成、反对以及无所谓态度统计;把一个教师群体同时按职称类别和态度等交叉分类。对于这一类数据的差异显著性检验,最适合的检验方法是x2检验62、计算x2时①
若实际观测次数f0和理论期待次数fe完全相同,则x2为0,表明观测的次数分布与设想的总体的理论次数分布没有差异②当实际观测次数f0和理论期待次数fe相差越大时,则x2值也越大,这表明观测的次数分布与设想的总体的理论次数分布之间的差异也越大
63、χ2(读作卡方)是检验实际观测次数与理论期待次数之间差异程度的指标,其最一般表达式 为 f0表示实际观测次数;fe表示理论期待次数。χ2检验最重要的最关键的一步是如何从虚无假设出发,确定各类事物的理论期待次数
64、总体分布的拟合良度检验包括非连续变量观测次数分布的拟合良度检验、连续变量观测数据次数分布的拟合良度检验
65、在计算理论次数时,根据χ2统计量的特性,对此要求把理论次数小于5的组同相邻的组进行合并,直至所有组的理论次数均不小于5方可
66、列联系数C与χ2值,在对r×K 列联表检验中(这里 r与K 中至少有一个大于2),当所得的χ2值大于由预定显著性水平及特定自由度决定的χ2临界值时,我们有理由拒绝虚无假设并推断说,两种特征或属性之间具有相互依存的连带关系;但这种相关关系的程度怎样呢?在统计学中,人们用列联系数C来表示这种相关的程度。
关系式为: C= 列联系数在0与1之间取值
67、在实际工作中我们有时需要同时对多于两个的总体平均数有无显著性差异作出检验,三个或三个以上用方差分析
68、方差齐性检验方法:多总体方差是否齐性常采用Hartley最大F值法
69、方差分析作出各总体平均数有显著差异之后,还必须作进一步的分析,目的以探清到底有多少对平均数之间有显著差异,到底哪些平均数之间有显著差异。方差进一步分析方法有N-K法。
简答题
1、 算术平均数的运算性质①数据组全部观测值与其平均数的离差之和必定为0②每一观测值都加上一个相同常数C后,则计算变换后数据的平均数等于原有数据的平均数加上这个常数C③每一观测值都乘以一个相同常数C后,所得新数据的平均数,其值等于原数据的平均数同样乘以这个常数C④对每个观测值作线性变换,即乘上相同的常数C,再加上另一常数d,则计算变换数据的平均数,其值等于原数据的平均数作相同线性变换后的结果
2、 标准差的性质与应用①全组数据每一观测值都加上一个相同的常数C后计算得到的标准差不变②若每一观测值都乘以一个相同的非零常数C,则所得到的标准差等于原标准差乘以这个常数的绝对值③每个观测值都乘以同一个非零常数C,再加上另一个常数d,所得数据的标准差等于原标准差乘以这个常数C
3、 建立常模步骤①科学抽样,从清楚而明确地定义的“特定人群”总体中,抽取到容量足够大、并确具代表性的被试样组②要用拟建立常模的测验,采用规范化施测手续与方法对标准化样组(常模组)中的所有被试,施测该测验,以便恰当而准确地收集到所有这些被试在该测验上的实际测值③对收集到的全部资料进行统计分析处理,真正把握被试样组在该测验上的普遍水平或水平分布状况
4、 年级常模的缺点:年级常模虽直观好懂,但也有一定缺点。一是许多学校科目并不连年授课所以无法求年级常模;即使多学年授课的科目,如数学,随年级的递升内容重点也不断转移,二是所得年级等值常易引起误解
5、 百分等级常模的应用优点?它应用得相当广泛。这主要是因为百分等级的意义直观、好解释而且若几个不同测验对同一常模组实施,建立起了这不同测验的百分等级常模,那么,原来无法相互比较的不同测验上的原始分数,就可以通过百分等级而相互直接比较
6、 百分等级本身不是等单位的量度?心理和教育测验分数的分布状态,一般不会形成平行分布状态,而会形成“两头小中间大”的形状,或者就呈正态分布。这样,第一百分等级(PR=1)跟第二百分等级(PR=2)所对应的原测验分数的差,和第五十百分等级(PR=50)跟第五十一百分等级(PR=51)对应的原测验分数的差,是不会相等的。尾端一个百分等级的差,要比中部一个百分等级的差大得多
7、 标准分数是等单位的量度,不存在尾端单位大而中部单位小的问题①标准分数是一个比值,分子是原始测验分数的离均差,它是会随测验分数联欢会取值不同而变化的;但分母却是一个固定值,是所属分数组的标准差,不会随测验分数是在尾端或是中部取值而变化②就位臵不同测验分数的离均差来求比值时,被比的基数都是相同的,所以标准分数的单位就是相等的了
8、 建立标准分数常
模步骤?我们要为性能优良的测验建立标准分数常模步骤①从明确界定好的该测验应该测查的被试总体中,抽取一个容量足够大的代表性样组,即建立起常模组(常模团体)②对该代表性样组按应有规范施测该测验,获得代表性样组中每一被试的测验分数,即得到常模团体的测验分数组③求取常模团体测验分数组的平均数与标准差,按公式求取从-3.000到3.000这一区间上若干个点的标准分数(Z值)跟测验原始分数的对照表,就得到了标准分数常模表
名词解释:
1、统计:就是“统而计之”对所考察事物的量的取值在其出现的全部范围内作总体的把握,全局性的认识。教育统计:对教育领域各种现象量的取值从总体上的把握与认识,它是为教育工作的良好进行,科学管理、革新发展服务的。教育统计学:社会科学中的一门应用统计,是数理统计跟教育学、心理学交叉结合产物
2、测量:按一定规则给对象在某种性质的量尺上指定值。教育测量:就是给所考察研究的教育现象,按一定的规则在某种性质量尺上指定值
3、心理量表:心理测验工具与常模的结合
4、数据:用数量或数字形式表示的资料事实称为数据。计数数据:是以计算个数或次数获得的,多表现为整数。测量评估数据:借助测量工具或评估方法对事物的某种属性指派给数字后所获数据。人工编码数据以人们按一定规则给不同类别的事物指派适当的数字号码后所形成的数据
5、称名变量:只说明某一事物与其他事物在名称、类别或属性上的不同,并不说明事物与事物之间差异的大小、顺序的先后及质的
优劣。顺序变量:是指可以就事物的某一属性的多少或大小按次序将各事物加以排列的变量,具有等级性和次序性的特点。等距变量:除能表明量的相对大小外,还具有相等的单位。比率变量:除了具有量的大小、相等单位外,还有绝对零点。比率变量数据可以进行加、减、乘、除运算
6、次数分布:一批数据中各个不同数值所出现次数多少的情况,或者是这批数据在数轴上各个区间内所出现的次数多少的情况。简单次数分布表:通常简称为次数分布表,其实质是反映一批数据在各等距区组内的次数分布结构。相对次数:各组的次数f与总次数N之间的比值
7、次数分布曲线:从理论上讲,如若总次数无限增大,则随着组距的缩小,这些折线所接近的极限便将成为极光滑而富有规则性的曲线,称为次数分布曲线
8、散点图:用平面直角坐标系上点的散布图形来表示两种事物之间的相关性及联系模式。散点图适合于描述二元变量的观测数据。线形图:以起伏的折线来表示某种事物的发展变化及演变趋势的统计图,适用于描述某种事物在时间序列上的变化趋势,也适用于描述一种事物随另一事物发展变化的趋势模式,还可适用于比较不同的人物团体在同一心理或教育现象上的变化特征及相互联系
9、观测数据不仅具有离散性的特点,而且还具有向某点集中的趋势,反映次数颁分布集中趋势的量数叫集中量数。中位数:位于数据分布正中间位臵上的那个数。如果一组数据从小到大排列,则中位数通常是将这批数据个数一分为二,居于中间的那个数。众数:一个次数分布中出现次数最多的那个数,众数不唯一可有一个或多个。用符号Mo表示。离中趋势:数据具有偏离中心位臵的趋势,它反映了一组数据本身的离散程度和变异性程度。差异量数:反映一组数据离散程度的量
10、一批数据的算术平均数指的是这批数据总和数除以数据总次数后所得的商数。平均差:各数据与其平均数的离差绝对值的平均值。方差:数据的离差平方数的算术平均数。标准差:方差的算术平方根
11、差异系数:差异量数和集中量数两相对比后所形成的相对差异量数。地位量数:凡反映次数分布中各数据所处地位的量就叫地位量数
12、相关:行为变量或现象之间存在着种种不同模式、不同程度的联系。这种联系叫做相关。直线性相关:两个变量的成对观测数据在平面直角坐标系上描点构成的散点图会环绕在某一条直线附近分布
13、原始分数:在测量工具上直接得到的测值(数字),叫原始分数。相对评分分数:通过被试间相互比较而确定意义的分数叫相对评分分数。绝对评分分数:通过拿被试测值跟应有标准作比较来确定其意义的分数叫绝对评分分数
14、常模:测验常模简称常模即指一定人群在测验所测特性上的普遍水平或水平分布状况。组内常模:解释被试原始分数的参照体系,即被试所属那类群体的人,在所测特性上测验取值的分布状况。标准分数常模:用被试所得测验分数转换成的标准分数来揭示其在常模团体中的相对地位的组内常模
15、线性变换:对所有要作变换
的值,都乘以同一确定值然后再都加上另一确定值。测绘项目的难度:被试完成项目作答任务时所遇到的困难程度。项目的难度指数:定量刻画一个测验项目的被试作答困难程度的量数就叫项目的难度指数。得分率(通过率):最通用的项目难度指数的求法,就是计算被试在项目上的得分率或者说通过率。项目区分度:就是项目区别被试水平高低的能力的量度。测验信度:测验在测量它所测特质时得到的分数(测值)的一致性。它是对测验控制误差能力的量度,是反映测验性能的一个重要质量指标
16、观察分数:如果从测验实施过程中实际得到的被试分数叫观察分数。真分数:被试在所测特质上客观具有的水平值。测量误差:
观察分数与真分数的差就是测量误差。信度系数:利用同一测验向同一批被试重测两次所得的两批独立测值,求出其间的相关系数,就可利用这种重测相关系数作为测验信度的估计值。这样的相关系数就叫信度系数。稳定性系数:由于重侧法十分强调特质的稳定性,所以用这种方法求取的信度系数就叫做稳定性系数。等值性系数:用平行形式相关求得的信度系数,因为特别强调两测验形式的等值关系所以又叫等值性系数
17、测量标准误:实际测验中所得测值偏离真分数的程度叫做测量标准误可记为SEM。测验效度:测验实际上测到它打算要测的东西的程度。内容效度:测验项目构成应测行为领域代表性样本的程度。效标关联效度:测验预测个体在类似或某种特定情境下行为表现的有效性。结构效度:测验测得心理学理论所定义的某一心理结构或特质的程度。效度系数:测验分数与效标测量值间的相关系数叫效度系数
18、安臵性测验:学期开始或单元教学开始时确定学生实有水平以便针对性地做好教学安排而经常使用的测验。形成性测验:在教学进行过程中实施的用于检查学生掌握知识和进步情况的测验,这可为师生双方提供有关学习成败的连续反馈信息。诊断性测验:为探测与确定学习困难原因而施测的一类测验。终结性测验:在课程结束或教学大周期结束时,用于确定教学目标达到程度和学生对预期学习结果掌握程度的一类测验,称为终结性测验
19、常模参照测验:实是参照着常模使用相对位臵来描述测验成绩水平的一种测验。标准参照测验:跟一组规定明确的知识能力标准或教学目标内容对比时,对学习者的测验成绩作出解释的一类测验。职业能力倾向测验:测量人的某种潜能,从而预测人在一定职业领域中成功可能性的心理测验
20、能力倾向:一个人获得新的知识、能力和技能的内在潜力
21、确定性现象:在相同的条件下其结果也一定相同的现象。不确定性现象:在相同的条件下其结果却不一定相同的现象,又称随机现象
22、随机变量:我们称记录各种随机试验结果的变量为随机变量。概率:通俗地说,某事件发生的概率就是该事件发生的可能性大小记作为P(A)
23、正态分布是连续性随机变量中常见的一种概率分布形态也称常态分布。总体:我们把客观世界中具有某种共同特征的元素的全体称为总体。样本:从总体中抽取的部分个体组成的群体称为样本。统计量:在总体数据基础上求取的各种特征量数我们称其为参数,应用样本数据计算的各种特征量数我们称其为统计量。抽样分布:从一个总体中随机抽取若干个等容量的样本,计算每个样本的某个特征量
数,由这些特征量数形成的分布,称为这个特征量数的抽样分布
24、小概率事件:在教育统计中常常把概率取值小于0.05或小于0.01的随机事件称为小概率事件。小概率事件原理:认为小概率事件在一次抽样中不可能发生的原理
25、统计假设检验的显著性水平:在统计假设检验中,公认的小概率事件的概率值被称为统计假设检验的显著性水平。记为α。虚无假设又称为原假设、零假设,以符号H0表示。虚无假设在假设检验中将被视作为已知条件而应用,因此虚无假设应是一个相对比较明确的陈述命题,一定要含有“等于什么”的成分。备择假设又称解消假设,研究假设等,以符号H1表示。备择假设作为虚无假设的对立假设而存在,因此它也是一个陈述命题,备择假设是对虚无假设的否定
26方差分析:统计学中一种独特的假设检验方法,它的最基本功能就是一次性检验多个总体平均数的差异显著性
简答题部分
1、 为什么不同测验分数转化为Z分数就能比较①标准分数Z值是以被试所属组分数的标准差为单位来表示的被试个体分数对平均数的距离②标准分数的分布状态,就是原始分数整个分布状态的“平移放缩”后的产物;两个分布状态是完全的相似形,只是标准分数分布中,平均数取0而标准差为1③若两个测验上原始分数分布状
态相同,比如都呈正态分布,那么两个测验上的标准分数,就可直接比较了
2、 求整份测验难度①当所有项目的满分值都相等时,才能用求算术平均数办法;如果各项目的满分值并不相等,就要用求加权平均数的办法②在后一种情况下,各项目难度指数都要用本项目的满分值来加权③当有了全部被试的测验总分后,就可直接利用它们来求取被试总分的平均数,然后再求它对全卷满分的比
3、 标准化常模参照测验难度①一般的标准化常模参照测验目的是要尽可能把握信住被试的个别差异,因此希望测验后所有被试的分数“尽可能拉开距离”,好、中、差被试都能得到相应的彼此有足够差异的分数②测验项目的恰当难度应该是p值尽量接近0.50③只有当项目难度指数值愈接近0.50时,项目才愈具有区分被试的能力4、 标准参照测验难度?教育领域中有不少测验是标准(目标)参照测验①其目的是要考察被试的水平是否达到应有要求。这种测验其项目的难度,就不应该由被试的实际通过率来决定,而应由项目的考核要求是否体现了应有标准或教学目标来决定②即使一个测验项目的通过率为1.00,但考核要求确实体现了应有标准或教学目标,项目的难度仍然是恰当的、合理的。相反,如果一个测验项目的通过率很低,甚至为0.00,但考核要求并无不当,体现的是应有标准和教学目标,那么,项目难度也是合理的、必要的,应予坚持
5、 项目区分度指数取值范围多高为好①区分度指数值若在0.20以下说明项目区别被试优劣的能力很差,应从测验中淘汰这类项目②区分度指数取值在0.20至0.29之间说明这类项目区别被试优劣的能力还相当弱应通过修改来提高其区分能力③区分度指数取值在0.30至0.39间就说明这类项目的区别被试优劣的能力合格;若区分度指数取值大于0.40,试题区别被试优劣的能力就很强,是性能优良的试题
6、 各种信度系数适用情况①重测相关求信度系数,就特别着重考察跨时距上所得分数的一致性。经常测试如智力、能力倾向和人格特点。因此稳定性系数多用在预测性测验上②用平行形式相关法求信度系数,特别强调测验内容结构要平行等值性,多用于学业成就测验中③内部一致性系数强调测验中各个项目都要测查同一个特质。要求其所含项目具有高度的同质性
7、 常模参照测验与标准参照测验的差异①常模参照测验的成绩通常是一种相对评分,说明被试在某一被试团体中的相对地位;而标准参照测验的成绩通常是一种绝对评分,说明被试达成某一教学目标,或掌握某一范围内的知识技能的实有程度②常模参照测验在设计意图上比较强调对个体能力的区分鉴别,而标准参照测验在设计意图上考虑的是测验内容抽样是否良好地代表一组既定的能力标准或既
定的教学目标③常模参照测验通常涉及更广泛的、难以明确限定的学习内容与能力目标,对每一项而标准参照测验相对来讲,测验内容集中在限定的学习任务上,对每一项学习任务或目标通常用较多数量的题目来测量
8、 实验技能考核三原则①实践性为主的原则。应以动手操作为主,不能停留在笔试形式下考查实验操作知识的方式上②全面性原则。要尽力考核到实验计划与设计、实验的实施与操作、实验的分析与解释、实验报告撰写等环节;因此可结合笔试、口试和演示进行③客观化原则。要建立在行为观察的基础上,客观地评价学生的实验技能
9、 标准化成就测验特点①由有关教育测量专家和学科专家编制②实现了测验全过程的标准化③测验题目经过专家审查,常常还抽取代表性被试样本进行预测④备有测验指导手册⑤通常备有等价的或平行的几份测验⑥测验的质量经过检验,信度高、效度好⑦标准化成就测验还具有相对稳定性的特点
10、 编制命题双向细目表通常以教学大纲或考试大纲为根据,采取步骤①确定考试内容要目,并把它们排列在表中最左边一栏上。这有两种方法;一按照教材章节名称依次罗列;二是根据教学内容知识块分别罗列②界定该科目应考查的掌握目标层次,并把这
些目标层次从低级到高级依次安排在表中顶端第一行有关格子上③确定各项考试内容要目下的分数比重④把每一项考试内容的分数比重(如第一章绪论分数比重10分)逐一分配到若干必要的考查目标即掌握层次上去,形成网格的分数分配方案,即是命题双向细目表
11、 主观题突出的特点和长处①不允许简单猜测,适于考察分析综合能力、组织表达能力以及计算与推论等较为复杂的心智技能②提倡自由反应,有利于考察应用能力乃至创造能力③可以获得较为丰富的作答反应过程资料,便于分析被试的技能、策略和知识缺陷等④内容和形式更为接近教学与实践中的问题情境,被试不陌生、好接受,教师命拟比较方便
主观题不足①作答反应费事,有大量的书写任务,造成被试“忙于写而无暇想”,“手指累而头脑松” ②单位时间中施测的问题量减少,限制了测验内容的覆盖面,不利测验效率的提高③允许被试以文字技巧和作答风格来搪塞胡弄主试,靠“模棱两面可的词句”与“面面俱到的分析”来赚得高分④评分易受阅卷者主观因素的影响
论述题部分 1、
心理测验分类方法①测验编制程序是否系统、科学和完备可分为标准化心理测验和非标准化心理测验②根据测验实施时每次可测试一个人还是可同时测试一批人可分为个别心理测验和团体心理测验
③根据测验有无严格与苛刻的时间限制可分为限时测验和非限时测验④根据测验材料(刺激)是语言文字形式还是非语言文字可分成文字式心理测验和非文字式心理测验⑤根据测验引起的被试反应的特点可分为最高成就测验和典型作为测验(6)根据测验内容的性质,可分为智力测验、能力倾向测验、创造力测验以及人格测验等
2、
三种情况下的平均数抽样分布?1、原总体正态、总体方差已知情况下的平均数抽样分布所得样本平均数的分布,也就是我们所说的平均数的抽样分布服从正态分布。这个呈正态的平均数抽样分布的平均数等于原总体平均数,这个分布的标准差等于原总体标准差的
分之一。N即样本容量。2、原总体正态,总体方差未知情况下的平均数抽样分布一个总体服从正态分布,但是并不知总体的方差大小,从这个总体中所抽取的容量为n的样本,其样本平均数服从一个自由度为n-1的t分布,这个t分布的平均数就是原总体平均数,这个t分布的标准差,也就是平均数的抽样标准误等于样本标准差 分之一,也即SEx=S/ .t分布与正态分布一样,也是一个单峰对称呈钟形的分布,其对称轴通过分布的平均数,t分布曲线在正负两个方向上也以横轴为它的渐近线。与正态分布相比,t分布曲线中间低而尖峭,两头高而平缓。T分布的最大特点是它实质上是一族分布,每一个t分布的形态受一个称为自由度的东西的制约。3、原总体非正态,但样本较大情况下的平均数抽样分布不管原总体方差已知还是未知,平均数的抽样分布都是渐近服从正态分布,其总体平均数还是原总体
平均数,其标准差,也就是平均数的抽样标准误差,在总体方差已知时为σ/ ,在总体方差未知时为S/ 。
3、
统计假设检验步骤①根据题目的设问提出检验假设②选定显著性水平α③根据检验目的和已知条件找到相应的抽样分布④写出检验统计量计算公式并按已知数据条件计算检验统计量值⑤根据显著性水平α在抽样分布中确定临界值和危机域(6)将求得的检验统计量值与临界值作比较,根据其是否进入危机域而作出是否拒绝虚无假设的统计结论。
4、
χ2(读作卡方)是检验实际观测次数与理论期待次数之间差异程度的指标,其最一般表达式是:
f0表示实际观测次数;fe表示理论期待次数。χ2的意义:①若实际观测次数f0和理论期待次数fe完全相同,则χ2值为0,表明观测的次数分布与设想的总体的理论次数分布没有差异②当实际观测次数f0和理论期待次数fe相差越大时,则χ2值也越大,这表明观测的次数分布与设想的总体的理论次数分布之间的差异也越大
5、
χ2分布特点①χ2≥0,即χ2值从0到正无穷大②当自由度df≥3时,χ2分布是单峰正偏态分布,各曲线的尾巴都向右边(正方向)无限延伸,但终不与横轴相交③当自由度df>30时,χ2分布曲线基本上是对称的分布,而且随着自由度df的增大,越来越接近正
态分布形式④χ2分布具有可加性,比如,自由度df=4的χ2分布加上自由度df=6的χ2分布,其结果是自由度df=10的χ2分布⑤当自由度df=1时的χ2分布,它与标准正态分布Z值的平方正好相等;即df=1时,χ2=Z2
6、
χ2检验的主要作用是基于实际观测次数和理论期待次数之间差异程度的χ2统计量实得值的概率考察,检验如下两类问题:第一,检验某抽样观测数据的分布是否与某一理论分布相一致,即总体分布的拟合良度检验。第二,检验双向分类列联表数据下,两个分类特征(即两个因素变量)之间是彼此相关还是相互独立的问题,这类问题称为独立性检验。利用χ2检验进行分布的拟合良度检验和双向分类数据下的两变量的独立性检验,其一般步骤是①根据所存在问题的实际特点,提出虚无假设(H0)。这里的虚无假设总是“没有显著性差异”的假定,或“两个变量相互独立(即相关为零)”的假定②χ2检验最重要的、最关键的一步是如何从虚无假设出发,确定各类事物的理论期待次数③根据χ2统计量公式计算实得的χ2值④选取适当的显著性水平α值,并确定自由度df,然后在χ2值表中找到临界值χ2⑤做出接受虚无假设或拒绝虚无假设的统计决策。其原则是①当所确定的实得χ2值大于临界值χα2时,我们可拒绝虚无假设(H0),并接受研究假设(Ha)②当所确定的实得χ2值小于临界值χα2时,我们便没有充分理由拒绝虚无假设(H0)故暂认为虚无假设是成立的,把虚无假设先接受下来
7、
总体分布的拟合良度检验主要原理是借助χ2统计量的值来考察实际观测次数f0与某一假定分布的理论次数fe之间的差异是否显著,从而解决前面所提及的第一类统计检验问题,即解决“从实际抽样调查所得的观测数据,来推断其所来自的总体的次数分布是否服从理论上所假定的某一概率分布”的问题
8、
方差分析的条件①总离均差平方和的可分解性②总体正态性③样本随机性④总体方差齐性
单选、填空、多选
1、教育统计学的内容主要包括:描述统计与推断统计
2、测量结果能在其上取定数值的量尺,从量化水平高低的角度可分为:名义量尺、顺序量尺、等距量尺与比率量尺。在名义量尺上所指定的数字,只具有类别标志的意义,而无性质优劣,分量多寡的意义。顺序量尺上的数字量化水平则较高,有优劣、大小、先后之别,如学业成绩评定优劣。等距量尺上的数字量化水平又更高,这种数字是单位相等但零点可任意指定的线性连续体系上的值,如温度、可比可加。比率量尺是一种有绝对零点的,等单位的线性连续体系。如身高、体重等。能加、减、乘、除
3、测量工作按一定的规则进行,体现为三种东西即:测量工具、施测和评分的程序与要求、结果解释参照系或参照物
4、心理测量跟物理测量的两点突出差异:一间接性;二要抽样进行
5、数据的种类①从数据来源分成计数数据、测量评估数据和人工编码数据②根据数据所反映的变量的性质分分为称名变量数据、顺序变量数据、等距变量和比率变量数据
6、顺序变量数据之间虽有次序与等级关系,但不具有相等单位,也不具有绝对的数量大小和零点。因此只能进行顺序递推运算,不能做加减乘除运算。等距变量不能用乘、除法运算来反映两个数据之间的倍比关系,能做加减运算。比率变量数据可以进行加、减、乘、除运算
7、数据三个特点①数据的离散性②数据的变异性③数据的规律性
8、统计一批数据的次数分布两种方法:一、按不同的测量值逐点统计次数;二、为了简缩数据以区间跨度来统计次数。如分数段统
计
9、编制简单次数分布步骤①求全距②定组数③定组距④写组限⑤求组中值⑥归类划记⑦登记次数
10、相对次数分布表主要能反映各组数据的百分比结构
11、累积次数分布表还分成“以下”累积次数分布表与“以上”累积次数分布表两种。“以下”累积其目的在于反映位于某个分数“以下”的累积次数共有多少
12、次数分布图两种表达方式:次数直方图和次数多边图
13、次数分布曲线按形状有各种不同类型①单峰对称分布曲线。正态分布曲线也是这一类型曲线中的一种②非对称曲线即偏态分布。正偏态:次数分布有朝数量大的一边偏尾,曲线高峰偏向数量小的方向,在一些考试中,若题目偏难,多数考分偏低时,可形成正偏态分布。而负偏态的次数分布偏向正好与正偏态相反
14、几种常用统计分析图:散点图、线形图、条形图和圆形图
15、圆形图有其独特的功能,特别适用于描述具有百分比结构的
分类数据
16、集中量数有三个作用①向人们提供整个分布中多数数据的集结点位臵②集中反映一批数据在整体上的数量大小③一批数据的典型代表值
17、集中量数有多个种类,最常用的是算术平均数、中位数和众数三种。其中算术平均数是使用最普通的一个集中量数。中数在下列情况中有较好的应用价值①数据分布中有个别异常值或极端值出现时,用平均数作分布的代表值倒不如用中数作分布的代表值来得客观合理②在次数分布的某端或两端的数据只有次数而没有确切数量时③在一些态度测验、价值观测验或一般的民意问卷测试中,通常向被调查对象提出一些事项,要求被调查对象对这些事项排序。那么,在这种资料的信息数据整理分析中可应用中数来概括各个事项的总体排序结果
18、常用的差异量数是平均差、标准差和方差等指标 19、差异系数又称为变异系数和变差系数,用符号CV表示。差异系数是一种反映相对离散程度的系数,即相对差异量数。它消去了单位,因而适合于不同性质数据的研究与比较。数据在次数分布中所处的地位可用百分等级来表示。百分等级也称百分位。用记号PR表示。百分等级反映的是某个观测分数以下数据个数占总个数的比例的百分数,在0到100之间取值。如百分等级PR=75,与其对应的这个
百分位数,读作第75百分位数,记作P75
20、相关:统计学上用相关系数来定量描述两个变量之间的直线性相关的强度与方向。如相互关联着的两变量,一个增大另一个也随之增大,一个减小另一个也随之减小,变化方向一致是正相关。如相互关联着的两变量,一个增大另一个反而减小,变化方向相反是负相关。相关系数用r表示, r在-1和+1之间取值。相关系数r的绝对值大小,表示两个变量之间的相关强度;相关系数r的正负号,表示相关的方向,分别为正相关和负相关;相关系数 r=0,称零线性相关,简称零相关;相关系数|r|=1时,表示两个变量是完全相关。当0.7≤|r|<1,称为高相关;当0.4≤|r|<0.7时,称为中等相关;当0.2≤|r|<0.4时,称为低相关;当|r|<0。2时,称极低相关或接近零相关
21、积差相关是应用最普遍、最基本的一种相关分析方法,尤其适合于对两个连续变量之间的相关情况进行定量分析
22、等级相关适用的几种情况①两列观测数据都是顺序变量数据,或一列是顺序变量数据,另一列是连续变量的数据。如对学生的绘画、体育测试成绩排名就属顺序变量数据②两个连续变量的观测数据,其中有一列或两列数据的获得主要依靠非测量方法进行粗略评估得到。如语文基础知识水平可测验加以测量但学生的课文朗读水平却
只能根据若干准则由老师给予大体的评估。点双列相关适用于双变量数据中,有一列数据是连续变量数据,如体重、身高以及许多测验与考试的分数;另一列数据是二分类的称名变量数据,如性别
23、原始分数的意义必须要跟一定的参照物(系统)作比较,才能真正明确起来。原始分数意义的参照物大体有两类,一是其他被试的测值,即其他被试在所测特性上的普遍水平或水平分布状态;二是社会在所测特性上的客观要求,即被试在所测特性上发展应该达到程度的标准
24、常模总是指某一具体测验(不能简单地看成是其名称所指特性)上的常模。常模总是特定的、具体的,是就一定人群在具体测验上的表现来说的。常模又可分为发展常模与组内常模两大类。发展常模又有年龄常模与年级常模之别,组内常模又有百分等级常模与标准分数常模之别
25、历史上第一个提出常模这一科学概念的是法国心理学家比纳。他最早建立了智力测验的年龄常模。发展常模就是某类个体正常发展进程各特定阶段的一般水平
26、智商(IQ)=智力年龄/生理年龄×100
27、组内常模又可分为百分等级常模与标准分数常模两个类别。一个分数的百分等级,就是该分数在所属分数组中,取值比它小的分数个数占该分数组总个数的百分数。百分等级值只有可比性而无可加性,不能累加求和与进一步求平均;这是百分等级常模的一个局限所在
28、一个测验分数的标准分数,就是以它所属分数组的标准差为单位的,对它所属分数组的平均数的距离
29、难度指数(p)取值越大并不意味着项目越难,而是越易;指数p的数字值与其代表的含义,方向恰好相反
30、三种偏态分布:如果一个测验对某一被试团体来说,难度相对显得大,那么,被试团体中大多数人就会得低分,被试总分分布就会形成正偏态分布;如果一个测验对某一被试团体来说,难度相对显得小,被试团体中就会有很多人得高分,总分分布就会形成负偏态;假定被试团体在某一特定方面,其水平分布事实上是呈正态分布的,若测验项目的难度确能做到对这个被试团体来说是恰当的,那么对这个团体施测这一测验,所得被试测验总分分布自然也会呈正态分布
31、“高、低分组求得分率差”的办法就是将全体被试按总分多寡加以排队,然后取得分最多的27%的被试作为“高分组”,得分最
少的27%的被试作为“低分组”,最后求这两个组上项目得分率(通过率)的差来作为区分度指数的取值
31、人们就使用两个平行形式测验来测查同一批被试,这样也可获得同一批被试的两批独立测值,从而通过求相关系数,估出测验的信度32、效度验证工作大体分为三类即内容效度、效标关联效度和结构效度。效标关联效度又包含“并存”效度和“预测”效度这两个小类别
33、测验即使相当有效,效度系数rXY的取值也很少能超过0.70,一般取值能达到0.40就相当不错了
34、根据课堂教学运用测验的一般顺序来分可把学业成就测验分成安臵性测验、形成性测验、诊断性测验和终结性测验。根据解释测验分数的方法不同可把学业成就测验分成常模参照测验和标准参照测验两类。根据成就测验的实施方式与测验载体,我们把成就测验分成口头测验、纸笔测验和操作测验
35、纸笔测验优点①提高测验的效率,即同时可以进行大团体的测验②便于完整记录学生在题目作答上的反应③便于施测和评分过程的规范化和标准化从而提高学业成就测验的信度与效度④便于对测验中答题信息的分析研究
36、课堂成就测验特点①简易性②灵活性③随意性④测量性能较差
37、对教育目标分类的认识:布卢姆认为作为完整的教育目标应当包括三个主要的领域:认知领域、情感领域和动作技能领域。布卢姆把认知领域中的行为目标分为六个不同的层次,它们依次是知识(识记)、领会、应用、分析、综合和评价①知识:回忆或辨认某些特定的事实②领会:初步理解材料的意义③应用:能够运用已学过的材料④分析:把事物整体分解为部分,以便了解整体与部分以及部分与部分之间的关系⑤综合:把各个部分有机地组织成一个整体的能力⑥评价:根据一定的标准对事物的价值作出合乎逻辑的判断,如对小说、诗歌、电影、哲学流派、环保方案、测验设计等作出价值判断的行为与能力
38、我国教育工作者提出目标层次分为识记、理解(领会)、简单应用和综合应用这四个层次
39、学业测验中考试题目类型分为客观题、主观题
40、客观题:有一些考试题目,如果评分规则一旦明确下来,只要依照这些规则,无论谁去评分,都会得出相同的分数,典型的客观题类型常见的有填空题、简答题、是非题、匹配题、单项选择题或多项选择题等。简答题和填空题适合于测量相对简单的学习成就。是非
题这种题型的缺陷也是明显的,一是容易猜测,(猜对的可能性有50%),二是适合于用是非题来测量的学习成就其范围有限。多项选择题更适合于测量具有较复杂结构的学习成就
41、主观题型如论述题、证明题、计算题、作图题、作文题等
42、心理测验主要用途①人才选拔②人员安臵与人事管理③临床心理学研究④学校心理服务⑤建立和检验假设43、智力测验在国内常见①比纳智力测验②斯坦福—比纳智力测验③韦克斯勒智力测验④瑞文标准推理测验和⑤中小学生团体智力筛选测验
44、吉尔福特认为,发散思维所表现出来的一个人的外在的行为,即代表这个人的创造力
45、发散性思维在行为上表现三种基本特征:流畅性、变通性、独特性
46、人格测验的方法与类型主要有自陈量表法、投射测验法、情境测验法、评定量表法
47、客观世界中发生的各种现象分为两类:确定性现象不确定性现象
48、按照概率的定义,概率的取值范围在区间[0,1]上,如某个事件概率为1,表示该事件肯定发生,这样的事件称为必然事件,在实际研究中更多事件的概率介于0与1之间,人们把发生概率很小的事件,如概率小于0.05,或0.01,称为小概率事件
49、一个离散性随机变量的概率分布是指这个随机变量所有取值点的概率的分布情况。一个连续性随机变量的概率分布是指这个随机变量所有取值区间上概率取值的分布情况
50、从形态看,正态分布是一条单峰、对称呈钟形的曲线,其对称轴为过x=u的纵线。曲线在X=u点取得最大值。从x=u点开始,曲线向正负两个方向递减延伸,不断向X轴逼近,但永不与X轴相交。一个随机变量服从正态分布的最大特点是其取值在平均数附近的概率很大,而取值离平均数越远,其概率越小。在这许许多多的正态分布中有平均数为0、标准差为1的正态分布可以作为正态分布的一个典型代表,其他各种正态分布都可以通过一定的数学方法与它相互转化
51、在标准正态分布中,夹中间面积90%的两个Z值分别为±1.96;夹中间面积99%的两个Z值分别为±2.58
52、统计学中,推断统计的直接操作对象是总体的一个样本,但其推断的却是总体的各种特征。影响样本对总体代表性的因素主要有三①总体本身的离散性②所抽取样本容量的大小③对总体代表性强弱的因素是抽样方法
53、随机抽样方法①简单随机抽样②分层抽样③分阶段抽样④等距抽样
54、随机抽样方法原则①机会均等②相互独立。简单随机抽样最常见的形式就是抽签。较严谨的简单随机抽样是借助随机数码表而作的随机抽样
55、分层抽样的实质就是将总体各部分按其容量在总体规模中的比分派到样本结构中去,然后进行抽样。所以分层抽样是分两步进行①按比例求出各部分入样元素数②各部分按要求的人样数用简单随机抽样的方法产生入样元素,最终合成总样本。分阶段抽样实际上进行两次抽样,第一次是以“部分”为元素进行抽样,然后再在人样的这些“部分”中抽取入样元素。等距抽样的第一步也是首先对总体所有元素编号,所编号码应该是连续有序的。第二步计算每相邻两入样元素的间隔距离。第三步是在第一间隔中随机确定第一个入样元素的号码,比如说取定为00003。第四步则开始抽取入样元素
56、要认识抽样分布必须学会识别三种分布:总体分布、子样分布和抽样分布
57、α值常取0.05和0.01两个水平,偶而也有取0.001的。在假设检验中,α的取值越小,称此假设检验的显著性水平越高
58、统计假设检验中使用的假设有两种,一种称为虚无假设,一种称为备择假设。统计假设检验中冒犯I型错误的概率大小就等于显著性水平α值的大小,β同时也是犯 Ⅱ型错误的概率值符号。Ⅱ型错误称为β错误,影响Ⅱ型错误概率大小的因素有三个。第一因素是客观的真值与假设的伪值两者之间的差异。第二因素是α值的大小。α值越大,犯Ⅱ型错误的概率就越小,α值越小,β就越大。第三因素是样本容量。样本容量越大,犯Ⅱ型错误的概率就越小;样本容量越小,犯Ⅱ型错误的概率就越大
59、如果检验的目的是为了判断某个总体参数是否等于某个定值,或者是为了推断某两个总体参数是否相等,则应该使用双侧检验。如果检验的目的是为了推断某个总体参数是否大于或是否小于某个定值,或者是为了推断某两个总体参数之间有无大于或小于的关系
60、X1平均数-X2平均数的抽样分布形态以及它的各种参数估计公式主要受到四个因素的影响。第一是受到两个总体是否相关的影响,第二是受到两个总体分布是否正态的影响,第三是受到两个总体
方差是否已知以及是否相等的影响,第四是受到所抽样本容量的影响
61、把人按四种气质类型统计人数;学习成绩按优、良、中、差分类统计;对某项改革措施按所持赞成、反对以及无所谓态度统计;把一个教师群体同时按职称类别和态度等交叉分类。对于这一类数据的差异显著性检验,最适合的检验方法是x2检验62、计算x2时①若实际观测次数f0和理论期待次数fe完全相同,则x2为0,表明观测的次数分布与设想的总体的理论次数分布没有差异②当实际观测次数f0和理论期待次数fe相差越大时,则x2值也越大,这表明观测的次数分布与设想的总体的理论次数分布之间的差异也越大
63、χ2(读作卡方)是检验实际观测次数与理论期待次数之间差异程度的指标,其最一般表达式 为 f0表示实际观测次数;fe表示理论期待次数。χ2检验最重要的最关键的一步是如何从虚无假设出发,确定各类事物的理论期待次数
64、总体分布的拟合良度检验包括非连续变量观测次数分布的拟合良度检验、连续变量观测数据次数分布的拟合良度检验
65、在计算理论次数时,根据χ2统计量的特性,对此要求把理论次数小于5的组同相邻的组进行合并,直至所有组的理论次数均不小于5方可
66、列联系数C与χ2值,在对r×K 列联表检验中(这里 r与K 中至少有一个大于2),当所得的χ2值大于由预定显著性水平及特定自由度决定的χ2临界值时,我们有理由拒绝虚无假设并推断说,两种特征或属性之间具有相互依存的连带关系;但这种相关关系的程度怎样呢?在统计学中,人们用列联系数C来表示这种相关的程度。关系式为: C= 列联系数在0与1之间取值
67、在实际工作中我们有时需要同时对多于两个的总体平均数有无显著性差异作出检验,三个或三个以上用方差分析
68、方差齐性检验方法:多总体方差是否齐性常采用Hartley最大F值法
69、方差分析作出各总体平均数有显著差异之后,还必须作进一步的分析,目的以探清到底有多少对平均数之间有显著差异,到底哪些平均数之间有显著差异。方差进一步分析方法有N-K法。
简答题
1、 算术平均数的运算性质①数据组全部观测值与其平均数的离差之和必定为0②每一观测值都加上一个相同常数C后,则计算变换后数据的平均数等于原有数据的平均数加上这个常数C③每一观测
值都乘以一个相同常数C后,所得新数据的平均数,其值等于原数据的平均数同样乘以这个常数C④对每个观测值作线性变换,即乘上相同的常数C,再加上另一常数d,则计算变换数据的平均数,其值等于原数据的平均数作相同线性变换后的结果
2、 标准差的性质与应用①全组数据每一观测值都加上一个相同的常数C后计算得到的标准差不变②若每一观测值都乘以一个相同的非零常数C,则所得到的标准差等于原标准差乘以这个常数的绝对值③每个观测值都乘以同一个非零常数C,再加上另一个常数d,所得数据的标准差等于原标准差乘以这个常数C
3、 建立常模步骤①科学抽样,从清楚而明确地定义的“特定人群”总体中,抽取到容量足够大、并确具代表性的被试样组②要用拟建立常模的测验,采用规范化施测手续与方法对标准化样组(常模组)中的所有被试,施测该测验,以便恰当而准确地收集到所有这些被试在该测验上的实际测值③对收集到的全部资料进行统计分析处理,真正把握被试样组在该测验上的普遍水平或水平分布状况
4、 年级常模的缺点:年级常模虽直观好懂,但也有一定缺点。一是许多学校科目并不连年授课所以无法求年级常模;即使多学年授课的科目,如数学,随年级的递升内容重点也不断转移,二是所得年级等值常易引起误解
5、 百分等级常模的应用优点?它应用得相当广泛。这主要是因为百分等级的意义直观、好解释而且若几个不同测验对同一常模组实施,建立起了这不同测验的百分等级常模,那么,原来无法相互比较的不同测验上的原始分数,就可以通过百分等级而相互直接比较
6、 百分等级本身不是等单位的量度?心理和教育测验分数的分布状态,一般不会形成平行分布状态,而会形成“两头小中间大”的形状,或者就呈正态分布。这样,第一百分等级(PR=1)跟第二百分等级(PR=2)所对应的原测验分数的差,和第五十百分等级(PR=50)跟第五十一百分等级(PR=51)对应的原测验分数的差,是不会相等的。尾端一个百分等级的差,要比中部一个百分等级的差大得多
7、 标准分数是等单位的量度,不存在尾端单位大而中部单位小的问题①标准分数是一个比值,分子是原始测验分数的离均差,它是会随测验分数联欢会取值不同而变化的;但分母却是一个固定值,是所属分数组的标准差,不会随测验分数是在尾端或是中部取值而变化②就位臵不同测验分数的离均差来求比值时,被比的基数都是相同的,所以标准分数的单位就是相等的了
8、 建立标准分数常模步骤?我们要为性能优良的测验建立标准分数常模步骤①从明确界定好的该测验应该测查的被试总体中,抽取
一个容量足够大的代表性样组,即建立起常模组(常模团体)②对该代表性样组按应有规范施测该测验,获得代表性样组中每一被试的测验分数,即得到常模团体的测验分数组③求取常模团体测验分数组的平均数与标准差,按公式求取从-3.000到3.000这一区间上若干个点的标准分数(Z值)跟测验原始分数的对照表,就得到了标准分数常模表
名词解释:
1、统计:就是“统而计之”对所考察事物的量的取值在其出现的全部范围内作总体的把握,全局性的认识。教育统计:对教育领域各种现象量的取值从总体上的把握与认识,它是为教育工作的良好进行,科学管理、革新发展服务的。教育统计学:社会科学中的一门应用统计,是数理统计跟教育学、心理学交叉结合产物
2、测量:按一定规则给对象在某种性质的量尺上指定值。教育测量:就是给所考察研究的教育现象,按一定的规则在某种性质量尺上指定值
3、心理量表:心理测验工具与常模的结合
4、数据:用数量或数字形式表示的资料事实称为数据。计数数
据:是以计算个数或次数获得的,多表现为整数。测量评估数据:借助测量工具或评估方法对事物的某种属性指派给数字后所获数据。人工编码数据以人们按一定规则给不同类别的事物指派适当的数字号码后所形成的数据
5、称名变量:只说明某一事物与其他事物在名称、类别或属性上的不同,并不说明事物与事物之间差异的大小、顺序的先后及质的优劣。顺序变量:是指可以就事物的某一属性的多少或大小按次序将各事物加以排列的变量,具有等级性和次序性的特点。等距变量:除能表明量的相对大小外,还具有相等的单位。比率变量:除了具有量的大小、相等单位外,还有绝对零点。比率变量数据可以进行加、减、乘、除运算
6、次数分布:一批数据中各个不同数值所出现次数多少的情况,或者是这批数据在数轴上各个区间内所出现的次数多少的情况。简单次数分布表:通常简称为次数分布表,其实质是反映一批数据在各等距区组内的次数分布结构。相对次数:各组的次数f与总次数N之间的比值
7、次数分布曲线:从理论上讲,如若总次数无限增大,则随着组距的缩小,这些折线所接近的极限便将成为极光滑而富有规则性的曲线,称为次数分布曲线
8、散点图:用平面直角坐标系上点的散布图形来表示两种事物之间的相关性及联系模式。散点图适合于描述二元变量的观测数据。线形图:以起伏的折线来表示某种事物的发展变化及演变趋势的统计图,适用于描述某种事物在时间序列上的变化趋势,也适用于描述一种事物随另一事物发展变化的趋势模式,还可适用于比较不同的人物团体在同一心理或教育现象上的变化特征及相互联系
9、观测数据不仅具有离散性的特点,而且还具有向某点集中的趋势,反映次数颁分布集中趋势的量数叫集中量数。中位数:位于数据分布正中间位臵上的那个数。如果一组数据从小到大排列,则中位数通常是将这批数据个数一分为二,居于中间的那个数。众数:一个次数分布中出现次数最多的那个数,众数不唯一可有一个或多个。用符号Mo表示。离中趋势:数据具有偏离中心位臵的趋势,它反映了一组数据本身的离散程度和变异性程度。差异量数:反映一组数据离散程度的量
10、一批数据的算术平均数指的是这批数据总和数除以数据总次数后所得的商数。平均差:各数据与其平均数的离差绝对值的平均值。方差:数据的离差平方数的算术平均数。标准差:方差的算术平方根
11、差异系数:差异量数和集中量数两相对比后所形成的相对差
异量数。地位量数:凡反映次数分布中各数据所处地位的量就叫地位量数
12、相关:行为变量或现象之间存在着种种不同模式、不同程度的联系。这种联系叫做相关。直线性相关:两个变量的成对观测数据在平面直角坐标系上描点构成的散点图会环绕在某一条直线附近分布
13、原始分数:在测量工具上直接得到的测值(数字),叫原始分数。相对评分分数:通过被试间相互比较而确定意义的分数叫相对评分分数。绝对评分分数:通过拿被试测值跟应有标准作比较来确定其意义的分数叫绝对评分分数
14、常模:测验常模简称常模即指一定人群在测验所测特性上的普遍水平或水平分布状况。组内常模:解释被试原始分数的参照体系,即被试所属那类群体的人,在所测特性上测验取值的分布状况。标准分数常模:用被试所得测验分数转换成的标准分数来揭示其在常模团体中的相对地位的组内常模
15、线性变换:对所有要作变换的值,都乘以同一确定值然后再都加上另一确定值。测绘项目的难度:被试完成项目作答任务时所遇到的困难程度。项目的难度指数:定量刻画一个测验项目的被试作答
困难程度的量数就叫项目的难度指数。得分率(通过率):最通用的项目难度指数的求法,就是计算被试在项目上的得分率或者说通过率。项目区分度:就是项目区别被试水平高低的能力的量度。测验信度:测验在测量它所测特质时得到的分数(测值)的一致性。它是对测验控制误差能力的量度,是反映测验性能的一个重要质量指标
16、观察分数:如果从测验实施过程中实际得到的被试分数叫观察分数。真分数:被试在所测特质上客观具有的水平值。测量误差:观察分数与真分数的差就是测量误差。信度系数:利用同一测验向同一批被试重测两次所得的两批独立测值,求出其间的相关系数,就可利用这种重测相关系数作为测验信度的估计值。这样的相关系数就叫信度系数。稳定性系数:由于重侧法十分强调特质的稳定性,所以用这种方法求取的信度系数就叫做稳定性系数。等值性系数:用平行形式相关求得的信度系数,因为特别强调两测验形式的等值关系所以又叫等值性系数
17、测量标准误:实际测验中所得测值偏离真分数的程度叫做测量标准误可记为SEM。测验效度:测验实际上测到它打算要测的东西的程度。内容效度:测验项目构成应测行为领域代表性样本的程度。效标关联效度:测验预测个体在类似或某种特定情境下行为表现的有效性。结构效度:测验测得心理学理论所定义的某一心理结构或特质的程度。效度系数:测验分数与效标测量值间的相关系数叫效度系数
18、安臵性测验:学期开始或单元教学开始时确定学生实有水平以便针对性地做好教学安排而经常使用的测验。形成性测验:在教学进行过程中实施的用于检查学生掌握知识和进步情况的测验,这可为师生双方提供有关学习成败的连续反馈信息。诊断性测验:为探测与确定学习困难原因而施测的一类测验。终结性测验:在课程结束或教学大周期结束时,用于确定教学目标达到程度和学生对预期学习结果掌握程度的一类测验,称为终结性测验
19、常模参照测验:实是参照着常模使用相对位臵来描述测验成绩水平的一种测验。标准参照测验:跟一组规定明确的知识能力标准或教学目标内容对比时,对学习者的测验成绩作出解释的一类测验。职业能力倾向测验:测量人的某种潜能,从而预测人在一定职业领域中成功可能性的心理测验
20、能力倾向:一个人获得新的知识、能力和技能的内在潜力
21、确定性现象:在相同的条件下其结果也一定相同的现象。不确定性现象:在相同的条件下其结果却不一定相同的现象,又称随机现象
22、随机变量:我们称记录各种随机试验结果的变量为随机变量。概率:通俗地说,某事件发生的概率就是该事件发生的可能性大小记
作为P(A)
23、正态分布是连续性随机变量中常见的一种概率分布形态也称常态分布。总体:我们把客观世界中具有某种共同特征的元素的全体称为总体。样本:从总体中抽取的部分个体组成的群体称为样本。统计量:在总体数据基础上求取的各种特征量数我们称其为参数,应用样本数据计算的各种特征量数我们称其为统计量。抽样分布:从一个总体中随机抽取若干个等容量的样本,计算每个样本的某个特征量数,由这些特征量数形成的分布,称为这个特征量数的抽样分布
24、小概率事件:在教育统计中常常把概率取值小于0.05或小于0.01的随机事件称为小概率事件。小概率事件原理:认为小概率事件在一次抽样中不可能发生的原理
25、统计假设检验的显著性水平:在统计假设检验中,公认的小概率事件的概率值被称为统计假设检验的显著性水平。记为α。虚无假设又称为原假设、零假设,以符号H0表示。虚无假设在假设检验中将被视作为已知条件而应用,因此虚无假设应是一个相对比较明确的陈述命题,一定要含有“等于什么”的成分。备择假设又称解消假设,研究假设等,以符号H1表示。备择假设作为虚无假设的对立假设而存在,因此它也是一个陈述命题,备择假设是对虚无假设的否定
26方差分析:统计学中一种独特的假设检验方法,它的最基本功能就是一次性检验多个总体平均数的差异显著性
简答题部分
1、 为什么不同测验分数转化为Z分数就能比较①标准分数Z值是以被试所属组分数的标准差为单位来表示的被试个体分数对平均数的距离②标准分数的分布状态,就是原始分数整个分布状态的“平移放缩”后的产物;两个分布状态是完全的相似形,只是标准分数分布中,平均数取0而标准差为1③若两个测验上原始分数分布状态相同,比如都呈正态分布,那么两个测验上的标准分数,就可直接比较了
2、 求整份测验难度①当所有项目的满分值都相等时,才能用求算术平均数办法;如果各项目的满分值并不相等,就要用求加权平均数的办法②在后一种情况下,各项目难度指数都要用本项目的满分值来加权③当有了全部被试的测验总分后,就可直接利用它们来求取被试总分的平均数,然后再求它对全卷满分的比
3、 标准化常模参照测验难度①一般的标准化常模参照测验目的是要尽可能把握信住被试的个别差异,因此希望测验后所有被试的分数“尽可能拉开距离”,好、中、差被试都能得到相应的彼此有足够差异的分数②测验项目的恰当难度应该是p值尽量接近0.50③只有当项目难度指数值愈接近0.50时,项目才愈具有区分被试的能力
4、 标准参照测验难度?教育领域中有不少测验是标准(目标)参照测验①其目的是要考察被试的水平是否达到应有要求。这种测验其项目的难度,就不应该由被试的实际通过率来决定,而应由项目的考核要求是否体现了应有标准或教学目标来决定②即使一个测验项目的通过率为1.00,但考核要求确实体现了应有标准或教学目标,项目的难度仍然是恰当的、合理的。相反,如果一个测验项目的通过率很低,甚至为0.00,但考核要求并无不当,体现的是应有标准和教学目标,那么,项目难度也是合理的、必要的,应予坚持
5、 项目区分度指数取值范围多高为好①区分度指数值若在0.20以下说明项目区别被试优劣的能力很差,应从测验中淘汰这类项目②区分度指数取值在0.20至0.29之间说明这类项目区别被试优劣的能力还相当弱应通过修改来提高其区分能力③区分度指数取值在0.30至0.39间就说明这类项目的区别被试优劣的能力合格;若区分度指数取值大于0.40,试题区别被试优劣的能力就很强,是性能优良的试题
6、 各种信度系数适用情况①重测相关求信度系数,就特别着重考察跨时距上所得分数的一致性。经常测试如智力、能力倾向和人格特点。因此稳定性系数多用在预测性测验上②用平行形式相关法求信度系数,特别强调测验内容结构要平行等值性,多用于学业成就测验
中③内部一致性系数强调测验中各个项目都要测查同一个特质。要求其所含项目具有高度的同质性
7、 常模参照测验与标准参照测验的差异①常模参照测验的成绩通常是一种相对评分,说明被试在某一被试团体中的相对地位;而标准参照测验的成绩通常是一种绝对评分,说明被试达成某一教学目标,或掌握某一范围内的知识技能的实有程度②常模参照测验在设计意图上比较强调对个体能力的区分鉴别,而标准参照测验在设计意图上考虑的是测验内容抽样是否良好地代表一组既定的能力标准或既定的教学目标③常模参照测验通常涉及更广泛的、难以明确限定的学习内容与能力目标,对每一项而标准参照测验相对来讲,测验内容集中在限定的学习任务上,对每一项学习任务或目标通常用较多数量的题目来测量
8、 实验技能考核三原则①实践性为主的原则。应以动手操作为主,不能停留在笔试形式下考查实验操作知识的方式上②全面性原则。要尽力考核到实验计划与设计、实验的实施与操作、实验的分析与解释、实验报告撰写等环节;因此可结合笔试、口试和演示进行③客观化原则。要建立在行为观察的基础上,客观地评价学生的实验技能
9、 标准化成就测验特点①由有关教育测量专家和学科专家编制
②实现了测验全过程的标准化③测验题目经过专家审查,常常还抽取代表性被试样本进行预测④备有测验指导手册⑤通常备有等价的或平行的几份测验⑥测验的质量经过检验,信度高、效度好⑦标准化成就测验还具有相对稳定性的特点
10、 编制命题双向细目表通常以教学大纲或考试大纲为根据,采取步骤①确定考试内容要目,并把它们排列在表中最左边一栏上。这有两种方法;一按照教材章节名称依次罗列;二是根据教学内容知识块分别罗列②界定该科目应考查的掌握目标层次,并把这些目标层次从低级到高级依次安排在表中顶端第一行有关格子上③确定各项考试内容要目下的分数比重④把每一项考试内容的分数比重(如第一章绪论分数比重10分)逐一分配到若干必要的考查目标即掌握层次上去,形成网格的分数分配方案,即是命题双向细目表
11、 主观题突出的特点和长处①不允许简单猜测,适于考察分析综合能力、组织表达能力以及计算与推论等较为复杂的心智技能②提倡自由反应,有利于考察应用能力乃至创造能力③可以获得较为丰富的作答反应过程资料,便于分析被试的技能、策略和知识缺陷等④内容和形式更为接近教学与实践中的问题情境,被试不陌生、好接受,教师命拟比较方便
主观题不足①作答反应费事,有大量的书写任务,造成被试“忙于写而无暇想”,“手指累而头脑松” ②单位时间中施测的问题量减
少,限制了测验内容的覆盖面,不利测验效率的提高③允许被试以文字技巧和作答风格来搪塞胡弄主试,靠“模棱两面可的词句”与“面面俱到的分析”来赚得高分④评分易受阅卷者主观因素的影响
论述题部分 1、
心理测验分类方法①测验编制程序是否系统、科学和完备可分为标准化心理测验和非标准化心理测验②根据测验实施时每次可测试一个人还是可同时测试一批人可分为个别心理测验和团体心理测验③根据测验有无严格与苛刻的时间限制可分为限时测验和非限时测验④根据测验材料(刺激)是语言文字形式还是非语言文字可分成文字式心理测验和非文字式心理测验⑤根据测验引起的被试反应的特点可分为最高成就测验和典型作为测验(6)根据测验内容的性质,可分为智力测验、能力倾向测验、创造力测验以及人格测验等
2、
三种情况下的平均数抽样分布?1、原总体正态、总体方差已知情况下的平均数抽样分布所得样本平均数的分布,也就是我们所说的平均数的抽样分布服从正态分布。这个呈正态的平均数抽样分布的平均数等于原总体平均数,这个分布的标准差等于原总体标准差的
分之一。N即样本容量。2、原总体正态,总体方差未知情况下的平均数抽样分布一个总体服从正态分布,但是并不知总体的方差大小,从这个总体中所抽取的容量为n的样本,其样本平均数服从一个
自由度为n-1的t分布,这个t分布的平均数就是原总体平均数,这个t分布的标准差,也就是平均数的抽样标准误等于样本标准差 分之一,也即SEx=S/ .t分布与正态分布一样,也是一个单峰对称呈钟形的分布,其对称轴通过分布的平均数,t分布曲线在正负两个方向上也以横轴为它的渐近线。与正态分布相比,t分布曲线中间低而尖峭,两头高而平缓。T分布的最大特点是它实质上是一族分布,每一个t分布的形态受一个称为自由度的东西的制约。3、原总体非正态,但样本较大情况下的平均数抽样分布不管原总体方差已知还是未知,平均数的抽样分布都是渐近服从正态分布,其总体平均数还是原总体平均数,其标准差,也就是平均数的抽样标准误差,在总体方差已知时为σ/ ,在总体方差未知时为S/ 。
3、
统计假设检验步骤①根据题目的设问提出检验假设②选定显著性水平α③根据检验目的和已知条件找到相应的抽样分布④写出检验统计量计算公式并按已知数据条件计算检验统计量值⑤根据显著性水平α在抽样分布中确定临界值和危机域(6)将求得的检验统计量值与临界值作比较,根据其是否进入危机域而作出是否拒绝虚无假设的统计结论。
4、
χ2(读作卡方)是检验实际观测次数与理论期待次数之间差异程度的指标,其最一般表达式是:
f0表示实际观测次数;fe表示理论期待次数。χ2的意义:①
若实际观测次数f0和理论期待次数fe完全相同,则χ2值为0,表明观测的次数分布与设想的总体的理论次数分布没有差异②当实际观测次数f0和理论期待次数fe相差越大时,则χ2值也越大,这表明观测的次数分布与设想的总体的理论次数分布之间的差异也越大
5、
χ2分布特点①χ2≥0,即χ2值从0到正无穷大②当自由度df≥3时,χ2分布是单峰正偏态分布,各曲线的尾巴都向右边(正方向)无限延伸,但终不与横轴相交③当自由度df>30时,χ2分布曲线基本上是对称的分布,而且随着自由度df的增大,越来越接近正态分布形式④χ2分布具有可加性,比如,自由度df=4的χ2分布加上自由度df=6的χ2分布,其结果是自由度df=10的χ2分布⑤当自由度df=1时的χ2分布,它与标准正态分布Z值的平方正好相等;即df=1时,χ2=Z2
6、
χ2检验的主要作用是基于实际观测次数和理论期待次数之间差异程度的χ2统计量实得值的概率考察,检验如下两类问题:第一,检验某抽样观测数据的分布是否与某一理论分布相一致,即总体分布的拟合良度检验。第二,检验双向分类列联表数据下,两个分类特征(即两个因素变量)之间是彼此相关还是相互独立的问题,这类问题称为独立性检验。利用χ2检验进行分布的拟合良度检验和双向分类数据下的两变量的独立性检验,其一般步骤是①根据所存在问题的实际特点,提出虚无假设(H0)。这里的虚无假设总是“没有显著性差
异”的假定,或“两个变量相互独立(即相关为零)”的假定②χ2检验最重要的、最关键的一步是如何从虚无假设出发,确定各类事物的理论期待次数③根据χ2统计量公式计算实得的χ2值④选取适当的显著性水平α值,并确定自由度df,然后在χ2值表中找到临界值χ2⑤做出接受虚无假设或拒绝虚无假设的统计决策。其原则是①当所确定的实得χ2值大于临界值χα2时,我们可拒绝虚无假设(H0),并接受研究假设(Ha)②当所确定的实得χ2值小于临界值χα2时,我们便没有充分理由拒绝虚无假设(H0)故暂认为虚无假设是成立的,把虚无假设先接受下来
7、
总体分布的拟合良度检验主要原理是借助χ2统计量的值来考察实际观测次数f0与某一假定分布的理论次数fe之间的差异是否显著,从而解决前面所提及的第一类统计检验问题,即解决“从实际抽样调查所得的观测数据,来推断其所来自的总体的次数分布是否服从理论上所假定的某一概率分布”的问题
8、
方差分析的条件①总离均差平方和的可分解性②总体正态性③样本随机性④总体方差齐性
因篇幅问题不能全部显示,请点此查看更多更全内容