成绩统计与分析(三):测验的信度、效度、难度、区分度
第一列为考号(学号)或其他自定义标识列,第二列起是每小题的得分列,表头规则:题号~分值。
一、测验信度
如果一个电子表总是走快或者走慢那么我们可以说这个电子表是不可靠的信度很差。同样衡量测验的可靠性我们用测验信度,就是同一组学生用同一测验实施两次后所得分数的一致性;或者同一组学生经过一次测验后再用另一个同质测验再测一次,这两次测验所得分数的一致性。衡量信度的方法有:稳定性系数即某测验间隔测试两次后计算学生两次测验中所得分数的相关系数;等值性系数即以两个等值但具体内容不同的测验,在最短时距内对相同应试者进行测试后所得两组对应分数的相关系数;内部一致性系数即将一个测验分数分为两个相等而独立的部分,然后求两者的相关系数。易点成绩统计软件采用克隆巴赫系数,其依据一定公式估量测验内部一致性来作为信度的指标。操作步骤:点击【数据编辑】按钮打开演示文件夹的“测验的信度.难度.区分度.结构效度.xlf”文件,关闭表格编辑器后点击【开始统计】按钮。如图所示,系数越大测验的信度越好。
二、测验效度
测验效度是衡量一个测验的内容与它所要测量的对象特征的相符程度的指标,简单地说就是有没有测量到想要测量的东西。根据测验目的可以把测验效度分为内容效度、结构效度、效标关联效度:内容效度是指测验目的代表准备测验的内容和引起的预期反应所达到的程度;结构效度是指测验结果能够说明教育学和心理学理论的某种结构或特征的程度;效标关联效度是指测验结果与作为效标的另一个独立的测验结果之间的一致性程度。软件使用了因子分析作测验的结构效度分析只作为测试功能不详细介绍。
三、测验难度
测验难度一般是用正确解答该测验题的人数与参与测验的学生数的比值来衡量的,计算公式:P=R/N,其中P表示某测验题的难度,R表示答对该测验题的人数,N表示参加测验的人数。难度会影响测验成绩的分布、测验成绩的离散程度、测验的区分能力。软件采用的计算公式为:难度=平均分/分值,测验中各题型的难度建议如图所示。
点击【试题曲线】按钮可查看难度曲线图。
四、测验区分度
区分度是测验对学生实际水平的区分程度的指标。一个具有良好区分度的测验题,实际水平高的学生应该得高分,实际水平低的学生应该得低分。测验的区分度有积极区分度和消极区分度两种。积极区分是指区分的方向与测验总分的方向一致的区分,反之为消极区分。对客观题软件采用的计算公式为:区分度=PH-PL,PH为高分组通过率,PL为低分组通过率。区分度的评价标准如图所示。
点击【试题曲线】按钮可查看区分度曲线图。