编辑: 此身滑稽 2019-07-07

78 个试题过高,60 个试题过低.从图

1 中可以看出,预估值大于实测值的试题数量平均为 77.5 个,小于实测值的试题数量平均为 60.5 个,平均多出

17 个 试题,说明专家对学生能力的判断总体偏高. (2) 将每个教师估计的误差值相加, 计算每个教师的平 均差异. 图2中柱体表示命题专家平均每道试题预估得分率大 于实测得分率的值. 由于是计算误差值的代数和, 所以存在 误差值正负相抵的问题. 从中依然可以看出, 所有教师的估 计平均值都高于实测值. (3) 将每个教师估计的误差值的绝对值相加, 计算每个 教师的平均差异. 图3中柱体表示命题专家每道试题预估得分率与实测 得分率之差的绝对值的平均数. 由于是计算误差值的绝对值 的和, 所以不存在误差值正负相抵的问题. 绝对值差可以用 来量化描述命题专家预估得分率与实测得分率的相近程度, 即预估的稳定程度.从中可以看出图

2 差异值最大的教师, 在图

3 中的差异值较小,说明该教师的预估虽然总体偏高, 但其误差值的绝对值的和较小,即预估的稳定性较好. (4) 求每个教师估计值与实测值的相关系数, 判断每个 教师预估值与实测值的拟合程度. 求全体教师估计平均值与 实测值的相关系数, 并与每个教师进行比较. 判断教师预估 平均值的拟合程度. 从表

2 可以看出,每个教师的预估值与实测值的相关系 数都大于 0.7,说明其相关性很高,即教师对试题难易的感知 与实测结果吻合度较高. 教师的平均值与实测值的相关最高, 说明全体教师的平均预估结果好于每个教师的预估结果. (5) 考察教师每个试题预估值的标准差. 表1中的标准 差是全体教师预估值的标准差, 从表

1 中可以看出, 教师预 估值与实测值差异大的试题其预估值的标准差不一定大, 但 标准差大的试题其预估值与实测值差异都比较大. 例如, 全国III 卷理科数学的第

1 题、 第10 题的预估与实际差异非常

14 数学教育学报第27 卷大,但是预估值的标准差相对较小;

全国 III 卷理科数学第

5 题、第12 题的预估标准差较大,其预估值与实测值的差 异也较大, 这可能是因为这些试题比较新颖, 教师对其与考 生水平的吻合程度估计不准, 教师间的认识分歧较大, 所以 造成了预估值的标准差较大. 因此在进行难度预估时, 应特 别关注预估值标准差较大的试题. (6)把教师分为两组,每组独立估计试题难度,考察教 师组间差异性.数学组的命题工作分为两个组平行推进,A 组(T

1、T

2、T

3、T

4、T

6、T12) ,B 组(T

5、T

7、T

8、T

9、 T

10、T

11、T13) ,为了比较两个组教师预估值的差异,分 别采用

4 种模型进行分析. 模型一: 假设试题难度受

3 种因 素影响: 两种水平因素 (专家组之间的预估难度水平差异和 试题间的难度水平差异) 和随机误差, 建立双因素方差分析 模型.模型二:不考虑试题难度水平,认为每个试题作为随 机样本, 难度基本服从正态分布, 建立两个专家组的单因素 方差分析. 模型三: 经过验证样本符合独立样本的方差齐次 性,进行独立样本均值 t 检验.模型四:每个命题专家作为 独立的水平, 通过单因素方差分析模型考查专家预估难度之 间是否有显著性差异. 基于

4 个模型的分析结果显示两组专 家在高考数学全国卷的

下载(注:源文件不在本站服务器,都将跳转到源网站下载)
备用下载
发帖评论
相关话题
发布一个新话题