目前,国内的学业测评基本上还是纸笔考试,并且结果以分数的方式表达。但从测量的角度讲,这种方式将会被基于电脑网络的考试所取代。纸笔考试的最大弊端是很多生动的材料无法反映出来,比如医生资格考试中需要听到心脏跳动的声音,这在纸笔考试中就无法实现,而用电脑就可实现。纸笔考试虽然也能进行学业测量,但是太落后了,一方面是手段上落后,无法呈现形象、环境等真实情境下的内容,另外,考试安全也是一个很大问题。中国每年都在考试安全上花很大力气,如有的考试保密室设三道铁门,可还是会出问题。如果进行电脑化考试,建设大容量题库,考试时试卷自动生成,安全问题就会解决,因为背一套试卷没用,要偷整个试题库并记住也不太可能。
学业测评有两种类型。
其中一种是评估政府的教育政绩、评价教育的进程,这样的测评一定是抽样的。比如美国的“国家成绩报告单”(NAEP),实际就是国家教育进步评估报告,这个报告的数据来源是通过全国抽样的,反映的是整个美国按人口统计的整体状况。如了解每天看4小时电视的儿童的成绩怎么样,每天领取免费午餐的中学生的成绩怎么样,在国外驻军人员子女的成绩怎么样,私立学校学生怎么样,天主教徒家庭学生怎么样,等等。每年这个国家成绩报告单公布的时候,国家电视网络会在黄金时段加以评论。
另一种类型是对学生个人的测评,比如每个学生都要参加的统考。
目前,国内的学业测评基本上还是纸笔考试,并且结果以分数的方式表达。但从测量的角度讲,这种方式将会被基于电脑网络的考试所取代。纸笔考试的最大弊端是很多生动的材料无法反映出来,比如医生资格考试中需要听到心脏跳动的声音,这在纸笔考试中就无法实现,而用电脑就可实现。纸笔考试虽然也能进行学业测量,但是太落后了,一方面是手段上落后,无法呈现形象、环境等真实情境下的内容,另外,考试安全也是一个很大问题。中国每年都在考试安全上花很大力气,如有的考试保密室设三道铁门,可还是会出问题。如果进行电脑化考试,建设大容量题库,考试时试卷自动生成,安全问题就会解决,因为背一套试卷没用,要偷整个试题库并记住也不太可能。
此外,纸笔考试用一张试卷去测试所有学生,这可能对一些学生显得太简单,而对另外一些学生又太难,这样就测不出学生真实水平,不知道真实水平就不能真正的了解学生,不能为学生提供帮助,尤其是差生。如果是零分试卷的话,就表明你将对这个学生一无所知。如果用网络自适应考试,根据学生答对答错情况不断调整试题,遇到学生不会的题目,系统自动降低标准,一直降到会的程度,这样才会测出学生真实水平。现在的托福、GRE等都是这样的模式。计算机介入学业测评将是一个趋势。
现在内地的许多学业测评只是满足于把分数测出来并对学生进行排队,这实际是做到一半就停住了。应该对这个成绩进行分析,然后用于诊断与改进。通过计算机自适应考试,建立诊断性模型,能高效的检测出该学生的学习状况。考试前教师和专家要定义这些题目要考查学生的什么能力。比如,测试学生的计算能力,一个学生考了70分,通过专家分析得出该学生加法和减法还可以,乘法稍差,除法一点都不行,学生的老师一看到相关的信息马上就知道需要在哪些方面帮助这个学生,做到“对症下药”。