标准化考试也称标准化测验(Standardized Test),是指根据统一、规范的标准,对考试的各个环节包括测试目的、命题、施测、评分、计分、分数解释等都按照系统的科学程序组织,从而严格控制了误差的考试。
好处:
考试的标准化是实现考试科学性与公平性,保证考试质量的重要途径。
标准化考试的目的在于提高效率。标准化考试和现代教育一样,是大规模生产的必然结果。此前有一错误观念,认为学校教育就是要把所有学生放在同一条生产线上,这种想法实际上夸大了学生的共性而忽略了学生的个性。
但是在现代社会,学校教育可以提高教育的效率,使得几乎所有社会成员都能享受以前少部分人能够享受的特权。为此,一定的牺牲是值得的。实际上,标准化考试在某种意义上就是一个牺牲一定效果而获得效率的行为。
因为有了标准化考试,就可以大大提高评价的效率,降低评价的成本。为此,一定的牺牲在所难免。考试可能对部分人无效,或者不公平,但是从社会整体来说,考试却是有效的,也是公平的。
如果将来社会资源极度丰富,不用考虑时间、成本等因素,标准化考试或许会被更为准确的面试或长期观察所取代,但近期实际情况证实,在社会和自然资源相对发达的美国,也难实现。
因此在目前情况下,尤其在我国,还不能对标准化考试抱有过高的期望,认为考试就是一个完美的选拔制度。就是说,应该也只能把考试作为提高人才选拔效率的一种手段,而且只能是一种辅助手段。
弊端:
(1)编制良好的选择题较花费时间,特别是干扰项的设立。
(2)这种题型较难测量以发散为思维特征的重要能力,如表达、创造能力等。
(3)无法测量学生的思维过程。
(4)这种题型有被试者猜测正确作答之嫌疑。(张敏强,1998)
扩展资料
在我国,每年都在举办着成千上万的各种类型的考试。这些考试的规模不可谓不大,其利害也不可谓不高。但这些考试真正实现标准化却可谓少之又少。究其原因,可以归结为观念和体制两个方面:
首先,从观念方面分析,中国的广大民众对考试有一种“膜拜”的心理,普遍认为考试一定是神圣的、公平的。如果因为考试结果比其他人差而失去某些机会,必然是心服口服。这种心理或许源于对权威的服从,或许是被考试的形式所“蒙蔽”。
但不管怎么说,考试的形式不仅保证了考试的信度,而且保证了考试的效度,即一个考试是否真的能够考查出试卷编制者想要考查的能力。这种心理使得人们几乎从不对考试的科学性和有效性进行质疑。
考试的形式使人们看到的只是形式上的平等和公平,却忽视了实际上可能存在的不平等和不公平。 其次,从体制方面来分析,中国的考试大多数都是由政府部门或隶属于政府部门的机构来组织的,因此,这些部门或机构可以通过行政力量来“培育”或“分割”市场。
在这种情况下,不同的考试能否生存或壮大不取决于考试本身的质量高低,而是从很大程度上取决于行政命令。即便是对考试的质量,也缺乏有效的监督,往往只有通过考试研发人员的责任心来实现。
到头来,在我国社会主义市场经济的大趋势下,是否也应该把考试行业放在市场中,让考试经受实践的检验,让不同的考试在相互竞争中得到提高,观念和体制成为影响我国考试行业发展的重要原因。而这两方面本身也相互影响。
政府部门组织的考试会因其“官方”身份而增加考试的“权威性”,于是民众更加不会怀疑其科学性和有效性。与此相伴,民众的笃信不疑必然从另一方面削减了对考试质量的监督,使得考试的组织机构在不经意间放松对考试质量的追求。
如此恶性循环,必然影响标准化考试的发展。为此,我们必须首先大力宣传有关标准化考试的观念,提高广大民众对考试的认知,进而推动考试体制的逐步变革。这样,才能不断提高标准化考试的推行,真正实现利用考试达到人才评估的目的。
标准化考试作为一种人才评估手段,在中国正发挥着越来越大的作用,然而标准化考试也只不过是人才评估的手段之一。
因此,我们既不能低估标准化考试的作用,也不能高估其作用。那种对考试“膜拜”的心理和将考试“一棒子打死”的态度,都不可取。标准化考试的推行和真正落实,还有一个漫长的形成和发展过程。
在现代教育测量中的成绩测验,常常以常模作参照标准,并按科学的系统程序严格控制考试误差,以保证考试的准确性、可靠性和可比性。这样的客观成绩测验考试题目就叫做标准化试题。所谓“标准化”,具体包括试题编制的标准化、施测过程的标准化、评分记分的标准化、分数合成的标准化以及分数解释的标准化等等。
标准化考试的优点
1、试卷编制的科学性;
2、试题取样的代表性;
3、评分的客观性。
标准化考试的缺点
1、能力测试的片面性;
2、题型的僵化性;
3、防止考生舞弊的困难性;
4、各项质量指标也存在不完善性。
准备标准化考试的正确做法
第一步:确切了解考试如何进行
不仅要知道需要学习的材料,还要知道考试准确的形式以及考试本身的规定。比如购买备考指南。这对于参加大型标准化考试尤为重要,因为已经有很多人对这些考试进行了无数研究,知道这些考试如何运作。
第二步:考试检测的是知识还是智力
下一步是了解测试考查的具体材料。这里会遇到两种不同的标准化测试。对于知识测试而言,复习的重点应该是获得相关知识;对于能力测试,则需要分配精力,一部分用于获得可以获得的知识,另一部分专注于熟练考试技能,尽可能地了解考试本身。
第三步:了解考试材料
对于知识测试,或者含有具体可学习内容的能力测试,下一步你需要做的是学习考试材料。这就和准备普通考试一样,只不过如果涵盖多门课的内容,学习的范围要比普通考试广得多。
第四步:掌握考试
理想情况下,交叉进行复习和测试练习的状态应该是:先立即做一次测试练习。即使第一次测试的成绩惨不忍睹,但这为未来的进步设定了基准线,也会显示出所面临的困难。
一直复习,直到有50%的把握参加考试。这是一个主观的标准,但应该主动获得复习进展的反馈。再进行一次测试,检验自己判断是否正确。如果判断正确的,应该较第一次有显著的提高。
什么是标准化考试?
我国是考试的故乡,既使从隋朝的科举制算起,考试在我国也已经有1300多年的历史。悠久的考试历史,积累了丰富的考试经验。
标准化考试是近代逐步发展起来的一种考试方法。目前仍处在探索和试验阶段。随着现代科学技术的不断发展,将数学方法、概率统计方法用于考试研究,使考试成为一门科学教育测量学。近一个世纪以来,教育测量在美国等一些西方发达国家得到了长足的发展。在教育测量学理论指导下,随着计算机等现代化手段的广泛使用,20世纪40年代初在美国出现了一种新的考试形式标准化考试。
标准化考试是一种按系统的科学程序组织、具有统一的标准、并对误差作了严格控制的考试。考试需要做到试题编制的标准化、考试实施的标准化、阅卷评分的标准化以及分数转换与解释的标准化。
实行标准化考试,是我国考试工作的一项重大改革,它将以崭新的面貌载入我国的考试史册。与传统考试相比,标准化考试有以下特点。
⑴试题编制
1)标准化考试试题编制的组织形式是开放型的、分散型的、经常性的。对每道试题都经过测试、统计,科学地评价出试题的质量,建立起题库,以便根据不同的考试要求,随时组成不同难度的试卷。对同一种考试,保证每次考试试题质量相对稳定。这种编题形式相对于我们传统的封闭型的、集中型的、突击性的编题有便于组织、经济方便、试题科学稳定等优点。
2)标准化考试试题量大,覆盖面宽,能比较全面地考察考生对教材的掌握情况,同时也能较好地防止猜题、押题等弊端,将学生的注意力引导到掌握教材的基本知识及基本理论上来,真正做到有利于大学选拔新生,有利于中学教学工作。
⑵组织施测
1)标准化考试采用主观试题同客观试题相结合的形式。标准化考试如全部采用选择性试题同样有它的局限性。考生在答题时不能自由地表达自己的观点,不能表现自己的创造能力和文字表达能力,因此也就不能训练学生的求异思维和发展思维。主观性试题则恰恰可以弥补选择性试题的弱点,所以我国目前采取的标准化考试是主、客观试题相结合的形式。实践证明,这两种题型结合并用,可以相互补充,相得益彰。
我们现行的标准化考试,是把主观题和客观题分开,并且单独印刷。客观选择性试题为第Ⅰ卷,用统一规定的答题卡答题,主观题为第Ⅱ卷,考生将答案直接答在试卷上。2007年统考英语科继续试行网上阅卷,主观题第Ⅱ卷考生将答案直接答在英语答题卡Ⅱ上。
2)客观选择性试题的题目形式是由提出问题的题干和回答问题的选项构成。目前我国通常采用的选项为四项,四个选项中规定只有一个选项是正确的称为单项选择题,四个选项中规定有两个或两个以上选项是正确的为多项选择题。考生在应考时要特别注意审视题目规定,避免造成不应有的失误。
3)客观选择题试卷(第Ⅰ卷)答题卡又分两种排列方式。题目的先后排列次序是不同的。考生填涂时对准题号。
⑶评阅试卷
1)高考卷Ⅰ的答题卡使用光标阅读器评阅。其特点:快速、准确、节省人力。评卷方法:每张答题卡首先由一台阅读器评阅,再由另一台阅读器对其结果复核,只有当两台阅读器的结果一致时,才能得出考生该卷成绩,遇有两次结果不一致时,阅读器会自动停止运转,等待人工判断结果;为了确保准确,评卷期间还要对评卷结果进行抽查,抽查的试卷不低于总数的千分之三。近几年每年高考共评阅卷Ⅰ试卷40万份左右,全市每年于6月底由考生公开查卷,共查阅试卷3000余科次,无一错误。
2)主观题评卷将仍沿用传统的人工方法,我们将对人工评卷易出现的错误采取有效措施严格控制。统考英语科主观题将实行网上阅卷,是有效控制评分误差的措施之一。
⑷分数解释
使用标准分是标准化考试的重要标志。它可以提高测量结果的可比性,使不同科目分数相加更合理,为高等学校录取新生提供更准确的信息。
我们知道,考试是一种心理测量。人的绝大多数心理现象是没有绝对零点的。即使一个学生数学考试得了零分,也不能说他的数学知识为零。可见,考试分数的零点是相对的,是教师根据需要通过调整试题难度确定的。这样,不同的考试因为难度不同便有不同水平的零点。这种因参照点不同使不同考试分数无法比较的现象是显而易见的。例如,1984年高考,数学试题较难,北京市理科考生数学成绩及格率为5.8%,平均分为23.23分,考生的分数普遍偏低,我们不能因此说1984年的考生数学知识普遍不如前几年的考生。
把同一考试的不同科目的原始分数直接相加,依据总分决定取舍,是目前我国多数省市考试采取的方法。实际上,不同的考试分数,因为参照点和单位不同,是不具可加性的。仍以1984年高考数学为例,考生分数普遍偏低。本来在高考中语文、数学两科为加权科目,每科为120分,目的就是加重语文、数学两科成绩在总成绩中的比重。由于数学明显难于其它科目,数学的参照点就和其他科目有了区别,这种不同参照点的分数直接相加,其道理也就同美元与人民币直接相加一样,没反映出数学的真正分值,不仅没有达到加重数学科在总成绩中的比重的目的,反而使其比例变小,这是很不公正的,对择优录取也是很不利的。
考试的原始分数非但不能直接相加,也不能直接加以解释。例如,某考生高考语文成绩为85分,作为孤立的分数,它几乎没有任何意义。据此我们既无法得知与其他科目相比该生语文学得如何?也无法知道与其他同学相比他的成绩高低?更无法知道该生对语文教材掌握了多少?哪些已经掌握,哪些没有掌握?在报告和解释考试结果时人们常把分数绝对化,把分数的微小差异看作是有意义的,甚至以1分之差决定取舍,实际上有些分数差异是由不可避免的误差因素造成的。例如,考生考试期间紧张、失常、没有发挥出自己的水平;试卷题目用词不当,答题要求说得不清;人工阅卷、计分出现误差等等。把它们作为有意义的差异来解释是不合适的。
上述例证,不但说明了实行标准化考试的必要性,也说明了心理测量的标准化比物理测量的标准化更加复杂,更加困难。由于我们对标准化考试的研究才刚刚起步,主、客观条件不完全具备实行标准化考试,因此目前的标准化考试仅仅是试验,特别是分卷考试,它是我国由传统考试向标准化考试过度的一种形式。无论是标准化考试试验,还是分卷考试,对考生来讲,其答题方法及基本要求是一致的,在此不再多叙述。
标准化考试是相对的,只有水平高低之分,而不是“全有”或“全无”的性质。没有一种考试做到了完全的标准化,也没有一种考试一点没有标准化。以我国目前的高考来说,通过多年实践,我们已经取得了丰富的经验,从命题、施测、评分到录取,有一套较为严格的组织管理办法,对各种影响测验分数的误差因素作了一定控制。但总的看来,我国高考的标准化水平还比较低,在考试科学化方面还有许多工作要做。
标准化考试不是万能的,认为只要实现了标准化,考试中的一切问题就都解决了的想法是不实际的。标准化水平再高,也不可能把所有误差都排除,为此我们需要多次考试,多种考试,要把考试分数与从其他方面来的信息结合起来,只有这样才能对一个学生、一位教师、一所学校或一个地区的情况作出较为全面的、正确的评价。
gdfh