英语阅读理解题测试效度分析
来源:用户上传
作者: 杨继龙 张孝香
效度作为测试学领域的专门术语,指一项测试能测出预定要测量内容的程度,或能够引起预报作用的程度。测试的效度可以用多个不同的统计方法来估计。语言测试的效度是指测试作为测量手段,测量出想测量的语言学习者语言能力的程度和水平。Bachman将语言测试的效度分为以下几种类型: 1.内容效度(content validity),其高低根据测试所包含的具体内容来确定。设计测试的内容之前必须首先思考测量的目的,然后确定具体的测试内容。2.结构效度(construct validity),其高低根据测试项目及其所反映的理论关系决定。比如,交际能力测试和交际能力理论的关系越大,测试的结构效度就越高。3.标准关联效度(criterion-related validity),其高低源于某一测试在反映学习者水平方面与其他外在评估标准的一致性程度上。例如,学习者在某项测试的表现与其在有关这项语言能力评估中表现的水平应保持一致。4.预测效度(predictive validity),其高低根据测试能否准确地预测学习者将来的学习成绩而定。某一单项语言测试应该能够预测学习者在这一语言能力方面的水平。5.卷面效度(face validity),指测试中根据观察者的主观判断,测试达到预先设想的衡量知识或能力的程度。对语言测试的效度进行类型划分,将效度这样一个抽象的专业术语具体化,便于在语言测试的设计及评价过程中更多地追求具体的有关效度的指标,便于在语言测试的研究领域对不同类型的效度展开探索和研究,便于通过实践操作提高语言测试的效度。本文拟以湖北省2007年高考英语中的阅读理解试题为例,以对其进行统计的数据为基础,从卷面效度的视角,分析其测试效度存在的问题,并提出改进意见。
一、2007年湖北高考英语卷阅读理解试题相关数据统计
(一)阅读理解题选材分析。
(二)阅读理解题考点覆盖情况。
二、2007年湖北高考英语卷阅读理解试题卷面效度存在的问题
(一)文段过长。
2007年湖北高考英语阅读理解试题的篇幅过长,有一篇竟然接近600个单词,整个大题的英文词数达到2551个,以2007年高考英语考试大纲中对阅读理解规定的参考时间35分钟来计算,要求考生的阅读速度接近73w/pm,相对于全国其它自主命题的省份,这个速度要求比较高。
(二)体裁、题材重复。
C、D的题材都是有关心理的,C篇是有关儿童害怕心理的文章,D篇是有关影响人们幸福因素的文章,这两篇相同题材的文章,会使考生感到枯燥。再者,高考考生对心理方面的知识接触不是很多,接连考了两篇有关心理的文章,其效度肯定会降低。B、C、D三篇在体裁上都是说明文,所以题材和体裁上都出现了重复。
(三)表层理解的考题有余,深层理解的考题不足。
考查细节理解的题目太多,考查作者的意图、态度等深层理解能力的题目较少。从表2中我们不难看出,考查对文章细节的理解的题目达到11个之多。2007年高考英语考试大纲对阅读的要求是这样描述的:“……阅读,要求考生读懂熟悉的有关日常生活话题的简短文字材料,例如公告、说明、广告及书、报、杂志中关于一般性话题的简短文章。考生应能:(1)理解主旨要义;(2)理解文中具体信息;(3)根据上下文推断生词的词义;(4)作出简单判断和推理;(5)理解文章的基本结构;(6)理解作者的意图和态度。”可见,2007年湖北高考英语试题阅读理解并未涉及对文章结构的理解,而且出题者对考生的六项阅读理解能力的要求也没有分出孰轻孰重。
(四)阅读材料呈现的方式、阅读理解题目的题型单一。
阅读材料单纯以文字来描述、呈现,缺乏图画、图表等呈现方式。阅读题型全都是四选一的多项选择题,没有简答、综述等效度比较高的题型,而且与生活联系不太紧,对于公告、说明、广告等与生活联系紧密的材料均为涉及,实属遗憾。
三、对提高卷面效度的思考
通过分析2007年湖北省高考英语阅读理解题可知其命题存在一些问题,其主要原因在于:1.质量专业标准与监督机制没有建立。在制定和实施分省命题政策的同时,没有建立起分省命题的质量专业标准,也没有形成有效的试题质量监督机制。2.达到专业水准的试题命题者数量不足。分省命题政策总体上比较仓促,各省没有足够时间寻找或培养出足够数量的有专业水准的试题命题人,一些省市往往是仓促形成命题小组,有些大学英语教授本人并没有接受过试题命制的专业训练,有些大学教授对新课程理念不是很熟悉。这样的试题命题人往往只能凭借自己的经验来命题,难以依据科学的语言测试理论命题。据此,笔者从宏观和微观两个层面对提高英语阅读理解测试效度提出以下建议:
(一)尽快建立试题质量专业标准和监督机制。
在建立分省命题制度的同时,应该建立各科试题质量专业标准,建立起试题质量的监督机制(即使是事后监督,也可以起到一定的作用),保证各省市命制的试题达到几乎同样的水平,从而保证试题质量,确保其效度。
(二)广泛选拔和培养有足够专业水准的试题命题者。
有足够专业水准的试题命题者是确保试题质量、提高试题测试效度的根本。现在的高等院校中有一些测试专家,或者接受过语言测试训练的专业人士,应该广泛选拔命题人员。若人数仍然不足,则应通过短期培训,尽快培养有足够专业水准的试题命题者,或者建立3―5人的全国审题专家委员会,对分省命题的高考英语试题进行最后的审定,确保试题质量。
(三)精心构思高考阅读理解测试的目的。
为了保证高考阅读理解测试的效度,针对高考考生,高考命题者要明确高考阅读理解应测量的阅读能力的层次。具体来讲,阅读测试的目的分为基本的对文章大意和主要信息的理解与较高层次的对写作态度、隐含意义、阅读策略等的驾驭。
(四)合理设计高考阅读测试的内容。
为了保证阅读测试的效度,根据具体的测试目的,高考命题者应充分考虑阅读测试的文章来源、文章体裁、文章题材、篇幅长短、题型选择、题目设计等每一个要素,从而确保与具体测试目标的一致性,确保对阅读能力测量的有效性。
(五)深入比较阅读测试题的优劣。
为了保证阅读测试的效度,高考命题者在高考测试的进行、评分等各项工作结束后,应将试题与同层次其它阅读试题进行比较。通过这种分析,一方面可以检测试题和其它阅读试题所测量的学习者阅读能力是否保持一致,另一方面也可以查缺补漏、取长补短。
(六)科学吸收阅读测试的反馈。
为了保证阅读测试的表面效度,高考命题者在测试结束后,应了解考生的答题情况以及同行对这次测试的评价。根据反馈的信息,高考命题者能够及时地了解到测试在哪些方面没有达到对考生阅读能力测量的目标,在哪些方面与对考生阅读能力的要求有偏离等重要问题。通过这种从测试的设计到反馈各个阶段的细致工作,可以提高阅读测试效度的保险系数,提高阅读测试的设计水平,使阅读测试更好地、真实地反映考生的阅读能力。
总之,我们必须在分省命题政策下,尽快提高分省命题的试题质量,确保为高等学校选拔合格新生、引导基础教育健康发展这两个高考基本目的的实现。
参考文献:
[1]Bachman,L.F.& Palmer,A.Language Testing in Practice[M].Oxford:Oxford University Press,1996.
[2]鲁子问.国家・考试・人[M].武汉:湖北人民出版社,2006.
[3]鲁子问,王笃勤.中小学英语评价测试理论与实践[M].北京:中国电力出版社,2005.
[4]高兰生.英语测试与试题命制[M].北京:人民教育出版社,2002.
[5]湖北教育考试院.2007年普通高等学校招生全国统一考试(湖北卷)――英语试卷.
转载注明来源:https://www.xzbu.com/9/view-988946.htm