《对外汉语教育学引论》背诵梳理|3.4测试评估|背诵逻辑
这次更新应该是我这个《引论》系列最后一节了。我们现在一起来梳理一下测试评估部分的主要逻辑。
我们这里讨论的是比较具体的“语言测试”,它的定义是:根据一定的评估目的,以抽样的方式通过有限试题来诱导出受试者的言语行为,然后借助于定量描述来判断受试者掌握的该语言的知识和能力。
这句话的关键词我已经加了黑体。按照我的理解,概括为“抽样诱导,定量描述”。背过这几个词不是最重要的,最重要的是理解语言测试的考察逻辑:如何诱导出可以体现受试者语言知识和能力的言语行为,并对这种行为做量化和说明解释。
因为如上逻辑,所以本书归纳出语言测试的几个特点:
(1)间接性
人们所具有的语言知识和语言能力是无法直接测量的,只能通过诱导出的言语行为来间接测量。
(2)片面性
实际操作中,很难一次性把受试者所掌握的语音、词汇、语法、汉字全考一遍,只能采取抽样的方式。所以不可避免具有一定的片面性。
(3)主观性
主观性试题一定会受到评卷人的主观好恶影响。
(4)偶然性
测试命题、受试者临场发挥以及评卷过程中总有一些偶然性因素。
语言测试用途分类和语言测试的作用紧密相关。
本书作者介绍,按照用途分为四种类型。实际上,除了学能测试我们一般很少接触,其余的三种类型我们中国学生都经常接触。
还记得高中练习册的某些习题前面会标记例如(西工大10),表示10年西工大附中考题。还有些会标记(黄冈1诊),当时不太明白啥意思。现在看过这一部分内容后,终于明白了,应该是黄冈中学第一次诊断测试题。在高中背景下,诊断测试就大体相当于月考,而期中期末考试就大体相当于成绩测试。
再回想一下,月考的内容往往就是本月所学,或者是本学期截至到考试的时候所学;而期中期末考试,就是考察一学期或者半学期的内容。
水平测试就很好理解了,就是我们的汉语水平考试HSK,英语的托福,或者西班牙语的DELE。不管受试者学历背景,只要对于考试语种是非母语者,都可以通过这些考试评估自己的水平。西班牙语就业市场,有西班牙语专业八级+DELE C1,几十个W的好工作就在向你招手。
我将这部分内容汇总到同一个表格中,如下:
语言测试按照不同分类标准,我做成如下表格:
比较有意思的一个知识点是:大学英语四六级属于标准参照测试还是常模参照测试?
英语四六级属于常模参照测试。也就是说,四六级最终的成绩是以同批次考生成绩为常模,经过复杂计算获得最终的分数。让我想起了360开机小贴士:您的开机速度打败了全国17%的用户。没错,您的英语四级如果425的话,打败了全国17%的考生(数据仅供参考)。
这部分内容是用来评价语言测试质量。我整理成如下表格。
这一小节我们一直梳理的都是语言测试,实际上,有些概念我们在之前非语言考试也听说过。
例如,区分度概念和试卷难度相关,用来区别不同水平的受试者。理解了区分度的概念返回头,对我们考研,甚至高考、中考都有指导意义。
还记得当年高考数学最后一道压轴题,too young too naive的我,还在想,只要我努力,也是写出点什么来。现在知道,实际上,这就是一道大区分度的考题。它是用来区别顶尖学生是进入清北还是进入一般985。而对于目标是普通一本以及往下的同学,最后一道题只需要尽力做一下第一问,没必要在第二问浪费过多时间。
同理,我们考研专业课《现代汉语》的大区分度考点可能会出在单句和复句的层次划分上。这个题属于综合能力题型,往往是建立在理解了词汇和语法章节的基础上。
语言测试题型就是我们常见的多项选择题、综合填充题、作文、口试题。我将这部分内容做成如下表格:
《引论》梳理的内容终于告一段落了。确实花费了很多时间精力,但是也是收获满满。更新这个系列,对我自己来说有两个收获。首先,能够完完整整善始善终独立系统地做完一件事情;其次,对于专业课本身也有很多新的认识,更正了以前一些不正确的认知。总之还是很开心的。
我想各位同学看完这个系列也多多少少有些收获吧!我们留言板或者后台见,说出你的建议、意见、感受!