第十一讲:汉语作为第二语言的测试与评估 主讲人:李老师 一、测试的作用与目的
1、评估教学,提供反馈信息。(反馈作用) 2、评估人才,提供用人的重要依据。 3、是语言教学研究和语言研究的重要手段。 4、推广母语教学,扩大母语影响。 英语:托福、雅思;日本JLPT;韩国KLPT 二、测试的种类
第二语言测试可分为:水平测试、成绩测试、诊断测试和潜能测试四大类。
H.S.K.是一种水平测试 1.水平测试
定义:用以测量测试对象的第二语言水平,一般而言有专门的考试大纲、统一的试题和统一的评分标准,以尽可能客观的标准来测量考生目的语水平的考试。
目的:测量测试对象的第二语言水平。
特点:有专门的大纲、统一的试题和统一的评分标准,较高预测效度。 原则:能够有效的测量测试对象的实际语言水平。例如:HSK/TOEFL/WSK(全国外语水平测试) 2、成绩测试(课程测试)
定义:成绩测试是一门或一种课型的一定学习阶段的测试。用以检查
测试对象在学习的一定阶段掌握所学课程的情况 。
目的:检查测试对象在学习的一定阶段掌握所学课程的情况,所以也叫回顾式测试。
特点:跟教学过程和教学对象紧密相关,可以测定受试者的学习成绩,但不一定能反映受试者的语言水平。 例如:结业考试、期中考试、期末考试、月考 水平测试 vs.成绩测试
成绩测试是一门或一种课型的一定学习阶段的测试。用以检查测试对象在学习的一定阶段掌握所学课程的情况。包括:期中、期末考试,结业考试、毕业考试……水平测试的目的是测量测试对象的第二语言水平。
一般而言有专门的考试大纲、统一的试题和统一的评分标准,以尽可能客观的标准来测量考生的目的语水平。包括:HSK、TOFEL…… 二者区别简单来说,成绩测试可能是对听、说、读、写任意一个技能的考察,而水平测试是对听、说、读、写技能全方面的考察。 3、诊断测试
目的:检查受试者对学习内容的掌握情况,以及教学效果是否达到教学大纲所预期的要求。
特点:A.不受教学进度的限制,随时可以进行;B.测试内容可以相对集中,突出针对性;
C.诊断测试是非正式的测试,完全由任课教师根据实际情况来进行命题和施测,形式灵活;
D.对信度和效度没太高的要求。
例如:课堂提问“V+得”的掌握情况;“趋向补语”的掌握情况。 4、潜能测试
目的:了解受试者学习第二语言的潜在能力,预测学习者在未来学习目的语是否会成功。
内容:模仿能力;记忆能力;理解能力。例如:语言能力测试 5、分级测试
目的:评估学习者现有的语言水平高低,从而确定其适合于学习什么样的课程或适合于在何种程度的班级上课。 三、语言测试的质量评估:信度和效度
信度和效度是测验质量评估的最重要的两条标准(一)信度指测量结果的可靠性、一致性和稳定性程度。即,
在不同时间或不同测试条件下,使用同一测验,对同一组被试实施多次测验所得结果的一致性或稳定性程度。
影响测验信度的一些因素1.测验的长度即题目数量一般来说,测验题目数量越多,信度越高。但需注意题目不能过多。2.测验题目的同质性测验题目的同质性主要靠题目的区分性来保证,一个测验所有题目都有较好的区分性,则内部一致性信度便会较高。 3.题目难易度分布
题目难易度虽然与信度没有直接关系,但如果题目难易度分布不好,或题目过难,则也会影响测试信度。
4.被试样本的异质程度被试的水平差距越大,即被试异质程度越高,
信度就会越高。 (二)效度
效度指测量的有效性和准确性,即测量对它所要测的东西准确测量的程度
效度的分类:1.内容效度
指测验的内容对所欲测量的内容的代表性和恰当程度。即实际测验内容与预定测验内容的一致程度。
与内容效度容易相混淆的一种效度是所谓的表面效度。表面效度指测验表面上看是否测了它所要测的知识或能力。它被认为是外行人谈论的效度,因此不是真正的效度。
比如,作文和改错究竟哪一种题型更能测出一个人的表达能力。 2.效标关联效度
指测验结果与效标的一致性程度,它评判的是测验结果与某一特定准则的关系的密切程度。
如:汉语水平考试的效标是根据其他可靠手段评定的考生实际运用汉语的熟练程度。
影响效度的一些因素:1.样本的异质程度被试之间水平差距越大,效度系数就会越大。2.效标的质量效标选取是否恰当,效标本身是否可靠都会影响到效标关联效度。3.测试本身的质量
测试的难度、区分度、及难度分布会影响测验效度。4.测试实施的程度(标准化) 信度和效度的关系
1.信度是效度的必要前提,效度受到信度的制约。 2.信度高的测验不一定效度高。 练习
我国中学没有开设阿拉伯语的课程,而外语大学有阿拉伯语专业,可以用一种
倾向测验来选拔在未来阿拉伯语学习上具有潜能的学
生。目的在于妥善地将学习者按照程度分班或编组的测试叫 。 留学生来中国学汉语的期末考试属于考试。 A.成绩测试B.水平测试C.诊断测试D.潜能测试
下列哪种测试市目前教育测验中运用最广的:A.水平测试 B.成绩测试C.诊断测试 D.潜能测试
老师教学“把”字句,给学生讲了“把”字句的基本原则,为了检验“把”字句教学效果,教师自己出了一些题目让学生做,了解学生哪些规则掌握了,哪些弄不清楚。这属于( )测试。 A.成绩 B.水平 C.诊断性 D.能力倾向 四、语言测试的四个发展阶段 1、传统时期(20C初—50S)
这一时期的测试缺乏科学性,测试方法主要是作文、口试、翻译。测试结果主要靠实施者的直觉来判断,缺乏科学性。 2、结构主义时期(20C50S末—70S)
这一时期测试以结构主义语言学为理论基础,测试方法主要是分立式测试,这一阶段重视测试信度。 3、后现代时期(20C70S—80S初)