高考选考科目计分方法探讨
刘 慧
【摘 要】摘要:本文在参照国内外相关研究的基础上,结合我国新一轮高考改革方案的实际情况,提出高考选考科目计分方法的建议:采用基于假设总体的量表化方法对选考科目分数量尺进行调整,使各科目分数量尺依据同一个考生样组建立。这种量表化方法可以减少目前计分方法下不同科目依据各自考生群体进行科目内标准化造成的误差,从而增强不同选考科目成绩进行比较的合理性。
【期刊名称】中国考试 【年(卷),期】2018(000)006 【总页数】5
【关键词】高考改革;选考赋分;分数转换;量表化 修回日期:2018-04-03
2014年,国务院发布《关于深化考试招生制度改革的实施意见》,由此启动了以浙江省、上海市为试点的新一轮高考综合改革。2017年第一轮招考工作虽然已经平稳、顺利地完成,总体情况符合预期,但是新一轮高考改革方案包含了较为复杂的制度设计,实践中不可避免地出现一些问题,其中选考科目的计分方式就是新一轮高考改革实践中出现的一个值得讨论的问题。
浙江省、上海市高考综合改革方案中的考试科目为语文、数学、外语3门必考科目和高中学业水平考试3门选考科目[1-2]。普通高校按学科大类从选考科目中指定选考科目范围,考生选考科目满足其中一门即可报考(对部分没有提出选考科目要求的专业,考生在报考时无科目限制);也就是说,报考同一高校同
一专业的考生,考试科目不一定相同。比如复旦大学数学类专业对2017年高考选考科目的要求为物理、化学,考生3门选考科目中包含物理或者化学即可报考。按照这个要求,在上海市2017年高考选考科目共计20种组合(6选3)中,有16种可以报考复旦大学数学类专业,也就是说,在竞争复旦大学数学类专业的入学资格时,参与竞争的考生选考科目不一定相同,组合可能是物理、政治、地理,也可能是化学、生命科学、历史。因此,在录取时需要对这些选考不同科目考生的水平进行比较。目前选考科目成绩按照考生在相应科目所有考生中的排名等级进行赋分,这意味着选考科目的成绩不仅仅依赖于考生个人的考试表现,还与选考该科目考生群体的水平有关。如果选考不同科目的考生群体能力水平不一致,那么,当选考某个科目的考生总体水平较高时,能力一般的考生在这个科目上只能拿到较低的分数;当选考某个科目的考生总体水平较低时,即使能力一般,也能在这个科目上拿到较高的分数。在合成高考总分时,选考科目的分数是直接计入的,因此在得失之间,考生就会倾向于选择“容易拿高分”的科目。这也是导致引起社会广泛关注的、个别科目选考人数下降问题的一个原因。2017年年底,浙江省人民政府发布《浙江省人民政府关于进一步深化高考综合改革试点的若干意见》(以下简称《意见》)[3],对浙江省高考综合改革试点提出若干意见,其中包括建立科学合理的选考科目的保障机制。《意见》针对当前选考出现的情况,率先建立了物理选考科目的保障机制,当物理选考科目考试赋分人数少于6.5万人时,以6.5万人为基数计算各等级人数,从高到低进行等级赋分[4]。发现问题后的种种思考和建议,都是为了保障参加不同选考科目考生的权益不受到损害,使高考改革方案更加完善、高考选拔制度更加公平公正。
实际上,避免考生过于理性地“趋利避害”地选择选考科目,解决问题的关键是在不同选考科目的分数量尺之间建立连接,使各选考科目分数具备一定的可比性,从而有效地降低考生由于选考某个科目而额外获“利”或者受“害”的可能性。
1 构念不同测验的分数可比性
连接(linking)是泛指两个不同测验所得到的分数之间的转换。高考不同科目有各自的考查目标和内容,不同科目的考试属于构念(construct)不同的测验[5]。构念不同的测验的分数无法通过测验等值(test equating)进行连接,因为等值需要建立在平行测验的基础上。从构念不同的两个测验得到的分数如果要进行比较,就需要通过量表校准(scale aligning)的方法将两个测验的分数转换到同一个量尺上以建立连接,这个过程常被简称为量表化(scaling)[6]。 构念不同的两个测验如果进行量表化,从而使它们对于同一总体而言两个测验得分分布相同,那么就可以认为两个测验的分数可比,这里的分数分布相同通常不是要求分数分布的形状相同,而是仅仅要求均值和标准差相同即可[6-7]。构念不同的测验在测验分数之间建立起可比性后,就能够比较合理地解释不同测验的得分差异;此时可以认为,相较一个测验上的低分,另一个测验上的高分就意味着考生在参照群体中有较好的表现。
当两个或者多个构念不同的测验对同一总体进行施测时,每个测验的分数都可以转换成考生总体相同的分数分布,最常用的方法就是对各测验设定相同的均值和标准差。新一轮高考综合改革统考科目均对全体考生施测,就可以采用这种方法建立语文、数学科目分数的连接(高考统考科目中的外语并非专指单一的英语科目,情况不太相同,本文暂不讨论)。