171陶明利:大学排名何以引起大学评价偏差?
媒介时代当前,人们隔三差五就能在“朋友圈”刷到各式各样“新鲜出炉”的大学排行榜单。无形之中,原本“以评促教,以评促改”的涵盖各种指标的排行榜,逐渐简化成了只看得见大学名称和与之对应的阿拉伯数字的“两列式表单”。人们下意识地就判定数字越靠前的大学就是好大学,数字越靠后甚至没在排行榜上出现的大学就是不好的。换句话说,人们在评判一所大学好或不好的时候,出现了大学评判标准的排名化的趋势。
诚然,大学排行榜是将大学整体发展水平拆解成一个个合理的结构性指标进行测量,根据测量的结果进行高低排序。[1]但是它在一定程度上只反映了排行榜中所体现的选择性指标的高低,并没有还原大学整体发展水平的真实面貌,也就很难想当然地据此评判一所大学的好或不好。大学排名本质上是一场“零和游戏”,一些大学“榜上有名”,必然导致其他大学“榜上无名”。所以,仅以排名来评判一所大学好或不好,未免太过武断了。
一、简单和片面的排名指标引起大学评价偏差
就实践发展的现实意义而言,以量化指标设计而成的排行榜的出现,是大数据时代的必然趋势,其存在是出于发展需要,且具备一定市场性的,这毋庸置疑。但就理论意义而言,教育的本质属性决定了教育是复杂的特殊活动,在一定程度上是“反测量”、“反评价”的,以人才培养为主要职责之一的大学教育更是如此。所以大学排行榜的出发点就违背了教育性,不能够代表大学的实际发展水平。妄加借此来评判大学的好或不好是很难具备说服力的。
而且,分析国内外各大排行榜单可以发现,学术科研能力必定在各大排行榜评价指标中占据一席之地。软科世界大学学术排名(ARWU)的学术性最强,虽说在一定程度上反映了大学科学研究的职能,但是其学术指标更多的看的是学术的总量,而非质量。虽然明确了学术刊物是顶级报刊,但顶级报刊发布者不一定是“真材实料”的“大家”。因排行榜的预测指标需要所形成的“科研指挥棒”,导致了“黑色产业链”繁荣,枪手泛滥,学术科研水平的实质性高低令人生疑,更谈不上以此来评判一所大学的好或不好了。
二、无效和失真的排名数据引起大学评价偏差
很显然,简单的排行榜是难以做到完全的科学性,所以官方从来没有发布过类似的榜单。除了评价指标的设计存在一定的局限性以外,大学排行榜在根据所设定的指标展开具体的测量提取时,也会存在一定的局限性。其主要表现为两方面:一是存在无效指标的问题;二是存在数据是否权威性的问题。
一方面,无效指标的问题在各大排行榜中占据一定的比重,更有甚者会成为大学难以“榜上有名”的“致命原因”。比如QS大学排行榜中“国际教员、国际学生”的评估指标更多地只能反映学术交流的国际化特征,与大学自身的发展水平其实没多大必然的联系,却在评估中占据10%,这对于那些专注本土建设的大学而言无疑是“吃亏”的。
另一方面,提取的数据是否权威性在很大程度上决定了排行榜最终的呈现形式,因为最终的排名结果是根据一项项量化指标收集到的数据整理分析而得出的。作为世界知名度最高的QS大学排行榜,它的主要权重涉及到许多“软指标”,譬如其中的“学术声誉、雇主声誉”竟占据最终评估结果的50%。这样的评估指标主观性很强,就为“注水”提供了“契机”,其结果的可信度要打上问号。
三、选用和滥用的排名结果引起大学评价偏差
在公认的各大排行榜上,表现均不错的大学,一定是无可非议的好大学,也是公众概念当中的好大学,这是不可置否的。但是目前全球出现了超过50种不同类型的的大学排行榜,不同机构发布的版本甚至“互掐”,同一所大学排名相差20位。对此,我们如何选择最后的排名结果是值得思考的。
“圈外人”较之“行内人”偏好简单直白式的“数字”,往往以“数字”大小判高下。这样一来,有的大学为满足“圈外人”的偏好,对排名结果进行巧妙地加工,选择其中“数字”最小的,最靠前的名次。任何一所大学的校长或书记在做公众发言报告的时候,不可避免地都会提及自己所在大学的排名。这个排名到底出自哪所排行榜是“无关紧要”的,它有可能是全球排名,可能是全国排名,也有可能是全省排名,但它一定是某一年某一排行榜甚至某一单项中最漂亮的排名。可想而知,公众若凭借这样的排名结果,去评判一所大学的好或不好是不具备真实意义的。
总之,任何一种排行榜在设置的时候,都是有其自身的价值取向的,可谓是“横看成岭侧成峰,远近高低各不同”。我们决不能草率地以一份大学排名结果就论断一所大学的好或不好。我们理应“尊重排名,不唯排名”,保持冷静客观的态度,在仔细审思排名结果的可靠性基础上,对其做出合理的评判。
[1]张应强. 理性利用大学排行榜 促进高校内涵发展[J].河北师范大学学报,2020(3):9-13.