王翠叶:简论《通用规范汉字表》制定的特点及问题的解决
《通用规范汉字表》(以下简称“《字表》”)的研制是30年一遇的汉字大整理、大规范,其研制几乎梳理了与汉字相关的所有问题,涉及了所有的相关规范标准和政策法规,因为语言文字规范标准研制工作,涉及技术性、学术性、政策性、社会性,不同于一般学术研究。《字表》研制与其他语言文字规范研制工作相比,涉及情况更复杂,问题更多,难度更大。《字表》的名称、收字和分级、异体字、一简对多繁、类推简化、字形等众多问题,都经过激烈的争辩和不计其数的修改。仅名称就从《规范汉字表》《通用汉字表》到《通用规范汉字表》进行反复修改。从争论到形成共识的过程中,每个专家都自愿放弃个人见解,服从集体智慧。专家们一丝不苟的学术风范和甘于奉献的学术精神,令人感动和敬佩。我从《字表》研制的组织者、服务者到成为使用者,一直很关注《字表》发布后的实施情况,现就其研制和实施中的问题进行思考,就正于方家。
一、《字表》研制工作的主要成果
《字表》自2001年开始立项研制,2008年后开始上报、完善、公开征求意见,2013年发布。从研制到发布历时13年,有很多值得总结的经验。其中,最成功的经验有3个方面:
1.运用现代化科技手段。信息化时代对《字表》研制提出了迫切需求,也为《字表》研制提供了有利条件。《字表》研制之初采用的是传统的科研手段,从手工制作《字表》开始。但随着研制工作的深入开展,科研组及时采用了现代化科技手段,从收集和建设语料库、资源库到运用语料库技术和统计方法,从对50年来汉字规范进行全面梳理和总结到对众多用字资源、数据进行分析研究,最终完成了对一系列重大问题的研究处理,对8105个汉字进行定量、收字、分级和定序。《字表》说明中虽只提到4个主要语料库和两部字词典,但其参考过的语料库、字词典则远不止这些。《字表》的收字曾多达1.2万字,需要统计分析和逐一研究甄别的字则多至几万,工作量巨大。试想如果没有现代化的技术手段和方法,《字表》研制不可能有这样的效率,也不可能达到这样的水平。
2.充分征求意见。技术产品的规范标准,一般由技术发明者和专业人员制定,大多数人只有使用权,很少能有发言权。语言文字的规范标准则不同,因其关系到每个人,涉及全社会的方方面面,人人都有使用权和发言权,所以需要考虑全体社会大众的不同使用习惯。《字表》研制不能遵从一家之言,也不能固守某个学派的思想,而要向各领域、各方面广泛征求意见,形成集体智慧。在研制过程中,充分发扬学术民主,广泛听取各方意见,几乎调动了所有相关的学术团体和所有的学界专家,向近40个重要用字单位收集用字资料,征求用字意见,先后组织召开各种会议120余次,4000多人次海内外专家学者参与讨论。同时,在语言文字规范标准研制史上开了公开征求意见的先例。通过报刊、电视、网络等多种渠道向全社会公开征求意见,在20天的时间里收集到社会意见3141件,并“件件有回音,字字有着落”地进行充分研究和吸收。公开征求意见工作对《字表》的增补取舍、修改完善起到了重要作用。与过去传统媒体的征求意见不同,通过网络媒体公开征求意见,覆盖面广,参与度高,影响大。其效果是一举多得,不仅提前宣传了《字表》,有利于其发布后的实施,也进行了语言文字法规和规范知识的宣传普及,是语言文字工作的一次大宣传、大普及。可以说,《字表》研制在新中国以来的汉字规范工作中,社会透明度是最高的。
3.坚持科学可行的研制原则。汉字系统有自身规律,但汉字的应用发展不是整齐划一的,难免出现规律外的特例;汉字的简化和规范,不可避免地遗留下一些特例和问题;信息时代的社会应用又有新的需求,而且不同文化层次、不同职业的人群有着不同的需求。这使《字表》研制与过去几次汉字规范工作相比,面临的矛盾和难题是最多的。为了处理和解决众多矛盾和难题,《字表》研制坚持了6项原则,包括5个“尊重”,一个“考虑”,6个“注重”。注重汉字规范的稳定性、继承性、时代性、社会性、科学性、国际性,主要是处理科学性、规律性与社会性、现实性的关系。其核心是处理科学性与可行性的辩证关系,就是既要遵循汉字发展和应用的客观规律,又要照顾汉字应用的现实和可能。对若干重大问题,都是在统筹兼顾、权衡利弊的基础上,努力进行科学抉择和合理取舍。一些字的字级从一二级字表来回反复变动,从恢复少量繁体字到最后一个繁体字不恢复,有些字被反复考量取舍。比如“月朦朦”“日曚曚”“水濛濛”“目矇矇”几组词的“朦”和“曚”收录在《字表》中,“濛“和“矇”因是繁体字没有被收录,其中“濛”是地名用字(吉林“濛江乡”),出入《字表》无数次,最终还是没被收录,因为遵循不恢复繁体字的原则,对地名用字也不能开口子。《字表》中调整为规范字的异体字虽然只有45个,但统一考虑和研究的则涉及所有异体字和相关字。公开征求意见时调整的异体字数量是51个,有些字则经历不计其数的变动。《字表》经过90余稿修改而成,可以说在当时的基础和条件下,尽最大可能地解决了汉字规范的问题,尽最大努力地满足了汉字应用的需求,取得这样的成果得益于坚持科学可行的原则。
《字表》的成果主要有5点:一是集以往多个字表于一体,调适了已有汉字规范之间的矛盾,使字表更好用;二是恢复部分异体字,解决了一些姓氏、人名、地名等用字的困扰;三是科学收字、定量和分级,提高了各级汉字应用的有效性,增强了基础教育领域汉字教学的针对性;四是设立三级字表增收专门领域用字,解决了中小学语文教材文言文、人名地名、科技术语等用字不足的问题,也有利于提高相关领域用字的规范性;五是梳理了汉字的简繁正异关系,设立简繁正异对照表,有助于减少各领域汉字使用上的混乱。应该说,与过去相关的字表相比,《字表》调整“蹚、勠”等6个异体字为规范字,调整“昇、邨”等39个异体字在特定用法上为规范字,是最大的变化,对汉字使用的影响较大;在《简化字总表》和《现代汉语通用字表》之外收录“闫”等226个简化字,虽然数量不少,但是符合《简化字总表》类推简化原则且已在社会语言生活中使用的字,实际上是对其实用价值的确认,给人的感觉变化不大,但按“不恢复一个繁体字,也不再扩大简化范围”的原则处理一简对多繁和类推简化问题,对汉字使用的影响则较大;字量、字级有不小的变化,对汉字教学和特殊领域用字影响明显,对其他用字方面影响则不是很大。
二、《字表》研制工作的字形问题
《字表》研制有成功的经验,也有无奈的遗憾。遗憾的是没有解决字形问题,而且还增加了今后解决的难度。在公开征求意见中,44个汉字的字形微调引起社会争议。多数意见认为字形微调会改变长期以来形成的使用习惯,将给大众用字造成麻烦,担心影响学生学习、考试和增加社会成本,认为不宜轻易改动。其实,这些都不成其为问题,因为字形微调只针对印刷体的字形,并不影响汉字的书写和识别,随着印刷字库、出版物以及教材的变更适时更新即可,也不会产生成本问题。其好处反而有4点:一是有利于汉字字形规范的规律性;二是有利于汉字笔画、部件、笔顺等属性规范的规律性和系统性;三是便于汉字学习、识记和使用;四是便于计算机自动造字。字形规范非常重要,是汉字字形属性规范的基础。自20世纪80年代汉字进入计算机之初开始,有很多辞书编写和字库制作方面的专家呼吁,为了子孙后代的汉字学习和使用,要系统规范汉字字形,对一些不合规律的特例字形进行调整。遗憾的是汉字字形错失了当时的最佳规范时机,而《字表》研制恰是解决字形规范问题的又一次机会。可惜因事先预估不足,应对网络舆情没经验,在难以把控舆情的情况下,不得不放弃字形微调。目前宋、楷两种字体的规范字和繁体字的字形规范,经过近几年的研制已有了较成熟的成果,但对部分汉字的字形微调,曾经的社会争议让研制者心有余悸,也让管理部门难以决策。所以,字形规范迟迟还没有出台。
《字表》研制工作,特别是字形微调的争议,引发我们反思3方面问题:
1.规范标准的征求意见方式。面向社会公开征求意见,是规范标准制定“问计于民、集中民智”的有效方式,但并不是所有规范标准内容都适合采用公开征求意见的方式。《字表》的几个重大问题面向社会公开征求意见,总体是很成功的,也是很有效果的。但字形微调是技术性、专业性很强的问题,短时间内不容易向社会大众解说清楚,适合向专家和应用领域征求意见,不太适合公开征求意见,因为网络舆情一旦形成,征求意见工作难以正常进行。
2.规范标准的层级。规范标准一般有国际标准、国家标准、行业标准、地方标准、团体标准、企业标准。国家标准的审批发布一般由国务院主管部门负责。语言文字因其特殊性和重要性,建国以来一直有党中央和国务院审批发布规范标准的先例,如《汉语拼音方案》《汉字简化方案》等,大都是涉及语言文字政策的规范标准。《字表》研制发布工作得到了国务院和党中央的高度重视。国务院批准发布《字表》,发布层级之高,确保了规范的权威性,有利于贯彻执行。不过,语言文字规范标准发布的层级并不是越高越好,应根据需要而定。一般的规范标准可由国家语委发布,涉及社会多领域、多部门管理的规范标准,可由国家标准化管理委员会发布。因《字表》替代了1986年经国务院批准、国家语委重新发表的《简化字总表》,增加了226个简化字,梳理了简繁关系,按照惯例需要由国务院批准发布。如果《字表》只是调整过去国家语委发布的常用字、通用字、异体字等方面的几个字表,仅是涉及收字、字量和分级、字形、字序等,则不需要国务院批准发布。国务院发布《字表》的规范内容也应有侧重,像字形规范包括宋体、仿宋体、楷体、黑体等4种印刷体的字形规范,不是必须体现在《字表》中,更适合单独制定,由国家语委发布即可。
3.规范标准的更正和修订。规范标准发布后有个更正和修订的时期,更正程序简单,在标准文本中附更正单即可,修订则需要经过复杂程序。规范标准层级越高,越不易更正和修订。虽然《字表》说明第10条说“本表可根据语言生活的发展变化和实际需要适时进行必要补充和调整”,也就是说可以适时增补用字,也可以调整《字表》的内容,但报请国务院审批,毕竟有一定的程序,是不容易的。比如,在文言文教材里常出现的“毂”字,是“轂”的简化字,涉及“毂嗀糓觳豰縠”等一批字,只有“轂”字因“車”部简化而顺带少了上面的一横笔,增加了特殊性,给学习和识记造成麻烦。此字被诟病为当年汉字简化中的错字。许多专家建议修改,但因已执行几十年,涉及汉字笔画数和字序的变化,因争议较大而没有修改,至今仍有不少专家呼吁修改。这正反映了语言文字标准化工作的难度。规范制定有问题,若不及时更正,时间久了难以修改,比如“毂”字(其实当时按编校错误加以更正,是智慧处理的有效办法,也不需要报请国务院审批)。规范制定不及时,约定俗成应用久了便不得不认可。比如戛纳电影节的“戛”字,本来只有一个jiá的读音和字义,被用作音译字后,额外增加了读音gā和地名义,因没有及时规范,结果用久了难以再规范。如果及时确定用“嘎”字(其本身有gā音)在原字音上增加一个字义,则要好于音、义全增加。如果规范制定存有问题,则应立即更正。像“毂”字,当时立即更正是最佳机会,通过《字表》加以修改也是一次机会。让其作为特例字永久存在下去,不能不说是汉字规范史上的遗憾。
三、《字表》实施的情况和问题
教育部等12部门关于贯彻实施《字表》的通知对各领域都有明确要求,以保证《字表》“积极、稳妥、有序地贯彻实施”。应该说,《字表》的实施总体还是顺利的,促进了信息化时代汉字应用的规范化水平,但也还存在一些问题。基础教育领域,新编小学语文教材都能执行“识字写字教学基本字表”,其他教材和教辅大多能执行《字表》,但也有执行不准确的。如中小学文言文教材和传统文化读本对表外字的使用就存在问题。教师和教研员习惯于查阅辞书,对《字表》的学习和掌握还不够。信息产业领域,汉字信息处理的编码字符集标准,已根据《字表》进行了修订,《字表》中的汉字目前已全部有了编码(《字表》发布时只有3个字没有编码)。汉字信息处理的关键产品如应用软件、字库、输入法也大都进行了更新,但个人计算机应用系统对其采用程度不同,有的更新了,有的则没有更新。行业领域的信息系统则大多没有采用更新。新闻出版传媒等领域,汉语文出版物,广播、电影、电视,公共场所设施,招牌、广告以及互联网等用字,大多能执行《字表》,但有的执行还不到位或不准确,比如调整为规范字的异体字的使用、表外字的使用等,都不同程度地存在一些问题。语文辞书编纂领域,出版或修订、再版的相关语文辞书大都能执行《字表》,但有的大型语文辞书对表外字的收录则有自造新简化字的情况。科学技术领域,相关部门能够引导使用表内字,但专业辞书、专业教材、科技专著等,对表外字的使用也存在一些问题。户籍和民政管理领域,新命名、更名的人名用字大多能使用表内字,但仍有人喜欢使用表外字;地名的新命名和更名用字方面都能使用表内字,但人名地名用字,特别是人名用字方面,存在计算机里打不出来或显示不出来的问题。
《字表》在各领域实施存在的问题,主要有5方面的原因:一是因使用者不熟悉《字表》而没有执行,这只限于少量汉字使用者,依据没修订的旧辞书查阅使用汉字。二是因条件不具备而没有执行《字表》,比如银行、交通、医疗等领域的信息系统因涉及安全和成本问题没有更新字库,致使有些字特别是地名、姓氏人名用字无法在计算机里处理,给使用者造成很多不便。三是因理解不准而错误执行《字表》,比如《字表》收录“锺”用于姓氏人名用字,有人误以为姓氏人名用字为“钟”的必须都改为“锺”,徒生麻烦。四是执行《字表》有困难,有的计算机软件系统、字库或输入法没有更新,致使一些字无法处理。如科技术语“二噁英”的“噁”字应使用其简化字形,有的排版印刷系统没有更新,只有繁体字形,需要编辑手写和排版单独造简化字形。五是表外字的使用无所依据,因表外字没有规范整理,如何采用历史通用字形,使用者难以把握,容易出现自造新简化字的问题。
四、推动《字表》实施的举措
1.加强宣传推行。《字表》虽已发布5周年了,但社会各方面还没有达到全都知晓,需要加强宣传和推行。语言文字工作部门要组织宣传,相关行业部门要对行业领域加强宣传并组织实施,要提出明确要求,加强督促管理。新闻出版传媒(包括辞书编纂)是实施《字表》的重要领域,信息产业领域是实施《字表》的重要保障,新命名和更名用字是影响汉字长远规范的关键方面。各方面需要共同发力,辞书编纂和新闻出版传媒领域要认真学习、正确理解、准确实施《字表》,确保辞书、教材和其他出版物用字规范,引领其他领域顺利实施《字表》;信息产业领域要提供支撑《字表》的普及性应用软件、字库、输入法,涉及民生的行业领域的信息系统要尽快采用更新,为《字表》的实施提供保障,满足社会需要;基础教育领域、户籍和民政管理领域、科学技术领域也要正确实施《字表》。
2.加强实施指导。语文出版社和商务印书馆陆续出版了《字表》《〈通用规范汉字表〉解读》、字典等图书,发挥了很好的指导作用。为了更好地指导社会各领域顺利实施,需要语言文字专家发挥学术优势,对相关内容继续编写详细指导用书。可就难点内容编写详细解读,对容易出现问题的内容编写使用指南。以下问题尤其需要指导:
一是调整为规范字的异体字的使用问题。45个异体字中有6个是调整为规范字,39个是在特定用法上调整为规范字。每个字的用法,最好能给出具体用例。尤其是39个字很容易用错,要逐一加以提示。指导汉字使用者特别是新闻出版传媒从业者,掌握正确查阅《字表》或新出版的规范性语文辞书的方法。遇到异体字,要查是否已调整为规范字,如果没有调整为规范字,就不能使用。如果已调整为规范字,就可以使用,但要弄清其用法,避免错用。比如“淼”“氾”“脩”都是在特定用法上调整为规范字,要根据《字表》的注释弄准其用法。“淼”可用于姓氏人名、地名,“氾”可用于姓氏人名,读fán,读fàn时用“泛”,“脩”用于表示干肉,如“束脩”,其他意义用“修”。需要注意的是“淼”的注释是“可用于姓氏人名、地名”,这并不是说姓氏人名、地名用字只能用“淼”字,根据需要也可以用“渺”。有人将已用的人名“渺”更名为“淼”,是误解《字表》的规定,也是自找麻烦。其实,对新命名者来说,这两个字都可用,对于已用的姓氏人名用字,为避免麻烦没必要更名。因为更名有复杂的程序,还要变更一系列个人信息、身份证、户口本、医保卡等证件。
二是《字表》里有些字在计算机里打不出来或显示不出来的问题。这是许多人常会遇到的麻烦。计算机里能否打出《字表》里的字,取决于计算机系统是否采用了支撑《字表》的应用软件、字库、输入法,如果没有采用更新,就会出现有些字打不出来或显示不出来的情况。个人计算机只要采用依据《字表》更新过的应用软件、字库和输入法,用形码输入就能解决这个问题。即使没有采用更新,也可通过其他途径解决问题。这虽然会有一些麻烦,但不至于产生太大问题。而银行、邮政、医院、学校等行业领域,特别是邮政和银行这些关系民生的重要行业领域的信息系统,如果不采用更新,涉及有些人名地名和科技术语等用字处理不了,就会给一些人的学习、工作和生活造成很多困难。据悉今年将发布的汉字编码字符集国家标准,因各领域应用系统更新涉及安全和成本问题,只强制实施字符集基本平面的27484个字,没有强制执行《字表》全部汉字。如此看来,行业领域信息系统的更新是个难题,这种情况需要让社会大众了解。信息产业领域实施《字表》虽允许有过渡期,但也不能让使用者无限期等待下去,至少要给出系统更新的时间表。
三是新命名和更名用字的使用问题。《字表》是对社会一般应用领域通用规范汉字的收录,不同于汉字编码字符集,不是对历史上所有汉字的收录,也不是对现有用字的收录。其作用是规范引导社会用字,最大的作用是能够规范引导新命名、更名用字,包括地名、姓氏人名和其他各类命名用字。现有的姓氏人名、地名用字,要承认其存在,也要提供技术条件方便其使用。很多字,比如濛江的“濛”,虽然不在《字表》里,但因有编码,在计算机系统里是能处理的。目前,已有8万多汉字有了编码,还在不断整理和补充编码。但有了编码不等于就能在系统里处理,从目前的条件来说,部分字在计算机系统里无法处理的问题短时间解决不了。为使今后的地名和人名用字不再遭遇使用麻烦,对新命名和更名用字要给予专业指导。2019年发布的国家编码标准可实现《字表》全覆盖,那么《字表》8105个字是否都可以要用来命名,都可以在计算机系统里处理呢?《字表》刚发布时,许多受姓氏人名用字困扰的网民欢呼雀跃,以为从此就可以方便使用姓名用字了,如《中国教育报》2013年8月28日有报道“我的姓名终于转正,登机牌再也不用盖章了”。但《字表》发布5年后,表内字是否都能畅通无阻呢?显然在少数已更新的信息系统里都可以处理和使用,但在多数没有更新的信息系统里有些字则不能处理和使用。比如,姓氏用字“”是通过征求社会意见收进《字表》的,也有编码,但在有些计算机系统里是打不出来的。可以预见行业领域信息系统的更新是很缓慢的,与其把希望放在技术上,不如慎重选用新命名、更名用字更为可行,这也有利于汉字系统的高效性和精练性。最好选用一二级字表的字,慎选三级字表的字,不选表外字。对于三级字表的字,可选常用输入法能打出来的字。户籍和民政部门要加强指导,做好服务和管理,引导人们立足现实,慎重选用新命名和更名用字,让子孙后代在银行取钱、学籍报名等方面,不再遭遇因名字处理不成而增添麻烦。
3.研究解决有关问题。表外字的使用,特别是表外类推简化的问题,是《字表》没有解决的问题,需要进一步研究。汉字有简繁两个体系,有人称汉字的二元结构,同时又有正异关系。汉字简化和异体字整理,都或多或少存在一些问题,增加了汉字系统的复杂性,给《字表》研制带来了诸多困难。往往解决了这个问题还有另外一个问题,想找到万全之策很难,做到尽善尽美也不可能。对此,只能在全面考虑汉字规律、综合权衡社会应用实际的基础上,寻找相对合理又可操作的处理办法。《字表》毕竟只是整理规范了的通用字,还没有解决所有汉字应用规范的问题。表外字虽有研究整理,但没有给出规范,人们对表外字的使用无所依据,容易自造未曾使用过的新的简化字。其中类推简化是汉字二元系统的大麻烦,也是表外字处理面对的先天困难。全面无限类推不好,会使汉字走上两个体系的不归路;有限类推似乎又不太容易,特别是遇到与表内简化字是关联字的表外字,如果不类推简化,则会出现在同一文本中不一致。目前在出版物(含语文辞书)中有两种处理方式:一种是遵循《字表》实施通知的要求,表外字一律不简化;另一种是表外字符合类推简化原则的也简化。比如编辑遇到“马”字旁的“駉”“駃”“騠”等字,经查在《字表》中,就类推简化;遇到“駜”“騧”“騃”等字,经查不在《字表》中,有的保留原形,有的则用类推简化字形。这是应用中需要解决的问题。不允许乱造简化字应是基本原则。或许经过一段时间的应用,能找到适当的解决办法,但究竟如何处理,有待深入研究。
4.制定配套规范。《字表》的有效实施,有许多配套规范需要研究制定。主要有字音规范、字形规范,还有依据字形的汉字笔画、部件、部首、结构方式、笔顺等属性规范。这些规范的制定要着眼于更大字量范围的汉字,以确保规范的科学性和实用性。制定并实施好配套规范,才能更好地发挥《字表》的效力和作用。
5.为《字表》修订做准备。《字表》说明第10条“本表可根据语言生活的发展变化和实际需要适时进行必要补充和调整”,教育部等12部门关于贯彻实施《字表》的通知第6条指出,姓氏和地名用字中如需补充进《字表》的,由各地语委、民语委负责收集这些字的字形、读音、来源、用途等详细属性信息,定期报至国家语委,以便《字表》修订时适当补入补充和调整。要做好这项工作,应设立专门研究机构,有常态化工作机制,采取有效方式跟踪了解《字表》使用情况,收集研究需要补充的姓氏和地名用字。这是确保《字表》有效实施、适时修订的长久之计。
部分参考文献
王宁.谈信息时代的汉字规范———《通用规范汉字表》的制定与应用[N].语言文字报,2013-08-30(4).
王宁.《通用规范汉字表》解读[M].北京:商务印书馆,2015.
教育部语言文字信息管理司.信息时代汉字规范的新发展[M].北京:商务印书馆,2015.
王宁.再论汉字规范的科学性与社会性[J].语言文字应用,2006(4).
国家标准化管理委员会.国家标准化基础知识[M].北京:中国标准出版社,2004.
语文出版社.通用规范汉字表[M].北京:语文出版社,2013.
王翠叶.关于数字化时代的汉字应用问题[J].语言文字应用,2016(1).
王东海,杜敏,陈淑梅.《通用规范汉字表》繁简字处理原则[J].陕西师范大学学报:哲学社会科学版,2009(6).