《文字源流》专题之六:文字之孳乳

汉字的发展,是一个相形相生、孳乳分化的过程,是一个由少而多的过程。

我们已知:距今9000-5000年间是汉字的孕育期,出现了数百个原始字符。从5000-3500年(史传仓颉造字至殷墟甲文)是汉字的系统造作和成熟期,已发现的甲文单字数量在四千左右(包括异体字)。从3500-2200年(西周至秦统一)是汉字应用于大规模著述期,根据传世先秦典籍统计,不重复单字约八千余(包括异体字)。此时期的字书《史籀篇》、《仓颉篇》、《博学篇》、《爰历篇》,各本收字数量都是三千字左右。从公元前三世纪到公元后三世纪是汉字的孳乳分化期,许多原来属于多义共享的文字,通过会意、形声或会意兼形声的方法,分化成数个有共同字源的专用字。这种情况虽然在汉代前后均有发生,但汉代更为集中。汉代以及稍后的字书收字情况:扬雄《训纂编》(已佚)5340字;许慎《说文解字》10,516字(字头+重文);晋吕忱《字林》(公元514年,已佚)12,824字;南朝顾野王《玉篇》(公元534年,残)16,917字。

经过汉代前后的孳乳分化期,汉字基本处于稳定状态,通用正字基本在六千左右。这里包括了孳乳字,但不包括异体字。前说所谓孳乳字,虽从共同字源出发,但其某些义项是有分别的。如夌字为重要字源,淩、凌、陵从其分化。三字大多数用义,同为逾越、凌驾、侵犯。如言凌辱,亦可用淩辱、陵辱;欺凌亦可用欺淩、欺陵。但淩作水名、地名,凌作冰凌字,陵作丘阜义,如言陵谷、陵寝等,则不可互替。所以这类孳乳字应按正字计入。还有些孳乳字,义项全部相通,则可以归入异体字。如

四字音义同,皆为卓之孳乳字。卓本高人义,如言卓越。后累增足作踔、累增走作趠、累增辵作逴,会意仍为高也、越也,如言踔蹈、逴迈、趠越。凡能高者必由脚腿蹬踏,故从彳、从走、从辵、从足无别。

所谓异体是指:与正字音义相同而字形稍异之字,古称别字、别写、重文。在先秦文字著述期产生了大量的异体字,主要原因有三:一是出版业尚未发达,文本流传常是辗转抄录、甚至口口相传,衍生出种种异写、异体;二是敎学课本尚未普及,师生授受多为口授笔录,衍生出种种异写、异体;三是地域不同,受地方用字习惯的影响。所以字书里通常储存众多的异体字。如《说文》叫、噭、嘂、訆、譥、㰾六字,分在口、言、㗊、攴、欠五个部首下,实际同为一字。但其中四字并见于先秦经传,收于字书尚有实际意义。

后世字书收字越来越多,例如:

这些所谓字典,已经不是传统的字书,而相当于字形库。传统的字书是文字书,而文字一是必须有独立的音形义,以区别它字,否则为别字;二是必须合乎造字之理、合于六书,否则为俗字;三是必须见诸于典籍,有普遍的跨时代的通用性,否则为生造字。如果不考虑文字的这些标准,只要见过不同的字形便加以收录,那就成了字形库。设想如果收录小学生语文作业本上的字形,可能超过千百万,但这已脱离了文字的范畴。

汉以下至今,确实有一些新增字。按类别说,一是名物字,如葡萄、苜蓿、箜篌、琉璃、咖啡、佛陀之陀、菩萨之萨等,这些是外来物品输入中国时新增的名物字;二是元素字,如锰、铬、钠、氟、氮、氧、砷、砹、碲等,系清末以来从西方输入的化学元素字。这两类新造文字数量约数百,一般遵循了汉字的造字之理(多为形声),对应着新的客观事物,承载了新的信息,基本可以视为正字。而新增的方言类俗字,如粤语的冇、京话的甭、北音的孬等,这些不能视为正字。至于汉以下中国所经历的分裂期,如魏晋南北朝、五代十国、宋辽金夏等,社会的动荡和割据导致大量别字、俗字、异体字产生,这些不应计入正字范围。

所以,按上述标准计入新增字,汉字正字的总数量应不超过八千。而历代典籍用字的常规数量,则远远少于这个数目。先秦典籍总字数约在一百五十万,单字总量为八千余。其中仅有一次用例的约有两千个,两次至四次的近两千个,这其中大部分是俗体、或体即异体字。以后历代各类著作所用不重复字数,也很少超过四千。思想深邃、道通天地的老子,其书所用单字只八百余;辩才无碍且擅美文的孟子,其书用字只一千八百余;才情恣肆、辞出滂沱的杜甫,其诗文集用字方才三千五百余;权高如秦相吕不韦,集当朝群贤作大型文集《吕氏春秋》,用字才三千出头;位高如淮南王刘安,倾一国美士所成文集《淮南子》,用字亦不过四千余。

由此可知,即便通读古籍,识习正字数量不至超过六千,其中常用字不到三千(占用字量99%)。写作需用正字,即便是专业作家,单品通常在一两千字,毕生之作难逾三千。正确计算汉字的数量及个人用量,对于学生习字数量的划定,是有意义的。《说文敎本》正课版敎授正字六千,课外版则为三千。实际学好三千正字,对99%的人已经够用,额外三千,是修养、见识。愚意一般文科可学三千,而理工科应学六千。因为额外三千很多是名物字、是博物学,通晓天地万物、器用造作,了解人类原始概念创制,对将来科研事业有用。

以上六章简述了文字之源流,中国在几千年的不同历史阶段上,对汉字有着不同的认识、不同的描述、不同的定义,古人曾自豪过、近人曾沮丧过、今人则往往各执一词,或判然分立、或游移两端。在历史此刻的节点上,我们有条件检视古今、比对各国,对汉字进行更深入的研究。其后我们将推出《文字属性》专题系列文章,以飨读者。

《文字属性》专题之一:文字与语言
《文字属性》专题之二:文字与语符
《文字属性》专题之三:文字与世界
《文字属性》专题之四:文字之洗练
《文字属性》专题之五:文字之效用

(0)

相关推荐