《出土文献》|莫伯峰、张重生、门艺:AI缀合中的人机耦合

AI缀合中的人机耦合

莫伯峰    首都师范大学 出土文献与中国古代文明研究协同创新中心

张重生 门艺   河南大学

摘 要:本文结合我们近期的计算机缀合实践,以五组新缀甲骨为例,探讨了AI时代如何利用计算机的优势,并结合专家知识,共同推进古文字研究发展的一些经验。认为AI和专家各有所长,二者需要密切合作,人机耦合是现阶段利用AI技术最为有效的一种方式。

关键词:甲骨 缀合 人工智能

天下难事必作于易,天下大事必作于细。

——《道德经》

2018年第22届古文字年会上,吴振武会长提出了古文字研究与人工智能(Artificial Intelligence以下简称AI)相结合的构想。经过两年多时间的摸索,AI已经在一些古文字问题上展现出一定的应用潜力,对学科发展起到了一些助力作用,说明这一方向的确非常值得尝试和期待。
AI与古文字研究的结合,现在还处在非常初级的阶段,今后还会有很漫长的道路需要探索。我们认为,在这一过程中,采取“人机耦合”的策略极为重要。所谓“人机耦合”,就是在AI擅长的领域,解决人类智能比较困难的问题。在人类智能比较擅长的领域,解决AI比较困难的问题。通过这种“耦合”,最终完整地解决整个问题,并在此过程中对问题本质有一个更深刻的认识。
这一选择是两方面因素决定的:一方面是AI发展的现状决定的。AI在一些特定领域的表现已经达到或超过了人类智能。但与此同时,在可预见的时间内,AI又还不可能全面超越人类智能(当然,AI是否一定会全面超越人类智能也并不确定)。另一方面是古文字学的发展水平所决定的。中国古文字学有着非常悠久的历史,和深厚的学术积淀,已有的各种学科知识,既是AI可以利用的,也是AI必须要利用的。因此,在比较长的一段时间里,“人机耦合”将会是我们与AI共存的一种主要形态。
下面我们通过近期取得一定突破的AI缀合工作,来试述古文字领域人机耦合如何实现,具有什么样的优势,又需要注意哪些问题。

黄天树师曾在《甲骨拼合集》序言中归纳总结了甲骨缀合的四种方法:据字体缀合;据残字缀合;据碴口缀合;据同文缀合。[1]过去的缀合实践,基本上都没有超出这几种方法的范畴。但是在这几种方法中,据碴口缀合主要被视作一种验证缀合的方法,很难作为一种寻找缀合的方法。这是因为,我们人脑对碴口的记忆,远远达不到对同文、残字和字体的记忆水平。因此,虽然从理论上来说,甲骨断裂处的碴口也能成为寻找缀合的一个线索。但是在实践操作中,却很少有学者完全基于碴口来实现缀合。也正因为这个原因,对于边缘没有残字,也缺乏同文的一些甲骨,缀合难度就显得大很多。而这也就成为了缀合工作的一个盲区。
与之相反,人脑比较困难的碴口记忆和匹配能力,恰恰是AI比较擅长的领域。现时的AI技术,在人脸识别、物品识别等方面都已经相当成熟,而甲骨的碴口本质上也是一种线形图形,处理起来并没有特殊的困难。因此,在我们近期缀合的一些甲骨中,就主要依靠了AI的碴口匹配能力。以下试举几例来说明:
第一例:《合集》954(《粹》187、《善》86)+《合集》4248(历拓10371)
缀合释文如下:
(1)贞:

。一。

(2)丙辰卜争贞:

。一。

(3)贞:奠于丘绝[2]。不

鼄。一。

(4)甲辰卜争贞:㞢伐于大甲。
从缀合线索上来看,《合集》954与《合集》4248之间既没有残字也没有残辞,因此不能根据文字方面的信息进行缀合。而就同文来看,《合集》4248与《合集》779、《合集》780存在一定同文关系。但这三片甲骨恰恰都只是骨条部分,不与《合集》954骨首部分存在同文的情况。因此,碴口成为了缀合唯一可以依靠的线索。而AI也就成为解决这一问题的最佳途径。
通过碴口进行的缀合,通常具有较大的材料创新性。无论是残字、残辞还是同文,对于将要缀合的卜辞内容,我们都会有一些心理预期。而很多时候,依靠碴口进行的缀合,对于将要缀合的内容则完全不能预计。以本则缀合为例,《合集》954上的卜辞为祭祀祖先的内容,而《合集》4248上的三条卜辞则主要讨论了如何处置服属者[3]以及军队的情况。所以两版甲骨上的内容关联性不强,也从未存在共版的情况。通过碴口实现缀合,才发现了这种共版关系。
第二例:《合集》2824(《簠杂》89、历拓10130)+《合补》5175(历拓12874)+《缀集》21(《合集》6232+《合集》870)
缀合释文如下:
正:
(1)不其得。
(2)贞:得。一。小告。
(3)贞:妇

。一。小告。

(4)贞:[其]亦[雨]。一。
(5)贞:不亦雨。不

鼄。一。二告。

(6)癸丑卜宾贞:今至于丁巳追至。一月。一。
(7)辛未卜宾贞:乎伐方,受㞢又。一。
反:
五日丁巳追允至。
本则缀合中,《合集》2824与《缀集》21的缀合也完全依靠特征性碴口实现。二者之间既没有残字,也缺乏同文参照,碴口是唯一可以将二者进行缀合的因素。缀合完成后,得到了一版比较完整的甲骨,看到了战争和气象等事类的共版情况。
第三例:《合集》11759(《珠》108)+《合集》15149(《前》6·5·2、历拓6550)
缀合释文如下:
(1)王孚。
(2)王孚。
(3)贞:乎往。
(4)庚子卜韦贞:雨。
本则缀合同样只能依靠碴口的线索来实现,两片甲骨之间没有残字可以利用。从同文方面来看,“王孚”一语在甲骨卜辞中罕见,因此难以找到类似的同文进行比照。也正由于辞例罕见,所以大家对于“王孚”将与哪些卜辞有关联,也非常希望了解。通过本则缀合复原,让我们看到了更加完整的甲骨,对“王孚”含义的理解带来一些新的线索。
利用AI匹配碴口缀合,在没有残字和同文线索的缀合中,能够发挥无法取代的作用。而在一些有残字和同文的缀合中,依然能够发挥主导作用。如以下两例:
第四例:《上博》49003.250+《合补》2684(《日天》61)
缀合释文如下:
(1)贞:求牛于

。一。

(2)

本则缀合中有一个残字“牛”,而近似的辞例也还可见于《合集》940和《合集》7565等。但是《合补》2684上的残字“牛”在《上博》49003.250上只遗留了很少的残笔,非常难以进行拟补。同时,近似辞例中也并没有完全一致的同文。例如《合集》940“贞:王求牛于夫。○贞:勿求牛于夫”与此版缀合内容还是有些差异,并不能起到很好的提示作用。
第五例:《合补》1913(历拓5724)+《合补》2161(《日天》216)
缀合释文如下:
正:
□□卜争贞:

往归方,其

。二月。一。

臼:

屯。

本则缀合有一个残字“其”,但是由于墨拓不佳,《合补》2161上的残笔十分模糊。而从同文角度来看,本则缀合的内容同样罕见,“其”的辞例虽然很常见,但并不能有效地缩小缀合范围。因此,在AI的帮助下,通过碴口的匹配,也是这类甲骨最有效率的缀合方法。
由以上例子可以看出,AI在图形匹配方面,的确展现了高人一筹的能力,克服了人工劳动的一些局限性。在缀合过程中我们还发现,依靠AI复原的缀合图像,基本上不用再进行角度的调整,便已经处于最恰当的缀合位置。可见,AI对于碴口密合的认识与人类专家已经非常相似。而AI进行比对的效率,却是人类专家完全无法比拟的。古文字研究中这种性质的任务,交由AI完成会更为有效。

在感受到AI对研究工作帮助作用的同时,我们也看到,现在AI能够充分发挥作用的领域还十分有限,在很多任务面前,人类专家更为灵活有效。在古文字研究人机耦合过程中,古文字学家还大有用武之地,人机耦合中“人”的因素也是不可或缺的,以下我们结合AI缀合中的一些具体事例来谈下这方面的情况。
前文已述,缀合的四种方法中,据字体缀合也是一种主要方式。辨析字体类型在缀合工作中非常重要,是寻找缀合必须考虑的因素。那么是否可以让AI来承担这项工作呢?
我们曾在《利用深度神经网络判别甲骨文字体的初步测试——以字形为依据》[4]一文中专门从字形角度进行了测试论证,认为AI可以依据字形的差异进行字体类型的区分,但要达到人类专家的水平还需要持续优化。同时,基于字形进行字体分类的前提,是AI能够具有甲骨文字的检测和识别能力,也就是说AI还需要先会认字。这方面,我们也曾进行过一些研讨,在《利用深度神经网络进行甲骨文单字识别和检测的初步测试》[5]和《基于人工智能的甲骨文识别技术与字形数据库构建》[6]两文中都有过讨论,认为AI在文字识别方面同样也可以达到较高的识别率。但要完全达到人类专家的识别水平,则又必须对甲骨语言有所认识。例如:甲骨卜辞中表示干支的“巳”和表示一种身份的“子”,使用的是同一字形“

”,这就只能根据语境才能加以辨别。因此,为了解决字体分类问题,就需要先解决字形识别问题,为了解决字形识别问题,又还需要先解决语言理解问题,这就变成了一个一环套一环的问题链。而彻底解决这些问题中的任何一个,AI都需要花费相当长的时间。

除此以外,字体分类本身就是一个复合型工作,它除了与字形因素相关外,还与书体、贞人、行款、卜辞内容等很多方面因素都有关联,我们人类专家进行字体分类的时候,也都需要综合考虑这些因素,才能最终确定类型属性。AI要具有完善的字体分类功能,同样也需要把这些因素全都考虑进去,这就更加大了任务的难度。
由此可见,对于人类专家而言,看似性质很单纯的字体分类工作,对于AI而言则是很多不同性质工作的集合。而现在AI最主要的问题,就在于迁移能力不强和综合能力不够,每考虑一个因素就需要重起炉灶新建一个模型。因此,以缀合为目标的AI字体分类工作无疑困难重重。
与此相反,依靠人类专家来解决甲骨文字体分类工作,无疑要有效得多。这种有效性集中体现于以下两个方面:
一方面是小数据驱动。AI近年来取得了很多重大进展,深度学习发挥了重要的作用。而深度学习与大数据有密切的联系,甲骨文材料总字数虽然也可达百万字以上,但仍难视作大数据级别。在小样本数据面前,人类专家的分类效果往往都要比AI更好。而且,由于甲骨卜辞的总量是有限的,人类专家逐片分类所需要的时间,会低于开发AI系统所需的时间。因此,从效率角度来看,人类专家无疑也更占优势。
另一方面是已有知识和成果的利用。甲骨文字体分类研究有着很悠久的历史,今天的分类工作是站在前人已有的认知基础上进行的。对已有知识的充分利用,对甲骨文字体分类工作非常重要,但这一代AI还不完全具备这样的能力,[7]在这方面人类专家无疑也要比AI强很多。而且,还需要考虑另一个因素,人类的很多研究都有成果积淀。甲骨卜辞的逐片字体分类工作,有很多已有成果可以直接加以应用,[8]这就更不需要AI重起炉灶了。基于以上分析,在我们的AI缀合过程中,字体分类方面的工作,都是利用了专家已有的成果。
因此,在人机耦合过程中,我们有一个明显的感觉:性质比较单纯的工作,AI具有非常大的优势;性质比较复杂,综合性要求高的工作,人类专家的灵活性和创造性都是AI无法比拟的。

通过上述“人”和“机”两方面的分析可以看到,AI与人类专家在各自擅长的领域都有着显著的优势,人机耦合将是较长时间里一种主要的共存模式。古文字研究者明确自己的优势所在,着力发挥自己的优长,或将受益匪浅。从我们合作的经验来看,至少在以下三个方面,AI还非常需要人类专家的协助:
一是对问题的规划求解。面对古文字中的现实问题,AI还难以对它进行合理分析,自行设计出可行的解决路线。人类专家在问题求解方面一定会发挥主导作用,AI只能发挥辅助性作用。
二是对语义的理解。自然语言理解问题,一直被视为AI领域皇冠上的明珠,也是AI研究最为困难的问题之一。而古文字研究必然涉及到语义理解方面的问题,这在相当长的时间里,仍将是人类专家充分发挥优势的领域。
三是创造新的知识。人类专家可以基于已有的认知,结合新的数据,发现新的知识。而这对于AI而言,应该是最终极的发展目标,现在AI离这个目标还比较遥远。
当然,人机耦合将是一个动态过程,AI发展的方向必然是让计算机在更多问题上代替人类智能。比如对甲骨缀合的验证,人类专家需要根据同文、辞例等因素作出判断,现在我们还没有复现这种能力。但这方面的内容较为容易描述清楚,因此也是较容易被AI模拟的一种能力。我们相信,通过下一阶段的努力,可以让AI复现这方面的能力,并让现有的缀合模型进一步提升效率。
以上,是我们在实践AI与古文字研究结合过程中的一点粗浅经验认识,研究还非常初级,所论也还难言深入,祈请大家指正。
引书简称表:
《合集》  《甲骨文合集》
《合补》  《甲骨文合集补编》
《粹》     《殷契粹编》
《善》     《善斋藏契》
《簠杂》  《簠室殷契征文》
《缀集》  《甲骨缀合集》
《上博》  《上海博物馆藏甲骨文字》
《珠》     《殷契遗珠》
《前》     《殷虚书契前编》
《日天》  《天理大学附属天理馆所藏甲骨文字》
历拓        中国社会科学院历史研究所藏拓本
注释:
[1] 黄天树主编:《甲骨拼合集》,北京:学苑出版社,2010年。
[2] 施谢捷:《释“索”》,《古文字研究》第20辑,第209页,北京:中华书局,2000年。
[3] 裘锡圭:《说殷墟卜辞中的“奠”——试论商人处置服属者的一种方法》,《裘锡圭学术文集·古代历史、思想、民俗卷》,上海:复旦大学出版社,2012年。
[4] 莫伯峰:《利用深度神经网络判别甲骨文字体的初步测试——以字形为依据》,《甲骨文入选“世界记忆名录”发布会暨“甲骨收藏与绝学振兴”高峰论坛纪实》,北京:故宫出版社,2019年。
[5] 莫伯峰:《利用深度神经网络进行甲骨文单字识别和检测的初步测试》,《出土文献综合研究集刊》第9辑,成都:巴蜀书社,2019年。
[6] 门艺、张重生:《基于人工智能的甲骨文识别技术与字形数据库构建》,待刊。
[7] 张钹、朱军、苏航:《迈向第三代人工智能》,《中国科学:信息科学》2020年第9期。
[8] 对甲骨卜辞进行了逐片字体分类的成果已经较为丰富,例如杨郁彦《甲骨文合集分组分类总表》、莫伯峰《殷墟甲骨刻辞字体分类表》(待刊)、崎川隆《宾组甲骨文字体分类研究》以及“汉达文库”等各种已有研究成果都非常具有利用价值。
(0)

相关推荐