刘冠:《汉画研究数据库中“图与词”的结构性思考》
本文原载于《美术观察》2017年第11期
作者 | 刘冠(北京大学汉画研究所副所长、北京林业大学副教授)

“汉画研究”从广义而言,其对象包括所有汉代遗留至今的图像资料;而从更为确切的狭义角度,则指汉墓及其他遗迹中出土的画像石、画像砖、壁画、帛画等材料。作为中国古代艺术史研究的基础领域之一,汉画研究的深入对客观认识中国古代艺术的发展脉络,以及物质文化、思想观念的演进轨迹都有着重要意义。
性结构。维度之间相互独立且同时并存,所以物理世界中的任何一个(量子层级之外的)实体,都会在三维空间中有一个对应的位置,它的运动过程就是我们一般所理
但不同于后世卷轴画独立存在的形式,绝大多数汉画并无明确的作者、作品名称等信息标示,且皆依附于所属墓葬、祠阙等建筑物的结构之上,构成一种具有复杂“形·相”关系的艺术语言。“形”指研究图像的形态与样貌,“相”指图像与图像之间的位置关系。朱青生认为,“形相学”认为中国古代艺术,尤其汉画中的图像,必须在特定的位置才能显现其特定的含义。而对汉画的研究解释,又与先秦至汉代(以及三国魏晋)文献之间构成了另外一种形式复杂的关联。因此,大数据时代为汉画研究建立的专门数据库系统,已不能仅仅是对汉画图像、墓葬环境、考古发现、古代文献等各类材料的简单收集和整理,而应在掌握资料的基础上逐步建立相互之间的网络联系,并形成以“智能检索”为核心的复合式数据结构。
现代数据库在汉画研究中发挥的核心作用,不仅因其为汉画的资料收集和著录等工作带来了便利,也不限于其为研究信息的发表交流所提供的新平台,而是在于“检索”本身构成了对传统学者个体“见识”和“记忆”能力的根本性超越。换言之,在有着相对完善数据库的前提下,研究者不必非要经过“皓首穷经”式的积累过程,就能较为便捷地了解其所关注问题的整体概况、前沿方向、汉画图像与文献支撑材料等关键信息。这不仅对于青年学者有着明显意义,对于成熟学者进入自己比较陌生的研究领域也有巨大的帮助。
但是,本文要探讨的并非这个显而易见的常识,而是在前期实践经验的前提下,以笔者所在的北京大学汉画研究所的相关数据库为基础,探索文献与图像数据库“检索”关联结构的深层次问题。北京大学汉画研究所始终坚持从理论、实践两方面推进数字化革新对艺术史发展,尤其对汉画领域的基础性研究与建设的帮助,已建立并不断完善服务于汉画研究的“古文献数据库(包括全汉文、全后汉文、全三国文、全晋文)”、“研究文献数据库(目前共收录文献一万余篇/部,并定期更新)”、“汉画图像数据库(已完成并上线陕北部分,南阳部分正在整理上线,徐州与鲁中南部分正在建设中)”三个相对独立的数据库,正在筹划建设一个包括相关汉墓及遗址出土文物信息的“汉代考古材料数据库”。

随着工作的推进我们意识到,数据库之间的相互联通逐渐成为下一个阶段发展的关键问题。因为在现有(及未来)人工智能图像识别技术的条件下,虽然计算机可以对图像进行一定程度的分辨,但其仍要以图像的形状、色彩、甚至动作规律作为主要识别参数和依据。这种方式应用于人物照片和写实图像领域比较有效(如公安部门使用的人脸识别、网络监控中的色情图片识别等),但汉画普遍存在写实程度有限,而且有大量夸张变形以及风格化处理的情况,还有着线刻、剔地、浮雕等多种造型技法的差异,使得这一识别技术的应用难度较大。另一方面,智能图像识别大多应用于海量图像数据的处理,而汉画图像总量有限,是否有必要(至少从成本产出比例的角度考虑)投入大量资源开发针对性的软件硬件,也是一个客观问题。
比较现实的检索结构,仍会保持目前数据库主流的“名称检索”模式,即通过人为图像内容描述使得图像转换为一段可供检索的文字,实现文字匹配式的检索。但是,这种方式又会面临两个问题:一是人为描述过程中的主观性,将不可避免地出现对相同物象不一致的名称表述,这一问题可通过规范术语来解决。如北大汉画研究所在编撰《汉画总录·南阳卷》的过程中,对“汉画研究文献数据库”中涉及南阳汉画文献资料的阅读,并从中提取研究者所使用的各种术语专词,再经过与前期《汉画总录·陕北卷》术语的编辑核对,并遵从习用原则合并重叠词汇而最终确定了一个术语表;另一方面则涉及图像与文字的根本区别问题,及艺术史研究中“图与词”之间的问题。因为本质上,语言是“单意”的,否则会造成歧义与误解,而图像是“多意”的,任何形象都可以从多个层面来理解,且相互之间不构成可比性,同时图像的意义还会受到所处环境和位置关系的影响而发生改变,所以对画面的文字描述往往只能片面地表述图像中某一部分的典型特征,而舍弃了大部分信息。
另一方面,语言作为艺术史研究的主要工具,本身是由语词(约定代码)和语法(逻辑关系)组成的结构。在这两部分中,前者在目前检索应用中发挥着绝对主导作用,即基于字符的“语词匹配”。但这对于画面中丰富的内容显然过于简单了,因为汉画画面中的基本元素往往在不同层级的组合关系中才能呈现特定的意义,单层的术语字符匹配检索显然过于片面。汉画的这一特点,曾被雷德侯总结为“模件说”(Modular Approach);邢义田总结为“格套说”;朱青生则将汉画图像与汉语结构进行类比,提出了汉画的“七层意义”说,具体包括:1. 基本符号“纹”——笔画或部首,2. 图形(图案)——字,3. 形象——词(这一层目前为术语描述和检索主体),4. 图画(形象组合)——词组短语,5. 一幅画面(段块)——句子,6. 画面组合——段落(至此处可归为底层研究),7. 画面/器物共同构成的形相结构——篇章(至此处可归为中层研究)。这一结构具有将目前仅就形象(及对应术语专词)的单层检索方法向多层次复合检索系统推进的潜在可能,并大幅度提高图像检索的完整准确和智能化水平,因而成为我们在数据库建设上的主要攻关方向。
在此基础上笔者逐渐意识到:这一结构中的检索,越向高阶复杂层级发展,就会越受到非术语控制的语法因素的干扰(尤其在第五层之后)。这种语法因素是人在描述事物时将词语连缀成句的主观逻辑必要,但它既非画面原本所采用的图像“语法”结构,也并非计算机所使用的逻辑语言,因而应在描述和检索中剔除。那么,应如何理解和设置可行的检索语法呢?虽然很多学界前辈也对画面的叙事结构与观看方式提出了自己的观点,但要厘清每类汉画遵循何种“语法”结构本身就是一个更为复杂的问题。
各地各类汉画虽然在画面的表现方式上各不相同,但其具体形象可大体归结为“实词”和“虚词”两类。这里继续借用了语言学的概念对汉画进行解释,“实词”主要是名词和动词等直接参与叙事的语素,在汉画中主要包括具体的人神景物等形象或行走坐卧等动作,以及二者结合构成的叙事“短语”;而“虚词”则指连词、介词、助词和语气词,甚至一些非必要的形容词和副词等修饰性语素,其貌似不重要,实则控制并塑造了语言的节奏、风格和整体氛围并构成所谓的“文采”。在汉画中,这类“虚词”的情况比较复杂,其中最典型的是画面周围的边框与纹样,以及一些穿插于画面之中的装饰性图案;但还有一些原本作为“实词”出现的形象,在特定语境下被作为虚词来使用,例如常见于画面底部的“车马出行”形象,它们并不参与画面的叙事,只是作为渲染气氛而出现。若进一步推论,在整体墓室和丧葬环境中,甚至一些明显叙事的情节性画面,也很有可能整体作为“虚词”性质的元素而被使用,从而构成了具有一定程度非逻辑性的“铺陈”语法。更为重要的是,不同于实词叙事的千变万化,装饰性虚词往往会由个体习惯或特定风格而呈现出某种规律性特征。那么,汉画中的“虚词”性元素是否也应具有一定程度的规律性呢?就目前我们比较有限的实验性探索来看,的确是不能排除这种可能性的。
因此,我们可以合理借助画面虚词的这种规律性特征,为高阶复杂层级的画面检索提供额外的索引条件,而且将为研究者分析汉画提供新的视角和切入点,只是这一方法目前尚处于初步试验阶段,具体的有效性和作用尚待实践检验。但从汉画研究数据库这一具体课题,反映出大数据时代艺术史研究中“图与词”的结构性课题,是值得学界重视和思考的。

刘冠
北京大学汉画研究所副所长、北京林业大学副教授