万万没想到,流落海外的中国古籍能够以数字...
万万没想到,流落海外的中国古籍能够以数字化这种全新的形式回归故土!
流浪上百年、离家万里,它终于回来了。事情最早要追溯到1741年,当时一本名为《宋百家诗存》的宋诗选集刊刻成书。几十年后,它被四库全书收录,其中一份藏在杭州文澜阁。不过接连的战火导致古籍下落不明,直到2005年,大洋彼岸的加州大学伯克利分校东亚图书馆出版“中文古籍山善本书志”,文澜阁本《宋百家诗存》(卷七)现身期间。
2021年,“汉典重光”项目将文澜阁版《宋百家诗存》(卷七)以数字化方式向公众开放。
“汉典重光”项目其实早在两年前就开始计划,当时是阿里巴巴公益基金会联合四川大学、美国加州大学伯克利分校、中国国家图书馆、浙江图书馆共同合作开展的,目的就是寻觅那些流散在海外的中国古籍,同时借助达摩院的技术,用数字化的方式让它们回归故土。
接到这个重任的达摩院,为了实现数字化,将AI快速识别技术用在了古籍识别上,但古籍涉及正文、注释、批校等,很难进行系统的AI识别,数字化难度很大。
面对各种难题,达摩院的技术团队和川大的文学专家们开始了艰难的“文化远征”,经过不懈探索,利用单字检测、小样本学习等技术终于打造出了全新的古籍识别系统,将录入效率提升了近30倍,最终以97.5%的准确率完成了对伯克利20万页古籍的整体识别。
昨天,“汉典重光”海外古籍数字化回归发布会就在中国科技馆举行。我们不仅迎来了一批中文古籍善本,以数字化方式回归故土,阿里还宣布汉典重光平台的所有数字化古籍内容也将向全世界开放,让全世界人民可以感受到中华文化的博大精深。
珍贵的历史从来不会淹没在时间的长河中,因为总有一批心怀热爱与使命的人在负重前行,而这次海外古籍的数字化回归,也意味着以数字化形式赋予古籍二次生命力的成功。
赞 (0)