试论古籍版本数据库的建设

  【摘 要】 随着古籍数字化资源的建设,开发古籍版本数据库成为重要选题之一。文章以全国古籍普查工作的开展为契机,分析了当前建设古籍版本数据库的重要意义, 提出了古籍版本数据库建设的内容及建设原则,并列举了相关古籍版本数据库建设的阶段成果。

  【关键词】古籍数字化;古籍版本;数据库开发

  发端于上世纪80年代的古籍数字化建设,经历了近30年的不断发展,如今已经取得了丰硕的成果,一些大规模、具有代表性的古籍数据库陆续投入使用。2007年国务院办公厅发布《关于进一步加强古籍保护工作的意见》(国办发[2007]6号),也对古籍数字化提出了具体要求,这势必会将古籍数字化建设推向高潮。

  随着数字技术的不断发展,开发满足有关古籍版本需求、功能完备的古籍版本数据库成为今后古籍数字化的选题之一。本文希望在当前古籍数字资源库现状研究的基础上,对今后古籍版本数据库的建设与发展进行探讨。

  1.开发古籍版本数据库的意义

  卷帙浩繁的古代文献是我们祖先留下来的宝贵财产,也是传承我国五千年文明史的重要载体和不可再生的文化资源。正是由于其稀缺性及不可再生性,使得古籍具备文献价值的同时往往也具备文物价值和艺术价值。古籍数字化及相关古籍数据库的建设,为拓展古籍的利用提供了条件与便利。

  当前的古籍数字化项目多以古文献的内容作为切入点。虽说有的古籍书目或全文数据库有部分版本信息,但专门从版本视角开发的古籍数据库绝无仅有。而开发古籍版本数据库,利用现代化技术发掘蕴藏的古籍版本信息及其文物价值,对提升古籍全文数据库及其它数字化项目的建设质量,实现古籍信息的增值性开发,都有着十分重要的意义。

  1.1 古籍全文数据库的建设需要古籍版本数据库的支持

  古籍版本对于古籍全文数据库的建设十分重要,它将直接影响到数字化产品的质量。众所周知,在长期流传过程中古籍有着诸多版本,而不同的版本又存在优劣和互补。在进行古籍数字化时,应尽量选择精良的版本作底本,同时也要与其他的一些版本进行校对,拾遗补阙,这样才有可能制作出高质量的古籍数字化产品。

  古籍版本数据库汇集的是古代书籍版本的数据形态,可以揭示其表征、行款、字体、墨色、装帧等信息,这就为古籍全文数据库在版本选择及比较方面提供依据,尽可能地将最好的底本收入数据库,方便读者研究使用,从而提高古籍全文数据库的建设水准。

  1.2 古籍版本数据库是古籍增值性开发的直观表现

  古籍不仅仅具有文献价值,同时也是古代文化艺术(书法、雕刻、装帧等)和科学技术(印刷、造纸等)的重要实证,而这种实证就是通过不同形式、种类的版本来体现其差别的。

  古籍版本的形态,包括版刻工艺、装帧、用纸、行款、字体、边栏、墨色以及藏印、题跋等,如用文字描述,说得再详细也是纸上谈兵。而开发古籍版本数据库,使其具有重现作为历史文物古籍原貌的功能,并能满足版本研究、文物鉴赏及原件对照等特殊需要。

  同时,开发古籍版本数据库,可以拓宽古籍利用的渠道。通过对古籍版本中蕴含的数字素材进行萃取、加工、整合,发掘其间特有的中国文化元素,形成具有市场价值的文化产品,可供文化产业采用,实现古籍的增值服务。

  1.3 古籍交换价值的实现,急需古籍版本数据库的支持

  随着市场经济的繁荣,人们正在积极地寻找古籍的交换价值。拍卖这种竞价交易方式无疑就是一种方便、快捷的买卖方式,也是让古籍保护赢得社会各界重视、参与的重要渠道。

  作为一种特殊的交易对象, 古籍除了具有一般拍卖标的经济价值外, 其独有文献价值、历史价值与审美价值在很大程度上影响甚至决定古籍拍品在拍卖中的成交价格。而对于古籍投资、收藏者来说,更需要了解不同时期古籍版本的收藏价值。建设古籍版本数据库,挖掘古文献在版别、版式、结构和装帧等方面的信息,正是对这些“纸墨俱佳、写刻俱精”古籍的直观表征,将极大地推动古籍收藏与市场交易的健康发展。

  2.古籍版本数据库的建设契机

  2007年1月,国务院办公厅下发了《关于进一步加强古籍保护工作的意见》(国办发[2007]6号),要求从2007年开始,在全国范围内组织开展古籍普查工作,全面了解和掌握各级图书馆、博物馆等单位及民间所藏古籍情况。作为实施“中华古籍保护计划”的基础性工作,全国古籍普查是古籍抢救、保护与利用工作的重要环节,对登记的古籍进行详细清点和编目整理,建立中华古籍综合信息数据库,形成中华古籍联合目录。

  古籍普查对古籍版本数据库的开发提供了千载良机。古籍普查工作对我国存世古籍从数量、版本、文物价值、文献价值等方面取得的了第一手资料,每部书都有包括书名、作者、版本、分类、定损、书影等信息的详细著录,而这些数据都可以直接被古籍版本数据库所采用。同时,《全国古籍普查工作方案》中的相应标准及规范,如古籍普查规范、古籍书影拍摄相关规范、中华古籍总目编目规则等也都为古籍版本数据库的建设提供可借鉴的参考。

  截止到2010年6月,《国家珍贵古籍名录》和“全国古籍重点保护单位”已评审并公布三批,其中入选《国家珍贵古籍名录》的古籍共有9859部,而申报的古籍约有29600部之多,具体统计见下表:

  这些申报及入选的古籍都有完整的数据及图版,且多为古籍善本,据此完全可以制作一个与《国家珍贵古籍名录》相关的“古籍版本数据库”。

  3.古籍版本数据库的建设

  古籍版本数据库是以古籍版本信息为揭示对象,通过扫描、拍照、缩微胶片等方式对古籍原本进行影像处理,以便为读者呈现古籍原貌,并提供版本研究的服务。

  古籍版本数据库的开发对象是古籍各种形式的版本,即古代图书的实物形态。表现为一书有各种不同版本的现实,一书各本在形式、内容方面的特征和差异,版本的发生、发展的历史,版本的制作、流传、著录情况,版本的各种类型,版本的真伪、优劣、价值大小等。因此,为了能够反映古籍版本的文献、文物价值,古籍版本数据库可由三方面的基础数据组成,即⑴ 古籍版本的著录信息;⑵ 古籍书叶的影像信息;⑶ 历代版本目录学著作及相关工具书。

  3.1 古籍版本的著录信息

  对于古籍版本的著录,主要是将古籍的形式和内容特征依据一定的规则和方式记录下来,让使用者通过记录的文字能够了解和确认这部书,从而起到揭示古籍的作用。其信息主要包括:书名项(书名及其卷数)、著者项(作者时代、姓名和著作方式)、版本项(出版时间、地点、版本类别等)、稽核项(册数、装订形式、纸张、刻工和行款等)、附注项(以上四项的补充内容,如批校、题签、印章等)、提要项(评价书的价值及叙述版刻源流)等内容组成。

  3.2 古籍书叶的影像信息

  古籍书叶的影像信息是指集成能够反映古籍题名、责任者、出版年、递藏历史等相关版本信息的书叶影像,从而形象地揭示古籍的真实面貌,为准确地评估古籍版本与相关版本的比较提供依据。制作版本书影的目的是要鉴别和证实古籍的版本,因此所采集的影像信息需涵盖古籍版本的封面、牌记、卷端、版式、藏印、目录、正文文字及插图、版心文字、批校题跋等影像资料,从而使古籍的数字化版本能起到替代原件的作用。

  3.3 历代版本目录学著作及相关工具书

  进行版本的收集、鉴定、比较,我们首先要了解古代版本目录的著录和研究文献,熟悉相关工具书的使用。这是因为古代版本目录学著作记载了历代书籍的情况,如作者的生平、书籍的卷数、内容的体例、版本、流传、真伪的考辨以及对书籍内容与作者的评价等。通过版本目录学方面的研究文献可以了解各类古籍的大概情况及其性质、作用,然后可以决定取舍,选择我们所需要的图书。因此,在古籍版本数据库中集成相关版本目录学著作及工具书,可以完善数字化古籍版本的评估、分析体系,以达到对勘版本、梳析源流的作用。

  4.古籍版本数据库的建设原则

  4.1 规范化、标准化原则

  规范化和标准化直接影响着古籍版本数据库的使用效果、存在价值和发展前景。因此,所开发的古籍版本数据库一定要依据国家制订的古籍保护方面的相关标准,包括古籍普查规范、古籍定级标准、中华古籍总目编目规则,还要参照通行数字化制作的数据著录标准、古籍书影拍摄相关规范、数据标引标准、规范控制标准及各种协议等,以较成熟的系统软件和通用标准为技术平台来建立标准化、规范化的古籍版本数据库。

  4.2 实用性原则

  建设古籍版本数据库的目的和任务是为更好地发挥数字化古籍版本信息资源的功能,从而准确地揭示和正确地评价古籍版本,最大限度地满足人们对于古籍版本的各种需求。因此,建库时应遵循“实用性”的原则,充分调研对于古籍版本的信息需求和处理需求,深入分析版本数据库的实用价值以及社会效益,保证版本数据库能满足读者和社会需求,并能进行深层次开发,实现增值效应。

  4.3 可扩展性原则

  古籍版本数据库应具有良好的可扩充性、可缩放性和升级能力。首先,中文古籍一直以来没有一个清楚的数字,原来曾经是多少,现存多少都是未知数。所以,随着全国古籍普查工作的深入,而与之相关的古籍版本的信息量,在一段时期内会有一个稳定的增长。其次,古籍版本数据库系统本身,要能兼容不同的网络平台,并随着信息技术发展、古籍增值性开发的需求,实现平稳升级及过渡。

  4.4 协调性原则

  为了充分发挥古籍版本数据库特有的信息优势,避免内容贫乏或重复,版本数据库的建设需要采取协调管理,分工协作,联合建库的方式展开。目前已公布入选《国家珍贵古籍名录》的9859部古籍,其馆藏地分属国内500多家图书馆、博物馆。为了加大古籍版本信息的共享性,古籍版本数据库的建设应根据我国古籍再生性保护的整体需求,有针对性地拓展古籍版本数据库的统筹管理与建设。

  4.5 阶段性原则

  古籍版本数据库的建设是一项持续性工作,并与现阶段正在开展的全国古籍普查工作息息相关。“中华古籍保护计划”中明确提出要用3到5年时间,在全国范围内开展古籍普查登记工作,全面了解和掌握各级图书馆、博物馆等单位及民间所藏古籍情况。在此背景下,古籍版本数据库的建设也需要制定相应建设目标及中长期规划,在取得经验及阶段性成果的基础上,应分步发展,逐步完善。

  5.当前古籍版本数据库建设的阶段成果

  当前,古籍数字化建设的成果主要以古籍书目数据库及古籍全文数据库为主。下面所列举的“古籍版本数据库”,仅是部分或浅层次涉及古籍版本的信息集成,但可以作为古籍版本数据库建设的阶段成果,为接下来的深度挖掘及开发提供借鉴和参考。

  5.1 中华古籍善本国际联合书目系统

  网址:http://res4.nlc.gov.cn/home/index.trs?channelid=630

  “中华古籍善本国际联合书目系统”是由中文善本书国际联合目录项目发展而来的新数据库,主要由美国普林斯顿大学和中国国家图书馆合作建设。中文善本书国际联合目录数据库著录了北美图书馆的几乎全部藏书以及中国图书馆的部分藏书,数据达到2万多条。在其基础上建立的新数据库首批公布了普林斯顿大学东亚图书馆约2000条中文古籍善本数据,供公众免费使用,所有用户均享有检索、浏览、打印、下载本系统书目数据及书影。

  5.2 台湾国家图书馆善本丛刊影像先导系统

  网址:http://rarebook.ncl.edu.tw/rbook.cgi/frameset1.htm

  善本丛刊影像先导系统将台湾国家图书馆典藏善本古书一万二千余部中的部分善本,利用拍摄及扫瞄的方式,将善本古书的各叶影像数字化。内容收录十七种馆藏珍贵明人诗文集,各诗文集的书名、撰者、版本、篇名、序跋者、题跋者等数据皆可检索并浏览,其书叶影像全部为彩色。

  5.3 “学苑汲古——高校古文献资源库”

  网址:http://rbsc.calis.edu.cn/aopac/index.htm

  “学苑汲古——高校古文献资源库”是一个汇集高校古文献资源的数字图书馆,由北京大学、北京师范大学、南京大学、四川大学等高校图书馆先行合力创建。内容不仅包括各参建馆所藏古文献资源的书目记录,而且还配有部分相应的书影或全文图像。该资源库中的古文献类型暂时只有各馆馆藏善本古籍和普通古籍,今后还要增加金石拓片、舆图等多种古文献资源。各馆并向读者提供一定范围的文献传递服务。该资源库为中国高等教育文献保障系统(CALIS)的特色库项目之一。

  5.4 哈佛大学哈佛燕京图书馆藏善本特藏资源库

  网址:http://res4.nlc.gov.cn/home/index.trs?channelid=724

  中国国家图书馆与美国哈佛大学图书馆协议,将共同开发哈佛燕京图书馆藏中文善本古籍特藏。预计将用6年时间,完成中文善本古籍4210种51889卷的数字化拍照。“哈佛大学哈佛燕京图书馆藏善本特藏资源库”首批发布的中文古籍善本及齐如山专藏共204种。该系统可按照书名、著者、出版信息、分类等多维度进行检索和分类浏览,书目信息为中英文对照,更方便海外读者使用,同时提供全部书影的阅览,以便于用户的全面阅读和深入研究。

  5.5 东京大学东洋文化研究所汉籍全文影像数据库

  网址:http://res4.nlc.gov.cn/home/index.trs?channelid=629

  东京大学东洋文化研究所从2002年开始建立古籍全文影像数据库,在互联网上免费提供开放性服务。读者可按照经部、史、子、集四个部分进行分类浏览。这批数据包括收藏在东洋文化研究所和一些专藏文库中的珍贵宋、元、明、清善本和民国时期抄本,经史子集各类俱全,其中以小说、戏曲为大宗,具有重要的史料价值。

  5.6 汉籍数字图书馆

  网址:http://202.117.149.8

  《汉籍数字图书馆》(第一阅览室)内涵中文古籍文献近9万多种,120余万卷册,总页数达1622万页,目录系统文字达860万字,原文献数据量1814GB。该产品由目录系统和文献库两部分组成。目录部分采用文本格式,文献库采用PDF图形格式,原版原式、忠实原貌,确保了古籍文献的准确和应用价值。

  5.7 长春图书馆“馆藏国家珍贵古籍数据库”

  网址:(http://www.lib.cc.jl.cn/guji/index.htm

  作为全国古籍重点保护单位之一的长春图书馆,收藏有大量珍贵古籍善本。该图书馆将已入选《国家珍贵古籍名录》中的15种、273册进行数字化处理,以电子书形式(PDF格式)建成《长春图书馆馆藏国家珍贵古籍全文数据库》,供读者查询利用。

(作者单位:金陵科技学院人文学院 江苏南京 210038)

  

Comments are closed.

Baidu
map