论版本研究对古籍数字化的学术支撑

　　古籍数字化就是基于保护和利用古籍的目的，运用计算机技术将古籍文献的语言文字或图形符号转化为能被计算机识别的数字符号，从而制成古籍文献书目数据库和古籍全文数据库，用以揭示古籍文献信息资源的一项系统工作。古籍数字化是对古籍或古籍内容的再现及加工，是当前古籍整理与研究的一项重大工作，它不仅可以方便学者检索、使用古籍，而且对于古籍的保存、流传也极为重要。当前，对古籍数字化起学术支撑作用的因素很多，譬如电脑技术的发展、古籍分类学的研究，其中版本学的研究是一个尤为重要的环节。本文仅是从一个使用者的角度对当前的古籍数据库提出进一步完善的建议，刍荛之献，敬祈斧正。

　　当前影印古籍价格过于昂贵，普通读者难以购求，因此古籍数字化实在是当前解决这一日益增长的文化需求的最好方法。通常我们会利用古籍数据库进行一些相关的文献取证工作，譬如一些学术概念的演变、人物的生平里贯、引文的核查甚或校勘等。在使用过程中，我们逐步发现，版本学的研究尤其古书版本源流的研究，在古籍数字化的进程中显得尤为重要。

　　在古籍库建设的诸多环节中，择求善本是其中重要的一环。首先可以为使用者提供更为精确全面的录文。在构建古籍库时，我们需要选择当前最为完善的版本，尤其是经今人精心校勘整理过的本子作为校录文字的依据。当然，前提建立在今人的整理本对古书的篇卷次第并没有大的改动，这样也便于我们对多个版本进行比勘。而当前的古籍库大多未能很好地满足这一要求。以《中国基本古籍库》为例，其每种典籍均提供一个通行版本的全文信息和一到两个重要版本的原文图像。但其全文信息所依据的通行版本，并非都是经过精心校勘的版本，亦罕见今人整理校勘过的善本。因此，倘若所依据通行本不善，则可能出现衍文、脱文、残阙等现象。

　　其次，择求典型版本，与校录的文字版本相互对照，不仅可以供检索、查勘，而且可以为进一步的研究提供多个重要的版本。学术研究，尤重善本。不过，在浩如烟海的古代典籍中，仅有为数不多的典籍经过前人及今人的精心校订。因此，在古籍数据库中，如能为使用者提供尽可能多的不同版本的原文图像，庶几可弥补古籍善本难求的缺失。即使不能够网罗所有版本，也应尽最大努力提供典型版本的原文图像。我们这里所谓的典型版本，主要指两类：一是隶属不同版本系统的各祖本，一是稀见的稿抄本、批校本等。

　　那么，如何才能够做到择求善本呢？又如何对典型版本进行确认呢？我想应当具备最起码的古籍版本学的知识。古籍版本学，包括两方面的内容：一是讲如何鉴别古籍的版本；一是讲每种古籍有过哪些版本，其渊源递嬗关系如何，其中哪些是善本，哪些不善？黄永年先生将后者成为版本目录学，即讲各种古籍的版本的目录学。（黄永年《古籍整理概论》，上海书店出版社，2001年，8页）我们进行古籍整理（包括古籍数据库的建设），如果不懂得这门学问，就根本无从选择底本、对校本，一切整理工作也就无法进行。我认为可从以下几个方面着手：

一、通过前人的版本研究

　　清人对版本的研究颇为重视，自钱曾《读书敏求记》详列版本之后，诸家藏书志、题跋多著录版本信息。如黄丕烈《荛圃藏书题诗识》（缪荃孙编集）、张金吾《爱日精庐藏书志》、瞿镛《铁琴铜剑楼藏书目录》、陆心源《皕宋楼藏书志》、丁丙《善本书室藏书志》、缪荃孙《艺风藏书记》、叶德辉《郋园读书志》等，民国以降，学者继其轨辙，撰写藏书志之风更炽，傅增湘《藏园群书经眼录》、张钧衡《嘉业堂藏书志》、缪荃孙等《适园读书志》、王重民《中国善本书提要》及《续编》等，均值得珍视。此外，还有一类综合的版本目录，即前人在每种古籍下详细记载传世的各种版本。如莫友芝《郘亭知见传本书目》、邵懿辰、邵章《增订四库简明目录标注》、朱学勤批注《四库简明目录》、范希曾《书目答问补正》、孙殿起《贩书偶记》及《续编》。其中孙氏二书专门记载清人、民国初年人著述版本。

　　以上所列藏书题跋、藏书志等，多涉及古籍版本的诸多信息，我们如果能将其综合起来考察，基本可以获知一部典籍的典型版本信息。罗伟国、胡平先生所编《古籍版本题记索引》对我们考察古籍版本非常有帮助，这部索引为有关古籍版本的书目、题跋记、读书志、书影等102种图书编纂索引，“按图索骥”，使用起来非常方便。

二、通过今人的版本研究

　　前人的版本研究多有疏失，因此今人在进行具体的古籍整理或版本考察时，遂在前人基础上得出更为明晰的结论，其中颇多后出专精的研究。如周祖谟先生对《洛阳伽蓝记》版本的研究、吴金华先生对《三国志》版本的研究、张玉春对《史记》版本的研究、傅刚对《文选》版本的研究等，其他散见于各大期刊的版本研究文章更数不胜数。这些成果也亟待我们搜集整理，加以利用。

三、通过各种文献自行考察

　　还有一些古籍，前人涉及较少，故而需要我们利用各种文献资料，对其版本源流进行考察。这个过程或许还要依靠选择性的校勘才能解决，因为如果想把一部典籍的版本源流系统说清楚，仅靠一点版本知识或前人粗略的研究是远远不够的。必须通过认真的校勘，可以择取其中的数卷，从文字、内容的异同之处，理出源流，分清系统。

　　经过以上的考察研究，我们基本上可以为每一部古籍列一个版本源流表，进而选择出典型的版本，然后将其扫描，列入数据库。扫描过程中，一定不可删去序跋等相关资料，甚至诸本中的签条最好也能扫描。这些资料不仅可以为我们提供作者交游及书籍刊刻的相关信息，还能够帮助读者进一步核实此前版本研究的准确性。

　　至于能够利用检索的手段获得某一信息在具体刻本、钞本中的页码，则是更为深入的技术问题了。当前的许多古籍库虽然可根据需要调阅数个版本，实现全文版与图像版以及图像版与图像版的对照，但图像版只能够按照页码翻上翻下，不能通过检索直接跳转至所选文字，这不能不说是很大的遗憾。因此，如果我们在建立数据库时，能够为篇帙浩繁的典籍提供典型版本卷次的定位，方便使用者在检索到相关资料后能够迅速追溯到“史源”，则是莫大的贡献。

　　此外，目前的古籍库多贵远贱近，明清两代典籍很少，近代以来的更少。因此我们欲检索明清两代的资料时却没有大型数据库可供利用，这非常不利于学术的进展。如果能将《续修四库全书》、《四库全书存目丛书》、《四库禁毁书丛刊》、《中国方志丛书》、《中国地方志集成》、《丛书集成初编》及《续编》《新编》、《近代中国史料丛刊》等先行制作成数字版，可以弥补当前明清资料检索的困难，而这一工作也是切实可行的。

（作者单位：西北大学文学院）

论版本研究对古籍数字化的学术支撑

相关文章