浅议古籍数字化建设中的学科分类与古籍专题库建设

  【内容摘要】本文梳理、分析了中国古籍数字化研究中涉及到的分类概念,区别了古籍文献分类与数字化过程中学科分类的概念,阐述了二者各自的内涵和意义,从理论探索和实践需求的角度,提出了古籍专题库建设的原则和要求。

  【关 键 词】古籍数字化;分类;专题库建设

  【作者简介】李桂荣,女,1966年生,青海省委党校图书馆,副研究馆员。

一、分类、学科分类、文献分类的概念及联系

  分类是以事务的本质属性或其它显著特征作为依据,把各种事务集合成类的过程,是人们认识事物、区分事物、组织事物的一种逻辑方法。不同目的的侧重和不同对象的关注,产生不同的分类逻辑方法。

  所谓学科,是关于客观世界中特定事物对象的本质特征和规律的知识体系。[1]学科是科学的个体,是科学区分不同领域知识系统的框架工具。学科分类是对对象进行学科划分,确定其在整个科学体系中的位置以便于识别、区分的分类体系。学科分类法是按照对象的学科属性结合对对象的使用需求(如研究需要)对对象进行分类的方法。

  文献是记录知识的载体,文献分类是指根据文献内容和形式的异向,按照一定的体系有系统地组织和区分文献。如我国的“古籍”、“民国时期图书”和“现代普通图书”、“网络文献”、“国外文献体系”等。文献分类法侧重以事物对象为中心加以编制,如我国古代的皇家藏书提要汇编《别录》及在此基础上编定的《七略》,后来的《四库》系列、英国布朗的《主题分类法》的文献分类等等。

  由于文献分类是以文献主题内容等属性关系进行的,符合知识之间关系的系统性。因此文献分类的发展与学科分类是密切相联系的。由于学科分类体系是按照知识关系的内在规律性进行的,所以以学科分类为基础,可以更好地反映知识之间的联系,更有利于文献的系统揭示和使用。正是如此,现代文献分类法基本上都是依据当时的学科分类水平或体系进行,例如《杜威十进分类法》、《美国国会图书馆分类法》、《日本十进分类法》、印度S.R.阮冈纳赞的《冒号分类法》、我国刘国钧编的《中国图书分类法》、皮高品编的《中国十进分类法及索引》等等。由于我国历史上的使用需求和局限,在我国古代,古籍分类的目的主要是“组织藏书,体现分类者‘辨章学术,考镜源流’的学术水平”[2]。与学科分类不同,文献分类关注的仅仅是国内已经生成和留存下来的文献体系,没有关心现存文献以外领域和对象。因此没有完全发展为科学意义上的学科分类,所以它与学科分类是两个关注对象和内涵都有差异的概念,在结构上很相似,都是采用体系分类法,学科分类保持整个科学知识体系的系统性,我国古籍文献分类法保持个体文献体系(仅是我国“古代”、“现存文献”这个区域、时段和对象的个体体系)的完整性。

  我国古籍总类自晋代以来发展了一千八百多年,文献分类法随着文献的内容、形式的发展而发展,“四部”分类法最终占上了主流地位;而学科分类法是为识别学科在科学体系中的位置类分而存在的理论逻辑,是随着人类整体科学的发展和学科的日益丰富而出现和完善的。所以说,文献分类法是一种偏重于编目、服务于编目的语言,而学科分类法是一种事务的类分逻辑,价值更侧重于于检索区分。在学科分类已成为科学研究发展的一个重要需求的今天,学科分类法为我国古籍在计算机条件下统一分类编制以更好地开发利用即古籍数字化提供了条件。

二、学科分类与古籍文献分类的区别及古籍数字化的学科分类要求

  综上所述,学科分类法侧重于对学科对象的条理区分,文献分类法侧重于对文献对象的有逻辑地组织。我国古籍文献分类法虽然也是以学科分类为基础进行的,但除了上文中提到的产生、发展中的特点差异,要想进一步说明它与现代学科分类的区别,至少还要具体考察以下两个方面:

  其一,对象不同。现代学科分类的对象为某一主题或一组主题领域,是按照不同的研究方式以及其现象确定的,比较单纯。古籍文献分类的对象是古籍文献,既有其内容方面,又有其体裁形式、版本等方面的要求,涉及的因素比较复杂,与学科分类存在着诸多差异。在内容范围上,古籍文献分类需要涉及的范围更广、更深、更复杂。一方面,一种古籍文献往往会同时涉及两门或多门学科,如儒家十三经,《易》、《论语》、《孟子》、《孝经》归属哲学学科,《尚书》、《左传》、《公羊传》、《谷梁转》、《周礼》、《仪礼》、《礼记》归属历史类,《尔雅》归属语言文字类,《诗》归属文学类。另一方面,古籍文献中除了学科层次的内容以外,比学科分类的对象更为多样。如除了经、史、子、集四部是按学科内容设立的,还有综合性的和专门性的丛书以及辑录汇集资料以利寻检、引用的工具书—类书。文献分类具有学科内容、著作方式和装帧形式、生活用途等不同于学科分类要求的特点,以及以国家、地区、时代、人物等具体内容为独立体例的立类标准,因此比学科分类复杂和专指。

  其二,功能不同。学科分类的任务是根据其研究对象,明确学科的划分及其相互关系,确定每门学科在学科分类体系中的位置,目的是用以制定科学研究计划,建立科学研究机构和确定科学管理体制,正确设置专业以及进行不同门类之间的协调等服务。也可以作为各种具体应用,如文献分类、行业分类等的基础。在数字化网络环境下,学科分类还可以用于文献资源数字化分类的指导思想,揭示网络信息环境下文献资源的学科关系。其形势可以比较自由,可以采用文献分类采用的线性的列表形式,也可以根据计算机对学科知识关系表达的需要,以其他形式表示,例如,方框图、树形图等,以二维、三维的图形形式加以表示,并可以根据计算机对学科关系的理解,自由调整,揭示学科知识元之间、学科知识单元之间及其二者之间的关系,便于数字文献使用者对学科知识的检索、查询以及计算机的智能处理。而古籍文献分类法的任务主要是组织和揭示古籍文献,功能应该是提供实体文献的完整性(体例、体裁、类目、装帧等)、真实性(善本、版本等)及其整体之间的联系性、系统性、连续性。由于古籍文献处理具有历史累积性的特点,古籍文献分类体系作为古籍文献组织的工具,一般要求相对稳定,以已经发展成熟且具有代表性的“四库”法为标志,合理组织古籍文献体系,只能是将它完善、更趋于使用的便利,而不是将它废弃、不用。

  古籍数字化,是将古代典籍中以文字符号记录的信息输入计算机,从而实现了整理、存储、传输、检索等手段的计算机化。[3]是按照文献信息所载知识的学科属性,根据文献信息内容之间的相关性,组织成科学的便于计算机识别和处理的体系,由计算机对古籍文献进行管理和再现,满足读者、用户对古籍的数字阅读需求。因此,古籍的学科分类首先是数字阅读时代由计算机提出的。古籍数字化过程中计算机性能和系统把古籍与学科分类法紧密拉在一起。

三、面向数字化学科分类需求的古籍专题库建设

  适用于学科基础建构,推动学术发展的古籍数据库,应该是结合古籍文献体系特点和计算机双方长处的结晶,面对古籍体系的价值和机读后检索要求,一方面我们不能毁弃传统目录学中关于图书的四部分类法对所收文献所进行的组织分类,同时在技术上,还要保证计算机、数据库有强大的检索功能,知识重组功能。

  首先,文献分类不能等同于学科分类用做计算机分检方法。从文献本身的完整性价值来看,文献分类的对象必须是文献,而不是单纯的学科内容本身,所以必须以保留文献的完整性特点加以处理,完整地提供给读者用户。特别是在建设面向学者,为科研服务的文史类数据时,应审慎、严格、规范地按照传统目录学的相关知识对所收文献进行排列、设置。绝对不能凭借数据库强大的检索功能而疏于对数据按照古籍体例特性进行考虑。

  其次,文献的计算机处理还必须使用学科分类语言,根据科学研究和管理的需要对古籍体系在保持它的相对完整性前提下加以学科分类。符合学术规范、对学科建设有更大裨益的古籍数据库应是将文献分类法组织起来的古籍文献和计算机方面的功能结合起来的让读者和用户了解与研究中国传统文化与学术的开放式生态系统。

  对于计算机而言,无论是列举式分类法还是分面组配式分类法,最终都还需要归结为线性次序;同时,还需要以一定的标记符号对古籍文献类目之间的关系进行表达,以便可以使其作为文献标引和检索的工具有效地加以使用。理想的数字化过程,是给古籍类目配上学科分类号,再把类号交给读者,让读计算机使用者能够自主、快捷地使用分类检索途径查检古籍分类及其所需内容。新的古籍分类法还应同时附上“古籍分类法主题索引”[4],以方便分类法和分类目录的使用者自如操作、使用。

  再次,建立古籍专题数据库要注意遵循以下原则进行选题和策划:

  1、突出专题性和保持体系性。古籍专题数据库建设的目的根本上就是要向用户提供一种在内容上具有某一专题特色的资料查考或知识信息服务。为了吸引用户,也为了避免资源建设的重复浪费,就一定要考虑有一个很好的选题。专题数据库的选题策划既要考虑用户的个别需求,又要考虑古籍完整体系的价值,同时也要考虑计算机处理的可行性,进行可行性分析。专题数据库之所以能够脱颖而出,在许多综合性的大型数据库已经建成使用的情况下有其生存的空间,正是因为其突出专题原则,可以兼顾个性化需求和达及个体文献开发利用的深度。有利于零碎的馆藏资源深加工和被利用。因为尽管一些大型数据涉及的专业、学科全面而广泛,但就某一学科、某一专业或某一领域而言,它不可能像专题数据库那样能够集中力量,最大限度地去穷尽相关的不同类型的数据资料。还有好多图书馆,所藏古籍资料是零散的,体系不完整的,利用专题库方式把零散典籍及其相关研究成果组织起来,加以揭示就是可以实现有限资源的深加工和充分利用。

  2、建设实用性和兼顾共享性。数据库只是工具层面的东西,实用性才是目的。专题数据库建设的目的是为了最大限度地满足用户的文献信息需求,发挥图书馆的功能和体现图书馆存在的价值。一个专题数据库的价值的存在的意义主要在于它是否能用,有用,实用,好用数据库群建设的主要目标之一是在使用过程中产生知识增值,如在不同的检索路径中衍生知识地图,给检索中意外的知识收获。计算机智能技术可为特定读者量身定做所需,例如引文分析,数据评估,等。来自多处来源地的信息聚集在同一平台为读者进一步准确选择,缩小范围,提供步步逼近目标的基础可检索的结构,提供调整思考的机会,创建快速访问的条件。同时,利用数据库的基本数据模型的足够灵活性和古籍资源体系的多维性,实现资源共建共享。由于各古籍收藏单位的古籍排架顺序和手工目录相对稳定,而电子目录编排的极端灵活,只要确定计算机系统与古籍资源体系的对应关系即可达到分类统一的目标,可使各单位已经长期使用的不同的古籍分类法保持不变。不仅不会改变古籍原有分类目录和藏书布局,也方便本馆读者的习惯使用。协调组织机构实现“统一平台、统一界面、统一标准”,从而充分体现出专题数据库的共享原则,使共享为实用性的前提和必要。

  3、注意古籍文献文本信息分类和数字化后成为网络信息的学科分类区别,同时重视网络用户获取信息的方便性和易用性,采取分类法与关键词同时并用的古籍知识组织和检索技术。由于网络用户的范围十分广泛,他们的知识水平、知识结构、工作岗位、专业、上网目的和利用信息的种类存在明显差异,这一切导致各种用户查询和利用古籍信息的角度不同、方法不同、类型不同、深浅程度不同。在这种情况下,对古籍搜索引擎类目的命名除了要保证其科学性、准确性、简洁性以外,还要注意尽量采用自然语言,以增加类名的透明度,满足广大终端用户的需求。古籍知识之间的联系是多方面的,一个主题或事物,可以同时从属于两个或多个知识门类,也可以在从属关系以外有其他的联系。古籍分类搜索引擎应该提供不同角度的检索入口,以适应各种类型终端用户的需要。同时由于网络信息资源的虚拟性和可多角度揭示性,可以使古籍文献体系在网络环境下摆脱文献分类法单线性的限制,在网络传播中进行灵活的全方位揭示。超文本技术和链接技术能够为构建多维化的古籍知识体系提供技术支持。

  总而言之,随着现代信息技术和互联网技术的迅猛发展,在古籍数字化建设过程中建构完善的现代网络信息分类法已经成为图书馆学、情报学、计算机技术与网络技术专家学者共同关注的亟待解决的一个重大课题。

注释与参考文献:

[1] 图谋博客,面向学科分类的高校图书馆文献资源建设,2005年12月3日。

[2][4] 鲍国强,数字网络中古籍分类的作用和趋势,《文津流觞》第八期,2005年4.15.

[3] 刘琳,吴洪泽.古籍整理学,成都:四川大学出版社,2003年版。

  

Comments are closed.

Baidu
map