陈大为
(上海师范大学人文与传播学院 上海 200234)
作者简介:陈大为(1979~),男,北京顺义人,上海师范大学人文与传播学院历史系讲师,主要从事敦煌学与隋唐史研究。
新手段指随着科学技术和电子信息的发展,历史学的研究手段和工具也发生重大变化甚至可以说是革命性的变化,如网络(查询方式的变化)、计算机(书写工具的变化)、研究资料的数据化,知识库(检索方式的革命),这些手段和工具的改变对历史学的研究产生重要影响。这种影响不仅仅是史学工作者“换笔运动”那么简单,而是涉及到在信息时代史学本身如何现代化的问题,也是关系到史学自身发展的深层次问题。
1.网络 随着计算机技术的发展和信息化时代的到来,历史学科的研究也进入了一个崭新的阶段,利用国际互联网络,对古籍、文物资料进行检索传送、钩稽参照,已成为现代史学研究的发展趋势。日新月异的计算机与网络技术,正在给古老的历史研究注入新的活力。国际互联网络上的史学资源浩如烟海,若离开网络搜寻器的支持,要找到所需的资料,如同大海捞针一般。因此,在进行以学术研究为目的的资料查询时,率先访问能够提供超级文本链接的相关网站,不失为一条捷径。学会使用搜索引擎是重要的环节,是寻找一切资料的最基本手段。如百度、Google、雅虎和搜狐等公共搜索引擎不仅可进行搜寻检索,而且可进行实时性的提问。许多国家的研究机构和大学图书馆的网站以及一些学术性的网站,如中国期刊网、学位论文网等更是我们经常利用的。有关史学的一些专业性的网站,如中国历史资讯网、光明历史网、国史探微以及各种断代史、专门史研究网站等也如雨后春笋般出现,大大便利了学者们的研究工作的开展。拿敦煌学来说,据陈爽先生统计目前有关敦煌学的网站资源达32个,相关网站与网页资源16个,如此之多的网络资料,确实为敦煌学研究的发展起到促进作用。另外,论坛也不能忽视。运用论坛进行学术交流是一种新的交流方式,学者们已经逐渐熟悉和适应。现在比较具有代表性的文史方面的论坛有北京大学中国古代史研究中心国史论坛、上海师范大学域外汉文古文献研究中心网站论坛、国学论坛、中国经济史论坛、象牙塔、往复等。
2.计算机 计算机的出现是书写工具上的一次革新,键盘取代了笔杆,无疑使论著写作更加便捷。过去撰写论文、著述,往往用复写纸复写数份,除邮寄投稿外,还须保留底稿,以便今后查核、利用。且不说这几份复写稿是否够用,即使再次利用时,查检文章中某一内容也十分不便。计算机技术则有效地改进了这一传统学术研究中的缺陷。这主要表现在以下四个方面:一是计算机保留的文本是长期乃至可以说是无限时的,需要时就可以输出文本,省去了原来再次抄录的时间。二是它允许作者将保存的资料随意复制全部文本或部分内容,而且可以任意修订,因而为论著写作提供了极大的便利。三是计算机写作速度大大超过手工写作。目前常用的输入法有十几种,如微软拼音输入法、智能ABC输入法、全拼、郑码、王码、智能陈桥输入平台、紫光拼音输入法,甚至还出现了可手写输入的“逍遥笔”。许多输入法还可进行中文简体和繁体的输入及转换。比起手工写作,可谓省时省力,这些都是有目共睹的事实,无须赘述。四是作品的寄送、出版也更加快捷。过去把文章或专著交给杂志社、出版社,大都以邮寄的方式,现在发送Email给对方,安全便捷,还省去一些出版工作环节。
3.研究资料的数据化 随着计算机技术的迅猛发展,我们已经开始进入一个数据化文献时代。所谓数据化文献时代是与传统文献时代对比而言的,传统文献时代是以有形文献(如甲骨文以甲骨、金文以青铜器、书籍以纸张之类)作为主要传播手段,因此研究者只能依靠眼看手记的手工方式进行学术研究,而数据化文献时代则主要以无形化文献(研究资料的数据化)作为传播手段,研究者依靠强大的计算机功能来进行学术研究,摆脱了原始的研究方式。传统的学术研究, 查阅文献、摘抄卡片、添加批注、排比整理,是历史学者搜集、处理所需原始资料的常用方式。学者的首要任务是进行创造性的思维,但资料工作花费了他们一半以上的时间与精力,大大缩短了其学术生命,这是史学研究中的最大浪费。数据化文献时代对传统人文科学与社会科学的发展提出了挑战,利用电脑等手段对中国古籍进行整理、分析和研究,已成为学术界迫在眉睫的工作,也为史学研究的现代化提供了种种便利。电脑检索具有速度快、容量大、准确度高和搜寻范围广的特点,能够高速度、高效率地穷尽史料,可以把学者从枯燥的翻检工作中解放出来,从而把主要精力投入到更深层次的分析比较和理论思索中,以便能准确地把握历史发展的脉络。总之,研究资料的数据化为学者研究带来了莫大的便利,其中包括:文献资料的家庭化、珍贵资料与善本书籍的普及化、研究信息传播的迅速化、资料卡片的有序化、资料检索的准确化及论文写作的便捷化等等。特别值得注意的是,研究资料的数据化为史学研究提供了充分的量化资料,有利于学者利用数理统计的方法进行定量研究,这种计量史学的方法可以应用于许多历史现象发生周期的研究,例如人口增减、物价波动、经济升降、王朝更替、社会盛衰、边界变动、战和交替等。
目前大部分历史学研究资料几乎都已经开始数据化,如文渊阁四库全书电子版、汉籍全文检索系统、二十五史多媒体全文检索阅读系统、国学宝典等等。譬如,《四库全书》是清代乾隆年间官修的规模庞大的百科丛书,它彚集了从先秦到清代前期的历代主要典籍,共收书3400余种,79000多卷,分装36000多册,总字数约9亿。现在的文渊阁四库全书原文电子版只占7个多G的硬盘空间,在保存了原书文献真实性的基础上,还提供完备的阅读及检索功能,它在使用、存放、搬运、价格等各方面的性价比优势是显而易见的。又如,由陕西师范大学历史文化学院开发的汉籍全文检索系统,是史学数字化平台建设的典范,该系统目前已改进为4.20版,收入文史哲类古籍文献2960种,共15.4亿字。其中包括繁简两体《二十五史》、《十三经注疏》、《大正新修大藏经》、《四库全书总目提要》、《通典》、《朱子语类》、《艺文类聚》、《全唐诗(加注本)》、《全唐文》九种,共3.9亿字。该系统对于从根本上改变文史哲研究者的工作手段和条件具有重要意义。
4.知识库 “知识库”是指将数据经过加工整理成知识,并对这些知识以一定的结构加以分类、组织及管理,以供人检索利用的数据集合。体现一种人和知识间的“互动”以及人和人之间的“互动”的理念。如所周知,传统的纸本工具书,包括索引、类编、目录、年表、历史地图等,尽管已经提供了相当多的便利,但是仍然不能摆脱纸本检索工具的种种缺陷,如门类不齐全,排检方式单一,缺少综合条件和渐进式检索方式,无法产生再生资源,只能部分地完成信息查询功能,不能做到海量数据中的知识发现,携带不便等。知识库的开发正是为了解决纸本媒介存在的上述问题,确保信息查询的查准率和查询率,并实现海量信息中的知识发现。
知识库(Knowledge Base)又不同于一般的数据库(Data Base),所谓的数据库就是将数据汇集、整理并加以结构化,以供人检索浏览的数据群。资料是僵硬的、死板的,数据所能发挥的功效视使用人的学养而定,不同的使用者会有不同程度的运用与发挥;相对而言,知识是灵动的、活化的,容易为人所吸收利用的,使用者的程度并不构成吸收或利用上的障碍。以敦煌学为例,目前专为敦煌学建立或者与敦煌学相关的数据库已然不少,已经完成或尚在规划及进行中的如“敦煌学研究论著目录数据库”、“敦煌文字数据库”、“丝绸之路地名规范数据库”、“敦煌吐鲁番学学者档案数据库”、“丝绸之路专题数据库”、“国际敦煌学项目(IDP)数据库”、“敦煌遗书数据库”、“敦煌佛教人物数据库”、“敦煌图像数据库”等等。比较而言,敦煌学知识库的入库范围更加广泛,它不同于任何单个数据库,也不是多个资源库的叠加。2005年11月,由上海师范大学域外汉文古文献研究中心和中国敦煌吐鲁番学会、敦煌学国际联络委员会共同主办的敦煌学知识库国际学术研讨会在上海师范大学召开,提议建立一个可以融通各大数据库、具备跨数据库的检索功能、涵盖敦煌学常识、学识、文物、文献、学术资料、研究成果等理想的“敦煌学知识库”。
历史学研究的新手段当然不只是以上四种,譬如我们还可以利用计算机对某些历史场景进行模拟,通过虚拟复原使研究得到比较直观的参考。海外这一方面的发展已相当成熟,产品相当多,比如《古埃及虚拟旅行大百科》(Egypt Antique 3D 2004 DVD),这一软件可以使人徜徉于古埃及的立体场景之中,随意浏览,好像回到了5000年前。国内也有一些很好的尝试,例如浙江大学计算机科学系与敦煌研究院合作进行的“敦煌石窟虚拟重现与壁画修复模拟”研究,除了利用虚拟现实技术实现了敦煌石窟虚拟展示而外,还利用壁画复原与演变模拟系统完成了壁画图像色彩的数字化复原与历史演变过程的模拟。
最后需要指出的是,计算机虽属智能工具,但毕竟只是工具而已,不能代替人脑。新手段的应用对于历史学研究来说是一把双刃剑,一方面它大大推动着史学研究的深入,另一方面其本身也存在着一些弊端。历史学作为一门规律性的理论研究,最终还要靠人脑的分析和升华。我们只有在重视史学基本功的学习和训练的基础上,把新手段当作一个辅助性的工具,有选择地加以利用,才能使之为历史学研究的开展提供有价值的帮助。
发布日期:2009-08-18