新华每日电讯:跨越“历史天堑”,攻克古籍数字化瓶颈

  新华社北京11月24日电(记者张选杰 李宣良)中华古籍浩如烟海,数字化时代如何让这些承载中华文化的古籍更好地走近普通大众、走向世界舞台?

  转业军人尹小林历经10多年研发成功古籍“自动标点、自动比对、自动排印”三大核心技术,取得中华古籍数字化整理与传播的历史性突破,破解了国学文化走向世界的数字化“瓶颈”。

“三大核心技术”攻克古籍数字化“瓶颈”

  2002年,精通古代汉语与计算机软件的尹小林从第二炮兵转业后,创立,启动国学文献数字化工程。

  尝试、失败,再尝试、再失败……经过无数次挫折,尹小林终于研发成功“自动标点、自动比对、自动排印”三大核心技术,不仅改变了古籍整理、研究的传统模式,更重要的是为古籍数字化打开了一个新的大格局。

  “自动为古籍加注标点,是古籍整理工作者多年的梦想。”中国社会科学院语言所研究员杨成凯说,自动标点技术基于对大规模带标点文本的分析统计,以句型为基础,辅以语法分析和字词切分技术,对无标点的古籍文献自动加上合适的标点符号,使大规模古籍数据整理成为可能。

  校比异文,同样是古籍整理最基础也是最繁琐的工作,不仅耗费大量人力,而且很难杜绝谬误。自动比对技术能自动进行多种版本古籍的逐字比对,显示出文字和符号差异。其利用计算机能对海量文本进行快速查找、匹配,可以显著提升比对的效率。

  自动排印技术可将大型古籍数据库迅速转换为书版文件,解决了古籍生僻字造字、简繁体转换、横竖版式、自动生成索引等多项技术难点,可实现排版、出片、打样、印刷“一条龙”,极大地提高出版效率。

  《四库全书》是中国历史上规模最大的文化宝库,总字数达10亿,用传统方式对其进行标点整理,需500人连续工作100年才能完成。“如果运用‘三大核心技术’,同样的人力,5至8年即可完成这项宏伟的数字化整理工程。”尹小林自信地说。

跨越从传统到现代的“历史天堑”

  “古籍是中国的,是古老的;数字化是世界的,是年轻的。”尹小林说,“我所做的古籍数字化是在跨越一条从传统到现代、从实体书到虚拟网络的‘历史天堑’。”

  尹小林从关注国学文化伊始,就注重对传统文化传播方式的研究。1993年,他利用业余时间借助计算机技术编纂的《汉字数目词辞典》出版后,引起学术界的关注。进入国学研究前沿领域后,他相继开发出《全唐诗》等大型数据库。2003年,他被首都师范大学作为优秀高端专业人才破格引进,担任所长。

  在新的起点上,尹小林开发出大型中华古籍全文检索数据库《》,收录了上起先秦、下至清末的中文古籍文献,收书种类6000余种、总字数近20亿,目前仍以每年新增数亿字的速度扩充。《》是迄今唯一经标点整理、适用于互联网的大型古籍全文数据库,涵盖了单机版、网络版、镜像版和手机版等多种形式。

  为了推出普通群众读得懂的国学书籍,尹小林研发出《国学备览》等普及型电子读物,使古代经典走进了寻常百姓家。他还带领团队成功研发出《十三经注疏》《古代小说典》等一批“国学智能书库”,读者总数超过千万。

  2000年,国内第一个以弘扬中国传统文化为宗旨的公益网站“国学网”正式上线。由尹小林创办的这一网站,目前已发展成为专业水平最高、影响最大的中国传统文化学术型公益网站,为传统文化走向现代架起了一座跨地域、超时空的桥梁。

加快推动中华文化走向国际舞台

  “传统文化是中国发展的坚实基础,也是作为大国的重要标志。”尹小林认为,“中国要成为真正的文化强国,离不开国际社会对中华传统文化的了解和接受。”

  2005年,尹小林接受邀请,前往美国推介传播中国的传统文化。在哈佛大学图书馆,尹小林带来的《》以资料翔实、内容可靠、功能强大、前景广阔等优点得到校方的高度认可。随后,他又携《》走进耶鲁大学、普林斯顿大学等名校,每到一处都刮起了中国传统文化的“旋风”。
  
  2009年,美国国会图书馆和“国学网”正式签约,成为《》的授权用户。随后,日本早稻田大学、韩国仁川大学、德国国立图书馆等机构也慕名而来,《》的用户范围日益扩大……尹小林乘胜追击,在推出网络版的基础上,相继开发出IPAD版、安卓版的《》,将国学文化传播阵地拓展到移动终端上。
  
  在尹小林的积极推动下,北京市重点交叉学科——数字文献学今年正式招收研究生,标志着古籍数字化人才培养走上了健康发展的轨道。以电子文献研究所为平台,首都师范大学已连续主办召开了4届中国古籍数字化国际学术研讨会,不仅取得了令人瞩目的学术成果,还大大加快了国学文化走向世界舞台的步伐。

  

Comments are closed.

Baidu
map