English

学术研究和古籍数据库

2005-01-18 来源:光明日报 作者:林夕 我有话说

近十几年来,随着计算机软硬件技术的飞速发展和全面普及,在各方面人士的努力之下,已经研制出许多功能强大的古籍数据库,对学术研究有不可估量的推进作用。对此,不仅学术界,凡是跟古文献打交道的人士,都不能不给予特殊的关注。

我们知道,学者做学问出成绩的本钱是“腹笥”,就是肚子里装的文献资料。

称赞某人记诵渊博,就是说他肚子大,里面装的书多。再加上联想能力,遇事查查肚子里的资料,无所不知,这就是令人羡慕的大学问。王蘧常先生的《自传》说当年在大夏高师任国文系主任时,有学生在某处任高中教员,有人问归震川《思子亭记》“汉有太子,死后八日周行万里,苏后自述,倚尼渠余,白璧为质”一段的典故出处,到处查阅,毫无所得,事关学校声誉,不能不向王先生求助。王先生正巧在读《晋书》,知道此事出在《晋书》,为学生解了围。学生大喜,极称博学。王先生记这件事,并不讳言典故难以周知,有时眼前的书也会忘记。现在有各种古籍数据库,查找典故出处非常方便。像这个典故,若用《文渊阁四库全书全文检索》数据库,一二十秒就可以查到出处,毫不困难。

古代文献浩如烟海,学者有怎样的腹笥,也是“鼹鼠饮河,不过满腹”而已,未见的典籍还是多数。即使读过,偶然失记,也是人之常情,可以谅解。然而,尽管如此,学者偶然出现失之眉睫的疏漏,在佩服他人渊博时,自己内心还是有难言的尴尬和遗憾。现在我们有《四库全书全文检索》、《四部丛刊全文检索》、《国学宝典》以及其他已经面世和即将面世的大型古籍数据库,就不会出现这种情况。

传统作古籍整理笺注工作,经常要引证前人有关的文献,注明典故出处,古人诗文尤其乐于用典。为之作笺注,主要工作是注明其中使用的词语和出典。以往主要借助于《佩文韵府》、《骈字类编》、《渊鉴类函》等类书,晚近则有一些索引可以帮忙。然而这些书涵盖的文献毕竟有限,检索也不方便。像《佩文韵府》和《骈字类编》等本身也需要另编索引,帮助检索。而《渊鉴类函》等类书还没有完备的索引可用。现在这些类书本身就包括在《四库全书》之中,要查其中的字词和语句,使用《四库全书全文检索》瞬息即得,十分方便,比使用原书快捷得多。《四库全书》包含的三千四百多种古书有七亿汉字,《四部丛刊》也接近一亿,《国学宝典》包含的资料超过八亿汉字。在这样浩瀚的文献中检索资料,利用数据库唾手可得,学者引为臂助岂不是如虎添翼?一个人即使有超人的博闻强记,也望洋兴叹。

朱寿彭的《安乐康平室随笔》曾记京师一家酒肆悬一额“推潭仆远”,无人知其意。传闻老辈说语出《汉书》,朱氏就《汉书》反复查找不见踪影,后来发现在《后汉书》中。同书记前人制酒令,要求使用《四书》中仅出现一次的字。只凭一个人的记忆,这可是难题。朱氏为此特地翻阅《四书》,把出现一次的字逐一录出,共六百字。不难想见,朱氏为此付出了多少劳力。而利用古籍数据库做这些事情就易如反掌,前者用《四库全书全文检索》或《国学宝典》是几秒钟的事情,后者使用《国学宝典》统计字数的功能也很便捷。

查找一个字词或者一小段连续语句的出处,这是数据库最基本的功能。《安乐康平室随笔》中还记下了古人若干堂室名称用典隐晦,那些用典并不是连续文字,例如“道荣堂”出于《管子》“此谓道之荣”等。要查找不连续的字词,需要使用《国学宝典》的多条件检索功能,我们可以要求“道”和“荣”出现在同一个小句中、同一个大句中或者同一段中,还可以指定二者出现的顺序。这是《国学宝典》的一个值得称道的功能,对查找典故有巨大作用。

学人读书搜集材料时,发现有用的资料,随时录在卡片上,积少成多,排比卡片就能写出有内容的论著。用人力来做,显然需要长年累月涓滴不息的功夫。然而如今《国学宝典》有一项自动制作卡片的功能,这项功能十分有用,它能把数据库所收的文献中含有某字词或某语句的段落一段段截取下来,逐一注明出处。这简直就是在瞬息之间代替我们阅读了海量的文献,节省了大量人力。

古籍数据库的用处十分广泛,它对学术研究的影响不可估量,它可以完成许多过去必须由人来做的学术工作。它优游为之的查找字句的功能,可以代我们查找某一种古书散佚在历代文献中的语句,这对古书辑佚和校勘十分有用。它辑录卡片的功能可以帮助我们追踪字词的历史演变的轨迹,这为编纂真正按照历史原则的汉语字典和词典―――像举世闻名的《牛津英语大词典》那样―――提供了必要的条件。展望未来,这是多么令人鼓舞的广阔前景啊!

手机光明网

光明网版权所有

光明日报社概况 | 关于光明网 | 报网动态 | 联系我们 | 法律声明 | 光明网邮箱 | 网站地图

光明网版权所有