English

龙语瀚堂典籍数据库助力中国古籍电子化

2006-05-10 来源:中华读书报 作者:记者 张振胜 我有话说

本报讯 “困扰公安部户籍管理的生僻字、古字问题,在技术上已被解决。龙语瀚堂典籍数据库系统的四字节编码核心技术彻底突破了古籍整理和研究中生僻汉字数字化的瓶颈,目前可处理汉字数达到7万之多。”北京龙戴特信息技术有限公司总经理张帆日前透露,他所说的该项技术目前已经成功地应用于中国古

籍数字化整理中,最具代表性的应用是中国社会科学文献出版社出版的《说文解字》和即将出版的《康熙字典》,“这两部典籍生僻字出现频率极高,该项技术在古籍数字化领域的成功应用,使我们相信目前二代身份证所遇到的姓名、地名中生僻字管理的问题将迎刃而解。”该项专利技术不仅可以对龙语瀚堂典籍数据库现有的古籍自动累加,也可以由用户自主添加各种图书资料。无论是单位还是个人,都可以通过它建立一个与自己研究领域相关的专业数据库。比如说出版社可以利用它将历年出版的书籍整理成库,在弹指间查出某篇文章甚至某个人某句话在书中的出处、前后语境等。

龙语瀚堂典籍数据库系统另一个应用上的代表是《龙语瀚堂典籍数据库》(www.dragoninfo.cn),它收录了“字书类数据库”、“殷周金文库”、“音韵库”、“中国简帛库”、“甲骨文库”等13类子库几百万条数据记录,涉及字书典籍、出土文献和传世文献。在此之前,这些内容由于四字节处理技术瓶颈未被突破而无法在计算机平台上实现数字化。据悉,该数据库已经在国内百余所大学的中文系、历史系、考古系及汉学研究机构得到广泛应用。

手机光明网

光明网版权所有

光明日报社概况 | 关于光明网 | 报网动态 | 联系我们 | 法律声明 | 光明网邮箱 | 网站地图

光明网版权所有