详细内容_页头
 
当前位置:中工网人物频道时代先锋-正文
转业军人尹小林:破解古籍数字化“瓶颈”
//www.workercn.cn2013-11-24来源: 新华网
分享到:更多

为了中华文化走向世界

——转业军人尹小林破解古籍数字化“瓶颈”记事

    新华网北京11月24日电(记者 张选杰 李宣良)中华古籍浩如烟海,数字化时代如何让这些承载中华文化的古籍更好地走近普通大众、走向世界舞台?

    转业军人尹小林历经10多年研发成功古籍“自动标点、自动比对、自动排印”三大核心技术,取得中华古籍数字化整理与传播的历史性突破,破解了国学文化走向世界的数字化“瓶颈”。

    “三大核心技术”攻克古籍数字化“瓶颈”

    2002年,精通古代汉语与计算机软件的尹小林从第二炮兵转业后,创立北京国学时代文化传播股份有限公司,启动国学文献数字化工程。

    尝试、失败,再尝试、再失败……经过无数次挫折,尹小林终于研发成功“自动标点、自动比对、自动排印”三大核心技术,不仅改变了古籍整理、研究的传统模式,更重要的是为古籍数字化打开了一个新的大格局。

    “自动为古籍加注标点,是古籍整理工作者多年的梦想。”中国社会科学院语言所研究员杨成凯说,自动标点技术基于对大规模带标点文本的分析统计,以句型为基础,辅以语法分析和字词切分技术,对无标点的古籍文献自动加上合适的标点符号,使大规模古籍数据整理成为可能。

    校比异文,同样是古籍整理最基础也是最繁琐的工作,不仅耗费大量人力,而且很难杜绝谬误。自动比对技术能自动进行多种版本古籍的逐字比对,显示出文字和符号差异。其利用计算机能对海量文本进行快速查找、匹配,可以显著提升比对的效率。

    自动排印技术可将大型古籍数据库迅速转换为书版文件,解决了古籍生僻字造字、简繁体转换、横竖版式、自动生成索引等多项技术难点,可实现排版、出片、打样、印刷“一条龙”,极大地提高出版效率。

    《四库全书》是中国历史上规模最大的文化宝库,总字数达10亿,用传统方式对其进行标点整理,需500人连续工作100年才能完成。“如果运用‘三大核心技术’,同样的人力,5至8年即可完成这项宏伟的数字化整理工程。”尹小林自信地说。

    跨越从传统到现代的“历史天堑”

    “古籍是中国的,是古老的;数字化是世界的,是年轻的。”尹小林说,“我所做的古籍数字化是在跨越一条从传统到现代、从实体书到虚拟网络的‘历史天堑’。”

1 2 共2页

[保存]     [全文浏览]     [ ]     [打印]     [关闭]     [我要留言]     [推荐朋友]     [返回首页]
详细内容_右侧栏目
详细内容_页尾

中 工 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用
Copyright © 2008-2011 by www.workercn.cn. all rights reserved
浏览本网主页,建议将电脑显示屏的分辨率调为1024*768