User:Dqwyy/沙盒/1:修订间差异

维基百科,自由的百科全书
删除的内容 添加的内容
无编辑摘要
无编辑摘要
第16行: 第16行:


== 开发 ==
== 开发 ==
2022年3月17日,北京大学数字人文研究中心与字节跳动公益部门联合成立了北京大学-字节跳动开放实验室,识典古籍进行开发
2022年3月17日,北京大学数字人文研究中心与字节跳动公益部门联合成立了北京大学-字节跳动开放实验室,开发识典古籍进行中国古籍的数字化。古籍的数字化分三个步骤,一是使用电子扫描仪将古籍原本扫描成电子图片,二是利用[[光学字符识别]]技术将图片版中的文字转化成文本,并在此基础上进行校对,三是将文本进行整理,使其更加容易阅读

2023年12月9日 (六) 10:13的版本

[1]

[2]

[3]


识典古籍北京大学-字节跳动数字人文开放实验室所开发和运营的一个中国古籍数字化平台,于2022年10月11日上线[4]。平台目前收录了1887部中国古籍,按内容主题分为经部、史部、子部、集部道教部和佛教部六个类别,提供免费阅读和全文检索等功能。

背景

对古籍进行数字化是一项很常见的行动,目前世界上已有不少古籍数字化项目,用于收录版权过期、进入公有领域的作品,如美国的古腾堡计划创建于1971年、日本的青空文库创建于1997年、维基媒体基金会旗下的维基文库创建于2003年等等。而针对中国古籍,也有国学大师网中國哲學書電子化計劃等平台,一些图书馆亦有对部分中国古籍进行数字化,不过或许没有完全对公众免费开放,需要订阅才能访问。

据统计,中国现存约20万种中国古籍,合计约5000万册,其中有数字化扫描的约8万种,有文本数字化的只有约4万种,此外还有约1000万册古籍亟需修复。中国一直在陆续进行中国古籍的修复、整理、保存与出版工作,其中就包括对中国古籍进行数字化,让古籍文本不依赖于纸质介质,更好地保存下来。[4]

作为识典古籍的开发部门之一,北京大学数字人文研究中心认为虽然目前中国内外已有一些古籍阅读平台,但是在方便大众阅读、整理质量、阅读体验等方面仍有很大的提升空间,而将古籍数字化可以更好地保护与利用古籍,向大众传播古籍知识,所以便与字节跳动公益部门联合成立了北京大学-字节跳动开放实验室,以打造内容丰富、使用便捷、免费开放的高质量古籍数字化阅读平台。[5]

开发

2022年3月17日,北京大学数字人文研究中心与字节跳动公益部门联合成立了北京大学-字节跳动开放实验室,开发识典古籍,进行中国古籍的数字化。古籍的数字化分三个步骤,一是使用电子扫描仪将古籍原本扫描成电子图片,二是利用光学字符识别技术将图片版中的文字转化成文本,并在此基础上进行校对,三是将文本进行整理,使其更加容易阅读。在

  1. ^ 王梓. 构建全媒体时代中国叙事体系的文化新表达——以“古籍破圈”现象为例. 记者摇篮. 2023, (03): 54-56. ISSN 2096-3858. 
  2. ^ 天将降大任于是人还是斯人?“识典古籍”里有参考答案. 中国网. 2022-11-02. 
  3. ^ 张贺. 数字化,激活古籍生命力. 人民日报. 2023-10-03. 
  4. ^ 4.0 4.1 高丹. 古籍数字化平台“识典古籍”推出:三年将上线万种儒释道经典. 澎湃新闻. 2022-10-12. 
  5. ^ 识典古籍阅读与整理平台. 北京大学数字人文研究中心.