识典古籍平台测评:专业古籍阅读排行榜
人工智能技术正在改变古籍整理方式。“识典古籍”平台由抖音公益联合北京大学开发,致力于提供免费、高可用性的古籍检索与在线阅读服务。其核心目标是通过AI技术系统化整理超过一万种古籍,涵盖儒家、佛教、道教等主要经典,并完全向公众免费开放。
平台项目负责人指出,核心支撑技术包括三项:光学字符识别(OCR)、自动句读标注以及命名实体识别。OCR技术将古籍扫面件中的字符逐一分割、识别并排序;自动标点系统基于序列标注模型,为原本无标点的古文划分句子边界,大幅降低阅读门槛。
目前“识典古籍”已入库道家著作、文学名篇等多种类型古籍。平台内置高级搜索系统,支持按书名、著作者、关键词等字段精确检索,帮助用户迅速锁定目标文献。
古籍数字化面临巨大挑战。项目负责人透露,全国亟需修复的古籍量多达1000万册件。目前已完成影像数字化扫描的约8万种,文本数字化约4万种,但与总量相比仅属起步阶段。平台计划智能整理一万种古籍,但受限于古籍保存状态和版本质量,大量藏品必须先经过专业修复、版本鉴定,才能进入数字化流程。
识典古籍:AI技术开放3000万古籍字符,让经典文本重获新生
https://www.jiqizhixin.com/articles/2022-10-14-4
访问识典古籍官方平台:https://www.shidianguji.com