滚轮或键盘方向键切换页面 ↓
📚

古籍智能整理平台

AI赋能·众包协作·开放共享

基于人工智能与众包模式的全流程古籍智能整理平台,让珍贵文化遗产在数字时代焕发新生。

0
种古籍已完成数字化
0
OCR识别准确率
0
参与众包校对
0
公益免费开放
🔗
访问识典古籍平台 开始体验古籍智能整理

平台设计理念

📖

阅读平台:三大特色

左图右文创新
左侧原始图像 + 右侧标点横排文本
开放共享
所有成果永久免费,面向全球用户
易用设计
繁简转换、全文检索、实体关联、AI助手
⚙️

整理平台:人机协同

AI负责
文字识别、标点初标、实体识别、版式分析
人工负责
疑难判定、错误校正、复杂语境、学术把关
人机协同
AI提升效率,人工保障质量
识典古籍平台界面

识典古籍平台首页界面

众包模式与理念

核心理念:民主化参与

打破专业壁垒,全民参与文化传承

👨‍🎓

线上实习生团队

古籍专业学生

核心文献精细化整理

📝

"我是校书官"

上千所高校

上万名学生参与

累计校对数亿字

精校进阶组

资深志愿者

能力认证、质量把关

智能整理全流程

OCR校对
结构整理
文字精校
多版本校勘
标繁校正
标点校对
实体校对
译文校对

AI整理

快速发布

先让大众利用

粗校

文字校对

重要文献

精校

全面校对

核心典籍

数据批量处理与人机协作

统一标准 借鉴儒藏项目
自动化工具链 批量识别、标点、检测

AI赋能阶段

  • 图像预处理 98%+
  • 文字识别 96-97%
  • 智能标点 >90%
  • 实体识别 近98%

人工增强阶段

  • 疑难字词判定
  • 复杂语境判断
  • 版本校勘
  • 最终审核
文字录入 提升千万倍
整体周期 300年 → 二三十年

古籍智能整理方法

1

AI整理

快速建设基础资源

数日-数周完成

已完成4万+种

2

批量加工

线下数据快速导入

CADAL:25万册书影

3

精校加工

平台精细化处理

出版级别标准

4

众包校对

"我是校书官"模式

数万人参与

创新技术:自动比对校对法

参考文本自动比对
多版本自动校勘 10倍+
参考标点自动比对
四种智能整理方法流程

四种古籍智能整理方法工作流程

元数据设计与标准制定

技术优势与创新

四大优势

高效处理

效率提升10倍以上

🎯

精准识别

OCR 96-97%
标点 >90%
实体 近98%

👥

众包协作

多层次质量保证

🛡️

质量保障

AI + 多重人工校验

四大创新

平台创新

双平台一体化(阅读+整理)

模式创新

人机协同 + 众包参与

技术创新

专用OCR模型、智能标点算法

理念创新

公益开放、社群培育

借鉴与超越

儒藏经验借鉴

批量整理 AI批量处理
存真原则 图文严格对照
校勘原则 自动校勘支持

五类数据库借鉴

✅ CBETA:TEI XML标准
✅ 爱如生:图文对照
✅ 籍合网:阅读功能

创新超越

横排标点文本 整理平台开放 众包协作 公益开放

国际合作与资源共建

🏛️

哈佛燕京图书馆

9,600+种 善本古籍

无偿捐赠 + 技术加工 + 成果回馈

延续1930年代引得编纂处传统

🏛️

普林斯顿大学

古籍书影捐赠

类似合作机制

📚

CADAL项目

25万册 古籍书影

5年合作,可延续

学术乃天下之公器

资源共享,惠及全球 | 互利共赢,公益访问

国际合作机构

识典古籍与哈佛燕京图书馆合作签约仪式

整理成果

4万种古籍
已完成数字化

基础工具书

  • 四部丛刊(468种)
  • 百衲本二十四史
  • 四库全书(3500种,全部标点

宗教典籍

  • 汉文大藏经(6种版本)
    OCR 99%+,标点 90%+
  • 藏外道书(填补空白)

域外汉籍

  • 哈佛燕京善本(9,600种)
  • 敦煌文献(法藏+英藏)
  • 日本内阁文库

专题文献

  • 明清实录、古今图书集成
  • 四库全书总目提要
  • 红楼梦各版本
基础工具书 → 专门研究文献 → 特藏珍稀文献
代表性成果展示

古籍智能整理代表性成果展示