滚轮或键盘方向键切换页面 ↓
我是校书官

我用AI校古籍

“我是校书官”古籍大众智能整理计划

0 参与高校
0 参与人次
0 整理文字数

项目简介

"我是校书官:古籍大众智能整理计划"是由全国高等院校古籍整理研究工作委员会主办,北京大学数字人文研究中心、字节跳动公益联合承办的古籍数字化保护与传承项目。于2024年7月启动第1期,2024年9月启动第2期。2025年第3期启动时改名为:“我用AI校古籍:我是校书官古籍大众智能整理计划”,同时联动 22 所(含清华大学、武汉大学、中国人民大学、中山大学、四川大学等)作为承办高校。

借助识典古籍智能整理平台,利用人工智能技术实现全流程古籍整理工作,涵盖OCR文字识别、自动标点、自动分段等多种功能。通过人机协作的方式,使高校学子和社会大众能够参与到古籍整理工作中,为古籍人才培养提供实践机会,探索专业教育与社会参与融合的新模式。

平台功能

  • OCR文字识别
  • 自动标点断句
  • 智能分段处理
  • 文本比对校对
  • 结构化整理
识典古籍平台界面

大众组 vs 进阶组

两种不同的古籍整理参与模式对比

🎓

进阶组

具备文史哲背景的专业人士
文字精校 文本比对技术,校对错误文字
标点校对 AI自动标点结果人工审核修正
结构整理 书籍标题、段落结构整理
实体标注 识别标注书目名称等实体信息

质量控制流程

1
系统比对
2
人工精校
3
二级审核
4
专家终审
正式上架

AI赋能古籍整理平台

运用人工智能技术实现全流程古籍整理,涵盖OCR识别、自动标点、智能分段等功能

识典古籍平台界面
🖥️ 识典古籍平台

智能化古籍整理工作台,集成OCR识别、文字校对、标点断句等核心功能

古籍选目界面
📋 古籍选目

组织专家精选古籍书目,尽量选取大众喜闻乐见的古籍

工作内容

通过AI技术与人工协作,构建高效的古籍整理体系

三期成果展示

里程碑成果 · 累计突破

📝
15亿+
整理文字总数
🏫
1,500+
参与高校总数
👥
40,131
累计参与人次
🏛️
7,000+
哈佛燕京古籍

三期发展历程对比

从试点探索到规模化运营的跨越式发展

指标
第一期(2024.7)
第二期(2024.9-12)
第三期(2025)
增长率
参与高校
724所
1,210所
1,500+所
+107%
参与人次
2,549人
10,129人
27,453人
+977%
整理字数
4,490万
约4.1亿(大众+进阶组)
超11.1亿
+2,370%
完成古籍
约250部(估算)
1,643部
13,661部
+5,364%
传播曝光
392万+
15亿+
25亿+
+6,275%

特色成果亮点

📖
《四部丛刊》专项
400部+
标点精校整理
📚
《永乐大典》专项
813卷
残卷综合整理

参与高校与人员构成

高校覆盖统计

第一期
724所
本科院校568所
第二期
1,210所
双一流学校116所
第三期
1,500+所
全国覆盖

第三期承办高校

🏛️

985/211高校

清华大学中国古典文献研究中心 武汉大学文学院 中国人民大学国学院 中山大学文学系(珠海) 四川大学文学与新闻学院
📚

专业特色院校

天津师范大学古籍保护研究院 北京中医药大学中医学院 江南大学文学院 暨南大学文学院

人员构成分析

多元化参与群体,跨专业深度融合

🎓

学历分布

普通本科 89.48%
研究生参与
博士生贡献
⚗️

专业分布

古籍相关 44%
跨界参与 56%
🌟
双一流高校
7.06%
占比虽小但人均贡献值数量较高
🔬
跨专业参与
56%
医学、金融、工科等多领域融合

进阶组成果

二期进阶组:《四部丛刊》

2024.9-12
194 报名人数
166 参与人次
169部 正式上架
📖 探索标点校对新模式
🎯 二级审核体系

三期进阶组:《永乐大典》

2025
324 报名人数
166 参与人次
813卷 正式上架
📖 三重校对标注
🎯 最大还原原貌
📈
2451万字
第二期:《四部丛刊》精校文字
📚
813卷
第三期:《永乐大典》残卷整理
🎓
320+人
精选专业志愿者
成果展示界面
进阶组整理成果展示界面

质量保障体系

🔍
志愿者互审
👨‍🏫
专家终审
质量确认
📚
正式上架

课程建设

识典古籍智能通识课

识典古籍智能通识课

📚
从甲骨到AI的古籍穿越
主讲:杨浩
📜
中国古代大型典籍全攻略
主讲:刘蔷
🌏
那些散落在海外的中国古籍
主讲:杨海峥
✏️
一堂课学会古籍整理
主讲:廖可斌
🤖
古籍整理的AI黑科技
主讲:杨浩
古籍智能整理实训课

古籍智能整理实训课

👨‍🏫 主讲:北京大学杨浩老师
📖 系统性8讲课程
🎯 掌握古籍整理全流程操作
1️⃣ OCR文字识别技术与应用
2️⃣ 文字精校方法与技巧
3️⃣ 结构整理标准与流程
4️⃣ 标点校对规范与实践

多元激励措施

激励机制体系

在平台上获取贡献值,逐步获得校书官更高级别(基于唐代秘书省职官体系设计):

Lv1 秘书正字
Lv2 校书郎
Lv3 秘书郎
Lv4 著作佐郎
Lv5 著作郎
Lv6 秘书丞
Lv7 秘书少监
Lv8 秘书监
Lv9 秘书令
权益等级体系

多种激励方式

实践证书 激励文创产品 激励文创产品 “青史”留名
📜
实践证书
助力升学就业
🎁
文创周边
定制文创产品纪念
💰
现金奖励
进阶组根据工作量发放津贴
🏆
“青史”留名
在平台上对应书下永久记录人名

北美东亚图书馆藏汉籍数字化整理计划

哈佛燕京善本专题门户

哈佛燕京图书馆合作项目

🌐
专题门户网站上线
2025年4月正式启动
📚
7,000余种特藏古籍
完成全部数字化整理工作
🤝
馆长杨继东捐赠
全部中文善本古籍数字化扫描
北京大学数字人文中心获得多所大学古籍数字化书影捐赠
北京大学数字人文中心获得哈佛大学、普林斯顿大学古籍数字化书影捐赠
🏛️
多校合作
哈佛、普林斯顿等顶尖高校
📚
数字化书影
珍贵古籍资源共享

项目意义

🏛️
文化回流
实现海外中文古籍数字化回流
🌍
国际合作
中美古籍保护领域的重要合作成果
📖
学术价值
为学术研究提供珍贵文献资源

关于我是校书官

承办单位