中国最早古籍大全,中国最原始的古籍有哪些

#北大联合字节在线免费古籍阅读平台#

近日,“北京大学-字节跳动数字人文开放实验室”研发的古籍数字阅读平台“识典古籍”测试版正式上线。 该平台覆盖390个经典古籍,主要来自《四部丛刊》,共计3000多万字,即日起向公众免费开放。 在很多人的印象中,古籍文本往往很费解,接触机会很少。 在数字时代,这种情况正在改变。 通过现代技术将书籍数字化呈现,让海量的古代书籍“复活”,让尘封已久的文字再次跃动,成为人人触手可及的道具和数据库。 近年来,OCR (光学字符识别)、AI ) (人工智能)、知识图谱等技术的快速发展使古籍数字化成为更多的可能。 几家科技公司与专业机构和科研院校合作,有效地沟通和融合了技术优势和专业知识,积累了比较成熟的技术和经验。 这些技术支撑着当今《古典古籍》的测试版,成为更多古籍数字化的起点。 未来三年内,“北京大学-字节跳动数字人文开放实验室”将陆续完成10000种古籍智能化整理工作,基本覆盖儒家、道家、佛学核心典籍目录。

《古典古籍》测试版网站主页

为什么古籍保护需要更加开放? 古籍作为中华民族文化传承的重要途径之一,记载着许多中华民族文化形态和发展历史。 但由于王朝更迭、战争、自然灾害、年代久远等原因,大量古籍丢失或被破坏。 2007年,《中华古籍保护规划》实施至今已有15年。 经过全国古籍调查,每个古籍都有“身份证”,研究人员还发现了一批珍贵文献,包括《永乐大典》“湖”字簿。 收藏环境方面,全国1000多家古籍收藏机构仓储条件得到改善,2000多万册/件古籍得到妥善保护。

古籍修复师在工作

2023年的现在,人们阅读古籍和寻找资料的习惯和场景越来越多地转移到网上。 同时,普通读者对古典作品的兴趣也越来越高。 今年初,98岁的古籍版本目录学家沈燮元在纪录片中备受瞩目,走红网络。 嘀嘀打车中,国家图书馆副馆长、国家古籍保护中心副主任张志清、国家图书馆古籍修复专家杜伟生、故宫书画修复专家沈洪彩等通过短视频介绍了传统经典作品的保护和修复工作,让更多的人了解了它的知识和意义。 但是,古籍保护工作仍然任重道远。 据“了解古典古籍”项目负责人介绍,目前急需修复的古籍已达1000万册/件。 20万种古籍中,已有8万种完成了图像数字化扫描,约4万种完成了文本数字化。 古籍修复工作人力成本高,培养专业修复人员需要极高的时间成本,古籍数字化工作也面临资金缺口大、技术难度大等困难。 在社会各界的努力下,出现了一批数字化古籍平台,包括中国哲学书籍电子化计划( Chinese Text Project )、图书同文古籍数据库等。 这些平台有各自的优点,但也有局限性。 同文古籍数据库收费较高,普通读者不能随时随地阷览使用。 中国哲学书籍电子化计划目前覆盖了3万多部著作,但无法解决基本问题,用户往往无法访问。 在这样的背景下,开始出现更加开放的合作与探索。 在开放合作下的新趋势文物保护和传承过程中,文保机构、科研院校和科技公司的跨境合作越来越普遍,宝贵的古籍、专业团队、先进技术由此汇聚。 2023年,半导体公司英特尔与中国文物保护基金合作,启动了利用3D建模和AI识别修复长城的项目。 2023年3月,腾讯联合敦煌研究院为壁画修复和保护开发了AI病害识别技术。 2023年5月,阿里巴巴公益基金联合四川大学、美国加州大学伯克利分校、中国国家图书馆等,推出“汉典重光”古籍平台,将一批加州大学伯克利分校收藏的中文古籍善本数字化该平台覆盖的古籍数量为20万页。 从2023年6月开始,字节跳动联合国家图书馆等机构、中国文物保护基金会等在古籍修复、激活、数字化等领域开展了一系列合作,包括捐赠1000万元、共同设立古籍保护专项基金等,向着修复100多本珍贵古籍的方向发展。

字节跳动古籍保护专项基金启动现场

2023年3月17日,北京大学与字节跳动合作成立“北京大学-字节跳动数字人文开放实验室”,致力于开发开放的“古籍数字化平台”,将人工智能和大数据应用于海量古籍文献,实现古籍内容的智能整理和古文字近期上线的“经典古书”平台测试版是这一合作的最新进展。 项目负责人介绍,该平台主要使用字符识别、自动标点、命名实体识别三种技术。 文字识别技术是对古籍影印版文字进行单一的切分、文字识别、顺序识别。 自动标点符号技术是对古籍以顺序书写方式自动分割标点符号的技术。 命名实体识别是对古籍文本中的命名实体进行顺序标识,帮助识别人名、地名、书籍、时间、官职等信息。 目前,业内OCR识别准确率平均为93%至94%,“古典古籍”准确率为96%至97%。 同时,这些先进技术也离不开人的支持。 北京大学数字人文研究中心主任王军表示,北大此次合作将联合各高校学者和文献专家,负责人工(审核 )和校对,弥补人工智能识别错误率的短板,利用独特的学术平台,连接更多专业研究者和学生群体。 该平台的测试版对所有用户免费开放,在数字化文本内容之外,提供充分权威的副本作为参考,同时提供主题词检索和繁体字转换功能,使专业研究者、古籍爱好者更加高效便捷同时,《古典经典》测试版也存在一些不足。 例如,经典的数量相对较少,需要进一步降低标点符号的错误率。

《古典古籍》测试版页面

接下来,“北京大学-字节跳动数字人文开放实验室”将通过人工智能技术,实现全自动整理校对,借助全社会力量,更高效地实现存量古籍全部数字化。 同时,《古典古籍》向全社会开放古籍阅读检索研究能力,帮助古籍文化传承和传统文化研究。 编辑:段雅露

动态分享

2023年优秀作品:封绘CG RG Shazabigada模特大片

2022-12-12 8:46:08

动态分享

2023年虚拟主播将与冬奥会挂钩?突破二级天花板,科技感。

2022-12-12 8:48:16

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索