当前位置:首页 期刊杂志

基于数字人文背景下的古籍数字化研究*

时间:2024-05-04

崔 燚

(郑州图书馆,河南 郑州 450000)

1 背景

数字人文作为21世纪的一个现象级国际话语,以文献数据为根基,以数字化技术为辅,能够帮助文科研究者提高对人文社科文献的研究效率。随着计算机技术的发展及传统人文学科向更深更广领域发展,数字人文应运而生,给新文科建设带来了新的活力与机遇。“河洛古国”考古新发现再一次证明华夏民族创造了丰厚的历史遗产,古文献典籍作为古代文明的有形载体,与非物质文化遗产共同破除历史虚无主义,具有深刻的现实意义。古籍数字化是随着人文学科的科学化而兴起的新的研究领域,与古文献溯源与整理、数字保存与保真、文化保护等息息相关。2007年,国务院办公厅印发了《关于进一步加强古籍保护工作的意见》,要求相关部门从2007年开始,用3到5年时间,对全国各系统的古籍藏护情况进行普查,并制订相应标准,规范工作流程,建立中华古籍联合目录和古籍数字资源库等,实现古籍资源的保护和有效利用。2011年、2012年,文化部印发了《关于进一步加强古籍保护工作的通知》《文化部“十二五”时期文化改革发展规划》等文件,要求各地对古籍保护工作重视起来,强调古籍数字化建设的重要性。2022年,中共中央办公厅、国务院办公厅印发了《关于推进实施国家文化数字化战略的意见》,要求在全面建设社会主义现代化国家新征程的第一个五年计划里,完成文化数字化基础设施,搭建起文化数字化的服务平台,争取在2035年建成国家文化大数据体系,实现中华文化全景呈现及中华文化数字化成果全民共享的远景目标。笔者从数字人文的视角,探讨了古籍相关的理论研究与学科建设的发展趋势。

2 研究现状

2.1 数字人文

数字人文又称为人文计算,笔者在郑州大学搜递系统以数字人文、人文计算为关键词进行检索,获取相关文献1,792篇。相关的统计结果显示,研究主要集中在以下四个方面:一是人文资源相关的数字化研究,二是图书、情报、档案等学科在数字人文背景下的发展转型,三是数字人文相关概念研究,四是数字人文技术层面的相关研究等。

在人文资源相关的数字化研究方面,黄永林探讨了数字化技术在非物质文化遗产保护与传承中的重要作用,赵思渊提出了编制元数据的策略。在图书、情报、档案等学科的发展转型研究方面,刘炜认为人文科学研究正在向以数据为驱动的新型研究模式转型,形成了数字人文研究的新范式;马费成在分析国家社科基金项目的基础上提出档案学数字人文研究、古籍文献的整理利用研究等已成为研究热点;李珊珊认为图书、情报、档案等学科应加强自身构建,改善人们心中对于传统人文学科应需而生的印象,将人文学科重新定义为生产型学科。在数字人文概念研究方面,林施旺追溯了人文计算向数字人文转变的历史过程;王丽华指出了数字人文是多学科共同构成的新研究范式,是人文学科的延伸与发展。在数字人文技术研究方面,刘炜提出了数据驱动的研究范式应在人文学科中得到广泛应用;练靖雯总结了数字人文学者的特点,从平台设计、技术培训及跨学科合作的角度提出了相关数字赋能的对策;蔡迎春提出了相关机构应细化数字人文的相关项目,学习借鉴科研机构的技术经验,加强研究人员的问题意识、学习意识、创新意识、协同意识、共享意识、持续意识等建议。

2.2 古籍数字化

笔者在郑州大学搜递系统以古籍数字化、数字化古籍为关键词进行检索,获取相关文献2,570篇。文献分析结果显示,近年来,我国的古籍数字化工作在理论研究和信息化建设方面取得了实质性进展,如:构建了古籍数字化研究的体系结构,制定了数据库检索系统、书目数据库的标准和规范;实现了国际性的古籍资源合作与资源共享,组建了跨领域跨学科的专业研究队伍。

3 数字人文背景下的古籍数字化研究的意义

3.1 拓宽古文献研究的范围

数字人文学科的建立充分体现了信息时代多学科交叉的特点,推动了古籍数字化管理工作的持续开展。古籍数字化研究有助于拓宽古文献研究的范围,弘扬中华优秀传统文化,推动学术研究的转型发展。

3.2 为研究人员提供便利

在数字人文背景下,相关机构利用现代信息技术对馆藏古籍文献进行数字化处理,建设了各类古籍数字化资源平台,为研究人员提供了便利。

3.3 古籍数字化的专业化与科学化

在数字人文背景下,相关机构利用计算机视觉分析、数据清洗与数据分析、人工智能、物联网等新技术对古籍资源进行整理,推动了古籍数字化研究的持续开展。相关机构还组建了跨学科的数字人文研究团队,加强了古籍数字化资源平台建设,推动了文化产业产学研的深度融合,实现了古籍数字化资源的共建共享,促进了古籍相关专业学科建设的发展。

4 古籍数字化研究存在的问题

目前,古籍数字化研究工作主要存在数字化水平较低的问题。近年来,我国的古籍数字化工作取得了一些成果,但也存在一些问题,如:过度重视纸质形态的古籍文献,相对轻视骨、金、帛、锦等载体的文献;侧重于文史一类的古籍文献。我国古籍数字化水平较低主要体现以下三个方面:一是古籍数字化的开发还处于基础阶段,未完全实现语义内容层面的深度挖掘与高效利用。二是数字化技术有待提高。古籍数字化所依据的文字转换、文本加工、字库、检索等技术还有待改善。以OCR文字识别技术为例,该技术存在扫描识别度低、成本高的问题,无法实现对竖排繁体文字的理想识别效果。三是专业人才培养困难。合格的古籍数字化工作人员不仅需要具备古籍方面的专业知识、掌握计算机信息技术,还需要拥有一定的工作经验。但是,很多古籍收藏机构缺乏这方面的专业人才。针对上述问题,相关机构可采取以下措施:一是加大技术方面的投入与研发力度,推动古籍数字化工作的高效开展。二是从阅读体验的角度出发,重视读者的意见与建议,加强古籍数字化资源平台建设。三是注重人才培养,加强与高校科研机构、出版单位、数字化平台开发机构的交流合作,推动产学研的深度融合。

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!