当前位置:首页 期刊杂志

馆藏民国图书数据库建设探讨

时间:2024-05-04

温 泉

(广西师范大学图书馆,广西 桂林 541004)

1 馆藏民国文献收藏与保存概况

民国文献是指1911年辛亥革命以后至1949年9月新中国成立前所出版的中文图书和报刊。民国时期虽然只有短短的30多年,却是中国历史上政治思想、社会文化发生深刻变革的时期。由于出版业与新闻业的进步和发展,民国文献的出版与发行达到了一个空前的规模。据统计,民国时期共出版图书13.6万种,期刊2.5万种,这些珍贵的文献资料忠实地记录了民国时期中国社会政治、军事、外交、经济、教育、思想文化的方方面面,是研究中国20世纪上半叶社会历史发展的重要原始资料,其重要的史料价值、思想文化价值不在古籍善本之下。

建于1932年的广西师范大学图书馆是广西历史悠久、藏量丰富的高校图书馆之一,我馆所藏民国文献包括图书、期刊、报纸、图谱等,目前分别收藏于样本书库、古籍库、过报库、过刊库等几处,是我馆特色馆藏之一。2006年4月,我馆在广西高校馆中率先进行了民国图书的数字化建设,开启了我馆特色数据库建设之旅。目前已完成民国图书数据库的建库工作,共收录数据231条。

2 建立民国图书数据库的必要性

2.1 保护珍贵文献的需要

民国文献的年代虽距今并不久远,但却是馆藏所有文献中最不易保存,损坏情况最为严重的。由于当时机械造纸工艺落后,造纸材料混杂,使用酸性化学浆纸,使得纸张的酸性强、质量差、保存期短。据2004年国家图书馆完成的 “馆藏纸质文献酸性和保存现状的调查与分析”课题显示,国家图书馆收藏的民国文献老化、损毁现象相当严重,这些纸张的酸碱度平均值低于4.5。我馆也同样存在这一情况,民国图书普遍纸张发黄发脆掉渣,读者每翻阅一次都加大了其损坏的程度。据专家研究,民国时期普通报纸的保存寿命一般为50-100年,图书的保存寿命一般为100-200年。若不采取有效的保护措施,任由其发展下去,民国文献有可能在50-100年内损毁殆尽。如何有效保护民国文献,延长其存世寿命,同时又能方便读者使用,解决保存与利用的矛盾,这是所有收藏有民国文献的图书馆包括我们广西师大图书馆所面临的一个重大问题。我们认为,利用现代信息技术手段,对民国文献进行数字化处理,建立民国文献全文影像数据库,是一个最佳选择。所有民国文献进行数字化加工后,读者可上网浏览,而不必翻阅原件,原件可存入恒温恒湿的库房加以妥善保存,基本与外界隔绝,这样就使民国文献得到有效的保护。

2.2 有利于读者查阅使用

我馆所藏的民国文献为师生学习和研究广西现代史提供了丰富的原始资料,然而破旧不堪的图书、繁琐的借阅手续以及民国图书不能复印等等都给读者查阅民国图书制造了不小的障碍,影响了读者的使用,而建立民国文献数据库就能很好地解决这一问题。读者只需有一台连通校园网的计算机,就能随时随地上网查询。读者可通过书名、著者、主题词、分类导航等途径进行检索,方便又快捷,并且不受复本限制,一次可供多人查询,极大地满足了读者的需求。

2.3 丰富和充实了图书馆的网上资源

在数字化时代的今天,图书馆的信息服务功能得到深化和拓展,各高校图书馆除了购买商业数据库外,也在纷纷进行特色数据库建设,将馆藏特色资源进行数字化处理,联上互联网,提供远程信息服务。在这种大背景下,我馆自建民国图书数据库也应运而生。包括民国图书数据库在内的各种图书馆自建的特色数据库丰富和充实了图书馆的网上资源,是图书馆网上信息资源的重要组成部分,与商业数据库共同构成了图书馆网络信息服务的物质基础。

3 馆藏民国图书数据库的建设

3.1 确定收录范围

我馆自建的民国图书数据库全称为 “馆藏民国广西图书数据库”,为了突出广西的特色,我们确定了这样的收录范围:①广西籍作者的图书。②虽非广西籍,但在广西生活、工作过一段时间的作者的图书。③反映广西民国时期各方面情况的图书。

3.2 电子书的扫描与制作

确定了收录范围后,由工作人员到书库将图书调出来进行扫描制作。我馆自建数据库使用的是清华同方TPI数据库制作管理系统,扫描是在“电子书加工”模块下进行。由于我们制作的是全文数据库,所以图书的每一页包括封面、书名页、前言页、目次、正文、后记页、版权页、广告页、封底等等都要扫描进计算机。扫描时要保持与原书页面内容的一致性和完整性,忠实于原始文献形态,假如某一页只有页码而无任何文字,这一空白页也要扫描,以保持页码的连贯性。由于民国图书普遍发黄,应使用彩色扫描,使图像呈现出古色古香的原始状态。为使图像放大后仍能清晰地显示文字,应使用较高的分辨率,如200或300。由于民国图书普遍破损严重,因此扫描时一定要加倍小心,轻翻轻压,避免造成二次损坏。扫描完成后,须从头到尾检查是否有漏扫的页面及重复扫描的页面,若有,则及时添加或删除。

扫描完成后即进行目录索引的制作,制作目录索引时以扫描的每一页面的内容为依据,如封面、版权页、序言、目次、正文、封底等等,正文的章节一般以该书目次所录的内容为准。目录信息与相应页面的链接要百分之百准确无误,各章节之间的级次要清晰准确。目录索引制作完成后,点击“生成电子书”按钮,则一本完整的民国图书电子书生成完毕,经过网上发布后,在“元数据加工”模块进行标引、分类、检查,至此,一本民国图书的所有数据制作完成,读者即可在网上检索浏览。

3.3 数据库的逻辑组织分析

3.3.1 检索点的选取

标引时所著录的检索点信息是读者检索图书的重要依据。检索点依图书的外部形式特征和内容特征来进行选取,包括书名、著者、出版社、出版时间、主题词、分类号、索书号等项目。民国图书出版年代都为“民国xx年”,著录时须改为公元纪年,如“民国十一年”须著录为“1922年”。

3.3.2 导航方式

导航方式采用分类导航,依民国图书内容属性分为政治法律、经济、军事、文化教育、文学、历史地理、综合七大类。分类导航是读者检索图书的重要途径之一,读者可通过分类导航方式查找到七个大类中某一类的所有图书。

3.3.3 检索与浏览方式

我馆所建的民国图书数据库具有便捷的检索与浏览功能。读者可通过“初级检索”及“导航”两种方式进行检索。在“初级检索”中,读者可将“书名”、“作者”、“出版社”、“出版时间”、“主题词”、“分类号”、“索书号”等其中之一作为检索词输入检索字段,从而检索出所需的图书,点击某一本书,则可实现该书的在线浏览。另外,读者还可以通过分类导航的方式检索到某一主题的所有图书,比如点击“政治法律”,则所有该主题的民国图书都显示在屏幕上,点击某一本书,同样可实现该书的在线浏览。读者在浏览电子书时可通过鼠标拖动滚动条,就如同翻阅一本真正的书一样,从头到尾一页一页地阅读该电子书,也可通过点击目录索引,直接跳转到所要查阅的章节。由于考虑到版权问题,该数据库只提供在线浏览,不能下载数据。

4 对建设民国图书数据库的几个问题的思考及做法

4.1 版权问题

我国现行著作权法第二章第二十一条规定:公民的作品,其发表权、使用权和获得报酬权的保护期为作者终生及其死亡后五十年,截止于作者死亡后第五十年的十二月三十一日;如果是合作作品,截止于最后死亡的作者死亡后的第五十年的十二月三十一日。民国出版物距今不足百年,很大一部分作者去世不满五十年,其作品尚在著作权保护期内,我们将其作品数字化,按理应当得到原始著作权人的继承人的授权,但是,以图书馆的力量,是不可能一一查明这些继承人而得到他们授权的。为此,我们采取这样的办法来解决版权问题:①通过设置IP地址段,把数据库的使用范围控制在图书馆局域网内。缩小传播范围,也就减少了产生版权纠纷的风险。②利用“合理使用”原则。所谓“合理使用”,是指在法律规定的条件下,不必征得著作权人的同意,也不必向其支付报酬,基于正当的目的而使用他人著作权作品的合法行为。我馆自建民国图书数据库,其目的是为学校的教学科研服务的,并非为了商业牟利,因此可视为合理使用。③利用著作权法中的有关规定。著作权法第二章第二十二条规定:图书馆、档案馆、纪念馆、博物馆、美术馆等为陈列或者保存版本的需要,复制本馆收藏的作品,可以不经著作权人许可,不向其支付报酬。这一条款同样适用于民国图书数字化工作。综上所述,我馆为教学科研目的将馆藏民国图书数字化,自建民国图书数据库这一行为合理合法,是不会产生版权纠纷的。

4.2 自身权益问题

图书馆在遵守著作权法的同时也要注重自身权益的维护。民国图书数据库是我馆花费了很大的人力物力财力及技术力量自建的特色数据库,凝结了馆员的辛勤劳动,数据库的内容、结构、编排具有独创性,因而也应当受到版权保护。为此,我馆采取了设置IP地址段,控制数据传播范围,只提供浏览不提供下载等措施来防止数据被人恶意下载,恣意传播,以维护自身权益不受侵犯。

4.3 数据安全问题

互联网上往往存在着诸多不安全因素,如病毒攻击、软硬件故障等,若不加以防范,在网络上传播的数据面临极大的风险,因此,做好数据备份,防止数据丢失是我们要考虑的一个重要问题。为此,我们将所有民国图书数据刻录了一套光盘,作为备份的数据保存下来。这样,即使网上数据出现问题导致无法浏览,我们仍有一套备用的数据可供读者使用。这就保证了民国图书数据不至于丢失,为读者查阅使用提供了保障。

[1]孙琴.民国文献数字化建设现状分析研究[J].山东图书馆季刊,2008(1):71-73.

[2]钱承军.高校图书馆应重视对民国文献的保护与利用[J].山东图书馆季刊,2008(1):74-77.

[3]许彤.浅谈民国文献保护 [J].重庆图情研究,2009(2):46-47.

[4]汪帆.浙江图书馆民国文献保护利用现状及对策[J].图书馆研究与工作,2008(2):64-65.

[5]万华英.民国文献数字化建设--以重庆图书馆为例[J].四川图书馆学报,2008(4):31-33.

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!