|
摘要:古籍文献以统一、规范、灵活的数据库形式整合出版,打破了散乱慢的旧局,利于学术研究、学习应用。从出版角度看,古籍数据库也是优质内容资源与数字出版形式结合的典范,既有利于古籍文献的保护与传承,也适合持续运营与滚动发展。本文结合《汉籍数字图书馆》探究分析了古籍数据库出版的背景意义、出版运营、比对研究以及存在的问题与发展趋势等。
关键词:汉字古籍 数字化 数据库出版 古籍再生保护 出版运营 汉字古籍是中华文化的基本载体,据国家古籍保护中心普査数据显示,传世的大约有三十多万种。这些古籍分散在各级图书馆、研究收藏机构及民间各处,存在收藏保护难、研究应用难等问题。许多古籍状况堪忧,保护追在眉睫。而馆藏古籍作为镇馆之宝,在使用上亦存在诸多限制,既不便利,成本也高。数字化可以很好地解决古籍文献收藏、复制、传播的问题,调和古籍保护与利用之间的矛盾。
本文拟结合大型汉字古籍数据库产品《汉籍数字图书馆》(以下简称“汉籍”)的出版运营,对古籍数据库出版的背景意义、出版运营、比对研究,以及存在的问题与发展趋势做一个探究分析,以期为中小型出版社特色数据库出版提供参考。
一、数字化是古籍再生保护的重要方式
1.古籍保护与利用
古籍文献保护包括原生性保护和再生性保护两个方面。古籍文献原生性保护主要是指古籍修复与保存;古籍文献再生性保护主要是指古籍整理出版 (印制) 和数字化。保护是为了研究,研究是为了传承和利用。从传播应用的角度看,古籍数字化是古籍文献再生保护与传承的重要方式之一,能够有效解决古籍保护与利用的矛盾,促进典籍研究与文化传承,比其他方式更灵活、更具优势。
2.古籍数字化
古籍数字化不仅包括古籍原版图像扫描数字化、古籍文献全文数字化,也包括古籍文献整理、文献编目、文献管理、研究应用的数字化。全国古籍普査登记是全国范围内古籍保护的基础性工作,已初步建立起统一的数字化馆藏信息与普査编目。国家图书馆在“中华古籍保护计划”的框架内,已完成约三万多种古籍数字影像资源建设。但要全面整合全国三十多万种以及大量散落海外的汉字古籍,还存在着体制机制上的制约,成本也极其巨大,可谓任重而道远。
3.《汉籍数字图书馆》是古籍数字化保护与利用的一个实例
陕西师范大学出版总社自主投资、出版运营的《汉籍数字图书馆》不仅实现了汉字古籍文献编目数字化、图版扫描数字化,而且实现了数字化集成管理与应用,是目前所能见到的目录体系最完备、文献信息最齐全、图版收藏最丰富的大型汉字古籍数据库,也是我社在古籍数字化再生保护及数字出版领域的拳头产品。
二、《汉籍数字图书馆》的出版
1.“汉籍”的出版
《汉籍数字图书馆》由陕西师范大学多位文史哲和技术专家历时十多年精心整理,联手打造。专家团队在几十年教学研究的基础上,收集整理了丰富的文献资源和研究成果,给项目的开发与出版奠定了坚实的基础。从文献收集整理到数据加工和出版运营,全程都非常重视版权工作,通过了第三方权威专业机构的知识产权评估,合理规避了可能存在的法律风险。经过两年多集中开发,项目一期产品于2010年正式出版发行,版号ISBN 978-7-900716-94-1。产品一经推出,就因其古籍目录较完善、文献收藏量大、原版原式、使用便捷等特点,得到了学界的好评与支持,并获得首届陕西图书奖。
经过多年的运营与持续开发,2016年9月,《汉籍数字图书馆》V2.0(以下简称“汉籍”2.0版)作为正规的网络出版物已全新上线试运行。“汉籍”2.0版以服务读者古籍研究学习为核心理念,调整了核心数据库的结构,优化了古籍目录与图版资源的组织架构,平台功能更加贴近读者需求,资源覆盖面大幅提升(文献收藏量约为一期产品的4倍)。
2.“汉籍”2.0版的主要内容
汉籍”2.0版由传世文献库和甲骨文献库、金文文献库、石刻文献库、敦煌文献库、明清档案库、书画文献库、與图文献库、中医药文献库等八大专题分库组成,可以理解为1个核心产品加8个子产品。首期推出传世文献库和敦煌文献库,中医药文献库即将上线,其他各专库将陆续推出,进一步丰富产品线。
传世文献库是“汉籍”2.0版的基本库、核心部分,由传世文献目录库和传世文献库图版库组成。一般所说的“汉籍”2.0版默认指的就是《汉籍数字图书馆》传世文献库。传世文献库所收文献按照“经、史、子、集、丛”五部分类,依据部、类、属以及版本、印本、图版文件等分层结构组织,确保目录分类的规范性、科学性和适用性;采用PDF文件格式原版原式呈现,最大限度地保留古籍的文化信息,确保古籍文献的准确性、完整性和学术研究价值。除了按五部分类,还按文献的历史年代和名称音序分列,方便读者按图索骥。
其他8个分库有适合各自内容的资源组织方式,是为独立产品,可以单独使用,未来亦可跨库通检、联合使用。专题分库不是本文讨论的重点,在此不再赘述。
三、古籍数据库的运营
1.数据库出版的关键
数据库出版的核心在资源,关键在运营。一款好的数据库产品必须具备以下特点: ①体系完备,内容专业,符合学术规范;②资源丰富,可满足大部分研究学习的需求;③资源分类及编目科学实用;④应用灵活,扩展性强,切合市场需求;⑤具备持续开发与服务的能力。从出版的角度来看,资源的品质与数量是核心,也是产品运营的基础,而良好的运营才是决定数据库出版成功与否的关键。古籍数据库也不例外。
2. 古籍数据库产品的服务模式
古籍数据库产品的服务模式主要有: ①镜像副本服务模式,即卖产品--安裝产品副本于机构本地服务器,仅限用户在机构范围内使用,如单机版、局域网版、校园网版等;②远程访问包库服务模式,即卖服务--用户或一次性采购产品,或分年次支付服务费,或按点次付费,在授权范围和时效内基于互联网远程访问产品官网,如远程版,这其中不仅包括机构用户,也包括个人用户;③副本与远程混合服务模式,即远程访问产品官网与提供产品副本两者并存,这在实践中也比较常见。
3. 一般数据库产品的市场运作
在具体的市场运作中,情况则更加复杂,必须充分考虑产品的内在价值、同类产品的状况、用户的购买力、采购的灵活性、使用的便捷性以及技术支持与服务保障等因素。从销售的角度看,可以整库专项采购,也可以拆分或分次采购,有时甚至必须与其他产品整体打包参加招标或集采。在市场推广方面,有实力有影响的数据库产品运营者往往自建营销团队、自行开发市场,虽然风险较高,但市场把控力较强,回报也比较高;而一般数据库产品的市场推广多采取代理模式,具体合作模式及操作方式差异较大,一般有分成模式、底价模式及混合模式三种,总体来说风险较低,但市场把控力较弱,回报亦不会太高。
4.“汉籍”的运营
《汉籍数字图书馆》2.0版采取白主开发、滚动发展的策略,以全国统一的产品分类与定价体系为基础,镜像、远程及综合三种服务模式并存,整库与分包并行,在坚持统一定价与服务原则的前提下,以代理分成模式为主,具体操作上比较灵活,并配套有多种优惠措施和促销手段。经过多年的开发运营,取得了一定的效果,目前已有数十家机构用户正式采购使用。
四、主要古籍数据库的比较
1.“汉籍”的主要特点
《汉籍数字图书馆》2.0版是目前所能见到的最大的汉字古籍文献数据库。截至2016年5月,传世文献目录库总计约3260万字,收录文献201371种;传世文献图版库收录文献原件87704种,印本116671个,凡480余万卷(册件),约6400万页,电子文件307803个,数据量超过7TB。另外,还有大约5TB的文献正在整理研究,将择机分批发布。此外,我们也将与更多的古籍收藏机构及个人合作,通过资源置换、共建共享等方式不断丰富“汉籍”2.0版的文献收藏,并进一步开发古籍文献研究工具,完善服务。
2.“汉籍”与目录库的比较
《中国古籍总目》是一部全面反映中国古代文献流传与存藏现状的总目录,由上百位专家学者历时多年调査整理而成,2009年出版,共收录古籍文献177107种。“汉籍”2.0版汉字古籍目录系统在整理之时亦参考了《中国古籍总目》,特别是修正了其中存在的一些谬误,亦新增了大量文献,使本目录系统的文献收录达到201371种。
《全国古籍普查登记基本数据库》是“中华古籍保护计划”的一个重要成果,收录上千家古籍收藏单位约38万部古籍的普査数据,2016年最新发布。从古籍普査的角度看,该目录数据是丰富的、清晰的、完备的,但是没有按照古籍的内容来分类,也没有按学科规范统一编目,各家收藏的古籍文献亦多有重复;从使用的角度看,不甚合理、不够便捷,其科学性、适用性也有待进一步检验。
汉籍”2.0版与此类古籍目录库相比,最大的优势就是体系完备,不仅实现了规范实用的目录浏览、灵活便捷的文献检索,而且文献信息详细、目录与图版清晰对应,可满足多种专业需求。其中,传世文献库汉字古籍目录系统是“汉籍”2.0版的一个特色,具有较高的学术价值,已申请著作权保护。同时,我们郑重承诺该目录系统面向公众免费开放,可随时接受专家学者的检验,以期根据最新研究整理成果不断完善和丰富。
3.“汉籍”与全文库的比较
除了这些古籍目录库以外,目前市面上以全文类古籍库居多,主要有《中国基本古籍库》《中华经典古籍库》等。全文类古籍库的最大优势就是实现了古籍内容的文本化和全文检索,功能更加丰富,使用更加灵活。比如:古籍研究整理的初学者(如文史专业的学生)可以快速在不同古籍文献里找到特定主题的内容,方便摘录复制。但全文库也存在着一些明显的问题,比如:文献收藏量普遍不足,对整理研究造成极大的不便。其中最大的《中国基本古籍库》只有一万多种,其他全文库也就千百种的规模。再比如:古籍全文整理工程浩大,质量参差不齐。由于古籍文献浩如烟海、文简意深,存疑之处十分普遍,加之整理者水平参差不齐或治学态度不够严谨,致使全文库的内容质量得不到充分保证。对于文史专家学者等专业研究者来说,全文库只能参考,不可依赖,否则容易以讹传讹。
由于古籍的珍稀性,对于绝大多数研究学习者来说,如何方便快捷地得到古籍文献才是第一要务,这也正是《汉籍数字图书馆》着力解决的一个问题。从文献资源供给的角度看,“汉籍”2.0版横向发展与这些全文库的纵向发展完全不同,优势主要体现在:体系完备、收藏丰富,首先解决资源供给问题;古籍文献原版原式,真实、清晰、准确地反映了古籍的原貌,最大限度地保留了古籍文献包含的文化信息,是古籍整理研究的第一手资料,可靠性、可信度更高;文献收藏量巨大,集成化程度高,可满足古籍整理研究对文献版本的更多需求。更为重要的是,“汉籍”2.0版不是古籍文献整理的最终结果,而是不断研究和完善的动态过程,它既是古籍资源中心,又是文献研究平台,随着产品的持续开发和版本升级,这一特征将更加鲜明。
五、古籍数据库的发展
1.目录库的发展
古籍目录系统的代表是《全国古籍普査登记基本数据库》,作为国家级项目成果,摸清家底是其根本要求,强调的是公益性。随着工作的不断进展,基于馆藏的古籍信息也将进一步丰富和完善。它为古籍管理、保护、整理、研究、应用提供了最真实的基础数据,必将成为各类古籍数据库开发建设的重要参考,为推动我国古籍保护利用发挥积极的作用。
而其他商业古籍目录系统则更加倾向于基于古籍文献内容的科学分类、统一编目及便捷使用。
2.全文库的发展
全文类古籍库将继续深挖古籍内容,深度整理,精耕细作,不断提升内容品质,在细分领域推出垂直产品,点校、注解、评注等整理本必将成为最活跃的发展方向;同时将基于互联网,不断丰富平台功能,提升智能化水平、使用的便捷性、用户的参与度,甚至实现跨平台、移动化整合与应用。 一个不容忽视的问题是,古籍整理具有极强的专业性和主观性,往往因为整理者水平参差不齐、认知差异及治学态度等带来全文内容的质量问题。可行的思路是,通过提供多底本图文对照、双层文件等方式来尽量避免谬误,提升可信度,同时通过纠错机制、共建机制来不断完善产品内容,甚至建立新的著述文献库,包容并蓄。古籍整理工程浩大,不可能一蹴而就,因此需要客观严速的治学态度、持之以恒的学术坚持,当然也需要尽可能丰富的版本参考。
3.“汉籍”2.0版的发展
《汉籍数字图书馆》2.0版由汉字古籍目录库、图版库及应用平台组成。已经建立起科学完备的目录体系,目录收藏量20多万种,与目录库直接关联对接的图版库,已收录图版8.7万多种,不同印本11万多个,电子文件30多万个。“汉籍”2.0版将继续坚持免费开放汉字古籍目录系统,供社会大众研究学习,在高度集成化的平台上最大限度地满足用户得到古籍、掌握全貌的基本需求。虽然“汉籍”2.0版文献收藏已经超过8万种,是目前最大的,但仍然有许多文献没有收藏,我们将通过资源置换、共建共享等方式收集更多的文献,整理发布。同时,不断开发专题分库,推出系列特色子库,丰富“汉籍”产品线。
《汉籍数字图书馆》不是一个结果,而是一个过程。古籍数据库的全文化趋势,亦是“汉籍”2.0版的发展目标之一,争取在3.0版实现经典古籍全文数字化,进一步完善纠错机制和共建机制,提供专业实用的古籍研究工具,最终从单纯的古籍资源服务向复合的古籍研究服务转型,升级为全新的古籍知识服务平台,更好地服务学界、服务大众,保护汉字典籍、传承中华文化。
参考文献 [1]汉籍数字图书馆[EB/OL].[2016-09-28].http://www.hanjilibrary.com. [2]全国古籍普-查登记基本数据库[EB/OL].[2016-12-28]http://www.nlc.cn/pcab. [3]王会梅.两巨型数字古籍《中国基本古籍库》与《汉籍数字图书馆》对比研究 [J].农业图书情报学刊,2013(12) . [4]孙琴.两大中文古籍数据库比较研究 [J].新世纪图书馆,2007(1)
来源:《出版发行研究》2017.6
|