各位来宾大家好,很高兴在今年的年会再次对中国共产党思想理论数据库进行一次介绍,中国共产党思想理论数据库是08年启动建设,在今年年初完成了“十一五”期间建设任务的国家验收和财政部的绩效考核。在往年的出版年会,包括数字出版年会中,沈书记对我们这个项目开发应用的功能、建设的思路和管理方法都进行了介绍,今天我主要从技术角度,围绕内容资源的主题,从工程建设成果角度进行一下介绍。在介绍之前,首先向大家说明一下,中国共产党思想理论资源数据库,以前是通过人民出版社网进行提供服务的,今年正式更名中国理论网,为什么要更名?我们这个网站是以中国共产党思想理论起步的,在未来要进一步向整个思想方面进行扩展,新的版本在明年上半年和大家见面。
一、“十一五”期间的主要建设成果
建设成果一:完成了党的思想理论核心资源的数字化 主要内容:1万多册图书。主要包括人民出版社出版的马列著作、领袖著作、中央文件文献。 主要特点:标准高、品种多。采用了十多种形成的做法,电子数据可以支持目前和未来各种数字媒体 数字化加工主要成果: 扫描图:600dpi为的黑白图、300dpi的灰度图和彩色图。做扫描图的目的就是把图书的原貌先保留下来。 PDF,代码化单层PDF(五万分之一、三万分之一)、双层PDF(万分之一)和图象PDF。首先是图象PDF,主要用途是人民出版内容大量有解放前的图书,这些图书不具备什么使用价值,只是作为一个档案查询,所以我们只是简单的做了一个书架。第二类,一般的著作,按照目前最传统的方式做成双层PDF,表面是图象,背后有文本,供大家检索和复制,对一般类的著作和繁体图书,因为繁体字图书考虑到用户使用,目前使用的是简体文字,所以它做双层PDF的时候变成检字,所以这类图书我们都是双层PDF,它的差错率标准是万分之一。 还有一种是最优秀的PDF,单层PDF,对我们一些重要著作采用代码的方式,采用重新版本的方式,它的好处就是什么呢?我们知道在纸质书出版的时候,本身就会出现一些出错率,发现错误的时候可以直接修改掉,采用双层PDF还要修改图象。还有一种情况用户在发现文字错误的时候,就可以直接看到在数字化过程中产生的差错,可以一目了然,便于进一步对内容进行完善,而且它的体积也是非常小的,差错率是非常小的。 XML,正文XML和目录XML,主要用于全文检索、内容切分。其他的成果都是在这三种成果上进行再次加工产生的。 历史图书的数字化流程: 数字化加工系统:整理、扫描、文档处理、校对、生成处理、最终文档。为什么采用纸书没有采用历史的排版文件?发现历史排版文件涉及版本很多,文件的保存内容完整性有的时候缺失比较严重,还有它的版本,从排版文件出手做电子书花费的成本,要比纸书去扫描重新加工的还要高出很多。我们加工完之后,为了确保质量,还请了第三方验校公司对它的内容进行校对,他校对完成之后再由我社校对人员代抽检一批图书进行校对,完全达到了高质量的要求。大家可能认为这种做法投入成本很高,但这是作为数字出版的基础,是必须的,你前期把这部分成本节约了,后期肯定还要补出来,作为出版社你出版的东西,肯定不能像网上盗版的,肯定是对差错率是有要求的,你做得不好,甚至你的数字质量还不如网上盗版的,那就成问题了。而且你这个数字资源后期进行知识点标引、检索等等它是一个基础,如果后期再次来提高文字质量,在中间很多成果上都会造成重复投入。 基于历史图书加工成功较高,我们对新出版图书进行了数字化流程改造,首先要解决的问题是把排版文件转化成PDF文件,开发了一套转换系统,同时配备数字加工人员的基础,进行了一个完全的转化,同时对排版上容易产生问题的进行了规范要求,形成标准的PDF文件。我们整个后续的加工流程,都是以PDF为中心的。
建设成果二:建成了初具规模的资源库及网上传播平台 大家都知道大量的资源存储它的数据安全性是很重要的,如果你的数据丢失了,那你这几年的成果基本上就没有了,因此我们建立了两套数据库,一个是我们本社的存放的原始资源,同时还做了一个同步的异地备份数据库。在网站上我们建设了两个频道,一个是理论时空频道,也就是我们现在的中国理论网,它按照思想理论体系对1万多册书进行编排的。同时今年还举行了一个“日出东方马克思主义中国化解读中文电子出版,它是按实际形式对这个书进行展示的,主要特点是把党的思想理论进行规模化、系统化、规范化的建设。 基本架构是:首先对这些图书、文章、音频资料、视频资料,对所有资料进行加工整理和内容的深度加工,进入到数据库,推送到手机设备、计算机等终端使用。我们的支撑系统有:资源库、内容发布、资源发布、电子商务和版权保护来支撑这个网站。资源库网站又叫数字资产管理系统,因为大家知道资源电子书数字化之后,它的主要存储格式是电子文件,电子文件的管理是很繁琐的工作。比如说一本书400页,有400张图片,还有各种数字化产品,如果你的品种有很多,这个资源量是很庞大的,如果你不采取系统化的整理,这个工作也是很繁重的。同时这个资源库也是作为你日常收集资源的工具。 1、资源库 出版社在做数字出版的时候,很多面临一个问题,缺少资源,你出版社出一本书的时候,你有作者的一些评论,他的一些书形,还有召开新闻发布会的召开、视频,这些资源不在日常工作中进行收集,你在最终使用的时候,还要新华社、向中央电视台这些机构购买,所以资源主要是进行积累。同时还要把相应的资源进行数字化,大家都知道出版社拥有资源,但很多资源是名义上的拥有,并没有形成具体的实际环节,做到应用的时候很难,数据库作为原始资源保管的系统。 2、内容发布平台针对于网站,相当于图书的原数据中心,管理你所有网站的原始数据,设置网站样式,主要是内容编制的时候使用的。 3、资源发布系统。在数字出版,在网上大量展现电子书、视频,你通过传统的方式,因为资源需要进行保护,人员不能够管理资源,因此要开发这个系统,将资源进行加密处理,发布到这个网站上去。 4、电子商务系统 5、版保保护系统。
建设成果三:开发了一批新型适用、方便友好的服务功能 现在已经有八项特色服务。
建设成果四:我们建立了一支团队。 数字出版是一种新兴行业,在这个行业中主要的还是人才的问题,我们这块除了传统的编辑人员,还有数据加工,质量验校,质量验校对大家已经谈到了,公信力的问题,还有质量问题,我们成立了一个部门,专门部队电子书的校验,对原书出版也进行校对。 此外,还开展了知识点加工,对图书内容知识点进行标注,还有多媒体宣传推广平台,目前这块本社有60个人,社外有40人兼职,我们已经达到了100人的规模。
二、后期项目规划
1、指导思想和目标 两个着眼点:着眼推进马克思主义中国化、时代化、大众化和学习型政党建设的需要;着眼建设社会主义核心价值体系,用主流舆论占领互联网阵地的需要。 两个理念:寓理论学习于方便友好的服务之中;打造杀手锏,占领制高点 四个阅读:实施“知识点阅读、融合式阅读、互动式阅读、无缝隙阅读”的创新战略 一个目标:建成内容系统、编校规范、技术先进、功能强大的具有广泛影响力党的思想理论传播平台
2、功能定位 突出“四个服务”、建成“四个平台”服务全国各民族广大党员、干部和群众,建成一个马克思主义理论的学习交流平台; 服务广大理论工作者和青年学生,建成一个以马克思主义理论为核心内容的社科学术研究发布平台; 服务中央领导机关和各级领导机关,建成一个党的基本理论和方针政策资源的供给咨询平台; 服务国外马克思主义和中国问题研究者,建成一个多语种的中国共产党思想理论及路线方针政策传播平台。
3、特色要求 坚持“四性”:理论性区别于新闻性等网站,以思想理论为主要传播内容 公益性,我们这个网站是属于公益性网站,所有内容是供大家免费阅读的 资源性,我们这块主要是以资源开发为主,包括以资源为中心开发的一些服务功能。 权威性,我们要保证内容的准确度,作为一个权威平台,达到跟纸书同样的质量效果。
4、主要建设内容 一是对资源进行扩充,对业务资源进一步进行深度加工; 二是紧跟科技发展潮流,继续研发方便用户使用的服务功能; 三是广泛引进和培养人才,加强团队建设。
来源:中国出版网
|