账号: 密码:
中国大学出版社协会 | 首页 | 宏观指导 | 出版社天地 | 图书代办站 | 教材图书信息 | 教材图书评论 | 在线订购 | 教材征订
搜索 新闻 图书 ISBN 作者 音像 出版社 代办站 教材征订
购书 请登录 免费注册 客服电话:010-62510665 62510769
数字出版与数字化内容服务 - 2007年全国出版社网站建设工作交流会专栏 - 中国高校教材图书网
主页 > 2007年全国出版社网站建设工作交流会专栏
数字出版与数字化内容服务
高等教育出版社副总编辑吴向
2007-12-11 10:19:16  来源:中国出版网2007年12月07日 
 

 各位出版社的领导以及负责出版社网站工作的老师,下午好!
 辛所长介绍了高等教育出版社,过奖了。从易比网的统计数据来看,我们高等教育出版社并不是出类拔萃的,的确,高教社的出版网站很多,刚才所说的40个网站的出版社就是我们,并且很多网站是一级域名。主门户的网站我个人觉得还有很大的差距,今天在这儿抛砖引玉,主要谈谈高教社对数字化出版和在线服务的认识与我们的实践。
 分三部分进行介绍:一、出版业发展趋势的思考。二、数字内容服务基础。三、高教社的实践与探索。
 一、对于出版业面临的外部环境变化。按照波特的利润,每个出版社面临五种力量:消费者、供应商、潜在行业竞争者、替代产品以及本身的竞争对手。
 从消费端来看,读者的阅读习惯已经发生了深刻的变化,这一数据就不多说了。所以通过网络来获取信息的读者比例是越来越高了,再从替代产品端来看,现在信息的爆炸成为了一种现实。06年全球信息量高达1610亿G,产生的信息量已经超过了过去几十年产生的信息量的总和。所以通过传统的出版已经无法记载和传播信息,必须要有替代的产品手段出现。再一个是内容呈现的多元化,这也是潜在的一种趋势。数字化、多媒体、动态性等这些媒体的出现,对于我们这些传统出版业的图书、期刊等出版物来讲也是一种替代。
 技术提供商向客户产业进军,目前已经加快了步伐,大家知道的像万方数据,中国知网等等,都已经进入了内容产业,成为了内容的技术服务商。总而言之,大家可以看到,目前这一产业链发生了很大的变化,传统的出版业从作者到读者之间有一个很长的链条。由作者到出版社,由出版社再到印刷厂,印刷厂再到我们的仓库,进入物流再到分销商,再到读者,目前的产业链已经大大缩短了。数字化的产业链不需要经过经销商、分销商就可以达到他们手里,现在可能会经过的更短。美国的亚马逊的很多读者纸介在网站上发布作品,跟作者进行分成。
 在座的出版社可以考虑一下,在这样的严峻形势下,我们的出路在哪里?我认为出版社的出路体现在以下几个方面:
 第一,从出版物转变到做数字化的内容。为什么这么说?现在出版业的业务都是以产品为中心,研发、生产、销售的都是一个个的产品,一本书、一本刊、一张光盘等等。实际上,以产品为中心是很难深度满足读者的个性化、多样化和主动性的要求。只有把做出版物变成做内容,才有可能经过内容的重组来为各种不同需求的用户提供个性化的服务。
 第二,从内容生产转变到资源集成。如何理解?现在每个出版社都在做自己的内容,这种生产方式是分散的。实际上,读者需要的内容并不是针对某个出版社,而它所需要的内容是很广泛的。就像买商品,为了方便可能更趋向于去超市,而不是小商店。对于一个读者也一样,他希望我们提供的是一种集成内容,而不是每个出版社分散的内容。也就是说,我们应该有一个集成的内容服务平台,在这个平台上一位读者进去能够读到所有出版社的内容,这才具有最大的社会意义。
 第三,从出版商变成服务商。这在前面已经体现出来了,并不是说一本书生产出来之后入仓库发到经销商手里,我们的任务就完成了,实际上我们更多的是要对内容持续性的服务。
 第四,出版业要转变为数字化内容的服务业。这是我们粗浅的认识,举个例子,以一个学习者为例,他需要的内容是丰富多彩的,他既希望有经典的讲解,也希望有不同学者的评说,希望有案例,希望能够自测练习,同时希望多种媒体的素材,比如说动画演示、影视资料等等。对于学者来讲,是基于知识的学习,而不是基于产品的学习。对于知识的需求是因人而宜的,并不是说出一本书能够适应所有学者的需求。
 对于知识的学习是与时俱进的,传统的出版业生命周期是三到五年,这三到五年内容是不变的,而实际上我们的内容每天都在变化。因此它是一个动态的,通过多种渠道方便快捷及时有效获取知识。通过传统渠道的速度是很慢的,通过数字化网络手段速度则是实时的。主动获取而不是被动接受,传统出版物所需要的内容是在书店找,对于出版社来讲我们并不是在主动的为读者服务,而以后更多的是把他所需要的内容主动推送到他面前去。望交互式的,学习者希望跟他的老师、同学在一种交流的环境中学习,这样的学习效率、效果才是最好的。
 对于教育出版社来讲是了解学习者的需求,在知识库中进行数据挖掘、智能搜索,主动推送内容,使学习者能够按需选择,内容不断更新。
 以研究者为例进行说明,比如说需要检索论文,阅读参考文献的全文,还需要他所看到的论文参考分析中所没有的相关文献和相似的文献。还需要了解学术的定义、发展的前沿等等。总之,对于研究者来讲需要研究的是学术研究的最新成果,要了解学术同行对于某一个问题的不同观点。他需要在海量的文献中快捷的找到文件的需求。
 以学术出版商为例,我们提供的是元数据,通过元数据就可以找到他所需要的内容。其次才是搜索到全文的PDF文件。对于学术出版商来讲提供结构化参考文献,文献连接,提供引用查询服务;比如说这篇文章被多少次别的研究者的论文所引用,在这儿都能提供出来。提醒服务,对于每个读者、每个研究者根据他自己的需要,以及与他希望得到某个领域、某个专业方向的论文进行定制,出版商就可以主动为它提醒,一旦有了这方面的内容就会提醒研究者。提供结果化的内容包,世界上大的学术出版商销售大型的结构包,结果化的内容包卖给机构用户,卖给中国的大学售价是很高的,都是几十万元一年的服务费。基于语义的导航,现在的搜索引擎都是基于词汇进行检索,其实对于很多内容来讲,并不是要出现这个词汇才涉及到这一内容,可能他需要查找的内容并不出现与他相关的词汇,而你如何找到这一内容,就是通过语义进行导航、搜索。最后提供印刷版的出版物,对于学术期刊来讲,印刷版的出版物在国际上已经慢慢的淘汰,都是作为一种附属品,作为数据库服务提供的赠送配件。

 二、数字化内容服务的基础。
 传统的出版都是以一个产品提交到读者那儿作为内容的完成,现在来看更多的是过渡到数字化内容的服务,提供数字化内容服务要具备哪些基础。图片上可以看到数字化内容的类型,把内容进行分类,分类的方法有几种,可以按照产品类型分类,可以按照媒体类型分类,也可以按照应用类型分类。
 按照产品类型分类,有一些产品本身就承载着这些数字化的内容,比如说电子图书、教学软件、音像制品,资源库系统、实习题库系统,这些都是以产品形态出现的。对于某一类产品,比如说教育型软件,又分为教育课件、工具软件、数据文件等等。按照媒体分类有文本素材、图文图像素材、音频素材、视频素材等等。研究应用类型分类,对于教育出版来讲有教学课件、教学试卷、人物简介、名词俗语和常见的问题等等。
 对于数字出版来讲必须要有新系统进行支持,对于数字出版的基本信息系统有三类:第一类是协作创造平台。第二类是生产内容管理平台。第三类是内容服务和运营平台。对于协作创造平台,又分成作者的协同创造以及专家在线审稿和稿件平台,对于作者,协同创造平台可以提供一个网上在线的虚拟工作区域。作者、专家、编辑可以在虚拟的工作环境下,进行适时的沟通。传统的出版社业务流程是编辑选题通过之后进行组稿,组稿会有主编和参编,主编把分工告诉每一个参编者,分工之后每个编者把创造完之后把稿子送到主编手里,主编在进行整稿,整稿之后需要专家进行审稿。如果专家觉得编辑编稿的距离离他们的要求很远的话,会重新进行编辑。因此这中间需要很长的时间,有这么一个虚拟的平台,可以减少很多的时间。所以说编辑们可以提示输出意见和交流,这样可以大大提高我们提稿和交稿的资料。
 内容生产与管理平台,图书、电子图书的出版创造,内容加工和标注,根据不同的需求进行发布,比如说可以发布成图书、电子图书可以发布到网络等等。内容结构化处理,内容结构化的目的是为了一鱼多吃,一个内容可以应用在多个相同或不同载体的产品和服务中。传统的出版业主要是为了出书、出刊,所以我们的生产过程中尽量用电脑进行排版,排出来之后主要为了出软片用,最多的应用可以生产一个PDF软件做一个电子书,也就到此为止了。文档以后的用途就会很少了,内容结构化的目的为了使得我们做的内容可以变成不同的产品和服务。这样做的话,大大减少了内容创建的成本,减少了内容维护的成本。做一本书的同时,需要做一本网络课程,以前可能需要重做,现在就不需要了。同时在修改的时候,只要修改它的内容源头,而不需要修改每一个产品中的每一个地方,这就增加了内容的精确性。
 现在的内容都是非结构化的内容,非结构化的内容的特点是说内容跟版式是捆绑在一起的。比如说排版出来的文件排版命题和内容是混在一起的,这样的排版文件就不可能做网络发布,或者说生成一个手机图书或者说在别的阅读器上阅读的图书。你要做别的产品的话,就必须重做。结构化的内容,内容与版式是分离的,也就是说内容可以通过不同的版式生成不同的产品和服务。比如说结构化的内容SXM格式套用模板会生成PDF格式文件变成电子书,同样SXM的格式的内容用另外一个模板就有可能生成网络文件。结构化的内容通过排列之后进行组合变成每一个读者所需要的课程,如何做结构化?以图书为例,现在的趋势是以XML语言为内容结构化提供了可能,XML语言由W3C组织于2000年10月6日发布的,目前已经广泛地应用于出版业、互联网业,其特点是使用XML可以将内容从其表现形式中独立出来,对文档内容可以进行独立,并且提供了一个国际交换的方式。
 XML语言如何进行处理?实际上在内容上插了很多的标签,标签定义了段落,比如说基本的词汇要做缩影的词汇等等,还有一些是重点进行标记的词汇。这些标签的结合就构成了内容结构化的DTD,XML语言鼓励各行业根据自己行业的特点来制定自己的内容结构化标准,XML语言已经为内容结构化提供了可能,出版行业结构化标准为数字化出版奠定了基础。
 数字化出版的流程,首先是作者按照WORD模板进行创造,WORD模板是出版社根据自己的DTD的标准进行设计,作者提交WORD模板提交出版社,出版社前期做WORD初稿整理,用转换软件可以把书稿自动转换成XML的动态文件。
 内容加工和元数据标注,编辑在XML的编辑器上进行文档加工,加工的过程跟在电脑上处理WORD文档是一样的,这些标签都可以隐去,编辑就可以继续改动。二审、三审人员都可以在线在XML编辑器上进行审稿。
 这一特点一个是协同加工,对于一本图书尤其是大型的工具书可能是多个编辑进行加工,通过内容管理系统可以实现协同工作。每个编辑从已经存在内容管理系统中的书稿文档中剪出自己的章节,别的工作人员可以看到团队每个人所做改动的情况。但如果说我不负责这一章节,我就不能对别人所复制的章节进行改动,但我能看到别人的改动。这样可以为提高书稿的质量提供一个很好的工具。内容更改的跟踪、各版本记录,每个编辑做的删改在系统中都做了记录,谁在什么时间做了哪些改动。内容加工和重用单元元数据标注同步进行,在加工过程中,对精彩的段落、片断可以拆分出来,对于他的属性通过元数据进行标注。多种媒体的集成,在做一本书的时候,可以插入多媒体的素材,但多媒体的素材对于它的元数据标注时可以标注为在生成一本图书的时候不出现,但在网络发布的时候又出现,一旦书本做完之后,在网站上就可以同步发布。发布出去的产品,在图书上可能会插入很多多媒体的资源。
 内容元数据标注,对有重用价值的内容,对于教材、例题、习题、案例来讲进行元数据标注,以便这些内容更方便准确的检索,建立知识之间的关联。以前通过搜索引擎搜索所要的内容,搜索引擎只是单纯的进行词组的检索,而很多内容并不出现这个词,因此检索不到。通过元数据标注今后就可以准确的搜索到。更重要的是进行知识之间的关联,也就是说一旦一本书中的内容进行标注之后,一个读者在读别的作品时,他想要浏览跟那本书中的知识点相关的内容资源,我这本书的内容就可以跟他进行关联。也就是说,一位读者在读我这本书的时候,有一个内容是不能理解的,这个内容恰恰不是这本书所要讲的内容,只要别的书做了内容元数据的标注,那本可能讲这一数据最权威的书就会关联到这位读者所读的内容。
 内容标注的元数据标准,对实现跨出版社内容之间的关联很重要,在不同出版物之间,按照内容结构化和元数据的标准进行处理,不同出版社的内容放在一个公共的服务平台上,一位读者在读一个出版社内容的时候,就会关联到别的出版社更精彩的内容上。对于整个社会来讲,这一价值是非常大的。
 元数据标准的举例,包括通用、教育、技术、权利、关系类。元数据根据选题管理系统在报选题的时候,对这些书的属性已经做了鉴定,比如说分类、说明、作者、著作权归属等等,这些都可以集成到内容元数据中。并不是说在做内容元数据标注的时候,对所有的内容重标一边,有很多都是已经有了的。
 内容入库管理,对于有重用价值的内容我们把它放到一个数据库中进行管理,他的管理是分层的。第一层是产品,以一本图书,或者一个光盘,一个网络课程进行管理。第二层对于一本书中,有重用价值的单元进行拆分按照知识单元管理。对于知识单元中不同的媒体素材进行管理,比如说按照文本、素材、动画进行管理。也就是说对于一本精品图书的处理中,会有很多重用价值的内容单元。以后对这些内容单元可以进行重组,为读者定制新的产品,可以提供新的服务。
 内容多渠道的发布,与在座的网站管理人员是非常相关的,网站只不过发布了一种渠道,实际上是多渠道发布,比如说发布多渠道图书,或者发布电子图书,或者发布到网站上去。

 三、数字化运营服务平台。
 运营服务平台建设是数字化内容实现盈利的基础,这次交流会大家都在探讨未来出版业的商业模式,实际上未来的商业模式更多的是建立在运营服务平台上实现的,出版社的网站其实就是运营服务平台的组成部分。在运营服务平台上,必须实现知识内容的关联,要为读者主动推送内容,要实现个性化服务,实现跨出版商横向的资源整合。
 高教社的实践与经验:
 第一,教学资源库的资源建设。高教社从2002年开始建了很多学科资源库,这些资源库有一个特点是形象化、多媒体、交流互动型。一个有机化学资源库中可以动态演示两个物质分子的化学过程,这对一个学生的理解来讲是非常有用的。
 第二,内容管理系统。首先制定了高教社内容结构化的标准和内容元数据的标注系统。通过内容管理系统可以实现图书的发布,比如说右边是一个XML文档,这一文档已经存在到我们的内容管理系统中去了,这是经过加工和元系统标注的文档。对于这一文档我们选择这一模板,模板进行处理之后可以生成图书,实现了自动排版。对于排出来的图书页面、版式可以进行微调,我们运用XML的排版软件,可以大大提高排版的效率。
 第二代电子书,在做图书的同时我们做出了第二代电子书,他的特点与第一代电子书不一样的地方是,第一代电子书以产品为中心,读者看到的还是一本本书,只不过放到了不同的载体上。以前应该是在纸上的,以后的电子书是在阅读器上阅读的。第二代电子书有更多的功能,电子书的模型,学生可以在校园网上对课程进行学习。当然他能看到这本教材的全文,如果说他在学的过程中,对于一个知识点读不懂,在系统中可以推送跟这个知识点相关的内容。事实上读者可以定制这些内容,可以把学生的基本信息输进去,比如说学生的研究层次是高中生还是初中生还是本科生,对于不同的读者提供的内容是不一样的,包括对于媒体的喜好,比如说喜欢视频还是喜欢文本可以进行自己的选择。比如说对知识的选择,喜欢看案例还是看电子教案,一旦输入这些信息之后,推送过来的内容都是与他的需求相关的。比如说过渡时期的总路线,对于一个现代的小孩来讲肯定是不理解的,因此他可以看到系统给他提供的视频素材,并且可以看到一些没有预定的资源。比如说年轻学者对于资本家为什么愿意接受社会主义改造,他肯定不理解,提出问题之后系统会把相关的答案推送出来。
 第三,数字化内容运营服务平台建设。高教社开发了4A的网络教学平台,安装在各个学校,为学校提供数字化的教学、混合式的教学提供了信息平台。他可以灵活的自测策略支持,有效促进知识学习,强大数据分析能力,以及问题答疑。对于智能中心,老师可以创建自己的课程,记日记、开博客等等。对于课程中心,老师进去之后,可以排客,选择课程管理,选他的课程资源布置作业等等。讨论交流中心,学生与学生之间可以在4A平台中进行管理交流。目前通过学习卡登陆学习平台的用户已有将近150万人,在正版的教材后就赠送一张学习卡,学习卡可以使学生免费在我们的网站上享受50个小时的学习,可以下载免费的资源,也可以跟老师、同学们交流。
 学习卡网站有四五十个,最多的网站访问量非常高,学习卡网站可以为教师提供教师资源中心,为学生提供教学课件以及答疑。
 学术期刊在线发布平台,通过这个学术期刊的门户网站可以为读者、作者提供很多的服务,它的特点有支持期刊在线提前发布,也就是说在印出一本本纸质刊之前只要一篇内容进行内容加工标注之后,就可以在网站上先发布,另外还有检索功能,通过不同的功能进行检索,以及采用使用统计、个性化定制,参考文献交叉链接的功能和支持中英文的功能。一般的信息不单单是提供内容发布,而且可以为作者、读者提供更丰富的服务。
 以上就是我介绍的高教社对于数字出版以及数字化内容服务的认识与思考。最后感谢中国出版科学研究所,他们搭建了很好的平台,使我们兄弟出版社可以在一起交流,作为工作来讲是一个很好的导向,比如说今天两个信息的发布,实际上都为我们出版社今后数字化出版以及网站服务往什么方向努力指定了方向,所以感谢中国出版科学研究所为我们广大的兄弟出版社提供了交流机会。
 谢谢大家!

来源:中国出版网2007年12月07日
本版责编:江蕾
 
 
相关评论 发表评论 发送新闻 打印新闻 上一条 下一条 关闭
| 我的帐户 | 我的订单 | 购书指南| 关于我们 | 联系我们 | 敬告 | 友情链接 | 广告服务 |

版权所有 © 2000-2002 中国高校教材图书网    京ICP备10054422号-7    京公网安备110108002480号    出版物经营许可证:新出发京批字第版0234号
经营许可证编号:京ICP证130369号    技术支持:云因信息