账号: 密码:
中国大学出版社协会 | 首页 | 宏观指导 | 出版社天地 | 图书代办站 | 教材图书信息 | 教材图书评论 | 在线订购 | 教材征订
搜索 新闻 图书 ISBN 作者 音像 出版社 代办站 教材征订
购书 请登录 免费注册 客服电话:010-62510665 62510769
孙卫:数字复合出版的服务方式 - 2009全国出版业网站年会专栏 - 中国高校教材图书网
主页 > 2009全国出版业网站年会专栏
孙卫:数字复合出版的服务方式
孙卫(万方数据研究院研究员)
2009-11-19 09:28:54  来源:中国出版网 
 
 首先感谢出版协会邀请,也感谢出版科学研究所的邀请。为什么要讲这个?刚才我在底下听了一下,中国数字出版800亿,网游占到一半,手机占掉剩下一半的2/3。好象出版没事了。事实不是这样,在传统的出版走向数字出版里面有一个分支,我不知道现在怎么统计的,据我知道,至少有10亿的产值是传统出版跟互联网同时并轨以后产生的。但是比较遗憾的是这些部分没有在我们的出版社里,所以说出版社要反思的是这个问题。出版社怎么在互联网中怎么挖这桶金子。不是说出版社的内容没有挖到金子,而是挖了金子以后没有回到出版社。

 一、数字复合出版特点
 内容采编的网络化。谁能够使得你的工作流程这部分东西网络化,而不是传统的来回改纸稿。
 内容记载的数字化。写稿大部分都是数字化,编辑还要打出来再审稿,对于环境是个浪费,对于资源也是浪费。
 处理流程的网络化。知识抽取关联关系和内容采编出版、互联网服务、按需出版、移动终端服务、主题信息服务、机构服务。数字复合出版特点远远比我们传统的出版面要宽要广。
 大家首先要明白数字复合出版的特点是什么?
 数字出版的流程标准化是非常重要的,最左边那边看,所有稿件来全部是网络化和数字化的,全都变成基于XML的格式,上面是知识资源总库,这个知识不是一个出版社的,包括字库,包括知识库。往下有各种各样的标识管理,包括ISSN,BOM的管理。再往外就是最大的变化,传统出版社是一个内容加一个版式,数字出版是排完版的东西再变到PDF,非常非常的慢。最新的数字出版是不同的XML的风格文件,并不是从纸版回来的。最右边是可以针对多种多样的应用去做的。数字出版一个方法就是前面的内容全部是基于XML,不是纸板完的东西针对PDF,针对手机,那已经文了。排到手机是高清的东西,XML整个出版的流程可能是在编辑部里面要考虑的。最后就是网站,网站各种各样的功能。
 所有的东西,XML的内容加上知识,加上版式,格式是自动使用的。我的手机是iphone的,我的服务器应该能感知你的浏览器,我就要把合适的版,合适的内容合在一起给到你的手机上。所以说我们可以看到所有的变化,最后数字出版服务的变化,形态的变化可以冲内容,可以对移动终端,对互联网终端,可以通过大批量印刷,但是有很大一部分是小批量印刷了。这就是数字出版服务模式不是只有一个网站,是有很多模式需要转变的。

 二、数字复合出版服务方式——网站服务
 服务功能
 1、宣传企业的功能
 2、产品助销功能
 3、电子资源服务功能
 4、编辑、作者、读者围绕主题互动的功能
 5、标准化接口
 现在我们的网站几乎没有标准化接口,你的网站跟别人网站做互操作几乎都是零,做互相交换,你的数据结构拿给别人是用不了的。
 6、行业、专业、职业新闻
 一个出版社你有你的主题方向,你不是很泛的,在这个方面你怎么帮助行业。
 7、知识库服务,有直接、间接、前台、后台
 8、媒体服务
 传统的1996年我们做数字出版的时候是以内容为王,现在不再谈内容为王了,我们认为内容是基础,服务为王。为什么出版没有在互联网上挖到金子?就是我们的编辑,围绕着用户这一块的需求是不清楚的,是非常模糊的。可能有一些IT人拍脑袋想做手机挖金子,那不是出版社要挖的金子,我们要挖的是内容,把它打散以后能够服务于更多的人,各种方式服务更多的人。打散的内容能够赚更多的钱是出版社的金子。要想你的内容怎么打散了以后能围绕着各种需求赚钱,这是出版社真正要好好想的。
 正的总测件的服务模式在互联网不是最主要的模式,最主要的是围绕主题的服务模式。所以说数字出版应该是内容为基础,服务为王。
 有一些东西不太一样,传统出版是单一载体形态,内容完整为传播模式的。数字出版是以多载体,多媒体的。载体内容根据需要组合为传播模式的。传统出版是以纸排版为总结,再进行变形的。数字出版是以内容和版式自动适应需求为基础进行变形的。全部都在你的出版机构里面,你只要有一个新的模式上来,重新写一下立刻就能生成。而不是要生成模式再能改成你需要的。这就是很大的问题。
 传统出版是以单一作品为服务基础的,数字出版是以多作品,知识库为服务基础的。在整个服务体系,服务关系上要有很大很大的变化。为什么要在网站上说?因为网站是你出版的一个窗口,所以说你的功能的搭载和你能不能搭载出更多的服务来是很相关的。功能不合适,你不能真正通过服务赚钱,只是达到宣传的效果,没有达到网站真正的目的。
 这是一个网站,网站结构优很大的变化,开放链接就是互操作。你的网站一定要可以和别人的网站进行互操作。今天看你网站上有一个东西,你的网站有一个词,我不知道是什么意思。我点了这个词能不能通过开放互操作到别的网站上看这个词是什么意思。你的网站能不能根据用户的IP的分配,IP的来源搭载不同的广告?出版社的广告是很大的收入。计算机世界网站有大量的广告。你面向图书馆的,科技教育的就是机构专业。我们为小学的可能是为个人,但是也有可能是为机构的。明确的主题方向,我到底是做教育的哪一个方向,不能笼统说教育。SPM你说我做科学技术与医学,要有明确的方向。围绕这个方向组织你的内容。还有一块就是学习,任何一个网站你的专业是明确的,但是一个人来读你这个专业的时候是需要学习的,他学习的不仅仅是专业的东西,还有很多别的东西。所以面向用户的时候有互操作的,有搭载广告的,有面向专门机构服务的,有面向主题的,有面向学习的。
 左侧有鉴定授权的,你的服务登记,你委托是我什么样的服务,我怎么做服务登记。还有元数据地元素登记,标识服务,你是有DOI,是有SNN,你有什么标识要登记。机构预定服务,在有些机构预定,我已经预定了这个服务,这个东西还没正式出来以前就可以通过机构预定看到这个东西。术语服务,各种各样知识的词汇怎么解释的。中间是经济人。我是老板,我是委托你这个网站上的,我需要的这些东西,要看统计,目录、索引。后面才是内容。所以说最上面是内容,内容为基础,最勤勉就是服务,服务为王。这是网站的结构已经跟传统的互联网站,95年我做学者的时候,那个网站结构已经彻底不一样了。
 你绝对不是单一功能的分配者,而是多功能的,特别是出版社的网站要做好,一定要具备多功能,才能吸引更多的用户在你的网站上,只要用户牢牢围绕着你的主题吸住了,这个网站才是有机会的。

 三、在线采编——知识过程的开始
 出版做了很多年,在知识采编有很多的问题。包括你的作者、机构、地名、年代知识库的建立,一定要具有唯一性、相关性、历史性。最近出版科学研究所有一个标准叫做ISNI,这个很重要。作者可以把他的东西扔到不同的出版社,但是这个作者的标识应该是唯一的。别人要用到这个作者东西的时候应该可以把这个作者所有出版的东西都能够看到。
 权利知识识,包括知识产权,知识产权的转移,互联网的授权,DRM授权,全部都是有转移。著作权法里有一条规定,未经著作权人同意是不可以滥用技术保护的。很多IT人都愿意说技术怎么怎么好,但是你的技术是有限度的,是要得到著作权人同意。
 销售信息的建立,这在欧美的ONIX系统已经在逐步的应用。内容文件的管理知识,包括初稿、中间稿、审批排版前的稿、长期保存的稿。
 大的出版社多少年以前的东西是不是完全的保留了?很多出版社没有,我们的排版是请外国公司的,很多的排版文件,很多出版机构也没有真正的收回来,这是知识再延续时候的浪费。一定要建立编辑、主题、读者、作者互动关系。这是在采编过程要开始的。这是全生命周期信息管理成为数字出版的需求。
 发行机构随时都可以知道我什么时候哪个出版社有个新书,这个书大概是什么东西,书还没到他已经可以帮你做宣传了。所以在线全生命周期的管理,很多出版社有这种ERP,但是信息只是内部的,并不跟外部做交流。所以使得图书馆,新华书店要用这批信息的属于非常困难。而CIP属于预编的,它有很多问题,ONIX是当你有变化的时候可以发布出去。美国人和英国图书研究学会专门在关于在线信息交换,实际上是一种知识的传递,让你的下游每一个环节能够知道。
 我们现在得到的授权是整册的,包括按章节、段的使用权是不是得到了。你的表格之图片、公式,知识点是不是能够再标注,这也是一个问题。今后的数字出版的内容不再会是整册间的概念,而是到知识点到公式,到图表。
 多内容格式的变化,图片、文字、音频、视频、动画格式转换。这个问题可能比较突出了,中国最开始的甲骨文是象形文字,中国人是对图形,图象的认识转换成文字的。我们的后代永远在文字上走,他的思维不能开拓出去,我们要把我们的文字向图形,图像方面再做转换才能帮助他们做开拓思路。我们一方面是祖宗,从图形导向型文字,现在我们也有落后的,变成方块字以后没有办法再回到图形。这是我们出版在多内容格式变化的时候需要思考的地方。
 再就是作者、编辑、专家工作重点的变化。授权、理解、权威阅读分工。

 四、内容管理成为数字出版的需求
 我们觉得会有问题,现在几乎没有一个出版社能把你自己出版的内容,某一种温家排过版的文件从你第一份排过版到你现在出的能够拿齐的。现在好象都没有能够做到这条,非常可怕。Google总裁要中国要见文化部部长,他要数字化1949年以后中国出的东西。国家软件局批示不允许,其中有一句话是说,当年八国联军进中国是掠夺了中国的文物,现在美国人再来偷中国人的东西扫描就拿出去了。我们的这些遗产,我们自己都不很好的保护的话,没有保证出版过的内容是完整的和齐全的。所以内容的管理这块成为了我们现在数字出版里面很重要,需要解决的。

 五、知识管理成为数字出版的需求——什么是知识?
 我最开始和大百科合作,看大百科的知识库,知识库体系,知识要素这段东西也是非常重要的。不同的人学习不同的东西的时候,有些人是看全册书,有些人是看知识点的。大量机构编的都是属于学习的要点。但是这些东西怎么能很好的用?还是按一本书用吗?怎么能够通过前后台,通过外连接和内连接连接到你的出版机构,别的出版机构能够用起来?这是知识复用很重要的一条。你可以是搜词,我可以给你一个接口给你做起来。如果你们有机会看故宫博物院的网站,我是做这个网站的技术总监,在这个网站里只要研究员这是科普,需要有人知道的时候,那个词后面都会有一个问号,你点那个问号,那个词的解释就会直接出来。这种交互式的知识,是对于学习过程中非常非常重要的。不然永远都要查字典,查不同的工具书,效率很低。传统是没有办法办到的,因为不同的出版社出不同的工具书,在互联网上要提高效率就是要把知识很好的贯穿到一起。
 术语,包括任命、地名、机构名、年代、朝代的知识共享,这个并不是一个出版社用,所有的都用。
 字处理,我们非常遗憾,1974年中国开始搞计算机上文字到今天为止没把中国的字在计算机上管起来。尽管我们拿计算机代替了签字,但是没有把老祖宗留下的字统一化的管理好。国家下一个工程就是中国汉字工程,希望有20万个汉字把祖先留下来的字管理起来。
 机构数据交换知识的共享使用。机构里面不同的知识库,不同的数据元,这些数据元怎么再利用起来也很弱。
 科学符号处理,现在传统是用图片的方式,作为排版没有问题,互联网上有问题。互联网需要随着的缩放。排版里是不需要的,一旦出现随着缩放的时候,你的图表就会有很大的问题。
 标准,我们比较遗憾的是关于出版中间,特别是在互联网这个角度上出版的标准化。还有就是数字出版,针对数字全流程的标准化也是我们需要很弥补的一段。
 外字处理,有些字是搞不清楚这个版是坏的,还是真的有这个字。
 与服务机构,像图书馆、大学要获取作者的信息,作品相关内容转换到书目格式,作品内的知识的输出与共享,标准、规范、互操作、互交换。

 六、发行服务格式多样化
 载体多样化大家很直观,但是有一种意识,汤姆森的医疗手册永远是不在线的,他不换PDA,所以载体会有一种新的,你认为很重要的数据,不是说通过互联网的方式下载。因为通用的方式通过互联网可以下载,但是专用的东西是另外一种。
 服务的多样性比较关键,个人、机构订阅可能是载体型的。但是如果真正的电子报纸出来,它应该就是一张PAPER,他到了报亭以后把今天的内容一印就可以上去了。Epaper冲内容型的应用应该也属于载体型的应用。汉王做得很好,我们都还是叫Papper作为显示器在用。在英国是有真正的PAPER,就是一张纸你要什么内容就印什么样的内容,这个纸可以带着到处跑。
 你的内容要能够拆散卖,能够整合卖。

 七、知识产权保护
 这可能是所有人遇到的问题,数字图书馆初期也遇到了很多的非议,中国有500个作者在和Google打官司。美国的出版机构已经跟Google达成了谅解,Google的服务方式可能会给出版机构带来额外的码洋。这可能在中国只是一方面是我要保护出版机构的版权,但是在美国出版机构认为这可以带来额外的码洋。有限度的知识产权的保护,包括传递可能是一个很重要的东西。
 单文献表面组织,像图书馆这种组织。
 机遇文献内容的中等颗粒度组织法,包括引文的组织,这个可能像万方都是用这种组织法,还不是表面的组织法。
 基于文献最小颗粒组织法。北大他们是按照知识结构组织内容,把内容的知识结构抽出来再组织的。所以内容的最小结构闭路的时候是不一样的。既然是知识就要有普遍的意义,就是普遍人承认,那就用单纯概率法去抽,还有是基于时间轴,因为有的知识是随着时间变化而变化的。还有是基于多信源补充的组织法。所以说知识的组织方法是比较多的。大家可能都知道鲁迅,但是鲁迅到底真名是什么,可能有人知道,有人不知道,可能鲁迅还有别的笔名,所以要用多个信源组织信息,不是单信源法。这就需要出版社之间进行合作。因为一个出版社可能不会把全世界所有东西出在一起,但是全世界的出版机构合在一起就可以把所有出版过的东西搞清楚。所以知识的组织合作是非常重要的。
 作者、排版、印刷、发行、最终使用者、电子代理服务的版权明晰。02年的著作权法虽然规定了18种权利,互联网的信息传播条例可能也规定了很多,但是真正的这些东西哪些是权利,哪些是界限,是需要在版权的法律上非常清楚。如果你们有机会看一下在线信息交换的时候,它跟每一个作者签署东西的时候是有很多条例,甚至规定到了我的电子文件运不允许你做文献传递。传统的到图书馆是可以做传递的,但是电子书到图书馆的话可不可以做文献传递?如果可以的话,小图书馆就不需要再存在了。

 例子:电子工程专辑
 这是一个很不错的期刊,现在几乎所有做新的零部件的应用的工程师都会围绕这个网。一个新的器件出来就油供应上,有这本期刊。你可以看见它是围绕电子设计行业在组织用户紧紧的吸在它旁边。这是我看中文网站里比较值得大家学习和思考的。它不是只有一个电子工程专辑,是把它按照供应商、零器件的手册围绕着各种应用开用户区。要它的电子刊的人多了,要纸刊的人多了,围绕网站的也多了。这种电子刊,这种纸刊的发行量一定不会下降的。
 计算机世界:它很大一块也是在互联网,它的互联网服务最主要的条就是广告。这种广告传媒,实际上也是给出版社带来利润的。但是有一个前提,你的访问量要够。还有一个前提,你一定要让传媒的接口进来。传媒接口能知道来访问的是一个大学,这个大学是什么类的大学。他会把跟这一类大学的对应广告扔进去。很多人是做固定广告,谁来都是这个广告。Google就会换,它会随不同的地域广告栏是变的。这个专长是广告商。所以我为什么要说网站上开传媒的接口,让人家能够利用你的接口,你的用户宣传你的产品也是附带给你增值的地方。

 美国计算机协会服务:
 它原来不进中国,现在进中国的个人用户。原来都是进到机构用户,他进到中国的时候有一个很大的定位得清楚,他定位进入副高以上的。如果是副高以下的不是它的发展对象,他进入中国搞计算机副高以上的。所以可以看见,电子工程杂志是一个大范围做的,做硬件的。计算机世界是围绕着一个计算机的行业去做的。像计算机世界就是按照你的学历,你的职称,你的专业程度做的。它是一个计算机系列,有在线的书与课程,这不是它的,是他和出版社谈来的他认为搞计算机的人需要这些书和课程。他有很多计算机新闻。我是中国计算机协会的高级会员,我不看我们网站的东西,我看了觉得在别的网站都能看到,并没有特殊性的问题。但是ACM的计算机新闻我每次必看。我不可能在Google里找到所有关于计算机的新闻。他是靠他的编辑过滤过一次,把计算机行业当中很新的东西,很重要的反映到这里了。所以出版编辑的责任在变,除了跟作者打交道之外,你要跟用户的主题打交道,要根用户交流。
 出版服务最主要的理念需要变化,我今年抽40%的时间跟新闻出版总署在做数字复合出版的研究和专家评审,主要的是什么要变?传统的出版是靠编辑围绕作者定选题的,我一个好的编辑能把最出名的大家的作品拿到出版社来就成功了。我没有去管我这个作品的传播是不是真正产生效益。互联网不是,互联网最成功的基础是编辑是网络信息和用户需求的桥梁。你可以看新浪,亚马逊,他们都知道紧紧围绕用户的需求去做,而且是大量的编辑在做工作。
 数字出版成功的基础是比较清楚的,编辑是资源、作者、互联网信息与用户需求的桥梁。你的这个编辑一定要向互联网转,但是要具体化,你是资源、作者、互联网信息与用户需求的桥梁。
 未来绝对不会说我要你一本书,未来是你的书一定要打散,我要的是根据我的需求,你这个出版社跟我相关的内容重新组合。上面是现在的方式,一块一块的再买,一个包1.2万种刊扔到用户那去了,并不管你会不会看。以后不是,会以用户为选择,有行业的选择,工具的选择,反馈的选择。把拆散的块重新组合用户就会给你付钱了。
 谢谢大家!

来源:中国出版网
本版责编:江蕾
 
 
相关评论 发表评论 发送新闻 打印新闻 上一条 下一条 关闭
| 我的帐户 | 我的订单 | 购书指南| 关于我们 | 联系我们 | 敬告 | 友情链接 | 广告服务 |

版权所有 © 2000-2002 中国高校教材图书网    京ICP备10054422号-7    京公网安备110108002480号    出版物经营许可证:新出发京批字第版0234号
经营许可证编号:京ICP证130369号    技术支持:云因信息