|
 同方知网软件公司副总经理 张亚斌
尊敬的各位领导,各位出版社的同仁,大家下午好,我是来自同方知网的张亚斌,今天我给大家汇报的题目是“动态出版与知识服务”。我的汇报提纲分四个部分。
首先,我们看第一部分,知识服务推动数字出版转型。大家都知道我们传统的出版书报刊服务已经转向内容服务,并且转向知识服务,也就是说数字出版核心价值终极目标就是做知识服务,这是同方知网多年以来一直在做的一件事情。我们为什么要做知识服务呢?其实问题很简单,市场的需求发生了一些变化,市场的需求主要是用户使用行为发生了变化。我们一起看一些用户行为发生了哪些变化?
第一,个性化。个性化分为两个层面,第一个层面就是做一些个人图书馆、做一些个人的信息的定制。另外一个层面的个性化就是从我们出版社而言,我们出版社以前是做读书去找读者,而现在要根据用户需求定制我们的产品。
第二,及时化。及时化需要向用户提供精、准、深的内容,并且他可以脱离内容随时随地地享受知识服务,通过手机、移动终端随时随地的获得他的内容。
第三,知识化。面向一个业务应用,以用户的问题为目标,我们提出核心的解决方案,提供给他一种知识服务。我们通过的手段包括对信息的吸取、重组、创新、集成而形成符合用户需求的知识产品,形成增值服务,就是面向用户的问题提供知识的解决方案。
用户需求发生了变化,图情界通过资源发现、资源整合、知识揭示、知识组织去进行服务,但是这些还不够,要做好服务一定要从信息服务商源头来提供解决问题的办法。如果说图情界做的效果差强人意,出版界也在做一些尝试,现在我们也在做数字出版转型,从这两个图可以看到出版模式和出版形态都发生变化。原来是以图书为中心,以书找人,现在我们在慢慢摸索需求,根据用户需求结合我们自己出版机构的特点来定制我们数字产品,这个形态发生了变化。大家都在说要数字出版转型,不是十二五规划里面提到转型就要转型,一定是在市场需求和用户需求发生变化的时候,我们出版机构要做知识服务,同方知网在多年来也做了很多知识服务工作,待会儿我会给大家介绍同方知网做知识服务的案例。
谈到知识服务,我们就要做知识服务最核心的一点,就是做动态出版,动态出版是解决知识服务技术实现的必由之路。一般的专业出版社做动态出版是一个方向,动态出版包括几个步骤,第一个步骤就是做结构化的资源加工,定义我们内部的结构。另外,我们做内容碎片化,做到按需动态重组。做这个事情对出版社是很有好处的,一个就是出版内容有高水平的互操作性、可重用性。另外一块就是将多媒体内容进行控制,内容与样式分离,方便发送多终端,就是响应了用户需求的及时性,他可以通过手机、移动终端获取内容。第三,实现内容多次增值、快速增值。
所以,要做知识服务,我们要做动态重组,我讲一下动态重组的步骤,首先就是XML化,就是出版资源的数字化、内容碎片化,遴选出出版和有价值的知识内容制作成XML数据,包括篇章节、文字段落、图表、概念等等进行数字化。第二个就是内容结构化存储,按照统一的格式来定义,包含文本内容的结构、属性、关联信息进行存储,实现提取后数据完整性和结构化的标准化,自动将文档拆分为可重新利用的形式。有了内容组织以后,我们要做的就是按照我们定义某一种类型发布的样式进行多样化的发布,最后动态重组一系列产品。这是整体动态重组的关键步骤和技术。
实际上很多出版社都在尝试这个事情,但是做这个事情也有一些难点,如何实现海量数据碎片化?这是一个不小的工程,第二个难点就是碎片化内容如何实现动态重组和动态关联?比如面向旅游方面的,它的景点介绍、历史背景,这样的内容如何进行关联,这也是值得探讨的问题,所以现在我们能做的就是这样一些数字化。
带着这些难点,这下面是我们实现的一些内容的技术,动态出版为知识服务的实现提供了更好的数据基础和新的可能,相关技术包括XML技术、NXD数据库技术,知识元抽取技术和其他可行的知识技术。带着问题,我们掌握一些技术,我们一起结合这些技术看一下我们同方知网做了哪些知识服务的工作。
首先,我们CNKI云出版平台,云出版平台核心理念就是知识聚合、动态出版、多元发布、个性建馆,这四个核心点贯穿了整个从内容的生产、制造到整合,到下游服务整个流程。从这个我们可以看到首先我们第一个是做了一个动态重组的引擎,第二个是做了一个“腾云”数字出版解决方案,构建了自己的基于XML为核心的平台。另外是多元发布的引擎,之后我们还有一个内容发现引擎,帮助用户更好的找到他想要的内容。
同方知网在相关动态出版这块做了大量的工作,可以分两个层次。第一,基于单篇文献的知网节技术构建的知识服务体系,我们根据一篇文章,我们从这个图可以看到从14个层面去做,包括题录摘要、参考文献、引证文献等等方面来做,这是我们知网的独特技术。另外,我们从网线外部进行一些组织,通过文献分组,让用户在我们平台上进行查找,查找的时候可以更精确的去提供给用户做服务,这里包括文献类型、研究层次、作者、关键词、发表年度等等,从这几个维度进行搜索,更好为用户提供知识服务。
我们基于知识元级别也做了一些知识服务,首先是在动态出版平台上进行深层次加工,这里包括知识库、知识元库、动态存储、结构化存储、内容碎片化等等,为读者提供这个服务,形成一个知识生产、加工全流程的实际系统。我们技术研发工作,在今年推出了NXD数据库发布,另外我们知识元生产线投入运营。初步构建了一些理论、事实型知识元,约5亿条。理论型方法知识库,还有应用型方法知识库。实际上我们提了好几次知识元,知识元到底是什么?我们不知道哪一图书加工到碎片化加工到什么程度,一个词、一个字、一个段落都可以做碎片化处理,但是这个不足以描述我们的内容,所以我们建议文章最小单元,这就是一个概念。另外做的就是图片知识库,2000多万张,另外就是图片搜索,就是以图搜图。
另外,我们面向用户应用级的动态重组,包括和商务印书馆合作的商务工具书知识库系统,关于字词读、写、用的知识库系统。对用户提供一站式的知识服务,不需要用户在其他平台去找内容。另外,就是我们刚刚完成的汉语大辞典、康熙字典的知网版的工作。这也是构建了具有相关性立体的动态的知识体系,很好实现了知识具体,大大拓展用户信息视角,帮助用户便捷的获取信息。这是它的主要功能,包括十大增值服务,我就不一一介绍了,大家可以在同方知网首页体验。
刚才我介绍了同方知网的一些工作、应用和技术研发,另外我们还为出版社做了一些技术的整体解决方案,大家可以想到的服务我们都做了,包括版权保护、镜像知识库服务、电子商务等等。我们整体方案核心就是对内容进行数字化加工,深度整合、分类管理,以便于读者搜索所需要的内容。
另外,跟大家表一个态,同方知网愿意和出版机构在多个层面进行合作,不仅仅是做技术平台,这个表可以清晰的看到,我们可以做产品开发,和出版社一起委托制作、共同投资、共同设计做一些产品,比如刚才看到商务印书馆的做的工作。另外一块就是技术服务,我们可以软件开发、技术咨询、软件定制等等。另外就是市场营销,我们可以把同方知网在做数据资源发行的全球19000万家用户进行渠道共享、用户共享。另外就是数据加工,本身同方知网做自己数据出版的同时也有很大的资源加工的工作。另外就是排版印制,我们山西太原成立了自己的一个印刷厂。同方知网与出版社进行多层次、多种方式的合作,愿意与大家分享技术和市场、经验,共同把数字出版产业做大做强。谢谢大家!
来源:中国出版网
|