账号: 密码:
首页  |  宏观指导  |  出版社天地  |  图书代办站  |  教材图书信息 |  教材图书评论 |  在线订购 |  教材征订
  图书分类 - 中图法分类  专业分类  用途分类  自分类  制品类型  读者对象  版别索引 
搜索 新闻 图书 ISBN 作者 音像 出版社 代办站 教材征订
购书 请登录 免费注册 客服电话:010-62510665 62510769
碎片化设计重构数字出版演进史 - 代办站经营之道 - 中国高校教材图书网
教材图书查询






综合查询 分类查询
查询新闻




最新可供书目

信息技术基础

西安电子科技大学出版社


区域国别学跨学科研究的理论与方法

中国人民大学出版社


我国普通高校“运动教育模式”的 理论构建与实证研究

北京体育大学出版社


高原人员疗养与康复

第四军医大学出版社


于安澜书画篆刻作品选

河南大学出版社

主页 > 代办站经营之道
碎片化设计重构数字出版演进史
中国出版传媒商报记者 刘志伟
2016-12-15 09:45:21  来源:中国出版传媒商报 
 

    作为后工业时代的一种新型产业形态,数字出版的内容构成、产业特点、发展规律、经营策略等诸多方面与传统出版业都有本质的差别,既有的管理制度、管理模式、研究范式已不再适合。当前大多数的出版企业已经完成了对纸质内容的数字转化,但数字产品形态单一、生产与市场需要之间差距较大、数字出版收入在出版单位总收入中所占比例不高、投入与产出较低等问题仍较明显。如何进行技术创新,并赋予尖端技术广泛的商用价值,成为业界需要认真研究的新课题。出版企业需要跟上新产业、新技术、新模式的发展步伐,引领数字出版产业的发展演进。利用碎片化深度加工、人工智能化数据挖掘、隐性知识发现、内容动态重组等手段,是完善数字出版的一大发展趋势。

  知识元:动态重组出版资源

  知识体系的解构重建不是一日之功。出版企业需要用非传统的编辑方式来加工生产内容资源,将其定向规模化地汇集,并通过专家系统进行深度挖掘、发现和组织。这一过程需要横向、纵向聚集梳理各类资源,形成智力支撑的内容和知识。尽管工程浩大,但在各个专业领域和教育领域,这些数字内容有望发挥比纸质图书更大的作用。在这一背景下,出版企业开始展开探索对数字产品的碎片化、动态化的设计。

  化学工业出版社的相关负责人温强在与记者交流时谈到,该社正通过知识服务模式的不断创新,采用迭代开发的形式进行平台升级,进而实现动态化、智能化的知识服务。目前,化工社开展的专业领域知识服务工作处在“泛知识服务”的阶段,以化工社万余种存量优质出版资源为基础,以增量的出版资源为核心,通过个性化打造的全媒体出版资源管理系统、版权资产管理系统和化工类语义资源加工系统进行基础支撑,通过“化工知阅”平台进行知识资源的出版发布,已经基本打通泛知识服务的出版全流程。

  对于出版企业而言,打造数字产品、构建知识服务体系的同时,离不开对“知识元”的透彻理解和应用。所谓“知识元”,是指不可再分割的具有完备知识表达的知识单位。此前,同方知网技术有限公司基于知识元级别做了一些知识服务,在动态出版平台上进行深层次加工,包括知识库、知识元库、动态存储、结构化存储、内容碎片化等,为读者提供服务,形成一个知识生产、加工全流程的实际系统。又如,中南大学出版社开发制作了中国有色金属知识库,知识库的核心内容是其出版的有色金属图书和期刊全文内容以及有色金属行业期刊文献的摘要信息,涵盖地质、采矿、选矿、冶金、材料等相关学科内容。为了重组知识结构,体现碎片化、动态化的设计,该社并没有将知识库等同于单纯的数字化,而是经过具有专业知识背景的编辑标引,通过自主研发的“资源数字化加工平台”进行深度数字化,将其加工成为一个个“知识元”,形成有色金属专业知识的内聚与外延,成为具有知识网络结构的高质量专业知识库。

  有了“知识元”后如果能将其进行“动态重组”,则会使得数字产品得到进一步完善。一位业外技术人员陈旷告诉记者,动态重组的步骤,首先是XML化,即出版资源的数字化、内容碎片化,遴选出有价值的知识内容制作成XML数据,包括篇章节、文字段落、图表、概念等。其次要对内容结构化存储,包含文本内容的结构、属性、关联信息,实现提取后数据完整性和结构化的标准化,自动将文档拆分为可重新利用的形式。有了内容组织后,要做的就是按照定义进行多样化的发布,最后动态重组产品。相似的,人民卫生出版社正在搭建的药学互动型知识库,也强调“动态”“互动”。其是以临床实践需求为导向,以智能服务为目标,旨在成为临床医生科学诊疗、合理用药、追踪学术、循证医学的权威工具。它改变数据库的单一搭建模式,突出实时更新、在线编写、循证实践、智能综合服务的特点,构建智慧互动型知识库,建立医药卫生数字服务新业态。

  碎片化:升级内容检索标准

  数字出版已经迎来大数据时代,检索功能的重要性开始提升。传统的数字产品包括对标题、关键字、全文、作者等项目检索,但随着用户和读者进行相关图书信息搜索的需求越发多样化,此前的检索方式由于不适应自然语言的结构而明显落伍。因此,形成独有的对知识点检索、图检索、表格检索、公式检索等功能,将为用户提供创新的科技知识服务。

  读者自定义的搜索主题是用自然语言表述,是由字和词按一定规则构成,还可能包含一些符号或标点。图书内容也同样由这些基本元素构成。要想在两者之间建立起联系,就应当从这些基本单元入手。汉语中的词比单字具有更加完整的含义,所以把词作为基本的构成单元对待。将描述或构成图书内容的文本,拆分成具有独立含义的词,是寻找内容相关性的基本前提。而这一过程即“碎片化”。

  出版企业在完善数字产品的一项重要步骤即对搜索引擎进行升级,从而确保用户或读者能够实现精准的检索,这样才能确保知识服务有效开展。就碎片化对搜索引擎性能的影响来看,科学出版社的相关负责人金安的观点颇具代表性。经过基本的碎片化加工之后,可以从出现频率的角度,定量地考察各相关词汇(索引词)与内容的相关度。但实践表明这还不够。由于没有对正文全部进行碎片化处理,就忽略了章节内容、长短对图书整体相关性产生的影响。因此,需要挖掘一些能够定性描述图书核心内容的关键词,来补偿或校正这一影响。既然这些词起的是定性作用,则需赋予其较大的权重,即其所代表的内容以高于平均值的频率出现在总体内容中。这一措施对提高搜索引擎的质量作出了重要贡献。

  比如中华书局推出的“中华经典古籍库”(在线版)是此前推出的大型古籍数据产品“中华经典古籍库”(局域网版)的升级产品。它的创新功能就是强调“索引”。比如,中华书局专门为此搭建了“专名词库”将人名、篇目、事件、地点、职官、纪年等专名分门别类单独标引,构建这些知识点的资料库。又如提供“异称关联检索”,在繁简、异体字关联检索的基础上,整理并增加了人名、地名异称的关联,如字号、别号、谥号、官名等同步检索,简化了多次检索的繁琐操作,使检索更加灵活全面。

  具体案例来看,南京大学出版社在2016年推出了“中文人文社会科学学术著作引文索引数据库”(CSSCI),项目的核心内容是构建人文社会科学各学科的双语术语库,为了建立双语术语库,核心工作大致可分为四个部分,即确定词汇来源、词汇采集与规范、术语翻译与术语库构建、术语库应用等。

  谈及项目策划初衷,该社相关负责人戚宛珺介绍,知识服务是“十三五”规划期间出版行业融合发展的重要战略,为此除了需要制定一系列与出版行业相关的技术标准外,还需要建立较为规范的话语体系。规范化和标准化的学术术语库建设是话语体系建设的基础工程。

  南大社在数据采集过程中首先对正式出版的各学科专业词典和术语词典中的词汇进行数字化,由专家审定后形成学科汉语基础词表,再借助研发的分词工具进行机器分词,对分词结果进行人工核对后交由专家审定,形成学科汉语核心词表。与此同时对CSSCI收录的学术文献进行整理,对期刊文献的关键词进行提取,对图书文献进行电子化加工并研发工具对电子化图书进行高频关键词提取;对关键词进行有效性筛选后与期刊关键词合并,进行机器分词,将分词结果进行人工核对后与第一部分数据加工形成的汉语核心词表比对,未能匹配的词语进行专家审定,审定有效的词汇与汉语核心词表中的词汇一起形成学科汉语术语词表。而在后续的动态更新过程中,此术语词表将代替之前的汉语核心词表作为底表供比对使用。

  该项目最终词库应用,除了满足权威性外,还要满足准确性和有效性。为此,南大社在生成学科汉语术语词表后,对词表中的术语进行概念与语境抓取及核对,继而由专业团队结合资料、概念和语境进行术语翻译,并交由术语翻译专家和学科专家审定,将词条信息、翻译信息、概念信息、语境信息共同录入双语术语库,为学术翻译、学术交流及学术数据库精确化和国际化知识服务提供工具基础,同时在使用的过程中积累数据并挖掘用户行为,发现新的学术术语,经专家审核后动态更新学科术语词表。


    来源:中国出版传媒商报2016年12月13日 星期二

本版责编:姜舒

相关内容
  • 西南交通大学出版社应邀参加第三届国际海洋结构与管道学术研讨会暨《海洋工程柔性立管与海底管道设计及分析》新书发布会 (2016.06.22 16:07:55)
  • 中国人民大学周末高端UI交互设计培训班邀请函 (2015.02.09 16:26:57)
  • 关于举办移动出版策划与设计培训班通知 (2013.06.04 15:49:48)
  • 浙江大学出版社计算机专业课程设计教学研讨暨教材推介会在北京顺利召开 (2008.03.28 15:33:18)
  •  
     
    相关评论 发表评论 发送新闻 打印新闻 上一条 下一条 关闭
    专业分类
    经济学  公共课与文化课  政治法律  教育学  文学艺术  历史学  理学  工学  农学  医学  计算机/网络  管理学  其他  外语  哲学
    用途分类
    大学本科教材 大学本科以上教材 大学教学参考书 考研用书 自学考试教材 高职高专教材 中职、中专类教材 中小学教材、教辅
    电大用书 学术专著 考试辅导类图书 工具书 培训教材 其他
    中图法分类
    医药、卫生  语言、文字  工业技术  交通运输  航空、航天  环境科学、安全科学  综合性图书  文学  艺术  历史、地理  自然科学总论  数理科学和化学  天文学、地球科学  生物科学  哲学、宗教  社会科学总论  政治、法律  军事  经济  马克思主义、列宁主义、毛泽东思想、邓小平理论  文化、科学、教育、体育  农业科学
    教材征订
    公共课类 外语类 文科类 艺术体育类 理工类 医药卫生类 农林牧渔类 电大类 高职高专类
    中职技术类 继续教育类 馆配类 其它
    版别索引
    北京大学出版社 北京师范大学出版社 清华大学出版社 中国人民大学出版社
    北京工业大学出版社 北京大学医学出版社 北京航空航天大学出版社 北京交通大学出版社
    北京理工大学出版社 北京体育大学出版社 北京邮电大学出版社 中央音乐学院出版社
    北京语言大学出版社 对外经济贸易大学出版社 国家开放大学出版社 首都经济贸易大学出版社
    更多...
    网上购书指南
    一、我的账户
    用户注册
    用户登录
    修改用户密码
    修改个人资料
    二、查询图书
    快速查询
    分类查询
    综合查询
    三、订购图书
    第一步点击“订购”按钮
    第二步确定收货人信息
    第三步提交订单
    存书架
    四、邮购方式
    普通邮寄
    特快专递
    五、付款方式
    支付宝
    邮局汇款
    六、我的订单
    查询订单
    修改或取消订单
    联系我们

    | 我的帐户 | 我的订单 | 购书指南| 关于我们 | 联系我们 | 敬告 | 友情链接 | 广告服务 |

    版权所有 © 2000-2002 中国高校教材图书网    京ICP备10054422号-7    京公网安备110108002480号    出版物经营许可证:新出发京批字第版0234号
    经营许可证编号:京ICP证130369号    技术支持:云因信息