账号: 密码:
中国大学出版社协会 | 首页 | 宏观指导 | 出版社天地 | 图书代办站 | 教材图书信息 | 教材图书评论 | 在线订购 | 教材征订
搜索 新闻 图书 ISBN 作者 音像 出版社 代办站 教材征订
购书 请登录 免费注册 客服电话:010-62510665 62510769
人工智能之于科技期刊出版业态的变革及启示 - 专辑2:新业态与技术趋势主题 - 中国高校教材图书网
主页 > 专辑2:新业态与技术趋势主题
人工智能之于科技期刊出版业态的变革及启示
王亚辉 王晶(中国农业科学院农业信息研究所)
2023-01-11 10:41:54  来源:中国大学出版社协会 
 

  【摘要】为探讨人工智能对科技期刊出版业态的可能影响,采用趋势分析和案例论证方法,对人工智能技术语态下科技期刊的内容生产、传播生态和价值逻辑进行全景式呈现,认为未来出版业态将更加智能化、高效化、定制化、场景化;介绍了人工智能应用存在的现实瓶颈提出了如平衡人机关系、重塑编辑价值的人工智能风险挑战的适应性治理思路。
  【关键词】科技期刊;人工智能;智能化;算法;出版业态

  翻阅出版史,从“铅与火”到“光与电”再到“数与网”,每一次重大技术突破和革新都给出版行业带来巨大变化。以人工智能为代表的新一轮技术创新也必将驱动传统科技期刊出版行业发生历史性变革,加快智能出版融合发展进程。

  有学者就人工智能与出版行业的深度融合做了一些有益的探究。王晓光认为,人工智能对出版内容创作、编辑、发行传播多个环节都有潜在重大影响,而且这种影响是难于预估的[1]。刘华东等指出,智能出版将会成为新闻出版业的未来发展趋势,构建自动化、智能化、系统化的出版流程是融合发展的必然要求[2]。张海生和吴朝平提出,人工智能基于技术、数据和算法,推动出版技术的智能化、出版资源的数据化和出版供给的科学化,需要在技术、数据、算法和人才4个纬度协同推进人工智能与出版融合发展[3]。但上述研究多是聚焦新闻出版或广义出版领域,鲜有涉及科技期刊出版;论述的视角也较为宏观和抽象,对人工智能与出版融合发展的趋势和前景做了较多的论证和畅想,而对微观和具象层面的融合策略、创新路径、制约瓶颈着墨较少。本研究坚持问题导向,就人工智能之于科技期刊的未来出版逻辑、出版范式、出版主体、出版生态、出版伦理全方位、多维度的变革与颠覆进行了全景的呈现、具象的阐述和案例的论证。在透析人工智能或将重塑科技期刊传统出版流程、驱动内容生产、渠道分发和交流分享智能升级的同时,也讨论了科技期刊出版行业应用人工智能仍存在的一些现实瓶颈和困扰以及适应性治理策略。

  1  科技期刊出版业态的变革

  人工智能借助数据挖掘、机器学习、模式识别、智能算法等技术手段进行数据采集、分析和处理,通过智能感知、智能计算和智能服务,将从根本上改变科技期刊出版行业的选题策划、内容生产、编校加工、发行传播、知识服务和阅读体验等一系列业务流程,塑造出版产业全新的信息生产、分发、服务和消费的生态环境,实现出版业态的智能化、便捷化、自动化、高效化、定制化、精准化、场景化、可视化。人工智能将再造科技期刊出版业态,至少体现在以下方面:

  1.1算法化选题策划

  在大数据、云计算等技术支持下,人工智能依托智能算法对海量数据进行抓取、挖掘、分析,可快速定位、跟踪和筛选目标学科的研究热点和核心话题,还可以清晰了解读者偏好,根据读者阅读内容、环境、时间、浏览痕迹、情绪波动等主观行为及对论文的在线交流、评论回复转发数据的统计分析评价,最终制定出精准高效的选题策划方案。

  目前在出版范畴内,人工智能参与选题策划取得了一些积极的进展。德国的一家新兴出版商Inkitt本是一个电子书写作社区平台,平台上积累了超过20万部可供阅读作品的电子书资源,它利用算法模型分析读者在线的阅读行为和兴趣偏好,预测电子书的市场潜力,将算法标注为畅销书的电子书选题交由传统出版商完成纸质图书出版[4]。北大方正电子公司推出出版大数据解决方案,通过对电商、阅读、评论平台和社交网络内容、用户和市场数据去重去噪后的数据管理、可用评价、机器学习、情感分析、用户画像的绘制,帮助编辑发现研究热点,优化出版选题。Springer Nature开发的SciGraph关联开放数据平台,集成了包括期刊、论文、项目、专利、主题、研究人员、科研机构、使用数据在内的高通量、跨领域的内容资源和知识数据,在数据融合、知识发现、内容计算基础上,构建学术知识数据融通关联的大规模知识图谱,基于对知识图谱的智能语义搜索、主题聚合探索分析,有助于掌握学科发展脉络、挖掘特色选题[5]。美国Clarivate Analytics旗下的学术信息检索平台Web of Science期刊利用LDA(Latent Dirichlet Allocation)文档主题生成模型,该模型是一种无监督的机器学习技术,通过对特定领域的学科数据进行分析处理,筛选关键热点,借助算法抽取主题词汇,按显著性自动形成特定主题,为期刊选题组稿、热点追踪提供方便[6]。

  1.2自动化内容创作

  自动化内容创作较早出现在新闻出版领域,尤其是在国内外主流媒体的新闻报道中,写作机器人得到了大规模的应用,典型如美国《华盛顿邮报》的Heliogra、美联社的Wordsmith自动撰稿平台,国内腾讯的Dream writer、新华社的“快笔小新”。在学术和专业出版领域,2019年4月,Springer Nature出版了世界上第一本由人工智能写作的学术著作《Lithium-Ion Batteries》,这是由德国法兰克福大学应用计算语言学实验室合作开发的名为“Beta Writer”的算法完成的,它使用了基于相似性的聚类程序,将源文档排序为连贯的章节,并生成简洁的论文摘要,引文则以超链接形式注明,方便读者查阅,通过对锂离子电池领域53 000多篇学术文献的跨语料自动摘要,综述了该项技术的前沿进展[7];来自美国伦斯勒理工学院等机构的科学家们开发了一款叫做“PaperRobot”的人工智能学术助手,借助自然语言处理和自然语言理解技术对生物医学领域已发表的大量论文深度学习,构建背景知识图,并协助撰写给定主题的论文摘要、关键内容,梳理结论甚至提出进一步的研究建议,对“PaperRobot”生成论文的图灵测试结果表明,机器创作的摘要、结论和研究建议比人工写作有更高的接受度[8]。

  值得警醒的是,上述人工智能的尝试并不意味着在不久的将来,机器就能取代人类完成逻辑清晰、论述严谨且有创新发现的研究论文,人工智能现在所做的也仅仅是基于知识数据库或背景知识图对现有的知识、概念进行梳理、链接和聚合,它并没有且短期内也不会创造新的知识和科学发现,而新知识、新发现恰恰是人类不断探索、艰苦攻关、协同创新的智慧结晶。

  1.3智能化文稿处理

  在组稿阶段,人工智能能够利用智能联网搜索技术和数据文本挖掘技术,从各大平台和数据库中筛选研究领域符合期刊定位且学术成果丰硕的作者并定向约稿,同时附上刊物介绍、投稿要求、体例格式等材料,方便作者了解,增加约稿成功的几率。如Semantic Scholar、Iris.ai、UNSILO、Yewno等基于人工智能的学术搜索工具,采用机器学习、语义分析等方法,提取文本的含义和关键概念,帮助用户快速理解论文内容,定位、分类、筛选有价值的研究、作者和机构,给选题与组稿带来极大便利[9-12]。具体如UNSILO利用自然语言处理和机器学习技术,分析提炼论文内容,提取作者的主要论点和研究发现,还可抓取PubMed Central学术数据库中数百万篇的生物医学论文全文,便于编辑对研究成果有快速、大概的了解[11]。清华大学计算机科学与技术系的研究团队建立了科技资源大数据分析挖掘与服务平台“AMiner”,该平台囊括了超过2.3亿篇学术论文、专利和1.36亿位学者,集成了专家档案智能抽取、专家智能搜索、学术大数据融合、学术评价等多项功能,提供了针对科技文献、专家学者和学术活动的强大搜索能力。

  在审稿阶段,智能化的学术不端检测工具能够识别整个句子或部分段落,甚至一些反剽窃工具开发了图表检测功能,可以发现伪造图像,弥补了现在的查重软件逐字匹配查询且不能识别近义词或相似句、图像的缺陷,更加有效地打击学术抄袭,在初审环节过滤一批学术不端稿件。如Elsevier设计的自动化编辑系统Evise,通过检索和匹配程序与CrossCheck数据库的文献进行比对来检查论文的剽窃[13];来自美国Syracuse University的Daniel Acuna博士研究团队在bioRxiv上发表的一篇文章中介绍了一种机器学习算法,该算法使用基于关键点的检测方法对来自生命科学领域4 324本期刊的76万篇开放获取论文的200多万幅图片进行了检测,发现约9%的图像存在高度重复[14]。人工智能技术还可智能推荐合适的审稿人。如瑞士Frontiers Publishers研发的人工智能评审助手AIRA,结合内部自定义算法并嵌入Google、CrossRef的iThenticate(文档原创性检查工具)和Editage的Ada(论文自动化评估工具)的功能,快速准确评估稿件质量,还可匹配潜在的同行评审专家,并检查编辑、审稿人和作者之间可能存在的利益冲突[15]。

  在编校阶段,大量低端、重复的编辑加工校对工作都可交给人工智能的自动排查和纠错系统来高效完成,包括文稿中字词句段、语法修辞有无错误,中英文翻译是否对照,计量单位、名词术语的书写是否准确,篇章结构、插图表格、参考文献的格式是否规范,数理统计模型运用是否恰当,实验设计及结果论证是否可靠。如Elsevier的Aries审稿系统采用StatReviewer软件的AI功能核查论文的试验方法、统计数据和研究结论的完整性和可靠性[11];方正智能辅助审校系统应用机器学习和深度学习技术,拥有分词、实体识别、句法分析、深度语言模型等方法,已初步开发完成易错词、敏感词、不规范名词、连接符、全半角、单位大小写、图表公式序号检查等11项功能。

  1.4个性化发行传播

  科技期刊在数字化、网络化的转型过程中积累了庞大的科研成果、文献资料等内容资源,在长期的出版实践中汇聚了大量的编委、专家、作者、读者等用户资源,这是科技期刊实现内容与用户智能匹配的数据基础。在此前提下,人工智能依托用户在各类互联网平台、学术社交媒体上对学术资源的搜索、点击、下载、关注、收藏及分享行为的数据聚合和算法分析,描绘用户的研究领域、阅读兴趣、关注重点等特征画像,完成内容的个性化分发。

  TrendMD是加拿大的一家出版技术服务公司,可提供跨平台相关文章的个性化精准推荐,它通过在合作期刊网站后台安装插件,索引期刊论文的历史元数据,并利用跨平台内容推荐模块的协同过滤技术,根据读者阅读趋向实现合作期刊平台和第三方平台论文的精准推荐,每月通过TrendMD平台推荐的文章链接高达8亿条,惠及超过1亿的读者[16]。超星集团推出“域出版”移动出版平台,为用户提供智慧化的学习资源,其特色的“指纹采集”功能结合用户在平台上的“收藏”“最近浏览”“读书排行”等源数据,可建立个人阅读行为和阅读曲线,并按照阅读曲线推送定制化内容。

  1.5场景化阅读体验

  场景时代的媒体传播更多强调内容产品给用户带来的沉浸式、可视化体验,超脱了传统出版以文字、图片为主的静态传播样态,使得传播更加生动形象、贴近人心。VR(虚拟现实)、AR(增强现实)、MR(混合现实)等技术丰富了传统出版的内容呈现样式和用户交互方式,对内容和信息的表达更加深刻、直观,为用户带来了深度沉浸、主动参与的“临场”体验。

  VR/AR技术引入科技期刊出版,也可丰富读者的阅读形式,提升读者的阅读体验,特别是在理工农医类科技论文中仪器设备、实验过程、医科手术的立体再现中有较大的应用优势。《上海大学学报(自然科学版)》在“三值光学计算机”专题出版中,探索性地实现了科技期刊论文的动静态AR呈现,读者通过智能终端下载纸上AR的App,扫描文中图片,即可在移动端完美展示三值光学计算机实物和体验视频[17]。

  1.6社群化学术交流

  借助大数据技术的分类、聚类分析和关联规则,通过算法的智能匹配和精准推荐,能够将具有共同学术旨趣的专家学者聚在一起,组建科技期刊稳定的学术社群,如编辑作者交流群、作者读者互动群,实现编辑、作者、读者间的深度交流。在学术社群内用户可以实时关注期刊动向及最新研究成果的发布,可以就某一学术话题开展学科内或跨学科的探讨、辩论,还可以在线获取个性化、精准化的学术资源。

  Frontiers一直坚持社群驱动出版的理念和实践,开发了科研社交平台Loop,科学家们在平台个人主页上可发布科研成果、学术活动等内容,上传论文、视频、新闻等资源,学者间可相互关注,加入学术小组,向科研同行推荐有价值的学术内容,还可在线组织学术交流[18]。国家新闻出版署出版融合发展(武汉)重点实验室发起的开放科学计划OSID平台也有类似的功能,支持期刊社、编辑、作者、读者构建学术交流社区,在学术圈内可就期刊论文、学科热点进行学术讨论、资源共享、开放交流和社交互动。

  2  科技期刊出版应用的瓶颈及困扰

  诚然,人工智能近年来获得了迅猛的发展,重新定义了科技期刊传统出版的价值理念和思维方式,将催生出版的新业态、新模式、新逻辑。但人工智能完全应用于科技期刊出版行业,仍存在一些现实的瓶颈和困扰。具体表现为:算法驱动的选题策划、内容生产同质化严重,专业性、创新性不足;精准推送带来信息窄化;技术局限,人才匮乏;出版数据融通、共享困难。

  2.1算法驱动的选题策划或内容同质化

  人工智能利用数据挖掘和深度学习技术,抓取和分析互联网空间的热门事件、热点话题,辅助编辑选题策划,但一味追逐热点、热词,便会造成期刊选题同质化,甚至盲目跟风研究,而缺乏前瞻性、预见性。事实上,差异化、前瞻性的选题才是期刊凸显特色、塑造品牌,引领学科发展的主要抓手。

  2.2人工智能学科专业性、创新性不足

  人工智能目前还不具备人类思维的判断能力和创造能力,机器创作仍处于初级阶段,多适合程式化、模板化的新闻报道,对需要调查核实和揭示真相的调查性、评论性内容生产尚无所适从,更遑论需要专业研究、深度解释、复杂推理的科学论文,正是由于专业性、创造力的缺失,人工智能暂时还无法取代人类。

  2.3精准推送可能带来信息窄化

  基于用户个人画像和阅读行为的智能分发虽然为用户获取个性化信息带来便利,但也伴随一些信息遮蔽问题,受众接收的始终是同类或相近主题的内容,而接触不到其他领域的信息,致使信息窄化、视野受限,容易造成知识固化,即陷入所谓的“信息茧房”。这对于以科研工作者为主体的科技期刊受众打破学科界限,从事跨领域、跨学科学习及研究显然是不利的。

  2.4技术局限,人才匮乏

  目前的人工智能尚处于以深度学习为基础的弱人工智能阶段,距离可媲美人类智慧的强人工阶段还很遥远,人工智能与出版行业的融合也刚刚开始。除了技术局限外,人工智能的专业人才极度匮乏,出版业界运用人工智能的意识和能力严重滞后,一定程度上制约着人工智能与传统出版的融合进程。

  2.5出版数据融通、共享困难

  数据是人工智能的“养料”,没有数据支撑的人工智能是无以为继的。但长期以来,数据的价值易被传统出版单位忽略,对内容资源、用户信息、生产流程以及关系交互的数据积累不足,而且不同期刊出版单位、部门之间,学术出版商之间的数据难以开放共享,出版数据垄断和数据壁垒普遍存在。

  3  人工智能风险挑战的规约与治理

  人工智能是科技进步和社会发展的产物,它在为科技期刊出版业态变革带来一系列新机遇的同时,也不可避免地伴随着一连串新挑战。爱因斯坦说过,“科学是一种强有力的工具,怎样用它,究竟是给人带来幸福还是带来灾难,全取决于人自己,而不取决于工具”。因此,人工智能的问题,不是也不能简单归结为技术层面的问题,根本上还是人工智能与人类的关系问题:怎么看它,怎么用它,怎么引导,怎么约束,怎么适应,怎么治理,终极目标是确保其安全、可靠、可控地服务于人类的发展。

  具体到科技期刊出版领域人工智能应用风险挑战的规约与治理,其基本思路是:平衡人机关系,重塑编辑价值,增进协同共治。人工智能新时代下,我们需要深化对科技期刊出版流程的把控、编辑活动规律的认知、出版伦理和文化价值的坚守,加强前瞻预防,权衡技术利弊,调试价值冲突和伦理困境;我们应该公开算法,让算法透明化,增强算法的可解释性、可理解性、可预测性,关注和防范算法偏见、算法权利滥用和“信息茧房”,解决选题功利化、内容模式化、推送单一化等诸多问题;我们需要强化编辑的主体意识、责任意识和把关意识,在选题策划、同行评审上发挥编辑在人文关怀和价值判断上的文化引领性和主观能动性,弥补人工智能的技术缺陷和价值失范,与人工智能优劣互补、分工合作,构建人工智能技术与编辑伦理和谐共生的出版生态;我们需要增进法律、政策、行业、机构、个人多方协同,构建共建共治共享人工智能新格局,需要加强立法和政策监管,明确数据的使用边界和使用时效,规范技术的适用范围和使用标准,建立人工智能出版的责任管理体系,需要推进行业出版数据开放共享、标准统一和业务协同,需要加大全民人工智能的教育普及和人才培养力度,尤其是提高编辑人员了解运用人工智能新技术的专业素养。

  4  结语

  人工智能给出版业带来的变化是全新的,潜力是巨大的,影响是深远的,对内容生产、传播格局、出版生态的形塑和再造是全链条、多视角的,是出版生产力的进一步解放和生产关系的深层次变革。面对人工智能,我们需要以创新、务实的理念和开放、包容的心态,主动拥抱、积极融入,发挥其优势,弥补其缺陷。在人与机器的协同与共生中,我们需要强化编辑的主体地位和科学引领责任,也要认真评估算法歧视、数据越界、隐私保护、侵权追责以及人工智能生产内容的版权归属等技术、法律和伦理问题。

  参考文献:
  [1] 王晓光.人工智能与出版的未来[J].科技与出版,2017(11):6.
  [2] 刘华东,马维娜,张新新.“出版+人工智能”:智能出版流程再造[J].出版广角,2018(1):14.
  [3] 张海生,吴朝平.人工智能与出版融合发展:内在机理、现实问题与路径选择[J].中国科技期刊研究,2019,30(3):226-228.
  [4] ALBAZAZ A.How Inkitt publishes your books:from preparation to promotion[EB/OL].(2017-05-27)[2019-12-18].https://degfhkjgfjhf.inkitt.com/how-inkitt-publishes-your-books-from-preparation-to-promotion
  [5] 宋宁远.面向智慧数据的科学知识图谱构建——以SciGraph为例[J].科技与出版,2017(11):18-19.
  [6] 安琪.大数据时代学术期刊发展新探索[J].中国编辑,2017(7):58.
  [7] 环球网.出版机构施普林格•自然开始用机器写书[EB/OL].(2019-04-03)[2019-12-20].
https://smart.huanqiu.com/article/9CaKrnKjvDR
  [8] Wang Q, Huang L, Jiang Z, et al. PaperRobot: incremental draft generation of scientific ideas[C]//Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics. Florence, Italy: Association for Computational Linguistics,2019:1980-1991.
  [9] 谢智敏,郭倩玲.基于深度学习的学术搜索引擎——Semantic Scholar[J].情报杂志,2017,36(8):177.
  [10] 李媛.人工智能时代的学术期刊数字化传播[J].中国科技期刊研究,2019,30(11):1184.
  [11] HEAVEN D.AI peer reviewers unleashed to ease publishing grind[J].Nature,2018,563(7733):609-610.
  [12] 孙赫男.人工智能技术与学术和专业出版的融合发展[J].出版广角,2018(7):35-36.
  [13] Enago Academy.Can artificial intelligence fix peer review?[EB/OL].(2018-05-23)  [2019-12-22].
https://www.enago.com/academy/can-artificial-intelligence-fix-peer-review
  [14] ACUNA D E,BROOKES P S,KORDING K P. Bioscience-scale automated detection of figure element reuse[J].bioRxiv,2018,doi:https://doi.org/10.1101/269415
  [15] Frontiers.AI-enhanced peer review:Frontiers launches next generation of efficient,high-quality peer review[EB/OL].(2018-12-14)[2019-12-20].https://blog.frontiersin.org/2018/12/14/
artificial-intelligence-peer-review-assistant-aira/
  [16] 田文博,陈禾.国际学术出版推广新工具使用初探——以Kudos、TrendMD为例[J].科技与出版,2018(6):112-113.
  [17] 赵宇.《上海大学学报(自然科学版)》AR出版实践[J].编辑学报,2019,31(1):74.
  [18] 杨硕.Frontiers——社群驱动出版的典型代表[C]//第十七届全国核心期刊与期刊国际化、网络化研讨会论文集.郑州:北京万方数据股份有限公司期刊合作中心,2019:214.

来源:中国大学出版社协会

本版责编:江蕾
 
 
相关评论 发表评论 发送新闻 打印新闻 上一条 下一条 关闭
| 我的帐户 | 我的订单 | 购书指南| 关于我们 | 联系我们 | 敬告 | 友情链接 | 广告服务 |

版权所有 © 2000-2002 中国高校教材图书网    京ICP备10054422号-7    京公网安备110108002480号    出版物经营许可证:新出发京批字第版0234号
经营许可证编号:京ICP证130369号    技术支持:云因信息