账号: 密码:
中国大学出版社协会 | 首页 | 宏观指导 | 出版社天地 | 图书代办站 | 教材图书信息 | 教材图书评论 | 在线订购 | 教材征订
搜索 新闻 图书 ISBN 作者 音像 出版社 代办站 教材征订
购书 请登录 免费注册 客服电话:010-62510665 62510769
基于数据采集与分析的高职计算机类课程教材精准服务探析 - 2023编辑论坛 - 中国高校教材图书网
主页 > 2023编辑论坛
基于数据采集与分析的高职计算机类课程教材精准服务探析
白颢 侯昀佳 周先海(高等教育出版社有限公司)
2024-05-29 18:37:34  来源:中国大学出版社协会 
 

  【摘要】在数字技术与出版不断融合发展的过程中,高职计算机类课程教材出版产业在经营、服务、生产中产生的数据蕴含着释放生产潜能、驱动模式创新优化供给结构的强大潜力。大数据技术作为以数据采集、加工、分析、服务为主的新兴技术,是激活数据要素潜能的关键支撑,是加快经济社会发展质量变革、效率变革、动力变革的重要引擎。本研究通过数据采集、清洗处理、RFM模型对用户进行价值分层,为数据驱动的精准服务提供有力支撑,为产业化数据变现提供基础架构,催生大数据技术与教材出版市场服务融合的“化学反应”,为高职计算机类课程教材服务的精准定位、降本增效、数据变现提供依据与路径。

  【关键词】高职计算机类教材 精准服务 出版营销 大数据分析 数据变现

  随着数字技术和数字经济的快速发展,数据已成为重要的生产要素和基础性、战略性资源。大数据产业作为以数据采集、存储、加工、处理、分析、服务为主的战略性新兴产业,是激活数据要素潜能的关键支撑,是加快经济社会发展质量变革、效率变革、动力变革的重要引擎。大数据分析作为实现各行业释放数据要素潜能、发挥数据价值、实现数据赋能业务和各行业企业机构数字化运营发展的关键点,可有效提升服务决策的科学性、精准度及服务效能。因此,党的二十大报告中提出要加快发展数字经济、促进数字经济和实体经济深度融合的发展战略。

  大数据技术不断演进,相关研究及产业落地不断迭代,面对大体量的用户群体、快速迭代的计算机类知识、区域化/层次化的用户结构,数据分析技术通过数据发掘高等职业教育教材市场的潜在需求,增强与院校、教师的良性互动,激发服务效能,提升产品的社会价值与经济效益。本文基于深耕生产及服务环节积累的分布式数据,催生大数据技术与教材出版市场服务融合的“产业生态”及“化学反应”,研究在坚持正确发展方向的前提下,减少服务成本、优化区域服务模式、发掘潜力用户,推动高职计算机类教材数据变现。

  1.高职计算机类课程教材营销数据特点

  在高等职业教育教材出版业买卖方市场转变、用户增长空间收缩、“圈地运动”白热的现状下[1],众多出版商和出版从业者都将精准服务与有效营销作为破局的关键。近年来,出版业已敏锐捕捉到数据分析技术的价值,在教材营销和研发侧对数据采集、处理和分析的探索不断[2]。但面对成熟的出版产业体系、大体量的用户群体、分布式的数据来源渠道、快速迭代的用户需求,如何通过数据采集与分析技术,促进出版业实现数字化转型、数据资产变现,最终产业化落地,是业界长期以来探索与深耕的焦点。

  出版业在呈现方式、渠道、营销模式的不断数字化,拓展了用户申请服务的渠道,带来了大量申请服务的用户。激增的数据导致编辑在进行人工服务时,存在对不熟悉的用户无法快速定位用户价值、服务滞后和服务深度不够等问题,导致潜在用户流失和品牌价值影响。
高职计算机类课程教材在出版、经营和服务中产生的数据主要分5类:①主要客户互动数据,如产品咨询、样书申请、资源申请等;②经营数据,如教材流向、销售数据、库存数据、产品结构等;③市场数据,如竞争对手产品结构、市场占比、选题计划等;④用户反馈数据,如学生反馈、用书教师反馈、相关专家意见等;⑤客户信息,如各院校机构设置及人员信息、招生情况、用书特点等。

  2.数据分析流水线的基础架构

  “流水不腐,户枢不蠹”。经营数据仅进行单向的收集和存储会形成数据沼泽,造成数据淤积及存储成本成倍增长[4]。只有让存储的数据流动起来,输送到数据消费端才会发挥其价值。教材出版数据可参考数据中台的模式整合数据采集、处理、分析和分流的业务模式,构建数据流水线基础架构,本研究数据中台架构如图1所示。在架构中,原始数据自下而上流动,形成实时多维度的业务数据表,通过RFM模型对用户进行分层,驱动业务部门对用户进行定位及服务,促使数据变现、服务变现。通过日志记录系统,可在日常运维时快速定位系统问题、追踪程序执行流程和数量流向。

图 1 数据中台架构

  3.数据的采集、处理、分析及应用

  3.1. 数据来源与采集方式

  高职计算机类课程教材在研发策划、生产经营过程中不断产生的数据主要包含3类:①用户数据、②教材数据、③销售数据。本文基于信息技术公共基础课程和电子与信息大类计算机类中计算机应用工程、网络工程技术、软件工程技术、数字媒体技术、大数据工程技术、云计算技术、信息安全与管理等专业课程配套教材在策划、组稿、服务、营销中直接或间接产生的数据,浅析数据采集与分析反哺精准营销与服务的路径与实践。

  现代出版产业数字化过程中实现了完备的经营数据采集与基础汇总的信息管理系统[5]。不同品种教材的销量、流向、渠道报订等直接作用于企业经营的数据可在此类平台中周期性导出。该类数据因需财务审核,其准确性高且全面,可作为数据分析系统中主要数据使用。

  在大力推进教育现代化背景下,各高职院校数字化校园建设成果显著[6]。院校官网作为招生宣传、教育资源共享的平台,大多数合作院校的机构设置、教研团队招生情况可在院校官网通过程序自动爬取。市场数据可通过爬虫在电商销售网站、友商官网等相关网站自动爬取,也可通过人工收集的方式采集实时数据,同时更新陈旧信息。

  用户反馈信息、主要客户互动数据等可通过样书申请平台、用于院校及相关用户申请样书电子邮箱中的往来邮件、H5申请样书单等产品的后台导出。

  3.2 数据处理与存储

  经多渠道采集的原始数据分为结构化数据、半结构化数据及非结构化数据。原始数据中如销售数据、流向、渠道报订、备货信息、库存等高信息密度的结构化数据占比较小,但这类数据可信度高、处理成本低且占用磁盘空间少,通过批量化脚本进行匹配、整理、整合形成主数据库。

  如聊天记录、纸质样书申请单等半结构化或非结构化数据占比较高,这类数据存储及处理成本高。在数据处理时需要将非数字化数据进行数字化处理,如批量将纸质样书申请单扫描为图片等。进而对图片、自然语言文字、语音等半结构化或非结构化数据中关键信息采样、提取,转化为高价值密度的结构化数据,避免低价值密度数据造成数据量激增导致存储成本指数级上升及运算速度下降。样书申请、资源申请等邮箱中往来邮件、服务用户记录等自然语言数据可通过Natural Language Processing、ChatGPT、正则匹配、模板匹配等算法计算关键数据;样书申请单、会议登记表等纸质文件可扫描为图片,通过OCR (Optical Character Recognition,光学字符识别)、卷积神经网络等算法进行初步分类并提取关键信息;语音通过自动语音识别系统转化为文字后进行自然语言数据处理。通过批量化算法将高噪声的非结构化数据降噪、提取、整合后,形成结构化数据库,与主数据关联存储。

  数据库存储至云端便于客户端实时调用。为解决半结构化或非结构化原始数据经处理后为使用率低、容量大的冷数据,在标注存储位置等关键信息后可存储至以蓝光技术为核心的光磁电一体化大数据存储中心,储能能耗为磁盘的3.51%且具有防病毒、抗电磁、防篡改、保存寿命为电存储的10倍(50年以上)[7]。

  3.3 关键动作选取

  用户行为反映了其与产品的关系,通过数据可构建产品与用户的通路联系。教材营销角度的用户行为主要体现在样书申请、产品咨询、资源索取以及基础联系方式交换等。其中样书申请行为作为有效触达用户的关键动作,可直观地让用户感受产品,进而引导用户做出关键决策。其转化效果一直是众出版单位关注的重点,经过对经营数据以及样书申请数据的聚类整理出的各省样书申请量和销量呈正相关分布,因此可将样书申请行为作为用户关键行为处理。出版单位在接收到样书申请信息后,会着手安排样书寄送及后续人工服务工作,但大量样书寄送行为势必会导致经营成本、人力成本提高以及样书寄送转化率的降低。这一系列问题促使经营单位对做出申请样书动作的用户进行建模、归类、分析,对合作意愿强烈、预期转化值高、有流失倾向的用户制订服务策略。

  3.4 用户画像建模

  为协助数据更为直观、结构化地呈现在数据消费侧,用户画像通过数据整合、数据统计、标签归类等方式辅助数据消费侧研究用户群体、提供业务决策支持,促进精准营销服务。在高职计算机类课程教材出版及营销中,通过整合用户画像、院校画像、教材画像为后续分析数据提供结构化数据支持。如表1所示,将数据库中用户邮箱地址、姓名、工作单位、最后联系时间、所在区域、教授课程等信息整合,作为采集标签,并生成唯一的用户ID。并统计诉求标签、历史联系次数、是否为作者等信息。

表1 用户画像建模

用户画像

类别

标签名称

采集标签

邮箱

姓名

工作单位

最后联系时间

所在区域

教授课程

生成标签

用户ID

统计类标签

诉求标签

历史联系次数

是否为作者

  在教材订购环节,单一的订购用户具有依附性。将相关用户按照所属院校整合,将院校整体作为大客户可综合分析其订书策略、订书逻辑。如表2所示,将用户画像按工作单位聚类并与销售数据匹配提取院校画像。院校画像通过生成唯一的院校ID,采集或更新用户画像中院校名称、开设课程、最后联系时间、所在区域,统计诉求标签、历史联系次数、作者数量、是否订书、订书名称、订书册数等。

表2 院校画像建模

院校画像

类别

标签名称

采集标签

院校名称

开设课程

最后联系时间

所在区域

生成标签

院校ID

统计类标签

诉求标签

历史联系次数

作者数量

是否订书

订书书号

订书册数

  对具体教材进行画像,在进行关联分析时可得出影响教材销量的关键特征。与用户进行互动时,根据关键特征对当前用户诉求价值进行加权计算,以更精确地制订服务策略。如表3所示,教材建模通过唯一的书号对冗余信息去重后,生成唯一标签,采集教材名、主编、相关院校及企业、书号、出版时间、是否规划教材、资源下载链接,统计索取次数、对应课程。

表3  教材画像建模

教材画像

类别

标签名称

采集标签

教材名

主编

相关院校及企业

书号

出版时间

是否规划教材

配套资源下载链接

生成标签

教材ID

统计类标签

索取次数

对应课程

  3.5 定位用户价值

  基于基础用户画像,RFM模型通过用户的近期行为(Recency,R)、频率(Frequency,F)以及金额(Monetary,M)3个维度来描述用户价值状况的用户分层模型,以其方便实施以及准确定位的特点被广泛用于衡量用户价值和创利能力的重要工具和手段[8]。在收集高职计算机类教材数据时,用户的样书申请行为作为影响教材销量的关键动作,在RFM分析时可作为近期行为处理。基于RFM模型对高职计算机类课程教材用户进行价值分层,根据用户的价值层次,对不同类型用户进行需求分析以及服务策略的研究,促进服务的精准化和用户价值层次提升。本研究通过RFM模型对不同的用户群体进行分层,由于样书申请动作与销量的正相关分布,将样书申请动作作为用户近期行为的关键。根据样书申请时间差值(计算一定时间段内用户最近一次申请距时间节点的天数,值越小、价值越大)、频率(计算一定时间段内申请样书的频率,值越大、价值越大)及销售册数(计算一定时间段内销售册数,值越大、价值越大)3个维度进行建模。3个维度通过2×2×2组合,可以将时间段内的用户划分成8类。不同用户对应R、F、M值如表4所示。

  3.5 定位用户价值

  基于基础用户画像,RFM模型通过用户的近期行为(Recency,R)、频率(Frequency,F)以及金额(Monetary,M)3个维度来描述用户价值状况的用户分层模型,以其方便实施以及准确定位的特点被广泛用于衡量用户价值和创利能力的重要工具和手段[8]。在收集高职计算机类教材数据时,用户的样书申请行为作为影响教材销量的关键动作,在RFM分析时可作为近期行为处理。基于RFM模型对高职计算机类课程教材用户进行价值分层,根据用户的价值层次,对不同类型用户进行需求分析以及服务策略的研究,促进服务的精准化和用户价值层次提升。本研究通过RFM模型对不同的用户群体进行分层,由于样书申请动作与销量的正相关分布,将样书申请动作作为用户近期行为的关键。根据样书申请时间差值(计算一定时间段内用户最近一次申请距时间节点的天数,值越小、价值越大)、频率(计算一定时间段内申请样书的频率,值越大、价值越大)及销售册数(计算一定时间段内销售册数,值越大、价值越大)3个维度进行建模。3个维度通过2×2×2组合,可以将时间段内的用户划分成8类。不同用户对应R、F、M值如表4所示。

表4 用户类别划分

用户类别划分

用户价值分类

R

F

M

重要价值用户

1

1

1

重要唤回用户

0

1

1

重要深耕用户

1

0

1

重要挽留用户

0

0

1

潜力用户

1

1

0

互动用户

1

0

0

一般维持用户

0

1

0

新用户

0

0

0

  R值依据根据最后一次样书申请时间距时间节点的天数划分。本研究选取2021财年的数据作为样本分析,时间节点为2021财年年底。根据统计结果,11月~次年3月为样书申请淡季;4月~5月为样书申请旺季。根据订书周期以及数据分布确定区分用户的临界值,将样书申请数据划分为2档,分别对应样书申请时间距时间节点200天内(占比98%)、200~365天的用户(占比2%),权值分别为1和0。

  F值依据根据不同用户的样书申请数量划分。由于样书的推送是触达用户的行为,是一种转化率较高的营销手段。F值阈值选定依据样书是否触达了用户,本时间段用户申请了样书则该用户F值为1,未申请F值为0。

  M值依据用户订书册数划分。用户订书册数是衡量用户价值的关键因素。按照最少开课人数(30人)将一部分馆配书、零售等干扰项移除,同时将渠道及书店等订书数据筛除后,共3944所订书院校(包含高等职业教育、中等职业教育和应用型本科3种类型的院校)。根据数据统计,19%的订书单位占据了80%的总体销量。教材销量帕累托图如图2所示。


图 2 教材销售帕累托图

  注:横坐标为订书的具体单位,左侧纵坐标表示订书册数,右侧纵坐标表示频率。直方图为该单位申请样书的数量,对应左侧纵坐标。折线图为订书单位按订书量降序排列后的累积频率。

  据统计,19%的订书单位占据了高职计算机类课程教材80%的总体销量。在进行经营与销售服务时,这19%的大体量订书单位用户价值会高于另外3189家订书单位。M值选取订书册数分界点2513作为阈值,用户分布数量如图12所示。

  随后将所有用户的R、F、M值放入分类器中,定位用户价值及后续服务策略建议,具体如表5所示。

表5 用户类别及对应特点

用户类别划分

用户价值分类

R

F

M

用户特征

策略

数量

重要价值

用户

1

1

1

优质用户

重点关心,日常维护,有专属编辑服务

223

深耕用户

0

1

1

样书申请频次及购书量都很高,之前是大客户,但最近没有申请样书

流失征兆,通过编辑沟通挽留,增加用书院校走访频次、样书架设立情况监管

532

0

0

1

订书量大,但无样书申请记录

通过沟通了解潜在需求,寄送多品种样书,增强触达能力,使用户层次提升

潜力用户

1

1

0

样书申请次数多且近期有申请动作,但无订书动作

需要花时间引导,反馈各省院校代表进一步服务

1559

0

1

0

申请次数多,但近期无申请且订书量少

新用户需多重转化,继续维护,增加广告推送频次

  4.根据数据分析结果制订服务策略

  传统教材市场营销结合互联网及线上线下社群服务的手段已经相当成熟。但高度依赖经验以及缺少全方位的数据支撑易导致成本的升高及资源的浪费。结合数据及相关研究,教材出版中大比例的销量来自于小比例的重要价值用户[9]。但大比例的非重要价值用户有其开发和转化潜力,根据划分的用户类别可有效分摊非重要价值用户的经营成本、促进潜力用户转化、分析流失用户以及挖掘新用户。用户价值分类后针对不同用户具体服务方式如下。

  4.1维护重要价值用户、深化合作关系

  据统计,山东地区的重要价值用户占所有用户的15%;江苏地区的重要价值用户占所有用户的11%。重要价值用户的呈明显地域集群。高职计算机类专业课程教师在教学中兼任多门课程主讲的现象较普遍。在该类用户申请样书后,分析其申请品种并及时与教师沟通需求,寄送院校新专业、新课程教学建设中急需的教材。除了对重要价值用户点对点的样书寄送或对相关院校进行样书架建设外,还应进行重点关心、日常维护、配专属编辑进行服务,同时针对公共课等大订量的问询进行预警提示。在有明显重要价值用户集群的省份如山东省、江苏省、河南省等,可举办省级或全国范围的书展、教材建设研讨培训会等覆盖面较大的营销服务活动,通过活动力度和专业程度触达重要价值用户,使其更深入了解相关高职计算机类课程教材的优势、建设情况及种类,增加用户粘性并提升留存率。通过邀请重点作者分享教材建设思路、邀请重点院校成为主办会议相关组织的理事单位,加深与重要价值用户的纽带。在重要价值用户对产品和品牌有一定依赖后,在尊重用户自身意愿、参考专业水平的前提下,组织重要价值用户结合区域和院校特色及优势参与相关教材的编写、审读工作,深化合作关系。

  4.2 持续触达深耕用户、促进价值层次转化

  据统计,深耕用户基数大,但地区分布较分散。由于该类用户在统计的时间维度有订书行为,为增强用户粘性可持续性对相关用户的售后需求如数字资源索取进行自动监测、自动发放。深耕用户因其大订单的付费的能力及需求且无样书申请记录,可通过一系列方式激活深耕用户活力促使其转化为重要价值用户。如通过将深耕用户的售前咨询需求分流至专属编辑,专属编辑采用线上或线下的方式协助深耕用户继续深挖潜在需求;根据用户订书种类进行聚类,举办对应专题的线上直播或参与线下会议增加用户触达;小体量长尾用户通过省级书展、会议等“社群营销”等方式低成本广覆盖触达用户,提升用户参与感与忠诚度。

  4.3 广泛触达潜力用户、激活合作欲望

  据统计,潜力用户基础庞大,且地区分布与深耕用户类似较分散。潜力用户实现订书周期较长,需多重转化。这类用户应通过经营及人力成本较低的方式及媒介持续触达。结合用户不同类型课程教材需求,针对大定量的国家规划信息技术等公共基础课程教材,可视情况采用样书寄送、样书架建设、院校代表跟进等方式提供教材详细内容的初步触达;针对单位订量较小国家规划专业基础课程教材,可采用区域性或社群性直播讲书、书展等方式触达,在用户有订书意愿后寄送样书并指派专人跟进;针对单位订量最小的专业核心课程和专业拓展课程,根据课程标签进行细分产品套书广告投放、样章试读、直播讲书等低成本的线上方式增加用户触达,激发用户互动的欲望,促进潜力用户向付费用户转化。

  5. 结语

  作为高职计算机类课程教材精准服务的有力抓手,数据分析通过采集原始数据、清洗并处理、发掘关键动作、构建用户画像、定位用户价值、对特定的用户群体进行营销导向的服务建议,促进用户向高价值状态转化,为数据驱动的高职计算机类教材精准服务提供了合理、可批处理的解决方案。通过数据可发掘区域性用户集群特点及需求,为可持续性提供高职计算机类教材出版精准服务提供数据支撑。通过数据中台的构建,可实时、批量化解决用户诉求,是基于数据采集与分析赋能精准服务产业化的重要一环,也是数据产业全流程的落地基础架构。基于数据,可针对用户价值定位和区域性分析,持续优化用户价值定位赋能精准服务的产业化可行性,为数据驱动院校服务、市场宣传、推广活动做科学化数据支撑和精准化服务指导。

  【参考文献】
  [1]刘军.当代出版社环境与市场营销组合策略分析[J].现代营销(下旬刊),2020(12):84-85.DOI:10.19932/j.cnki.22-1256/f.2020.12.036.
  [2]张鑫.基础数据在高等教育教材营销中的作用[J].出版参考,2022(09):66-67+58.
  [3]陈冉.基于RFM模型的高校图书馆个性化阅读推广研究[J].科技资讯,2023,21(01):208-211+222.DOI:10.16661/j.cnki.1672-3791.2205-5042-1193.
  [4]蔡珉官,王朋.数据湖技术研究综述[J/OL].计算机应用研究:1-11[2023-08-24].DOI:10.19734/j.issn.1001-3695.2023.05.0173.
  [5]张泽.教育出版数字化转型升级路径探究[J].中国编辑,2022(04):57-61.
  [6].教育部关于发布《高等学校数字校园建设规范(试行)》的通知[J].中华人民共和国教育部公报,2021(05):14-42.
  [7].贾宁波,孙琢,王凌.基于磁光电存储技术的数据湖总体架构探讨[J].中国信息化,2023(05):39-44.
  [8]卢成晓,陈添源.基于RFM模型的高校图书馆用户细分实证——以空间服务为例[J].情报探索,2022(07):23-28.
  [9]王芳.超竞争环境下图书营销的顾客战略——以大学出版社教材产品为例[J].编辑学刊,2019(03):23-28.

来源:中国大学出版社协会
 

本版责编:江蕾
 
 
相关评论 发表评论 发送新闻 打印新闻 上一条 下一条 关闭
| 我的帐户 | 我的订单 | 购书指南| 关于我们 | 联系我们 | 敬告 | 友情链接 | 广告服务 |

版权所有 © 2000-2002 中国高校教材图书网    京ICP备10054422号-7    京公网安备110108002480号    出版物经营许可证:新出发京批字第版0234号
经营许可证编号:京ICP证130369号    技术支持:云因信息