当前,出版与人工智能技术的深度融合已是行业趋势。作为占整个图书出版60%以上市场的教育出版,如何利用人工智能技术实现高质量发展,对于整个出版行业的转型升级具有重要意义。人民教育出版社在人工智能技术的应用探索之路上,一方面充分利用人工智能技术助力传统出版的内容生产、资源管理、版权保护等业务,另一方面在音像与数字产品研发、运营服务中深度使用人工智能技术,取得了一定成效。
近期,《数字出版研究》专访人民教育出版社党委书记、社长黄强,探讨人工智能背景下教育出版转型的发展空间、顶层设计、行业实践、未来路径等核心议题。
1
想象空间:人工智能背景下教育出版的可能性
人工智能正在快速、广泛、深刻影响出版行业的运作与发展,有人认为人工智能对出版要素的重新组织与转化、分配,将会引发出版行业又一次的“范式转换”。从这层意义上讲,关注人工智能与教育出版的结合,就是关注教育出版的未来。
问:
您如何看待人工智能技术在教育出版领域的应用前景?
答:
人工智能技术的合理使用,有利于实现内容的定制化开发、智能化推送。利用人工智能技术可在选题策划、编写撰稿、编辑加工、校对审核、版权管理、物流管控、渠道发行、应用交互及用户体验和定制化阅读等方面,提供更加精准和智能化的支撑,可以极大提高产品和服务质量,能够促进产业升级,催生新业态。我相信,人工智能技术的迅猛发展一定会引发教育出版业的变革与重塑。
技术的发展与应用需要在有序的框架内推进。对人工智能技术的不当利用,将会带来技术伦理、隐私安全、版权纠纷等问题,出版单位也还面临着资源、技术、人才等压力,但智能化已成为教育出版业不可逆转的发展趋势。教育出版人应该深刻认识到所面临的挑战,以积极的心态迎接挑战,冷静思索新问题,探索解决新方法,坚持守正创新,立足中国特色,加强对新技术应用的研究,将传统教育出版的优势与新兴技术深度融合,运用人工智能技术赋能教育出版,为助力中国式现代化建设、创造人类文明新形态而努力。
问:
人工智能生产内容尤其值得关注。您能否具体谈谈其对教育出版意味着什么?
答:
一直以来,专家生产内容(Professional Generated Content,PGC)是出版社的传统核心优势,但生成式人工智能的发展正在改变着出版行业的内容生产方式——人工智能生产内容(Artificial Intelligence Generated Content,AIGC)在某些领域已经成为一种新型内容生产和创作方式,并在实际出版实践中代替一部分编辑的工作,实现人机协同。人工智能生产内容具有数据内容孪生、编辑和创作三大智能化能力,可以有效开阔思路和视野、提高生产效率、降低生产成本、赋能用户体验、助力提升产品质量。现阶段,对于一些介绍常规知识的教育出版物,我们可以尝试通过人工智能来辅助创作内容,但有两点必须坚持:一是教育出版是系统工程,从选题、创作、编辑到印制、发行都有规范流程及运行规律,而基础教育出版在为党育人、为国育才中发挥着极度重要的作用,任何内容生产方式的改变都必须在坚持高质量、高标准的前提下进行;二是对于人工智能创作的内容,必须由专家进行事先的规划和设计,在加工过程中给予适当引导,事后进行把关和提升,确保内容的思想性、科学性,更好地满足师生的需求。由此看来,人工智能生产内容在带来便捷性的同时,对专家的要求也变得更高了。
人教社秉承“编研一体,学术立社”的传统,利用国家新闻出版署出版融合发展(人教社)重点实验室、数字教育出版技术与标准重点实验室、人教数字教育研究院、《中小学数字化教学》期刊,为研究人工智能技术对教学、教育出版等的影响搭建了平台。近期,为了更好地探索包括ChatGPT在内的生成式人工智能对教育出版的影响,人教社专门建立了“人教数字AIGC实验室”项目,正在对ChatGPT、文心一言、通义千问、讯飞星火、豆包等大模型进行测试,评估人工智能生成文本、图片、音视频等的应用可行性。
2
顶层设计:教育出版转型的发展逻辑与规划布局
除人工智能这一技术要素外,教育出版的转型动能还来源于其他多个方面。厘清教育出版转型的发展逻辑,一方面,关乎教育事业的长期发展;另一方面,对于教育出版事业的战略规划、政策出台、资源配置等都具有基础性意义,也是教育出版机构开展规划布局、制定市场方案的重要参考。
问:
教育出版的转型要综合考量教育与出版两种生态。当下,教育生态变革是如何影响教育出版转型的?
答:
随着数字技术的发展和普及,教育的主体——教师、学生和家长的学习习惯和阅读需求正在发生变化,他们不再满足于单纯地阅读纸面上的内容,而是需要更多的服务和更好的体验。人工智能时代的人才观、知识观、课程观也都发生了变化,并推动了教学范式的转型——智能时代的育人目标从知识本位转向为以学习者为中心的素养培育,因此要构建网络化、数字化、个性化、终身化的教育体系;智能时代的教学不再是知识的单方面呈现或传输,而是在“学习进程”中的知识建构过程,“一人一张课程表”和围绕学科大概念而开发的综合性课程样态成为趋势;教学不再局限在单一的物理课堂,而是虚实融合的泛在学习空间;教师不仅是知识的传授者,也是学习的设计者、引导者和支持者;教学过程不再仅仅是知识的呈现和传递过程,而是综合多种教学媒介、多时空、多场景要素的创造性活动……面对教育领域的颠覆性变革,教育出版机构传统的资源形态和资源供给模式也必然会发生改变。因此,从单纯的内容提供商向综合的知识服务提供商转型,是教育出版单位发展的必然趋势。
问:
人教社作为全国教育出版数字化转型的领头羊,在利用人工智能技术助力教育出版转型方面,做了哪些规划和布局?
答:
人教社十分关注人工智能等技术前沿,积极探索新技术对数字出版的影响,不断将新技术应用于教育出版的流程优化、产品形态创新、运营模式变革、用户体验提升等各环节,以实际行动践行《新一代人工智能发展规划》等中央文件精神。人教社对人工智能技术的应用探索,主要体现在两个方面:一方面是充分利用人工智能技术助力传统出版,另一方面是积极探索利用人工智能技术实现业务创新。我们主要是在音像与数字产品研发、在运营服务中积极探索人工智能技术并实现了深度应用。
人教社很早就开始借助各种智能审校手段辅助内容编辑和校对。实践证明,人工智能技术在识别常见的语法差错、拼写不当等方面具有独特优势。我们也建立了多种使用了人工智能技术的平台和系统,来协助开展组稿、编写、印刷、发行等工作。
人教社还开发了大数据基础服务平台。我们以“促进内容质量提升、促进产品体验提升、以数据连接三通两平台、以数据辅助科学决策”为目标,充分利用大数据技术处理能力,结合教学实际和教材特点,打造了服务多个千万用户级产品的大数据基础平台,目前用户总量超过1亿,数据规模达650亿条,日均支撑用户数据达8 000万条。平台以海量数据为基础,积极进行智能算法、人工智能能力等前沿技术的探索,并在此基础上实现了数字产品的流量预警机制。平台在“停课不停学”“统编教材培训”“数字教材重要落地省份开学”等时段成功预测了流量趋势,有力保障了人教社数字产品的平稳运行。
人教社自主研发了一整套数字内容版权保护方案,应用于数字资源从加工到传输再到服务的各个环节;依托智能算法,研发外链监测平台,在核心产品中接入外链监控,有效确保了各种网络链接的安全。其中部分方案具备独特性和创新性,已获得国家知识产权局的专利授权。对用户产生的内容,利用文本、图像、音视频的智能检测技术,自动识别涉黄、敏感、涉暴、广告导流等内容,维护内容安全。
人教社还以智能算法探索内容运营新模式,确保运营安全。我们依托大数据平台,将用户画像、智能算法、规则引擎有机结合,形成了一套内容运营新方案,为教师备授课、学生自主学习等场景提供协同资源汇聚、资源评测、资源推荐等智能化支撑。
目前,人教社正在积极尝试结合人工智能技术构建图书数字化引擎,最大限度地提升一般图书、教参、教辅、辞书等图书数字化、数据化的效率,为构建创新型融合出版的生产、审核模式和业务应用探索解决方案。
3
实践样本:人教社教育出版应用人工智能技术的路径探索
人教社历来重视新技术对教育教学和对复制传播的积极影响。如对远程教育的有效服务、计算机排版的及时应用、教材立体化建设的探索与实践,等等。1983年经文化部出版局批准配书出版音像制品,1999年成立了人民教育电子音像出版社。2012年成立了人教数字出版有限公司,在数字出版领域进行专职、专业、专注的探索,取得了一些成绩。
问:
人工智能技术在人教社的业务创新方面,主要发挥了哪些作用?能否有一些具体的案例介绍?
答:
我们建立了语料库服务平台、资源管理与智能服务平台、真源出版印务管理平台、电子胶片远程传版系统等,将智能技术应用于出版内容存储、加工整理、智能检索、风险控制、校对审核、远程传版等各方面,大大提高了出版效率。
人教社自2020年开始中小学教材语料库的建设,其中包含“现代汉语/古代汉语/英语语料库”三个子库,提供多模式检索、信息报表、人工审核等功能,以及语义分析、关键字提取、实体识别等分析工具。目前基本实现了出版核心资源的集中存储、管理、检索、分析,既为教材和学生工具书的编研出版提供了资源和知识服务,又为后端数字产品的开发提供内容资源储备。
在内容资源管理方面,资源管理与智能服务平台以“统一存储、分级管理、协作共享”为建设原则,采用基础层、能力层及应用层的三层式架构,提供资源类、应用类及工具类的三重服务。针对人教社内容类型多样化、使用场景复杂的特点,平台使用面向海量数据的存储技术,保障了海量素材资源的集中安全存储,实现了内容的自动归档和备份;平台采用面向服务的设计,针对数字化转型涉及的部门、社外合作机构,实现了各类系统对接,提高了资源的重复使用率和高交互操作;平台规划了完整的内容管理及元数据标准,制定了成品及素材资源的XML结构化文件规范,实现了资源的碎片化处理,依托对内容的精确定位,结合多元化元数据为教材数字出版后续的数字化转型和创新提供基础支持;平台同时引入大数据、人工智能技术,正在尝试利用教材语料与素材训练算法模型。
作为人教社构建数字化生产服务体系的重要环节,电子胶片远程传版系统和真源出版印务管理平台分别应用于教材和教辅图书电子胶片的远程传版。其中,电子胶片远程传版系统以网络信息技术为手段,数字加密技术为支撑,实现了教材印刷文件的安全、稳定传输和准确输出到印版的数字出版应用技术。真源出版印务管理平台以教辅印前生产资源收集调用系统为起点,以生产资源总库为基础,实现了教辅电子胶片环保、高效、安全的远程传版。该系统以图像比对技术为核心,确保传版前后数据一致,提高传版过程中的数据准确性;同时,建立印务进程及质量跟踪管理体系,使印刷进度可见、可控。目前,该系统已为全国200余家印厂及代理商提供教辅传版服务,成为推动印刷行业数字化发展的重要力量。
我们还为纸质出版物配备了大量的数字资源,为广大师生和家长提供增值服务。在此基础上持续探索以人工智能相关技术为基础的纸数联动阅读场景。传统的联动方式是在纸质图书中预置二维码,读者通过扫码打开和观看配套的数字资源。随着人工智能技术的发展,已可以不用在纸质书上铺设二维码,而是通过图像识别技术来连接纸书与数字资源,用户使用终端设备直接扫描纸书页即可获得在线数字内容。这样不仅能节省纸质图书排版印刷前制作、设置明码、暗码等环节,减少因排码差错导致的印制、处理成本,而且能让读者不受明码的视觉干扰,保护其在阅读、学习过程中的连续性和主体性。我们正在搭建纸数联动管理平台,覆盖相应的纸数联动场景,进行纸质图书和数字资源的授权、加工、链接、发布的全流程管理。
人教社自2000年就开始了中小学数字教材的研发与探索,2018年推出了第三代人教数字教材,这是以纸质教材为蓝本,融合了优质资源与基础工具的数字化教材,具有交互性强、使用方便等特点。第三代人教数字教材充分利用信息技术的优势,将多媒体技术、大数据技术和人工智能技术有机融合在一起,实现了纸质教材的数字化重构,解决了传统教材在数字化教学环境中使用不便利的问题。与此同时,我们的数字教材平台已经成为教育信息化管理的主要抓手,正在推动教育决策由经验驱动向数据驱动转变、教育管理由单向管理向协同治理转变。
人教点读、人教口语等App是人教社为广大学生开发的移动学习类产品,其中嵌入了语音评测、图像识别等人工智能技术。类似技术可以自动分析和评估语音的质量和内容,评价普通话和英文的发音水平,定位问题,在口语水平测试、听力测试、发音纠正、角色扮演等场景中发挥着重要作用,提高了产品的体验价值。有600多万中小学生在人教社数字产品终端长期使用语音评测等智能化工具,仅去年一年使用量就超过1.5亿次。
我们依托人工智能技术开发的各类数字产品,得到了上级主管部门的肯定,获得了一系列荣誉和奖项。“人教数字教材”荣获第五届“中国出版政府奖”,“人教点读”入选“数字出版精品遴选推荐计划”,人教社入选国家新闻出版署“出版融合发展旗舰示范单位”,等等。
4
未来进路:人工智能背景下教育出版的挑战与应对
当前,虽然业内在利用人工智能技术服务自身的智能化生产及推进教育智慧化发展方面都进行了有益的探索,并取得了一定成效,但大多都还处于初期阶段。教育出版业如何适应人工智能时代带来的新变化、新机遇,实现出版流程智能再造和出版服务创新升级,还面临着诸多挑战。
问:
您认为当前教育出版单位在人工智能技术应用方面还存在哪些挑战?
答:
就现实情况而言,由于受到诸多复杂社会因素的制约,积极推进的数字出版尚未从根本上改变我国教育出版的范式,因此人工智能嵌入背景下教育出版范式的转型尚需时日。目前,人工智能对出版行业的介入,正在从效率和自动化的辅助工具,发展为尝试充当内容创作者这一原本完全由人类主宰的角色。人工智能的迅猛发展,正在推动出版理念的变革,甚至重塑整个产业;而具体到教育出版领域,对人工智能的应用成效还远未达到预期。
面对来势凶猛的人工智能变革,我们的教育出版机构在改革意识、出版思维、人才储备、技术积累、资金投入、组织架构、配套机制等方面还存在着明显的不适应。由于基础教育出版的特殊性,还有相当一部分同志并没有认识到人工智能的颠覆性挑战;教育出版产品的用户意识还没有完全建立起来;教育出版企业的转型所需要的复合型人才短缺;人工智能技术应用于教育出版必须有深厚的技术积淀及大量的资金投入作为基础,但教育出版企业在技术储备和资金方面有着天然的劣势;与新的出版流程和出版模式相适应的组织结构形态和配套机制也还需要进一步探索。在教育出版企业内部,还需要进一步凝聚共识,创新机制,以小博大,寻求突破。
与此同时,随着教育领域“双减”政策落地、教育数字化战略推进以及智能时代人才培养目标和模式的变革,教育出版机构在新的教育资源供给体系中如何快速适应教育领域变革并助推教育发展,也是关系到教育出版机构生存和发展的根本性挑战。
问:
对于出版机构而言,人工智能背景下的教育出版转型,其关键的突破口是什么?
答:
人才和开放是发展的关键词。
一是要高度重视人工智能技术对编辑队伍的影响。人工智能技术的使用,在提高内容生成和编辑效率的同时,也会影响到出版行业的把关人机制。联合国国际劳工组织不久前发布的《生成式人工智能对工作质量与数量潜在影响的全球分析》报告指出,生成式人工智能技术最重要的影响可能是增强工作——使职业中的某些任务自动化,同时给工作主体留出时间从事其他工作。因此,人类大多数的工作未来更有可能与包括ChatGPT在内的新型人工智能互补,而非被其替代。这对编辑提出了更高的要求,人工智能时代编辑的能力需要得以提升和重构。编辑需要紧跟技术发展的步伐,准确了解不同人工智能技术的优势与劣势,积极主动地将人工智能技术融入到编辑出版各环节、提高工作效率,同时不断提升自己发现和识别优质内容的鉴别力,增强沟通交流等跨领域合作的能力,并且保持学习和创新精神,不断掌握新的技能和知识,适应人工智能时代的变化和挑战。编辑也需要借助人工智能等技术,不断探索新的内容形式和表现方式,以及产品形态,为读者提供更好的阅读和服务体验。
二是要加强对人工智能技术的研究与产业合作。技术作为生产力第一要素,对于产业的转型发展具有重要的作用。数字化转型背景下的教育出版发展,离不开技术的加持。但技术积累薄弱和研发投入不足,是教育出版单位普遍面临的问题。当前,一批技术见长的在线教育企业成长起来并成为教育资源和教育服务的重要供给方。这些技术企业在资金、人才优势和灵活机制的加持下,持续发力人工智能技术研究与应用,通过数字底座打造、知识图谱构建、多模态数据采集分析、学习者画像描绘等,能够为用户提供更加精准、适时和个性化的资源服务和教学服务,并在服务入口和底层平台方面扮演着重要把控角色,在挤占传统教育出版企业内容市场空间的同时,也在改变着产业链布局。为了更好地做好基础教育优质内容资源的供给,更好地服务教育教学,教育出版机构必须加快人工智能的产业布局,利用智能化技术推动教育类产品形态创新。
一方面,教育出版机构必须加强对人工智能技术及其应用的研究,包括人工智能的关键技术、人工智能技术改变出版产业的逻辑、人工智能基础创新教育服务的形态等,进而做好利用人工智能技术助力教育出版转型的战略规划和路径谋划;另一方面,面对技术和资金的天然短板,教育出版机构需要加强与技术企业、运营商等的产业合作,实现资源整合、取长补短、强强联合,更好地发挥各自优势,推出可行的产品。
本文摘自《数字出版研究》2023年第4期《人工智能:教育出版转型升级的方法论——本刊编辑部就“教育出版转型”专访人教社社长黄强先生》。
评论留言