人工智能大语言模型在出版业的应用现状与趋势分析
引言
2023 年 10 月 18 日,在'出版、发行与大模型应用高端论坛'上,北京师范大学新闻传播学院媒介融合与数字出版中心主任秦艳华发布了《出版业人工智能大语言模型应用研究报告》。该报告基于人工智能大语言模型应用于出版业的实践,深入分析了国内外的应用现状、呈现问题、解决对策及发展趋势,旨在为我国出版业的数字化转型提供理论支持与实践指导。
一、应用现状:国内外发展对比
1. 国内大模型研发与应用
ChatGPT 于 2022 年问世后,全球范围内掀起了大语言模型的发展热潮。我国研究机构与企业积极响应,截至 2023 年 9 月 26 日,国内已有 168 个单位研发出 182 个人工智能大语言模型。尽管数量众多,但相较于国外的 ChatGPT,国内目前仍缺乏一个断层式领先且被业界公认的核心模型。
国内出版业对大语言模型的态度整体呈慎重而乐观。虽然尚未完全应用于图书出版的全流程,但在编辑校对、文献翻译、有声制作、阅读推荐等特定环节已展开探索。多家出版机构已与技术支持方建立深度合作:
- 人民交通出版社:2023 年 2 月宣布接入百度文心一言,成为首批合作伙伴之一。
- 华龄出版社:2023 年 3 月出版了由人工智能大语言模型生成的图书《ChatGPT:AI 革命》。
- 蜜度:2023 年 7 月在世界人工智能大会发布蜜度文修大语言模型,实现 90 秒校对 20 万字,助力内容校对提质增效。
- 果麦文化:以 1500 万元增资星图比特,并签订 AI 文字校对软件开发合作协议。
- 版阅 AI:2023 年 9 月上线'版阅 AI 内容服务平台',依托智谱 AI 的 GLM-130B 大模型,具备内容生产、在线编审、逻辑判断、文章润色等功能。
2. 国外数字出版应用
国外人工智能大语言模型在数字出版领域的应用更为广泛和深入。亚马逊自 2023 年初开始上架由 ChatGPT 编撰的各类书籍,并专门开辟了相关专栏。截至 2023 年 10 月 13 日,检索署名作者为'ChatGPT'的书籍已达 1024 本,另有以'AI'署名的书籍在售。
在国外,大语言模型已渗透到选题策划、文本创作、插图设计、编辑校对、有声阅读制作等多个环节:
- 选题策划:通过持续性对话激发作者灵感,提供选题参考。
- 文本创作:主要集中于自我描摹类工具书、故事小说及基础教材。
- 编辑校对:协助进行文字编校、语句修改、文献检索、查重及翻译。
- 插图设计:参与封面与插图设计,根据内容生成具象化形象。
- 有声阅读:如微软研发的 AI 语音工具 VALL.E,可模仿人类说话并带有情绪输出,具有较大开发空间。
二、核心问题与挑战
尽管应用前景广阔,但当前大语言模型在出版实践中仍面临六大核心问题:
- 版权纠纷难处理,作品认可度低:AI 生成内容的版权归属尚不明确,法律界定模糊,导致市场接受度受限。
- 图文内容不符,创作质量欠佳:模型存在幻觉现象,可能导致事实性错误或图文不匹配,影响出版物的严谨性。
- 存在隐形过滤,潜藏错误导向:训练数据中的偏见可能导致输出内容存在隐性误导或价值观偏差。
- 劣币驱逐良币,艺术创作存隐忧:低成本 AI 生成内容可能冲击高质量人工创作,影响行业生态多样性。
- 数据信息被窃取,信息安全难保障:出版机构在使用云端模型时,面临核心数据泄露的风险。
- 人机关系颠覆,警惕异化风险:过度依赖 AI 可能导致创作者主体性丧失,引发人机关系的伦理危机。
三、解决措施与建议
针对上述问题,《报告》提出了针对性的解决路径:
- 完善管理制度,加强版权意识:建立适应 AI 时代的版权保护机制,明确 AI 生成内容的权属规则。
- 大语言模型再升级,建立校对审核:优化模型算法,引入人工 + 机器的双重审核机制,确保内容准确性。
- :构建安全可控的行业云环境,促进技术成果在实际业务中落地。


