「现在每家公司都是 AI 公司,但引入 AI 之后,利润真的能提高吗?」
在针对 Transformer 作者、Cohere CEO Aidan Gomez 的一次采访中,播客主持人 Harry Stebbings 问出了这样一个问题。这反映了当前企业界对于人工智能投入产出比的普遍焦虑。
Stebbings 提到,现在很多公司都在往产品中引入 AI,比如提供客户支持的 Zendesk、笔记记录软件 Notion、提供设计服务的 Canva…… 但是选择维持产品价格不变的 Canva 等公司却担心,自己的利润不升反降,因为他们现在要为每个查询付出更高的成本。Canva 甚至在最近的节目中直言不讳地表示,他们的利润正在压缩。
对于这一问题,Gomez 提到,其实企业不必过于担心,因为 AI 的成本正在迅速下降,在提升客户体验的同时维持产品价格不变会是一个不错的选择,有利于扩大企业的用户基数。如果观察一下国内外的 AI 市场,我们会发现 Aidan Gomez 的预测是有依据的。很多 AI 公司,尤其是技术实力雄厚的大厂,都在通过技术升级来降低模型成本、提高模型可用性,从而让企业以更低的门槛使用 AI。
在国内,腾讯混元大模型走的就是这样一条路线。这个从亮相时就强调「实用」标签的大模型一直在持续进化。在刚刚过去的腾讯全球数字生态大会上,我们不仅看到了训练、推理效率提升 1 倍多,但推理成本降低 50% 的新模型混元 Turbo,还看到了升级版的大模型知识引擎、图像创作引擎、视频创作引擎等大模型产品。
对于那些还在怀疑自己是否有能力引入 AI,以及引入 AI 之后能否保住利润的企业来说,这些高性价比的模型以及低门槛、易用的大模型产品或许可以提供一个答案。
距 GPT-4o 仅 1.29%
混元 Turbo 拿下国内第一,价格还降了一半
效率提升,但成本不升反降的混元 Turbo 听上去似乎很有吸引力,但模型质量怎么样呢?第三方中文大模型基准测评机构 SuperCLUE 发布的《中文大模型基准测评 2024 年 8 月报告》提供了一个客观的参考。
这个报告聚焦通用能力测评,测评方案由理科、文科和 Hard 三大维度构成。理科能力包括计算、逻辑推理和代码能力;文科任务覆盖知识百科、语言理解、长文本、角色扮演、生成与创作、安全和工具使用;Hard 任务则侧重于精确指令遵循以及复杂任务高阶推理。
报告显示,混元 Turbo 在理科、文科均居于第一名,在 Hard 任务上表现也相当出色,是国内唯一超过 70 分的大模型,仅与 ChatGPT-4o 有微小差距。
更重要的是,在这个模型发布后,国内 TOP 1 大模型在中文领域的通用能力与国外领先模型的差距缩小到了 1.29%(总分相差 1 分左右)。而去年 5 月,这一数字还高达 30.12%。
所以,单从性能上来看,混元 Turbo 是可以满足很多企业对模型能力的高要求的。
那训练、推理效率提升超过 1 倍,推理部署成本下降 50% 是怎么做到的呢?简单总结就是:技术创新。
混元技术团队介绍说,相较于上一代混元 Pro MoE 大模型,Turbo 模型在数据优化之外自研了全新的万亿级分层异构 MoE 结构。MoE(Mixture of Experts)架构的核心优势在于稀疏激活,即在模型不同层采用不同的专家个数和不同的激活参数量,最终用更多的专家数、更少的激活参数量实现了更好的效果。这种机制使得模型在处理特定任务时能动态调用最相关的参数子集,从而大幅减少计算开销。
这样的技术创新创造了更多的让利空间,使得混元 Turbo 的定价(输入和输出价格)仅为混元 Pro 版的一半。目前,该模型已经在腾讯云上线,企业和开发者可以通过 API 接入。
此外,腾讯混元的技术团队还在研究中发现,其实 MoE 架构不只适用于语言模型,用来构建多模态大模型也是最佳选择,因为它能够更好地兼容更多模态和任务,确保不同模态和任务之间是互相促进而非竞争的关系。
按照这个思路,他们构建了国内首个基于 MoE 架构的多模态大模型,而且以简单、合理、可规模化的原则来设计这个模型。比如,该模型支持原生任意分辨率,最高可支持的分辨率达到 7K,而不是采用业界主流的固定分辨率或切子图方法。此外,它采用的简单 MLP 适配器也能比主流的 Q-former 适配器损失更少的信息。这些实用的升级无疑是在为进入产业应用场景做好充分的准备。
模型之外,产品实用性也升级到 Next Level
「模型本身不是完整的产品,要搭很多能力。用户要用得爽,不是简单的『模型吐东西』。」在前段时间的一次采访中,腾讯集团高级执行副总裁、云与智慧产业事业群 CEO 汤道生分享了这样一个观点。
基于这种认知,腾讯云其实不止打造了腾讯混元系列大模型,还围绕这个大模型打磨了一系列精调工具链(基于 TI 平台)和开箱即用的产品,包括大模型知识引擎、图像创作引擎、视频创作引擎等。
这些工具链、产品看似分散,其实组合到一起能解决很多问题。
就拿要求最苛刻的医疗场景来说。当下,很多人吐槽医生人心冷漠 —— 病人背着大包小包、坐了十几个小时火车去看病,结果只能跟医生沟通五分钟,失落的心情可想而知。
但其实,医生也很无奈,尤其是负责重症病人的医生。因为他们每天要花大量时间去理清多维度、连续变化的患者数据,还要书写病历和病程记录,分不出时间和精力去精细化地关怀每个病人。
为了解决这一问题,为重症医疗提供器械和解决方案的迈瑞医疗和腾讯一起打造了首个重症大模型瑞智 GPT,并基于该模型开发了「病历撰写、患者个体化病情查询、重症知识检索」三个面向重症科室的大模型智能应用。
这些应用可以帮助医生灵活查询患者的病情变化、自动撰写病历,还能为低年资医生提供高年资医生的重症知识和诊疗建议,极大地降低了医生解读大量连续变化的临床数据的难度,缓解了撰写病历和病程记录的工作负担。


