近期,国内多款大模型重磅消息不断,标志着国产人工智能技术进入了密集爆发期。
1. 近期大模型进展概览
3 月,月之暗面的 Kimi 升级迭代后,长文本能力达到尚未上线的 GPT-4.5 Turbo 的 10 倍,展现了在上下文窗口处理上的显著优势。
4 月,商汤科技发布的'日日新 SenseNova'5.0 多模态大模型在主流客观评测上,中文理解、知识储备、数理逻辑、代码编程等方面的能力达到了 GPT-4 Turbo 水平。
5 月 9 日,阿里云发布通义千问 2.5,据称'在中文场景模型性能赶超 GPT-4-Turbo',同时 1100 亿参数开源模型在多个基准测评收获最佳成绩。
5 月 15 日,字节跳动正式发布'豆包大模型',这也是国内又一家互联网巨头发布的自研大语言模型。据介绍,豆包大模型目前日均处理 1200 亿 Tokens(表示和传递信息的标识符)文本,生成 3000 万张图片。
此外,从各项指标测评来看,国内部分自研大模型亦表现亮眼。近期,全球增长咨询公司沙利文发布的《2024 年中国大模型能力评测》对国内主流的 15 个大模型进行了横评,其中,百度、腾讯、阿里等互联网大厂旗下大模型位于第一梯队,综合表现更为优异。而百度文心一言能力最为全面,五项评测维度均为优势能力,并取得四项第一。
上述种种,说明国内领先的大模型企业已取得了显著的进步,成功缩小了与国外先进水平的差距。
这让我们有理由相信在'百模大战'的下半场,会如近期腾讯研究院发布的《向 AI 而行,共筑新质生产力——行业大模型调研报告》中所说那样,在'人工智能+'政策指引下,随着国产大模型能力的提升,行业大模型将加速落地,向多模态、AI Agent 等方向发展。这就像是 AI 界的'未来城市',充满了无限可能。
01. AI 大模型的中国竞速
如今,国产 AI 大模型已狂飙突进有一年时间。
2023 年,在 ChatGPT 爆火之后,大模型技术迅速在全球科技界掀起了一场风暴,引发科技巨头们的激烈角逐。国内的科技大厂、中小企业、科研院所亦纷纷入局,当百度'文心一言'打响'大模型的第一枪'后,阿里巴巴'通义千问'、华为'盘古'、360'智脑'、昆仑万维'天工'、京东'灵犀'、科大讯飞'星火'、腾讯'混元'、商汤'日日新'等一大批大模型陆续登场,拉开了国产大模型进击的序幕。
据了解,目前市场上的 AI 大模型按照部署方式进行划分,主要分为云侧大模型和端侧大模型。与云侧大模型主要面向产业化应用需求不同,端侧大模型主要服务于个人用户。
云侧大模型通常依托于强大的数据中心算力集群,能够支持千亿级参数的训练与推理,适合处理复杂的任务,如大规模数据分析、复杂代码生成等。其优势在于计算能力强,但受限于网络延迟和带宽成本。端侧大模型则运行在终端设备上,如手机、PC、汽车车机等,具有低延迟、数据隐私保护好、离线可用等特点,但受限于硬件资源,参数量通常较小,往往需要采用量化、剪枝等技术进行优化。
毫无疑问,在这场空前的科技浪潮中,随着多家科技厂商推出 AI 大模型并落地商用,各类通用、行业以及端侧大模型在多个领域取得了显著的成果,初步形成多元化的产业生态。
在通用 AI 大模型方面,极具代表性的大模型产品如百度'文心一言'、阿里巴巴'通义千问'等具有强大的自然语言处理能力,可以应用于多个领域,包括但不限于智能客服、智能写作、知识问答等。这些模型基于 Transformer 架构,通过海量语料预训练,掌握了广泛的语言规律和世界知识。
在行业 AI 大模型方面,蜜度的文修大模型、容联云的赤兔大模型、用友的 YonGPT 大模型等都是各自领域的佼佼者。这些大模型针对特定行业的需求进行了优化和定制,能够提供更加精准、专业的服务。例如,YonGPT 大模型深耕企业服务领域,通过智能化业务运营、自然化人机交互、智慧化知识生成和语义化应用生成四大方向,为企业提供全价值链、全场景的泛在智能应用。行业大模型的优势在于结合了垂直领域的专业知识库,通过微调(Fine-tuning)或检索增强生成(RAG)技术,解决了通用模型在专业领域回答不准的问题。
在端云结合的 AI 大模型方面,vivo 的蓝心大模型是其中的代表。蓝心大模型是首个在手机端运行的开源大模型系列,通过矩阵化部署适应不同应用场景,为手机用户提供智能化服务,如智能创作、知识问答、角色扮演等功能。这种端云结合的方式使得 AI 大模型的应用更加广泛和便捷,既利用了云端的大算力,又发挥了端侧的低延迟优势。
在端侧 AI 大模型方面,蔚来的 NOMIGPT 大模型是一个典型的例子。NOMIGPT 大模型是蔚来汽车推出的智能语音助手,具有强大的自然语言处理能力和多模态交互能力,能够为用户提供更加智能、便捷的驾驶体验。车载场景对实时性和安全性要求极高,端侧模型能有效保障用户隐私并减少网络依赖。
尤其进入 2024 年以来,又有多重利好因素推动着国内大模型产业快速发展。首先是'人工智能+'行动等来自政府层面的有力支持,其次用户提升生活、工作效率的需求激增,再就是科技公司加大对 AI 领域投入资金、人力、技术研发。据国家网信办今年 4 月发布的公告显示,目前我国已有 117 个大模型完成生成式人工智能服务备案。
对此,有相关机构指出,这一势头表明国产 AI 大模型不仅在技术层面取得了突破,更在商业应用和推动社会生产力变革方面展现出巨大潜力,但同时也要看到,真正的爆款应用尚未出现,国产大模型要真正走到规模化部署依然道阻且长。
02. 深耕行业、落地行业的企业级大模型或成最优解
一项全新的技术要切实在生产生活中发挥作用,应用的场景尤为关键。
如果说 2023 年是 AI 大模型市场的百'模'争鸣,那么 2024 年则将成为国产大模型全面商业落地的元年,进入赋能千行百业的关键期。因此,如何将大模型与产业化应用无缝连接,并把大模型以高效低成本方式落地到千行百业,就成为大模型企业亟待突破的方向和自证价值的考场。


