大模型技术突破与产业应用发展新路径
人工智能大模型凭借 Transformer 架构实现从判别式到生成式、从专用到通用的能力跃迁。当前产业处于“势头已成、实处未到”阶段,面临幻觉、成本及落地难题。通过检索增强生成(RAG)、微调及智能体技术可有效提升准确性。我国在应用场景、数据要素政策及技术积累方面具备优势,应探索中国特色发展道路,推动大模型在垂直领域的实用化落地,引发新一轮产业变革。

人工智能大模型凭借 Transformer 架构实现从判别式到生成式、从专用到通用的能力跃迁。当前产业处于“势头已成、实处未到”阶段,面临幻觉、成本及落地难题。通过检索增强生成(RAG)、微调及智能体技术可有效提升准确性。我国在应用场景、数据要素政策及技术积累方面具备优势,应探索中国特色发展道路,推动大模型在垂直领域的实用化落地,引发新一轮产业变革。

自 2022 年底 ChatGPT 上线以来,人工智能大模型已成为社会各界普遍认可的新赛道。随着越来越多玩家快速涌入,产业开始逐渐摆脱炒概念的过热阶段,向实际应用落地的新阶段演进。这条赛道当前面临着激烈的国际竞争,我国还需扬长避短,走出发展新路径。
大模型能够成为新赛道的核心是其技术能力有了明显突破。ChatGPT 凭借其惊艳表现快速实现破圈,在不到两个月的时间里,用户数就突破了 1 亿,成为有史以来增长最快的应用之一。尽管 GPT 技术的核心基础还是谷歌公司在 2018 年发布的 Transformer 模型,但是持续提升的参数带来的涌现现象确实让人工智能的效果再次取得突破。
Transformer 模型通过自注意力机制(Self-Attention)解决了传统 RNN 和 CNN 在处理长序列依赖时的瓶颈问题。其并行计算能力使得模型训练效率大幅提升,为后续的大规模预训练奠定了基础。随着参数量的指数级增长,模型展现出了'涌现'能力,即在特定规模下突然具备未明确训练过的推理、翻译或代码生成能力。
这一突破主要体现在两个方面:
腾讯公司董事会主席、首席执行官马化腾认为,人工智能是几百年不遇的、类似发明电的工业革命一样的机遇。就如同 19 世纪末 20 世纪初,电灯和电动机的发明让电可以发挥功能的领域大大拓展,成为一代通用型技术,引发了电气化革命。当下大模型的突破确实也让人工智能潜在可以发挥功能的领域大大扩展,有望引发新一轮的重大产业变革。
当前大模型的发展正是处于势头已成、实处未到的发展阶段,要想实现产业化的突破,需要加快进入解决实际问题的新阶段。
从势头已成的角度看,国际国内大模型都已经进入了真刀真枪的全面竞争阶段。国际上,OpenAI 背后有巨头微软站台,谷歌公司的 Bard 借助其稳固的搜索份额快速实现访问量上亿,而 Meta 推出的开源大语言模型 Llama 2 不仅对研究和商用都免费,还实现了底层代码的开源。国内方面,在 2023 年 9 月 1 日网信办刚发布的深度合成服务算法备案信息中,明确备案的模型算法已经超过百个。
从实处未到的角度看,ChatGPT 在功能上主打聊天,说明现有技术还是主要定位于高容错率场景,与产生实效尚有距离。因此,ChatGPT 访问量在激增四个月后,到 5 月就基本停止增长,且公司还在持续面临着巨额亏损,距离实现盈亏平衡还有非常漫长的道路。
下一阶段,大模型人工智能的发展方向就是将能力真正落到实处。也就是在实际应用场景中,能够有效解决问题、提高工作效率,尤其是形成在多个领域和任务上具有较高准确性和可靠性的大模型。
为了提升大模型在产业中的实用性,目前主要采用以下技术手段:
如腾讯混元大模型经过腾讯丰富的业务场景磨练并完成技术积累,有效降低了大模型出现幻觉的比例,能够处理更复杂的用户指令并提升模型的逻辑思考能力,'从实践中来,到实践中去',为不同产业场景构建专属应用、为客户带来实际价值。
就如同现在回看,很多人往往把爱迪生 1879 年发明灯泡当作电气化革命的标志性事件,但是其实这一技术真正产生变革式影响是要到 1913 年,福特在 T 型车生产工厂中用电驱动机器取代蒸汽驱动机器,从而能够按照生产需要布局工厂,由此诞生的流水线生产彻底变革了工业生产模式,实现了生产力的极大提升,从而让电真正成为整个经济社会体系的变革性力量。大模型的长期价值将通过应用来体现,'实用级'的大模型才能够创造更多价值。
大模型已经成为世界主要国家高度关注的重要发展领域,我国在下一步的发展中还应扬长避短,走出富有我国特色的发展道路。当前,美国在大模型发展中具备一定的领先优势,尤其在 GPU 等硬件上的领先是我国在一段时间内都不得不持续面对的劣势。在这种情况下,我国需要加强自身独特优势的探索。总结起来当前我国发展大模型人工智能主要有三个方面的优势。
我国人口众多,是全球最大的独立统一市场,同时工业生产规模庞大,2022 年中国人口占全球比重接近 20%,制造业增加值占全球比重接近 30%,这就决定了相应的生产生活场景极为丰富,且市场体量庞大,叠加我国目前已经较高的数字化水平,就产生了极为丰富的人工智能大模型应用空间。
目前提高人工智能模型效率主要有两种思路,一类是提高硬件计算能力和效率,这方面我国已经难以占先。另一类是通过数据工程的方式,通过提升训练数据质量提升模型效率。随着近年来我国在数据要素化转化方面的政策设计不断取得进展,高质量数据的分享与聚合将越来越成为可能,从而助力我国人工智能大模型的发展。
在相关领域的技术创新上已经具有一定积累。在 ChatGPT 上线后,我国的科技企业迅速加入到这条赛道的竞争,力争不落后于人。而根据《2022 全球人工智能创新指数报告》,中国排名第二位,领先第三名的英国近 10 分,这显示出我国在相关领域已有一定的技术积累。腾讯混元大模型从第一个 token 开始从零训练,掌握了从模型算法到机器学习框架再到 AI 基础设施的全链路自研技术。未来国内的科技企业们要积极发挥自身技术优势,探索在人工智能领域的进一步创新。
从这三个优势出发,相信我国企业将会探索出一条中国特色的人工智能大模型之路,催生出全新的变革式发展引领力量。未来的竞争不仅是算力的竞争,更是生态和应用深度的竞争。只有将大模型技术与具体行业痛点深度融合,才能真正释放其生产力潜能。

微信公众号「极客日志」,在微信中扫描左侧二维码关注。展示文案:极客日志 zeeklog
使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online
生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online
基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。 在线工具,curl 转代码在线工具,online
将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online
将字符串、文件或图像转换为其 Base64 表示形式。 在线工具,Base64 文件转换器在线工具,online