国产大模型盘点:发布速度趋缓,医学垂直领域居多
本文分析了 190 个国产大模型的样本数据,指出发布速度自 2023 年 7 月达峰后趋缓,地域集中于北京、广东等地,主体以企业为主。垂直领域大模型数量远超通用领域,医学、金融等赛道尤为热门。文章探讨了算法备案作为商用门槛的重要性,以及不同赛道的技术路径差异。通过行业访谈洞察,强调大模型应作为生产力工具而非单纯聊天工具,未来竞争关键在于场景结合与技术落地,如 RAG、微调及推理优化等关键环节。

本文分析了 190 个国产大模型的样本数据,指出发布速度自 2023 年 7 月达峰后趋缓,地域集中于北京、广东等地,主体以企业为主。垂直领域大模型数量远超通用领域,医学、金融等赛道尤为热门。文章探讨了算法备案作为商用门槛的重要性,以及不同赛道的技术路径差异。通过行业访谈洞察,强调大模型应作为生产力工具而非单纯聊天工具,未来竞争关键在于场景结合与技术落地,如 RAG、微调及推理优化等关键环节。

当前,国内部分大厂具有多条'大模型产品线',因此,报告基于企业官方对外公开或宣传口径,选取其中一条最具代表性的大模型产品,同时参考 GitHub 已有的专门整理国产大模型榜单数据的项目,最终选取 190 个国产大模型的样本数据进一步的信息统计和分析。
从发布时间来看,2022 年 11 月 ChatGPT 发布并爆火之后,仅时隔 3 个月,2023 年 2 月便已有国产大模型推出。随后每月都不断有新的国产大模型面世,且数量逐月增高,直到 2023 年 7 月达到巅峰——当月共有 39 个大模型推出。此后大模型推出数量便开始逐月递减,显示出市场从狂热期逐渐回归理性,行业进入洗牌整合阶段。

从发布主体的地域来看,这 190 个大模型分布于 23 个省级单位(包括自治区、直辖市和港澳台地区)。
其中,有 5 个省份,至少聚集了 10 个或以上的大模型发布主体,按数量排名依次为北京、广东、上海、浙江、江苏;有 15 个省份,至少有 2 个或以上的大模型发布主体。其中北京共有 69 家组织机构发布大模型,占比约 36%,在数量上遥遥领先。这反映了北京作为科技创新中心,在算力资源、人才储备及政策支持方面的显著优势。

在大模型的发布主体上,目前国产大模型主要来自高校、企业、研究机构、医院、银行等五大主体。而 190 个国产大模型中,有 151 个由企业发布,数量最多。这表明商业化落地能力已成为大模型竞争的核心驱动力,企业更倾向于将技术转化为实际生产力。

从大模型的类别来看,通用领域的大模型共有 45 个,垂直领域的大模型则有 145 个。这一比例(约 3:7)清晰地表明,国产大模型的发展重心已明显向垂直行业倾斜。
垂直领域中又包含 43 个细分赛道,其中以医学、金融、企业服务、工业、政务、科研等赛道的大模型数量较多,均为 10 个及以上。也不乏城市规划、钢铁、林业、水利、心理健康等一个大模型开辟一条赛道的情况。
垂直模型的优势在于:

公开信息显示,截至目前,国内至少有 23 家大模型通过《生成式人工智能服务管理暂行办法》备案。这意味着算法备案已成为 AIGC 产品的向社会公众开放、进入商用市场的重要门槛。
所谓大模型备案,是指大模型产品在向公众开放及商用之前,经过监管部门的备案审批。没有经过备案,就只能小范围内测,大部分人无法注册使用,而通过备案的大模型产品或服务即可面向社会全面开放服务。
目前已通过备案的大模型主要有四种公开方式:官方给出在线网址(公众可接入/邀测制)、移动端上线应用商店、大模型开源、赋能企业内部其他应用(大模型本身不公开)。
对于企业来说,大模型通过备案即可向全社会开放服务,这就意味着规模更加庞大的中文语料库和更加丰富的原生应用场景。而对于大众来说,通过备案也意味着可以用极低的门槛接触到最顶尖的 AI 原生应用之一。因此,大模型的备案制度不仅是国家出于保障数据安全、规范行业发展的目的,也在能在制度上推进大模型进入产业落地阶段,加速大模型 C 端应用的普及。

从生成式 AI 整体来看,其文本生成、图像生成、音频生成、视频生成等四大赛道最具有代表性。
为了更深入地了解国内生成式 AI 的产业现状,南都数字经济治理研究中心也与 12 位生成式 AI 从业者进行了访谈。他们有的是 AI 公司创始人,如小冰公司 CEO 李笛、清博智能 CEO 郎清平、极态 AI 公司 CEO 王力等;也有的是头部互联网公司 AI 算法或数据合规的资深专家等;还有如知乎、博特智能等推出大模型的企业,也通过书面回复等方式参与了此次调研。结合自身背景和工作实践,他们从商业、技术、法律和产业等角度分享了对生成式 AI 发展的看法。
在访谈中,有受访者提到大模型开发这个赛道分为三类:
在技术实现层面,要真正发挥大模型的生产力价值,需关注以下核心环节:
在访谈中,从业者们普遍提到的一个观点是,对大模型的认知不应局限在聊天工具,它应该有更广泛的应用价值。有人称应该把大模型当成一个生产力工具,将其潜在性能释放出来,真正服务千行百业,助力产业升级。
此前在接受南都记者专访时,360 创始人周鸿祎也表示,尽管 Open AI 推出的 ChatGPT 至今仍遥遥领先,但 AI 发展的 iPhone 时刻还未到来,这场火热的大模型之争也远未结束。下一步竞争的关键在于,谁能把大模型的能力和用户场景更好地相结合。
但对于'百模大战'将会如何演变,从业者们有不同的看法:有人认为这是一个短暂的繁荣期,很快泡沫会消散;有人则认为竞争的下半场才刚刚开始。随着技术的成熟和成本的下降,预计未来将出现更多跨模态、具备自主规划能力的智能体(Agent),大模型将从'辅助工具'进化为'智能伙伴'。

微信公众号「极客日志」,在微信中扫描左侧二维码关注。展示文案:极客日志 zeeklog
使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online
生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online
基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online
将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online
将字符串、文件或图像转换为其 Base64 表示形式。 在线工具,Base64 文件转换器在线工具,online
将 Markdown(GFM)转为 HTML 片段,浏览器内 marked 解析;与 HTML转Markdown 互为补充。 在线工具,Markdown转HTML在线工具,online