国内 AI 大模型近 200 个:开源闭源、参数量与榜单的潜力解析
虽然'最有前途'难以绝对定论,但我们可以从技术路径、资源投入及市场应用等维度排除一些误区。在评估国产大模型时,需警惕以下三个常见认知偏差:
- 开源大模型一定比闭源的有前途吗?
- 参数量大的模型一定就比小模型有前途吗?
- 榜单排名高的大模型一定更有前途吗?
一、168 个国产大模型,都是什么来头?
人工智能时代的降临不亚于蒸汽机、电力或数字化对人类生产方式的变革。随着 AI 算法的不断演化和计算需求的迅猛增长,大型模型将为社会技术发展带来新一轮指数级信息爆炸。
我国本土大型模型的崛起进程始于 2017 年,当时中国的科研机构与企业积极投身深度学习与自然语言处理领域。据不完全统计,目前国内已有 AI 大模型约 168 家(数据来源:公开行业统计),比早期数据翻了一倍。
其中,通用模型约 24 个,用于科研/医疗/政务/公共服务的模型约 40 个,其余均为商业应用及服务提供。值得一提的是,开源模型相对较少,名列前茅的包括智谱 AI 和清华大学 KEG 实验室联合发布的 ChatGLM,以及百川智能推出的百川大模型系列。
这些智慧触角终将揭开科技未来的迷雾。中国的人工智能之路虽漫长曲折,但我们正稳步走出序章,迈向光明的未来。
二、开源大模型一定比闭源的有前途吗?
在中国,大型模型可分为两大类:一类以模型本身为核心,另一类则以服务应用为主导。
1. 通用开源模型
以 ChatGLM 和百川为代表。其独特之处在于在中文语境下的出色表现。为了提升这类模型在处理中文方面的能力,开发者通常采用两种策略:一是扩大词汇表的规模,二是增加中文语料库的比例。
优势:
- 易于使用: 只需强大的 GPU 即可运行,无需依赖特定 API。
- 成本可控: 通过极少的预算、适度的数据和低阶适应技术(LoRA)等工具,可以使参数相对较小的开源大模型达到令人满意的性能水平。
- 可替代性: 为企业提供了可替代昂贵闭源模型的低成本解决方案。
不足:
- 体验差异: 主观体验和论文中的数据可能存在差异,实际使用时性能可能不如宣传所示。
- 维护成本: 需要自行部署和维护基础设施。
2. 服务主导型模型
另一类大型模型数量较多,通常以套壳 Llama 或其他类似模型为基础,在特定数据集上进行深度的个性化定制和优化。特点在于它们专注于特定市场细分领域,通过深度定制和优化以提升性能。
在我国,目前还是以第二类大型模型主要以服务为主导,如百度、讯飞等推出了通用大型模型。这些模型不开源,用户需通过其提供的服务来使用。它们不仅提供聊天服务,还需要在特定场景中应用以实现盈利。这些模型的服务模式和费用基本与 ChatGPT 及其他竞争对手保持一致,以在市场竞争中取得优势。
自 Llama2 后,大模型圈风雨欲来,可商用开源成为了下一个各大厂商牟足了劲头实现的目标。是否开源并非最终评判某个大模型是否可以在这个斗兽场里存活的标准,关键在于生态构建与商业化闭环。
三、参数量大的模型一定就比小模型有前途吗?
关于参数量,曾有微软论文指出 ChatGPT 的参数量约为 20B(200 亿),而非以往认为的 100B 以上。虽然该论文后来撤稿,但这引发了对单一参数量维度的反思。
相比单一的参数量维度,宏观来说,大模型的评价其实可以分为以下几个维度:技术维度、商业应用、伦理责任。
1. 技术维度
哪个模型在深度学习、自然语言处理、计算机视觉等方面有独特的技术优势是最底层的核心逻辑。在此之上,模型的性能通常受训练数据和计算资源的限制。拥有更多、更多样化的数据,以及更先进的计算能力,将直接影响模型的前途。
此外,架构创新(如 MoE 混合专家模型)往往比单纯堆砌参数更能提升效率。基于 Llama2 的开源模型进行数据收集调用及调试的'再生长大模型',也并非没有可能实现弯道超车。
2. 商业应用
大模型厂商自身是否制定了更具前瞻性的商业策略、合理的商业模式,是其长期存活市场的基础。而其选择的赛道是否满足了标的市场的实际需求,在细分垂直领域的适用性能做到最好,市场是否买单,就是保证它前途光明的必要条件。
3. 伦理与合规
最后一个,也是全世界都在面临的同一个问题,就是机器伦理与合规。哪个模型在道德和伦理方面表现出更高的责任感?是否有明确的道德准则,以确保模型在使用中不会伤害社会和个体?哪个模型有更好的合规准则?更好的数据隐私保护和安全措施?


