2023 年无疑会被载入史册,成为大模型技术全面爆发的标志性元年
经过一年多的高速发展,各大科技厂商纷纷争先恐后地推出了自家的大模型产品,比如阿里的通义千问、百度的文心一言等。
与此同时,各家围绕着大模型生态建设的步伐也没有落下,各类 Agent、AI 大模型平台百花齐放。目前看来,各厂商正处于积极拓展用户基础、吸引模型&合作生态入驻、优化平台用户体验及探索商业化模式的关键阶段。
作为一名时刻关注 AI 技术前沿动态,并且每天切身在应用相关技术(跑个 demo 啦、撸个 paper 啦)的 AI 开发者,我觉得很有必要出一期当前(截止 2024 年 2 月份)国内 AI 大模型平台的全方面测评。
那么要全方位评判一个大模型平台的优劣,我们将从以下几个核心维度展开探讨:
1、社区规模:主要通过平台上模型数量&种类、社区开发者数量、应用数量、下载量等硬性指标进行评测;
2、平台基础设施能力:主要关注数据集&SFT(Supervised Fine-Tuning, 有监督微调)支持方面,考察平台是否提供了充足的算力资源和强大的数据集能力,以确保开发者能够高效便捷地进行模型训练、部署与微调工作;
3、生态建设与社区活跃度: 主要评估平台相关课程(教程)的丰富度、社区活动、赛事开展等因素进行综合评估。因为好的社区生态 + 活跃度会直接或间接地影响到平台上内容的'上新'效率(或者说发布周期)和质量;
那么接下来,我将基于上述多角度的专业评测,为广大的 AI 从业者提供详尽且客观的参考依据,希望能够帮助大家选择自己合适的 AI 大模型平台~
综合类平台
阿里云
关键词:开源、模型库强大、开箱即用

2022 年底推出的阿里云旗下的开放 MaaS(Model-as-a-Service)平台,提供了多种领域预训练模型的在线试用、下载、在线微调与部署等功能,致力于为 AI 开发者和研究者提供一站式模型开放服务。
根据公开信息显示,魔搭社区已经吸引了大量的开发者参与,拥有 2300+ 的模型、280 万+AI 开发者和 600+ 数据集。并且集合了来自多家顶尖人工智能机构贡献的 900 多个 AI 模型资源,涵盖了广泛的领域和应用类型。

整体来看领域覆盖度挺全面的,包括 CV、LLM&NLP、图像和多模态等其他领域。不仅支持自家的模型还吸引了非常多外部开源模型的入驻,但优势领域应该还是集中在 LLM&NLP 这块;
平台的基础设施能力不错,创空间有点那么'开箱即用'的意思了,并且基于阿里云基础设施底座为新用户提供了免费的 CPU/GPU 资源(高阶的算力得花钱,按量付费)。支持主流接入 SDK,创建好项目后就是一个 github 范式的开发大动作。
支持在线的 SFT,也封装好了很多 python 开箱库(简单留给用户,直接 pip install 就可以用起来)以及配套教程(也有专门的答疑群)


生态建设这块虽然有一些配套板块(在首页 -> 动态 -> 下拉栏里面)的布局,比如竞赛、活动等,但是横向对比其他平台来看,生态建设的丰富度还是相对薄弱一些的,所以个人开发者的社区活跃度可能会低一些。























