本文整理了市面上主流的大模型与小模型,按照国内外、开源闭源等维度进行分类汇总。用户可根据硬件条件和学习目标选择合适的模型进行实践。
🌍 国内外模型分布
国外主流模型
闭源商业模型:
- OpenAI 系列:GPT-4o, GPT-4.5-Preview, o1-preview, o1-mini
- Anthropic 系列:Claude 3.5 Sonnet, Claude 3.7 Sonnet
- Google 系列:Gemini 2.0 Pro, Gemini 1.5 Pro, Gemini 2.5 Pro
- Meta 系列:部分闭源版本
开源模型:
- Meta Llama 系列:Llama 3, 3.1, 3.2, 3.3 (8B-405B)
- Mistral AI 系列:Mistral 7B, Mixtral 8x7B/8x22B, Mistral Large
- Google 开源:Gemma 2B/7B, Phi-3, Phi-4
- 微软:Phi 系列 (2.7B-4B)
国内主流模型
主要厂商分布:
- 阿里巴巴:Qwen 系列 (0.5B-72B), QwQ-32B
- 深度求索:DeepSeek 系列 (1B-671B), DeepSeek-R1
- 字节跳动:Doubao-1.5-pro
- 腾讯:Hunyuan-turbos
- 智谱 AI:GLM 系列,GLM-Zero
- 百度:ERNIE-4.0 系列
- 月之暗面:Kimi 系列
- 零一万物:Yi 系列
- 360:360 智脑系列
🔓 开源 vs 闭源对比
顶级开源模型 (2024-2025)
| 模型名称 | 参数量 | 特点 | 适用场景 |
|---|---|---|---|
| DeepSeek-R1 | 671B | 推理能力强,成本效益高 | 复杂推理、编程 |
| Qwen2.5-72B | 72B | 超越 Llama3.1-405B 性能 | 通用任务、中文处理 |
| Llama 3.1-405B | 405B | 最大开源模型 | 企业级应用 |
| Mixtral 8x22B | 141B (39B 激活) | MoE 架构,效率高 | 多语言、编程 |
顶级闭源模型
| 模型名称 | 开发商 |
|---|

