AI 大模型发展史与工具选型指南
背景
AI 大模型的发展速度远超预期。从 2017 年 Transformer 架构奠定现代基础,到 GPT 系列改变世界认知,再到 DeepSeek 等国产模型的崛起,技术浪潮席卷一切。普通用户最需要的不是论文细节,而是了解有哪些工具、能做什么以及何时使用。
发展时间线
- 2017: Transformer 架构诞生(Google),奠定现代大模型基础
- 2018: BERT(Google)发布,NLP 领域革命;GPT-1(OpenAI)发布
- 2019: GPT-2(OpenAI)发布
- 2020: GPT-3(OpenAI)发布,1750 亿参数震惊世界
- 2021: GitHub Copilot 发布,AI 写代码进入实用阶段
- 2022: ChatGPT 发布,AI 进入大众视野;Stable Diffusion 开源;Midjourney 公测
- 2023: GPT-4 发布,多模态时代开启;文心一言、通义千问、讯飞星火集中爆发;LLaMA 开源生态爆炸;Claude、Gemini 发布;Kimi 发布
- 2024: Sora 发布,视频生成新纪元;可灵 AI 发布;GPT-4o、Claude 3.5 能力跃升;豆包、即梦矩阵成型
- 2025: DeepSeek R1/V3 震惊全球;Grok 3 发布;各大模型持续迭代
模型分类
按能力类型分
- 文本/对话类:国际(GPT 系列、Claude、Gemini、Grok、LLaMA);国内(豆包、文心一言、通义千问、Kimi、讯飞星火、智谱 GLM、DeepSeek)
- 图像生成类:国际(Midjourney、DALL·E、Stable Diffusion、Adobe Firefly);国内(即梦、文心一格、通义万相)
- 视频生成类:国际(Sora、Runway、Pika);国内(可灵 AI、即梦视频、海螺 AI)
- 音频/音乐生成类:Suno、Udio、ElevenLabs
- 代码专用类:GitHub Copilot、Cursor、DeepSeek Coder、Qwen-Coder
按开源/闭源分
- 闭源:GPT 系列、Claude、Gemini、Midjourney、可灵 AI
- 开源:LLaMA、Qwen/通义千问、DeepSeek、Stable Diffusion、Mistral
按国籍分
- 美国:OpenAI(GPT)、Anthropic(Claude)、Google(Gemini)、Meta(LLaMA)、xAI(Grok)
- 中国:百度 (文心)、字节 (豆包/即梦)、阿里 (通义)、快手 (可灵)、月之暗面 (Kimi)、幻方 (DeepSeek)、科大讯飞 (星火)、智谱 (GLM)
- 法国:Mistral AI
使用建议
| 需求 | 推荐工具 |
|---|---|
| 日常对话、写作(国内) | 豆包 / Kimi |
| 处理超长 PDF 文档 | Kimi / Claude |
| 写代码 | GPT / DeepSeek |
| AI 绘图 | GPT / Midjourney / 即梦 |


