跳到主要内容
极客日志极客日志面向AI+效率的开发者社区
首页博客GitHub 精选镜像工具UI配色美学隐私政策关于联系
搜索内容 / 工具 / 仓库 / 镜像...⌘K搜索
注册
博客列表
编程语言AI算法

AI 大模型发展史与工具选型指南

AI 大模型技术演进脉络梳理。涵盖 2017 年 Transformer 架构至 2025 年 DeepSeek 等关键节点的时间线,分类介绍文本、图像、视频及代码生成类主流模型。提供国内外模型对比、开源闭源区分及使用场景推荐,帮助读者快速掌握 AI 工具选型与技术背景。

颠三倒四发布于 2026/4/5更新于 2026/6/1217 浏览
AI 大模型发展史与工具选型指南

AI 大模型发展史与工具选型指南

背景

AI 大模型的发展速度远超预期。从 2017 年 Transformer 架构奠定现代基础,到 GPT 系列改变世界认知,再到 DeepSeek 等国产模型的崛起,技术浪潮席卷一切。普通用户最需要的不是论文细节,而是了解有哪些工具、能做什么以及何时使用。

发展时间线

  • 2017: Transformer 架构诞生(Google),奠定现代大模型基础
  • 2018: BERT(Google)发布,NLP 领域革命;GPT-1(OpenAI)发布
  • 2019: GPT-2(OpenAI)发布
  • 2020: GPT-3(OpenAI)发布,1750 亿参数震惊世界
  • 2021: GitHub Copilot 发布,AI 写代码进入实用阶段
  • 2022: ChatGPT 发布,AI 进入大众视野;Stable Diffusion 开源;Midjourney 公测
  • 2023: GPT-4 发布,多模态时代开启;文心一言、通义千问、讯飞星火集中爆发;LLaMA 开源生态爆炸;Claude、Gemini 发布;Kimi 发布
  • 2024: Sora 发布,视频生成新纪元;可灵 AI 发布;GPT-4o、Claude 3.5 能力跃升;豆包、即梦矩阵成型
  • 2025: DeepSeek R1/V3 震惊全球;Grok 3 发布;各大模型持续迭代

模型分类

按能力类型分

  • 文本/对话类:国际(GPT 系列、Claude、Gemini、Grok、LLaMA);国内(豆包、文心一言、通义千问、Kimi、讯飞星火、智谱 GLM、DeepSeek)
  • 图像生成类:国际(Midjourney、DALL·E、Stable Diffusion、Adobe Firefly);国内(即梦、文心一格、通义万相)
  • 视频生成类:国际(Sora、Runway、Pika);国内(可灵 AI、即梦视频、海螺 AI)
  • 音频/音乐生成类:Suno、Udio、ElevenLabs
  • 代码专用类:GitHub Copilot、Cursor、DeepSeek Coder、Qwen-Coder

按开源/闭源分

  • 闭源:GPT 系列、Claude、Gemini、Midjourney、可灵 AI
  • 开源:LLaMA、Qwen/通义千问、DeepSeek、Stable Diffusion、Mistral

按国籍分

  • 美国:OpenAI(GPT)、Anthropic(Claude)、Google(Gemini)、Meta(LLaMA)、xAI(Grok)
  • 中国:百度 (文心)、字节 (豆包/即梦)、阿里 (通义)、快手 (可灵)、月之暗面 (Kimi)、幻方 (DeepSeek)、科大讯飞 (星火)、智谱 (GLM)
  • 法国:Mistral AI

使用建议

需求推荐工具
日常对话、写作(国内)豆包 / Kimi
处理超长 PDF 文档Kimi / Claude
写代码GPT / DeepSeek
AI 绘图
GPT / Midjourney / 即梦
AI 视频生成可灵 AI / 即梦
开源/本地部署LLaMA / DeepSeek
Google 生态用户Gemini
最新信息/推理任务DeepSeek / GPT-o

核心模型速查

模型一句话记住它
GPTAI 界的开创者,最出名,能力全面
Claude写作最好,长文档最强,最像'文人'
GeminiGoogle 出品,搜索+AI 天然融合
DeepSeek中国造,顶尖能力,开源白嫖
Grok马斯克的 AI,最敢说话,接入 X 平台
LLaMAMeta 开源,撑起整个开源 AI 生态
豆包字节出品,国内新手首选
文心一言百度,最早落地的国产大模型
通义千问阿里,开源,程序员好伙伴
Kimi月之暗面,200 万字文档处理
讯飞星火科大讯飞,教育 + 语音场景强
智谱 GLM清华系,开源,学术界常用
Midjourney最惊艳的 AI 绘图,艺术感最强
Stable Diffusion开源绘图,可以本地跑
即梦字节,中文绘图 + 视频创作
可灵 AI快手,真实感视频生成国内第一
SoraOpenAI,开创视频生成新纪元

目录

  1. AI 大模型发展史与工具选型指南
  2. 背景
  3. 发展时间线
  4. 模型分类
  5. 按能力类型分
  6. 按开源/闭源分
  7. 按国籍分
  8. 使用建议
  9. 核心模型速查
  • 💰 8折买阿里云服务器限时8折了解详情
  • Magick API 一键接入全球大模型注册送1000万token查看
  • 🤖 一键搭建Deepseek满血版了解详情
  • 一键打造专属AI 智能体了解详情
极客日志微信公众号二维码

微信扫一扫,关注极客日志

微信公众号「极客日志V2」,在微信中扫描左侧二维码关注。展示文案:极客日志V2 zeeklog

更多推荐文章

查看全部
  • Spring Boot 数据仓库与 ETL 工具集成实战
  • ComfyUI Windows 本地部署系统环境配置指南(含 Python PyTorch CUDA)
  • 高并发场景下 Java 与 Go 的区别及 Channel 机制详解
  • OpenClaw 飞书机器人配置指南
  • LangChain 1.0 架构全景、Runnable 协议与 LCEL 声明式语法解析
  • Flutter 在 OpenHarmony 中应对跨域挑战:flutter_cors 实战方案
  • 前端 SPA 分布式部署实践:基于 iframe 的微前端探索
  • Git 原理与使用深入剖析(上)
  • C++ 函数重载:核心规则、匹配机制与实战
  • OpenClaw Linux 本地化 AI 智能体部署指南
  • Moon VR Video Player 使用教程:支持 8K/12K 多音轨及外挂字幕
  • Spring Web 模块核心解析与 RESTful API 实战
  • 医疗连续体机器人模块化控制界面设计与 Python 库应用
  • AIGC 模型推理延迟优化:C++ 级方案解析
  • 行星减速器:原理、计算公式及 C++ 实现
  • 二分查找与二分答案详解
  • 2024 年多模态大模型技术发展白皮书
  • MinIO 分布式对象存储介绍及与 SeaweedFS 对比
  • Web 开发者构建多模态 Agent 图像识别技能的全栈实战
  • Dify 工作流发布为 MCP Server 实战指南

相关免费在线工具

  • 加密/解密文本

    使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online

  • RSA密钥对生成器

    生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online

  • Mermaid 预览与可视化编辑

    基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online

  • 随机西班牙地址生成器

    随机生成西班牙地址(支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选),支持数量快捷选择、显示全部与下载。 在线工具,随机西班牙地址生成器在线工具,online

  • Gemini 图片去水印

    基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印,支持批量处理与下载。 在线工具,Gemini 图片去水印在线工具,online

  • Base64 字符串编码/解码

    将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online