大模型小模型选型手册:开源闭源、国内国外全方位对比

市面上有哪些模型,国内与国外,开源和闭源,热门的 友好的,哪些是小模型 适合个人本地学习练习用的,按照这些维度或者更多的维度 汇总发我。我需要对 大模型和小模型 有一个总体的了解

基于最新的搜索结果,我为你整理一个全面的大模型和小模型汇总,按照你提到的各个维度来分类:

🌍 国内外模型分布

国外主流模型

闭源商业模型:

  • OpenAI系列:GPT-4o, GPT-4.5-Preview, o1-preview, o1-mini
  • Anthropic系列:Claude 3.5 Sonnet, Claude 3.7 Sonnet
  • Google系列:Gemini 2.0 Pro, Gemini 1.5 Pro, Gemini 2.5 Pro
  • Meta系列:部分闭源版本

开源模型:

  • Meta Llama系列:Llama 3, 3.1, 3.2, 3.3 (8B-405B)
  • Mistral AI系列:Mistral 7B, Mixtral 8x7B/8x22B, Mistral Large
  • Google开源:Gemma 2B/7B, Phi-3, Phi-4
  • 微软:Phi系列 (2.7B-4B)

国内主流模型

主要厂商分布:

  • 阿里巴巴:Qwen系列 (0.5B-72B), QwQ-32B
  • 深度求索:DeepSeek系列 (1B-671B), DeepSeek-R1
  • 字节跳动:Doubao-1.5-pro
  • 腾讯:Hunyuan-turbos
  • 智谱AI:GLM系列, GLM-Zero
  • 百度:ERNIE-4.0系列
  • 月之暗面:Kimi系列
  • 零一万物:Yi系列
  • 360:360智脑系列

🔓 开源 vs 闭源对比

顶级开源模型 (2024-2025)

模型名称参数量特点适用场景
DeepSeek-R1671B推理能力强,成本效益高复杂推理、编程
Qwen2.5-72B72B超越Llama3.1-405B性能通用任务、中文处理
Llama 3.1-405B405B最大开源模型企业级应用
Mixtral 8x22B141B (39B激活)MoE架构,效率高多语言、编程

顶级闭源模型

模型名称开发商Elo评分特点
o3-miniOpenAI76.01最新推理模型
DeepSeek-R1深度求索70.33开源推理之王
Claude 3.7 SonnetAnthropic68.02对话体验佳
GPT-4.5-PreviewOpenAI67.46综合能力强

📱 小模型推荐 (适合个人本地学习)

超轻量模型 (1B-3B)

最适合CPU运行:

  • Qwen2.5-0.5B/1.5B/3B - 阿里巴巴,中文友好
  • Llama 3.2-1B/3B - Meta,移动端优化
  • Gemma-2B - Google,1.4GB大小
  • DeepSeek-R1-Distill-1.5B - 深度求索,推理能力强
  • Phi-2 (2.7B) - 微软,性能优异

轻量模型 (7B级别)

推荐配置:8-16GB显存

  • Qwen2.5-7B - 编程数学能力强 (HumanEval 85+, MATH 80+)
  • Llama 3.1-8B - 128K上下文,通用性好
  • Mistral-7B - 推理能力出色
  • DeepSeek-Coder-7B - 专业编程模型
  • Gemma-7B - 4.8GB大小,平衡性好

中等模型 (13B-32B)

推荐配置:16-32GB显存

  • Qwen2.5-14B/32B - 性能接近大模型
  • DeepSeek-V3 (37B激活) - MoE架构,效率高
  • Mixtral 8x7B - 47B总参数,13B激活
  • Llama 3.2-11B - 视觉语言模型

🔥 热门友好模型推荐

最受欢迎开源模型 (按下载量)

  1. Llama系列 - Meta,生态最完善
  2. Qwen系列 - 阿里巴巴,中文最佳
  3. Mistral系列 - 欧洲之光,商业友好
  4. DeepSeek系列 - 性价比之王
  5. Gemma系列 - Google出品,质量保证

新手最友好模型

本地部署简单:

  • Ollama支持的模型:一键部署
    • ollama run llama3 (8B, 4.7GB)
    • ollama run qwen:7b
    • ollama run gemma:2b (1.4GB)
    • ollama run deepseek-coder:7b

💻 本地部署硬件需求指南

显存需求计算公式

  • 无量化:显存(GB) = 参数量(B) × 2
  • 4bit量化:显存(GB) = 参数量(B) ÷ 2
  • 8bit量化:显存(GB) = 参数量(B) × 1

硬件配置推荐

显存大小推荐模型量化方式
4-8GB1B-3B模型无需量化
8-16GB7B模型4bit量化
16-24GB13B-14B模型4bit量化
24-32GB32B模型4bit量化
40GB+70B+模型4bit量化

CPU运行友好模型

  • Phi-2 (2.7B) - CPU友好,性能不错
  • TinyLlama (1.1B) - 专为资源受限设备设计
  • Qwen2.5-0.5B - 超轻量,CPU可流畅运行

🚀 快速开始推荐

零基础入门路线

  1. Ollama + Qwen2.5-7B - 最佳中文体验
  2. Ollama + Llama 3.1-8B - 最佳通用体验
  3. Ollama + Gemma-2B - 最低硬件要求
  4. Ollama + DeepSeek-Coder-7B - 编程学习专用

进阶路线

  1. 本地部署Qwen2.5-32B - 接近商业模型体验
  2. 尝试DeepSeek-R1 - 体验开源推理能力
  3. 部署专业模型 - 如数学专用、代码专用等

📊 2024-2025最新排名总结

综合能力TOP5:

  1. DeepSeek-R1 (开源推理之王)
  2. QwQ-32B (阿里巴巴推理模型)
  3. Qwen2.5-72B (综合性能优异)
  4. Llama 3.1-405B (开源最大模型)
  5. Mixtral 8x22B (MoE架构典范)

个人学习TOP5:

  1. Qwen2.5-7B (中文+编程双强)
  2. Llama 3.1-8B (生态完善)
  3. DeepSeek-Coder-7B (编程专业)
  4. Gemma-7B (Google品质)
  5. Mistral-7B (推理优秀)

这个汇总覆盖了从超轻量CPU模型到大型GPU模型的完整谱系,你可以根据自己的硬件条件和学习目标选择合适的模型开始实践!

Read more

一文读懂UGC、PGC、PUGC、OGC、MGC、BGC与AIGC

一文读懂UGC、PGC、PUGC、OGC、MGC、BGC与AIGC 在当今这个信息爆炸的数字时代,我们无时无刻不被各种形式的内容所包围——从短视频、直播到图文资讯、专业评测。你或许经常听到UGC、PGC、AIGC这些听起来很“高级”的缩写,但它们究竟代表什么?彼此之间又有什么区别和联系?今天,就让我们一次性说清楚内容创作领域的各种“GC”(Generated Content)。 文章目录 * 一文读懂UGC、PGC、PUGC、OGC、MGC、BGC与AIGC * 1 核心区别:是“谁”在创作内容? * 2 UGC (User Generated Content) - 用户生成内容 * 3 PGC (Professionally Generated Content) - 专业生成内容 * 4

By Ne0inhk

【AIGC行业前沿】2026年2月AIGC行业模型发布以及主要前沿资讯

目录 1. 阿里Qoder发布Qwen-Coder-Qoder 2. Kimi与南大发布SimpleSeg赋能模型像素感知 3. 字节研究团队发布ConceptMoE提升AI推理 4. 阶跃星辰发布并开源模型Step 3.5 Flash 5. 智谱发布并开源OCR模型GLM-OCR 6. xAI正式发布Grok Imagine 1.0视频模型 7. 优必选开源具身智能大模型Thinker 8. 通义千问发布开源编程模型Qwen3-Coder-Next 9. OpenAI宣布GPT-5.2系列模型提速40% 10. OpenBMB发布多模态模型MiniCPM-o 4.5 11. ACE Studio与StepFun联合发布开源音乐模型ACE-Step 1.5 12. Ai2发布轻量级开源编码模型SERA-14B 13. 上海AI实验室推出万亿参数多模态科学推理模型Intern-S1-Pro 14. Mistral AI开源40亿参数实时语音模型Voxtral Mini 4B Realtime 2602 15. 快手可灵发布可灵3.0 1

By Ne0inhk
AI 编程工具选型:Copilot、Cursor、Codex 核心差异

AI 编程工具选型:Copilot、Cursor、Codex 核心差异

【如文章引起大家共鸣,请“点赞”以及“转发”,以支持继续创作,谢谢大家!】 朋友们大家好!今天咱们不聊那些虚头巴脑的,直接来点实在的——AI编程工具选型,Copilot、Cursor、Codex这仨到底咋选?别急,我这就用最接地气的方式,给你唠唠它们的“脾气秉性”,保证你听完就能上手挑! 先说Copilot,这哥们儿可是“代码补全界的扛把子”!它就像你身边的“代码小秘书”,你敲代码时,它就在旁边默默观察,你刚敲个“for”,它立马给你补上“(int i=0;i<n;i++)”,那叫一个快!而且,它还支持多IDE,VS Code、JetBrains啥的,都能无缝对接。不过呢,Copilot也有个“小毛病”,就是它更擅长“补全”,对于复杂的代码重构或者项目级理解,就有点力不从心了。

By Ne0inhk

Cursor、Windsurf、Kiro、Zed、VS Code(含 Copilot) 等 AI 编程工具的 定价对比

以 USD/月为单位,2025 最新市场信息:(Windsurf) 1) Cursor(基于 VS Code 的 AI IDE) 计划价格主要特征免费 Hobby$0基础 completions / 请求额度有限,试用高级功能两周 (Bito)Pro$20/月无限 completions、约 500 高速 AI 请求 (Windsurf)Teams$40/用户/月团队协作、管理功能 (Windsurf)Ultra$200/月大量 AI 请求额度 (Bito)Enterprise自定义企业级安全与支持 (Bito) 特点:AI 多行补全、上下文理解强、Pro

By Ne0inhk