从 2023 年 ChatGPT 爆火以来,国内各大厂商也争先入局,国内大模型发展经历了'百模大战'。截至最新统计,国内已涌现出 180 多个大模型。在大模型发展上,国内正在奋起直追,国内外第一梯队大模型在中文领域的通用能力差距在持续缩小。
国外大模型现状
目前全球大模型的主要领头者是 OpenAI、Anthropic 和谷歌。以下是它们的最新进展与技术特点:
- OpenAI:最新推出了 ChatGPT-4o-latest。该模型在多模态交互、实时响应、情感识别以及多语言支持方面展现出了卓越的性能。它在医疗、教育、娱乐等多个领域都有广泛的应用潜力,特别是在处理复杂指令和跨模态任务上表现突出。
- Anthropic:公司推出的最新模型 Claude 3.5 Sonnet 在多个基准测试中超越了包括 GPT-4o 在内的其他知名 AI 模型,以及自家前代 Claude 3 Opus 模型。其优势在于长上下文窗口处理能力以及对人类意图的精准理解,适合需要高逻辑推理能力的场景。
- 谷歌:推出最新 AI 模型 Gemini 1.5 Flash,响应速度得到了大幅提升。它能够一次处理大量的信息,如 1 小时的视频、11 小时的音频、超过 3 万行代码或超过 70 万字的代码库。这使得它在处理超长文档分析和代码库理解方面具有显著优势。
国内大模型格局
国内大模型主要集中在互联网大厂,毕竟 AI 模型训练需要的成本太高,主要包括算力、数据和人才。主要玩家及其产品如下:
- 字节跳动:拥有豆包(Doubao)助手,Coze 智能体平台,人工智能视频应用有即梦 AI。字节在短视频内容生成和推荐算法结合的大模型应用上有独特优势。
- 百度:拥有百度文心一言大模型,文心智能体,百度健康等。作为国内最早布局大模型的厂商之一,其在搜索场景结合和企业级服务方面有深厚积累。
- 智谱 AI:发布了自家的视频生成产品——智谱清影(Ying)。同时其 GLM 系列模型在开源社区和学术圈有较高影响力。
- 腾讯:混元文生图大模型(混元-DiT)宣布开源小显存版本,此外腾讯基于混元大模型的 C 端 AI 助手 App 元宝也在不断升级。腾讯的优势在于社交生态和游戏场景的结合。
- 360:打造了新一代 AI 产品'AI 助手',与智谱 AI、商汤科技、百川智能、火山引擎、百度智能云、腾讯、科大讯飞、华为云、MiniMAX、零一万物、面壁智能等 15 家大模型厂商合作,全面内置到 360 国民级入口产品中,形成了聚合型 AI 入口。
- 阿里:除了阿里通义大模型外,阿里巴巴还推出了全新音频处理模型 Qwen2-Audio。通义千问系列在代码生成和多语言支持上表现优异。
- 零一万物:Yi API 正式新增 Function Call 功能,增强了模型与外部工具交互的能力,提升了自动化任务的执行效率。
普通人如何适应 AI 时代
随着 AI 的快速发展,不管是通用大模型,还是多模态,还是各行业细分领域,都取得了重大突破。可以预见未来会有更多细分领域的模型出现,从 AI 的发展趋势来看,未来 AI 必定会重塑各行各业。各大厂商将会全力抢占 AI 市场的生态位,因为在细分领域取得领先并且能实现商业落地会是企业的核心竞争力。
所以对于普通人来说,最重要的就是了解所处行业的大模型落地场景,能够理解它的基本原理和相关工具的使用是至关重要的!未来对于使用大模型,就好比我们在职场使用电脑办公一样,是满足职场要求的基本必备技能。
随着国内大模型持续发展,国内外第一梯队大模型在中文领域的通用能力差距在持续缩小,从 2023 年 5 月的 30.12% 的差距,缩小至 2024 年 8 月的 1.29%。这一数据表明国产模型在基础能力上已经非常接近国际顶尖水平。
目前各种大模型结合智能体(Agent),已经能够在场景上发力,解决具体的场景问题。在 AI 与场景的结合更紧密后,能大大提升职场的办公效率;很可能会出现一种场景,现在需要 10 个人干的活,后面只需要一个人来指导 AI 完成即可,这也是个大厂商逐步在缩减人力的原因之一,不然投入那么大成本研究 AI 的目的是啥,最终不都是为了'降本增效'。很多公司现在都开始强制员工使用 AI 工具了,如果对 AI 还完全不了解,一定要抽空去学习了解。
如何系统学习大模型 LLM
大模型时代,火爆出圈的 LLM 大模型让程序员们开始重新评估自己的本领。'AI 会取代那些行业?''谁的饭碗又将不保了?'等问题热议不断。事实上,抢你饭碗的不是 AI,而是会利用 AI 的人。
继科大讯飞、阿里、华为等巨头公司发布 AI 产品后,很多中小企业也陆续进场。超高年薪,挖掘 AI 大模型人才!如今大厂老板们,也更倾向于会 AI 的人,普通程序员还有应对的机会吗?与其焦虑,不如成为「掌握 AI 工具的技术人」,毕竟 AI 时代,谁先尝试,谁就能占得先机。
但是 LLM 相关的内容很多,现在网上的老课程老教材关于 LLM 又太少。所以现在小白入门只能靠自学,学习成本和门槛很高。针对所有自学遇到困难的同学们,以下将系统梳理大模型学习脉络,帮助大家建立知识体系。


