2024:人工智能大模型的璀璨年代

2024:人工智能大模型的璀璨年代

大家好,我是herosunly。985院校硕士毕业,现担任算法研究员一职,热衷于大模型算法的研究与应用。曾担任百度千帆大模型比赛、BPAA算法大赛评委,编写微软OpenAI考试认证指导手册。曾获得阿里云天池比赛第一名,CCF比赛第二名,科大讯飞比赛第三名。授权多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。

本文主要对2024年度人工智能大模型的创新和应用进行了总结,希望对学习大语言模型的同学们有所帮助。

文章目录

1. 前言

人工智能的发展轨迹似乎正在印证一个有趣的历史规律:颠覆性技术往往以超出最初预期的方式迅速演进。回顾历史,电力的普及、互联网的崛起,乃至智能手机的诞生,无一不是以远超人们想象的速度改变了社会的方方面面。

随着2022年底ChatGPT的问世,AI大模型如同一颗投入平静湖面的重磅炸弹,瞬间激起千层波澜。当时,人们对这一全新的语言模型充满好奇与惊叹,但鲜少有人能准确预见其将带来的深远变革。转眼间,短短两年过去,大模型已经悄然融入我们工作和生活的方方面面。而这些变化,则绝大多数发生在过去的一年当中。

那么,站在2025年的新起点,让我们共同回顾过去一年学术界与工业界在模型侧和应用侧所取得的突破性进展。

2. 从OpenAI一方独霸到群雄逐鹿

2024年成为大模型厂商激烈竞争的关键一年。Menlo Ventures的调研数据显示,OpenAI的先发优势正逐渐减弱,其市场占有率较2023年出现显著下滑。具体而言,OpenAI的企业市场份额从50%下降至34%。这部分流失的市场份额主要被Anthropic和谷歌瓜分,显示出市场竞争格局的显著变化。

在这里插入图片描述

2023年3月,OpenAI发布了GPT-4模型,其在起草诉讼书、通过标准化考试以及根据手绘草图建立工作网站等方面的能力令人惊叹,一骑绝尘。然而,时间来到了2024年,5月份OpenAI发布了原生的多模态模型GPT-4o,它可以接受文本、音频和图像任意组合的输入,并生成这些格式的相应输出。

2024年9月13日,OpenAI正式发布了o1模型,这是一款颇具颠覆性和创新性的模型。o1最引人注目的特点是其独特的思考机制,类似于人类的深度思考过程。在响应用户请求时,模型会进行长时间的内部推理,不仅可以尝试多种解决方案,还能够在思考过程中主动发现并纠正潜在的错误。这种近似于人类大脑思考模式的方法,使得o1在数学、物理、化学和编程等专业领域表现出卓越的能力。

在这里插入图片描述

到了12月20日,OpenAI推出了最新的推理模型o3及其轻量版本o3-mini。相较于o1,这一代模型在编程、数学和科学问答等方面取得了显著的进步。尤其值得称道的是,o3成功突破了ARC-AGI基准测试,标志着人工智能在适应新任务和学习未知场景的能力上实现了里程碑式的飞跃。

在这里插入图片描述

然而,值得深思的是,尽管从4o到o1再到o3,OpenAI的模型在技术上持续精进,然而,许多用户觉得,如今这些渐进式的改进似乎难以再现ChatGPT最初问世时的那种震撼惊喜。

与此同时,OpenAI的“孪生兄弟”Anthropic也在2024年发布了多款震惊世界的大模型。之所以称为孪生兄弟,主要是由于Anthropic的多位重量级人物均来自于OpenAI,包括GPT-3首席工程师Tom Brown、OpenAI安全与政策副总裁Daniela Amodei,以及近期加入的ChatGPT后期训练负责人John Schulman和前OpenAI安全主管Jan Leike。所以大家一定要持续关注Anthropic发布的模型、论文以及相关技术报告。

在这里插入图片描述

2024年3月,Anthropic推出了备受瞩目的Claude 3系列大模型,其中Claude 3 Opus迅速脱颖而出,成为业界公认的新一代性能标杆。紧随其后,6月发布的Claude 3.5 Sonnet更是将模型性能推向了前所未有的新高度。值得注意的是,即便在10月进行了重大性能升级,该模型仍然保持了原有的版本号,这一现象在业内被非正式地称为"Claude 3.6"。如果大家对AI编程有所了解,三大神器(cursor、windsurf、cline)均使用Claude 3.5 Sonnet模型作为其核心模型。充分体现了Claude 3.5 Sonnet在代码生成和理解方面的卓越能力。

在这里插入图片描述


调用claude-3.5-sonnet的示例代码如下:

from openai import OpenAI client = OpenAI( base_url="https://openrouter.ai/api/v1", api_key="<OPENROUTER_API_KEY>",) completion = client.chat.completions.create( extra_headers={"HTTP-Referer":"<YOUR_SITE_URL>",# Optional. Site URL for rankings on openrouter.ai."X-Title":"<YOUR_SITE_NAME>",# Optional. Site title for rankings on openrouter.ai.}, model="anthropic/claude-3.5-sonnet", messages=[{"role":"user","content":[{"type":"text","text":"What's in this image?"},{"type":"image_url","image_url":{"url":"https://upload.wikimedia.org/wikipedia/commons/thumb/d/dd/Gfp-wisconsin-madison-the-nature-boardwalk.jpg/2560px-Gfp-wisconsin-madison-the-nature-boardwalk.jpg"}}]}])print(completion.choices[0].message.content)

2024年,大模型领域的开源鼻祖Meta公司再次引领潮流,发布了Llama 3系列模型,并在此基础上推出了Llama 3.1和Llama 3.2两个升级版本。Llama 3系列模型的发布,不仅为开源社区注入了新的活力,更为国内大模型领域的蓬勃发展提供了重要的技术引领和创新动力。

2024年国产模型也进步神速,阿里发布了Qwen2.5 Chat、Qwen2.5 Coder模型以及深度推理模型QwQ。但最让本人感到最为欣喜的当属DeepSeek发布的多款模型,尤其是近日发布的DeepSeek-R1深度推理模型,不仅效果堪比OpenAI的o1模型,而且将技术报告和模型权重进行开源,这一点真的称得上国产之光,遥遥领先。

在这里插入图片描述

3. 大模型的重要应用方向:代码助手、智能客服、知识搜索

谈到大模型企业应用,首当其冲的就是代码助手(Code Copilots),该方向的市场占有率遥遥领先(51%),使得部分开发人员成为大模型技术的早期深度用户。GitHub Copilot的迅速崛起——其收入增长速度已突破3亿美元——充分印证了这一趋势。与此同时,Cursor、Windsurf、Devin等新兴工具也在快速扩展市场份额。除了通用代码助手外,企业还积极引入特定任务的代码解决方案,如Harness的AI开发运维工程师和质量检测助手,这些工具专注于管道生成和测试自动化。此外,像All Hands能够完成端到端软件开发的智能体软件也备受关注。

智能客服在企业应用中取得了显著进展,市场占有率达31%。这些应用为内部员工和外部客户提供全天候的可靠知识支持。Aisera、Decagon和Sierra等公司的智能代理直接与终端客户互动,而Observe AI则在通话过程中为呼叫中心代理提供实时指导,显著提升了服务效率。

在企业数据管理领域,企业搜索与检索(市场占有率28%)和数据提取与转换(市场占有率27%)成为两大热门应用方向,反映出企业迫切希望解锁并利用分散在组织各处的数据孤岛中隐藏的宝贵知识。Glean和Sana等创新解决方案通过连接电子邮件、即时通讯工具和文档存储库,实现了跨系统的统一语义搜索,并提供人工智能驱动的知识管理服务。

会议总结应用以24%的采用率位居第五,通过自动记录笔记和提炼要点,显著提升了工作效率。例如,Fireflies.ai、Otter.ai和Sana等工具能够智能捕捉并总结在线会议内容,而Fathom则专注于从视频会议中提取关键信息。特别值得一提的是,Eleos Health将这一创新应用于医疗保健领域,通过自动化文档记录并与电子健康记录(EHR)系统无缝集成,使医疗服务提供者能够将更多精力专注于患者护理,从而显著提升了医疗服务质量。

在这里插入图片描述

4. 从专家专属到人人可用:提示词使用趋于简单

随着模型的思考和推理能力逐步提升,提示词技巧的重要性逐渐降低。提示词的核心要点只有一个:问题必须清楚明了。如果担心大模型无法理解,可以适当增加示例,即为大模型提供更容易理解的上下文。

就像带领一个普通团队(普通大模型),由于成员能力有限,每项任务都需要你事无巨细地交代清楚,甚至要手把手指导具体操作,否则他们往往难以独立完成或达不到预期效果。而如果拥有了一支更为优秀的团队(深度推理大模型),通常只需明确任务目标和大致方向,他们就能自主高效地思考和推理,在具体细节上过多赘述反而可能会导致效果下降。

但在部分场景下设定大模型角色,依然是一个简单有效的方法。比如需要大模型去扮演心理医生、数学老师等特定角色时,明确的角色设定能够帮助模型更好地理解任务需求,生成符合角色身份的回答。这种设定不仅提升了输出的专业性和准确性,还能增强用户体验,使交互更加自然和贴近实际场景。例如,在心理咨询中,模型可以模拟心理医生的语气和沟通技巧,提供情感支持和专业建议;在数学教学中,模型可以像老师一样逐步引导学生解题,解释复杂概念。因此,角色设定在某些特定任务中仍然具有重要价值。

2025年已经到来,个人大胆猜测,2025 年有望成为AI Agent 商业爆发元年。各行各业都将受益于AI Agent带来的效率提升和用户体验优化。随着技术的不断进步和应用场景的拓展,AI Agent有望成为未来商业生态中不可或缺的一部分。

Read more

2026 最新 OpenClaw 企业微信 AI 机器人对接全流程教程|可复现实操 + 全场景避坑指南

2026 最新 OpenClaw 企业微信 AI 机器人对接全流程教程|可复现实操 + 全场景避坑指南

随着 AI Agent 技术在企业办公场景的落地,OpenClaw 作为轻量开源的 AI 智能体框架,成为了众多团队搭建企业微信自动化机器人的首选方案。无论是内部办公的智能问答助手、客户运营的智能客服,还是跨系统的定时消息推送、业务流程自动化处理,OpenClaw 都能提供灵活的能力支持。 但在实际开发部署中,不少开发者都会遇到技术卡点:官方英文文档对新手不友好、webhook 回调签名校验门槛高、企业微信权限配置逻辑复杂,很容易出现对接失败、消息收不到、机器人不回复、服务重启后配置失效等问题,很多人反复调试数天都无法完成稳定对接。 本文是我经过多轮实测、踩坑无数整理的 2026 最新稳定版对接教程,从后台配置、代码编写到排障逻辑,每一步都有可落地的操作指引,哪怕你是刚接触 OpenClaw 的零基础新手,跟着步骤也能一次对接成功。 如果你不想手动修改配置文件、反复调试回调接口、处理复杂的企业微信权限逻辑,也可以直接使用 OpenClaw 国产平替EasyClaw,它内置了企业微信原生一键对接能力,无需修改一行代码、无需手动调试回调地址,全中文可视化界面操作,最快 10 分钟就能

[论文阅读] AI + 软件工程 | AI辅助编程时代,新手真能替代资深开发者吗?这份实证研究给出答案

[论文阅读] AI + 软件工程 | AI辅助编程时代,新手真能替代资深开发者吗?这份实证研究给出答案

AI辅助编程时代,新手真能替代资深开发者吗?这份实证研究给出答案 论文信息 1. 原标题:Novice Developers Produce Larger Review Overhead for Project Maintainers while Vibe Coding 2. 主要作者:Syed Ammar Asdaque、Imran Haider、Muhammad Umar Malik、Abdul Ali Bangash、Maryam Abdul Ghafoor 3. 研究机构:巴基斯坦拉合尔管理科学大学(Lahore University of Management Sciences) 4. 发表会议:23rd International Conference on Mining Software

Flutter 三方库 angular_bloc 的鸿蒙化适配指南 - 在鸿蒙系统上构建极致响应、工业级的 AngularDart 与 BLoC 协同架构实战

欢迎加入开源鸿蒙跨平台社区:https://openharmonycrossplatform.ZEEKLOG.net Flutter 三方库 angular_bloc 的鸿蒙化适配指南 - 在鸿蒙系统上构建极致响应、工业级的 AngularDart 与 BLoC 协同架构实战 在鸿蒙(OpenHarmony)系统的桌面级协同(如分布式办公网页版)、后台管理终端或高度复杂的 Web 仪表盘开发中,如何将经典的 BLoC 状态管理应用于 AngularDart 环境?angular_bloc 为开发者提供了一套天衣无缝的组件化连接器。本文将实战演示其在鸿蒙 Web 生态中的深度应用。 前言 什么是 Angular BLoC?它是一套专门为 AngularDart 框架设计的 BLoC 实现。通过指令(Directives)和管道(Pipes),它实现了由于数据流变化触发的 UI

基于STM32的智能家居环境监测与控制系统设计

基于STM32的智能家居环境监测与控制系统设计

基于STM32的智能家居环境监测与控制系统设计 摘要 本论文设计并实现了一种基于STM32F103C8T6单片机的智能家居环境监测与控制系统。系统通过集成多参数环境传感器,构建了完整的家居环境感知-决策-执行闭环,实现了对室内温湿度、烟雾浓度、一氧化碳、空气质量、光照强度及大气压强的精准监测。设计采用模块化架构,利用OLED显示屏进行本地数据可视化,通过步进电机控制窗户开闭实现自动通风,结合LED照明系统调节室内光线,并借助ESP8266-WIFI模块接入机智云平台实现远程监控。系统支持手动模式(APP远程控制)与自动模式(阈值触发联动)双模式运行,创新性地引入用户习惯学习的阈值自适应机制,显著提升系统个性化体验。测试表明,系统在典型家居环境中温湿度误差<±2%,气体浓度误差<±5%,关键安全事件响应时间<3秒,WIFI连接成功率>98%,功耗控制在待机<1W的水平。本设计不仅有效提升了家居环境的安全性与舒适度,还通过智能化管理降低了能源消耗,为低成本、高可靠性的智能家居系统开发提供了实践范本。 关键词:STM32;智能家居;环境监测;WIFI通信;机智云;自动控制;多传感器融