引言
在人工智能领域,大模型(LLMs)的研究正迅速发展,当前涵盖了很多个研究方向,每个方向都带有其独特的研究重点和挑战。本文主要盘点几个比较热门的研究方向,主要包括检索增强生成(RAG)、大模型 Agent、Mamba、混合专家模型(MoE)、低秩适应(LoRA)等。这些研究方向旨在解决大模型在实际应用中的关键问题,如幻觉抑制、长上下文处理、推理成本优化及多任务适应性,从而提高性能和实用性。
检索增强生成 RAG
检索增强生成(RAG)通过结合信息检索和文本生成来提高 AI 系统的性能。RAG 的核心优势在于它能够利用外部知识库来辅助生成过程,从而显著提高生成内容的准确性和鲁棒性。结合大模型强大的生成能力,使得 RAG 在问答系统、文档生成、自动摘要、智能助手、信息检索和知识图谱填充等多种自然语言处理任务中都能发挥关键作用。
核心挑战与改进
研究重点主要集中在「检索器与生成器的集成」、「跨模态应用和知识更新」。面临的挑战包括如何提高检索效率、增强生成质量以及实现跨领域应用。如果仅仅依赖大模型本身的参数知识来进行文本生成,模型会产生不可避免的幻觉。为此,人们将 RAG 作为大模型文本生成的辅助方法,但 RAG 方法的准确性依赖于检索文本的准确性,当检索出现问题时,生成文本的准确性将难以保证。
代表性研究进展
- HippoRAG:OSU 与斯坦福作者提出了一种新思路,让大模型拥有一个像人脑海马体一样的'记忆操作系统'。借鉴海马体在人脑记忆中的关键作用,设计了名为 HippoRAG 的新型检索增强模型。实验表明,装备了这一'类脑'记忆系统的大模型在多种需要知识整合的任务中展现出了惊人的性能提升。
- Adaptive-RAG:AI2 提出了一种自适应 QA 问答框架。该框架涵盖各种策略(简单复杂的都有),可根据请求的复杂性动态地选择合适的策略,旨在提升检索增强大模型处理不同复杂请求的响应准确性,提高了 QA 问答的效率。
- CRAG:中科大提出了纠正检索增强生成(Corrective RAG)。旨在提高文本生成的鲁棒性,当检索出现问题时,系统能够进行自我修正或重新检索,减少错误信息的传播。
- RAG-Fusion:Infineon 提出的一种技术,结合了 RAG 和 Reciprocal Rank Fusion(RRF)。首先通过指令遵循模型生成多个查询请求,然后对每个生成的请求进行矢量搜索,以从预定义的集合中检索相关文档,接着应用倒数排名融合算法根据多个请求之间的相关性对文档重新排名,最后生成重新排序的文档组列表。
- SYNTHESIZRR:Amazon 提出了一种新方法,用于改进大模型在分类任务中的微缩化过程。传统方法通过 few-shot 提示生成数据集,但存在重复和偏见问题。SYNTHESIZRR 通过检索增强引入多样性,使 LLM 根据不同内容生成更多样化的示例,在提升词汇和语义多样性、模仿人类文本以及提高模型微缩化性能方面,均优于传统方法。
大模型 Agent
随着大模型应用场景越来越复杂化,单纯依赖大模型的能力将面临巨大的挑战。构建大模型 Agent 将是大势所趋。微软研究人员深入探讨了 Agent AI 的基础,强调了智能 Agent 在物理、虚拟现实、混合现实、感官交互等方面的能力,并指出 Agent AI 或是下一代人工智能的关键。其研究重点在于「多任务学习」、「常识推理和持续学习」,旨在提高 Agent 在广泛任务上的表现和适应性。
典型应用场景与框架
- AutoWebGLM:智谱提出新型自动化网页导航 Agent。它通过简化网页内容和使用 AI 技术来解决现有 Web Agent 处理真实网页时的挑战。AUTOWEBGLM 通过特别设计的算法来表示网页,保留重要信息,并利用混合人工智能方法进行训练。此外,该 Agent 通过强化学习和拒绝采样技术来提高对网页的理解能力和执行任务的效率。
- AutoDev:微软提出自动软件开发框架。这是一个完全自动化的 AI 驱动软件开发框架,旨在自主规划和执行复杂的软件开发任务。AutoDev 可以让用户定义复杂的软件工程目标,并将这些目标分配给 AutoDev 的自主 Agent 来实现。这些 Agent 可以在代码库上执行多种操作,包括文件编辑、检索、构建过程、执行、测试和 Git 操作。
- SceneCraft:Google 提出了 SceneCraft,它是一个创新的大语言模型 Agent,能够将文本描述转换成可在 Blender 中执行的 Python 脚本,用于创建复杂的 3D 场景。它通过高级抽象、战略规划和库学习来解决空间规划和布局的复杂性。
- REPOAGENT:清华开发了 REPOAGENT,这是一个基于大型语言模型的开源框架,专门用于自动生成、维护和更新代码文档。通过一系列的评估,包括定性和定量分析,证明了 REPOAGENT 在创建高质量的代码仓库文档方面的能力。
- GITAGENT:清华开发的 GITAGENT 可以让模型自己从 GitHub 上找到合适的代码库,然后加到自己的工具箱里。工作时会分四个步骤,如果遇到问题,它还会去 GitHub 上看看别人是怎么解决的,学习经验。


