跳到主要内容
极客日志极客日志面向AI+效率的开发者社区
首页博客GitHub 精选镜像工具UI配色美学隐私政策关于联系
搜索内容 / 工具 / 仓库 / 镜像...⌘K搜索
注册
博客列表
PythonAI算法

ICML 2024 顶级论文:机器学习领域新进展

综述由AI生成ICML 2024 收录了 2609 篇论文。重点探讨了隐私保护与大模型预训练的冲突、时间序列基础模型 TimesFM 及 LLM 在时序分析中的应用、多实例学习 TimeMIL 以及元数据整合生成模型 Time Weaver。迁移学习方面涉及自适应特征迁移 AFT、图助手 LLaGA、Transformer 量化 FrameQuant 及蒸馏方法 DistiLLM。计算机视觉与音频领域展示了基于状态空间模型的 Vision Mamba、超越准确率的评估指标研究,以及利用 LLM 进行通用音频生成的 UniAudio 模型。

时间旅人发布于 2025/2/7更新于 2026/6/226 浏览
ICML 2024 顶级论文:机器学习领域新进展

引言

作为人工智能领域最负盛名的会议之一,ICML 每年都会吸引全球顶尖的研究人员提交数千篇论文。今年,ICML 共收到 9653 篇论文投稿,但最终仅接受了 2609 篇,录用率仅为 27.03%。

本文将深入探讨 ICML 2024 上一些备受瞩目的论文,涵盖最佳论文奖、时间序列、大语言模型与迁移学习、计算机视觉与音频等多个领域。

最佳论文奖

论文标题: Position: Considerations for Differentially Private Learning with Large-Scale Public Pretraining

作者: Gautam Kamath(滑铁卢大学教授)、Florian Tramr(苏黎世联邦理工学院计算机科学家)、Nicholas Carlini(谷歌 DeepMind 研究员)

核心内容:

该论文对迄今为止大型语言模型(LLM)的训练范式提出了挑战。

背景: 目前,训练 LLM 通常采用以下方法:首先使用公开数据进行预训练,然后在私有数据上进行微调。然而,论文指出,公开数据本身可能包含敏感或私人信息,而即使经过'隐私保护'的微调,模型仍然可能会记住其预训练数据,这直接危害了隐私,并削弱了'隐私学习'的意义。

问题根源:

对公开预训练价值的过度估计,仅基于公开数据和私有数据分布重叠的参数。

训练这些大型模型需要大量计算资源,无法在最终用户的机器上执行,导致私有数据的外包。

意义: 该论文对当前私有学习实践的批判性立场恰逢 LLM 领域越来越多小型模型涌现之际。作者呼吁科学界考虑解决这些问题的方法。

时间序列

1. 论文标题:A decoder-only foundation model for time-series forecasting

作者: Das 等人

核心内容:

研究问题: 能否利用在海量时间序列数据上训练的大型预训练模型学习时间模式,从而对未见过的数据集进行时间序列预测?

方法:

分块处理: 分块类似于语言模型中的 token。

仅解码器模型: 给定一系列输入分块,模型经过优化,可以根据所有过去分块预测下一个分块。

更长的输出分块: 更长的输出序列可以避免与预测范围长度先验知识相关的限制。

受 LLM 和基础模型快速发展的启发,研究人员提出了一种名为 TimesFM(时间序列基础模型)的基础模型,用于零样本时间序列预测。

TimesFM 的架构基于以下原则:

结果:

该零样本模型能够达到全监督模型的性能。

在多个数据集上的实验结果表明,TimesFM 在时间序列预测任务中表现出色,甚至优于一些传统模型。

2. 论文标题:Position: What Can Large Language Models Tell Us about Time Series Analysis

作者: Jin, Zhang 等人

核心内容:

主要贡献:

路线图:

1950-2000 年代:统计时间序列模型(如 ARIMA、Holt-Winters)。

2010 年代:神经网络时间序列模型(如 RNN、TCN、STGNN)。

2022 年:预训练时间序列模型(如 TF-C、TimeCLR)。

2024 年:以 LLM 为中心的时间序列模型(如 Time-LLM、SocioDojo)。

为 LLM 在时间序列分析中的应用提供了新的视角。

对现有方法进行了基准测试和回顾,并提出将 LLM 集成到时间序列分析中的路线图。

确定了未来机会,例如利用 LLM 解决复杂现实世界的时间序列分析任务。

3. 论文标题:TimeMIL: Advancing Multivariate Time Series Classification via a Time-aware Multiple Instance Learning

作者: Chen, Qiu 等人

核心内容:

研究问题: 多变量时间序列分类模型如何更好地捕捉时间序列中的兴趣点和时间依赖性?

方法:

提出一种新的方法,称为多实例学习(TimeMIL),该方法利用弱监督学习来区分时间序列中的正负实例。

TimeMIL 将每个时间点视为一个实例,并学习区分包含正实例和负实例的包。

与传统的监督学习方法相比,TimeMIL 可以更好地捕捉时间序列中的罕见事件和模式。

4. 论文标题:Time Weaver: A Conditional Time Series Generation Model

作者: Narasimhan 等人

核心内容:

研究问题: 如何将元数据(如天气、位置等)整合到时间序列生成模型中?

方法:

提出一种基于扩散模型的方法,该方法利用元数据(以分类、连续或时间特征的形式)来生成更逼真的时间序列。

引入了一种新的评估指标,可以更准确地捕捉生成时间序列的真实感。

该模型在能源领域等需要整合元数据的时间序列生成任务中表现出色。

大语言模型与迁移学习

趋势: 小型化模型成为主流,研究方向主要集中在模型蒸馏和更高效的微调技术。

1. 论文标题:Transferring Knowledge from Large Foundation Models to Small Downstream Models

作者: Qiu 等人

核心内容:

方法:

基于权重的迁移信息传递有限。

预训练模型通常较大。

无法结合多个学习互补信息的模型。

提出一种新的知识迁移方法,称为自适应特征迁移(AFT)。

与传统的基于权重的迁移学习不同,AFT 直接在特征上操作,自适应地迁移那些最有用的特征。

该方法旨在解决以下与迁移学习相关的问题:

2. 论文标题:LLaGA: Large Language and Graph Assistant

作者: Chen 等人

核心内容:

方法:

提出一种名为 LLaGA(大型语言与图助手)的新模型,该模型利用 LLM 处理图数据。

该方法基于将图数据映射到与 LLM 兼容的空间。

LLaGA 在多个数据集上表现出良好的泛化能力和可解释性。

3. 论文标题:FrameQuant: Flexible Low-Bit Quantization for Transformers

作者: Adepu 等人

核心内容:

研究问题: 如何在不显著降低性能的情况下,对 Transformer 模型进行更高效的量化?

方法:

提出了一种 2 位量化方法,该方法基于一种称为'融合帧'的谐波分析。

研究表明,量化的关键不在于原始权重空间,而在于融合帧的表示。

该方法可以在保持性能的同时,将模型大小和计算成本降低到更低水平。

4. 论文标题:DISTILLM: Towards Streamlined Distillation for Large Language Models

作者: Ko 等人

核心内容:

方法:

提出了新的目标函数 Skew KLD(Kullback-Leibler 散度),该函数针对稳定的梯度和最小的近似误差进行了优化。

采用自适应非策略方法减少训练时间。

性能优异,效率高,与最先进的技术不相上下。

针对 LLM 引入了一种新的模型蒸馏方法,称为 DistiLLM。

计算机视觉与音频

1. 论文标题:Vision Mamba: Efficient Visual Representation Learning with Bidirectional State Space Model

作者: Zhu, Liao 等人

核心内容:

方法:

利用 Mamba 架构(一种新型的状态空间模型架构)进行视觉数据处理。

Vision Mamba(Vim)采用双向状态空间模型,并结合投影层、MLP 和预测层。

与 Vision Transformers 相比,Vim 在 ImageNet 分类任务、COCO 对象检测和分割任务中表现出更优的性能,同时速度提高了 2.8 倍,GPU 内存节省了 86.8%。

2. 论文标题:ConvNet vs Transformer, Supervised vs CLIP: Beyond ImageNet Accuracy

作者: Vishniakov 等人

核心内容:

研究问题: 如何超越准确率来衡量视觉模型的性能?

方法:

探讨了 ConvNet、Transformer 和 CLIP 等不同视觉模型在误差类型、输出校准、可迁移性、特征不变性等方面的差异。

强调了在评估视觉模型时,除了准确率之外,还需要考虑其他因素,以捕捉所有可能的细节。

3. 论文标题:UniAudio: Towards Universal Audio Generation with Large Language Models

作者: Yang, Tian 等人

核心内容:

方法:

对所有类型的目标音频以及其他条件模态进行标记化。

将源 - 目标对连接成单个序列。

使用 LLM 进行下一个标记预测。

提出了一种名为 UniAudio 的模型,该模型利用 LLM 技术生成各种类型的音频,包括声音、语音、音乐和歌唱。

训练数据包含 165,000 小时的音频,模型参数为 10 亿。

目录

  1. 引言
  2. 最佳论文奖
  3. 时间序列
  4. 1. 论文标题:A decoder-only foundation model for time-series forecasting
  5. 2. 论文标题:Position: What Can Large Language Models Tell Us about Time Series Analysis
  6. 3. 论文标题:TimeMIL: Advancing Multivariate Time Series Classification via a Time-aware Multiple Instance Learning
  7. 4. 论文标题:Time Weaver: A Conditional Time Series Generation Model
  8. 大语言模型与迁移学习
  9. 1. 论文标题:Transferring Knowledge from Large Foundation Models to Small Downstream Models
  10. 2. 论文标题:LLaGA: Large Language and Graph Assistant
  11. 3. 论文标题:FrameQuant: Flexible Low-Bit Quantization for Transformers
  12. 4. 论文标题:DISTILLM: Towards Streamlined Distillation for Large Language Models
  13. 计算机视觉与音频
  14. 1. 论文标题:Vision Mamba: Efficient Visual Representation Learning with Bidirectional State Space Model
  15. 2. 论文标题:ConvNet vs Transformer, Supervised vs CLIP: Beyond ImageNet Accuracy
  16. 3. 论文标题:UniAudio: Towards Universal Audio Generation with Large Language Models
  • 💰 8折买阿里云服务器限时8折了解详情
  • Magick API 一键接入全球大模型注册送1000万token查看
  • 🤖 一键搭建Deepseek满血版了解详情
  • 一键打造专属AI 智能体了解详情
极客日志微信公众号二维码

微信扫一扫,关注极客日志

微信公众号「极客日志V2」,在微信中扫描左侧二维码关注。展示文案:极客日志V2 zeeklog

更多推荐文章

查看全部
  • LLaMA-Factory 微调 Qwen3-VL 详细流程
  • GitHub Copilot 网络代理配置与优化实战指南
  • NavRL 详解:CMU 开源无人机导航框架核心技术与应用
  • Win11 本地部署 OpenClaw 通过 WSL 实现飞书机器人功能
  • 开源大模型 MGeo 实现高精度地址对齐
  • HDFS DataNode 故障处理:节点下线、数据重建、磁盘更换全流程
  • Ollama 本地 CPU 部署开源大模型指南
  • C 语言实现八大排序算法详解
  • Java 依赖管理详解:Maven 与 Gradle 的下载、缓存及配置
  • Android WebView 崩溃原因分析与解决方案
  • Python 与前端集成:构建全栈应用
  • C++ 模板初阶:泛型编程核心知识
  • DeepSeek-R1-Distill-Llama-8B 在线演示教程
  • ARM Cortex R52 架构 GICv3 中断控制器详解
  • llama-cpp-python 从安装到性能优化指南
  • 旧电脑 Win7 复活计划:编译与运行 llama.cpp (Qwen3版)
  • 区块链共识机制深度解析:PBFT、Tendermint 与 DAG
  • 8 篇必读的大模型论文
  • IDEA 启动 Spring Boot 项目时添加参数的方法
  • 本地部署 AI 量化分析平台:Docker 配置与波浪理论实战

相关免费在线工具

  • 加密/解密文本

    使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online

  • RSA密钥对生成器

    生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online

  • Mermaid 预览与可视化编辑

    基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online

  • 随机西班牙地址生成器

    随机生成西班牙地址(支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选),支持数量快捷选择、显示全部与下载。 在线工具,随机西班牙地址生成器在线工具,online

  • Gemini 图片去水印

    基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印,支持批量处理与下载。 在线工具,Gemini 图片去水印在线工具,online

  • curl 转代码

    解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。 在线工具,curl 转代码在线工具,online