次模函数（Submodular Function）概念与 AI 应用 | 极客日志

编程语言AI算法

次模函数（Submodular Function）概念与 AI 应用

综述了次模函数（Submodular Function）在机器学习与人工智能中的应用。核心概念为边际收益递减，即集合中增加元素带来的价值随集合增大而降低。文章介绍了次模函数的数学定义、直观理解及典型例子（如熵、特征选择）。作为离散优化中的凸函数类比，次模函数配合贪心算法可提供 (1-1/e) 近似最优解保证，广泛应用于文本摘要、数据集压缩、特征选择及主动学习等领域。

芝士奶盖发布于 2026/4/6更新于 2026/7/746 浏览

论文名称：Submodularity In Machine Learning and Artificial Intelligence

文章配图

一、综述论文

这篇文章是一篇 综述论文（survey）。

核心目标是：

介绍 Submodular functions（次模函数） 以及它们在 机器学习与人工智能中的应用。

作者想说明一个非常重要的观点：

很多机器学习问题其实是'离散优化问题'。

例如：

Feature Selection：属于数据预处理问题，旨在从原始特征中筛选出最相关、最有信息量的子集，以降低维度、提升模型性能与可解释性。
Dataset Subset Selection：属于数据采样或核心集选择问题，旨在从大规模数据中选取一个具有代表性的子集，以降低计算和存储成本，同时保持模型性能。
Active Learning：属于机器学习训练策略问题，通过让模型主动选择最有价值的数据进行标注，以最少的标注成本最大化模型性能。
Clustering：属于无监督学习问题，旨在根据数据的内在相似性，将未标记的数据自动分组为不同的类别或簇。
Data summarization：属于信息压缩与呈现问题，旨在通过生成简洁的摘要（如关键点、代表性样本或可视化）来捕捉大型数据集或复杂数据的核心信息。

这些问题的共同特点：决策变量是 集合 (set) 不是连续变量。

例如：从 1000 个数据里选 100 个，从 100 个特征里选 20 个，组合数量是指数级的。

因此：

需要一种结构，使得 指数空间的问题仍然能高效优化。

这就是 Submodular Function 的意义。

作者提出一个很重要的类比：

连续优化	离散优化
convex function	submodular function

可以简单理解为：Submodular ≈ 离散版本的 convex/concave 结构 但其实更复杂。

二、什么是 Submodular Function（核心）

论文给出的正式定义是：

对于集合函数：

$f:2^V \rightarrow R$

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online

f(S) = 集合 S 的'价值' |S| = 集合大小（选了多少个元素）

集合大小	f(S)	增长
0 → 1	0 → 1	+1
1 → 2	1 → 1.41	+0.41
2 → 3	1.41 → 1.73	+0.32
...	...	越来越小

f(S ∪ {x}) − f(S)

类型	数学
Submodular	diminishing returns
Supermodular	increasing returns
Modular	linear

次模函数（Submodular Function）概念与 AI 应用

论文名称：Submodularity In Machine Learning and Artificial Intelligence

一、综述论文

二、什么是 Submodular Function（核心）

更多推荐文章

相关免费在线工具

更直觉的理解

可视化解释

三、论文给出的例子

'朋友的价值'

四、论文里的复杂例子（咖啡、牛奶、茶）

1 Submodular（替代关系）

2 Supermodular（互补关系）

3 Modular（独立）

五、信息论里的经典例子：Entropy

六、常见 Submodular Function 类型

1 concave over cardinality

2 Feature-based function

3 Facility Location（重要）

4 Set Cover

七、Submodular 为什么重要

Submodular Maximization 子模最大化

八、机器学习中的应用

1 文本摘要

2 数据集压缩

3 特征选择

4 Active Learning

九、总结

更多推荐文章

相关免费在线工具

次模函数（Submodular Function）概念与 AI 应用

论文名称：Submodularity In Machine Learning and Artificial Intelligence

一、综述论文

二、什么是 Submodular Function（核心）

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

更直觉的理解

可视化解释

三、论文给出的例子

'朋友的价值'

四、论文里的复杂例子（咖啡、牛奶、茶）

1 Submodular（替代关系）

2 Supermodular（互补关系）

3 Modular（独立）

五、信息论里的经典例子：Entropy

六、常见 Submodular Function 类型

1 concave over cardinality

2 Feature-based function

3 Facility Location（重要）

4 Set Cover

七、Submodular 为什么重要

Submodular Maximization 子模最大化

八、机器学习中的应用

1 文本摘要

2 数据集压缩

3 特征选择

4 Active Learning

九、总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具