C++ STL set 系列完全指南:从底层原理、核心接口到实战场景

C++ STL set 系列完全指南:从底层原理、核心接口到实战场景
在这里插入图片描述

🔥草莓熊Lotso:个人主页
❄️个人专栏: 《C++知识分享》《Linux 入门到实践:零基础也能懂》
✨生活是默默的坚持,毅力是永久的享受!


🎬 博主简介:

在这里插入图片描述

文章目录


前言:

前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击人工智能教程跳转到网站。
在 C++ STL 容器中,set 系列(set 与 multiset)是基于红黑树实现的关联式容器,核心特性是 “自动排序”“高效查找”。它既能解决 “数据去重 + 排序” 的基础需求,也能在复杂场景中(如区间删除、频率统计)提供O(log N)级别的操作效率。本文将结合实战代码,从 set 的核心概念入手,拆解其构造、增删查、区间操作等关键接口,同时对比 set 与 multiset 的差异,帮你彻底掌握这一高频使用容器。

一. 容器分类:序列式容器与关联式容器的本质区别

STL 容器的设计围绕 “数据如何存储与访问” 展开,序列式与关联式容器的核心差异体现在存储逻辑与访问方式上,具体对比如下:

特性序列式容器(如 vector、list)关联式容器(如 set、map)
存储逻辑按插入顺序存储,元素位置由插入时机决定按键(key)的内在规则存储(如排序规则)
访问方式通过下标/迭代器位置访问(如vec[2]通过键值匹配访问(如set.find(3)
底层结构动态数组(vector)、双向链表(list)等平衡二叉搜索树(红黑树,set/map)、哈希表(unordered_set)
核心优势插入顺序稳定,适合频繁增删尾部元素自动排序,查找/删除效率高(O(log N)O(1)
典型使用场景存储连续数据、需要按插入顺序遍历、动态扩容需求去重排序、快速查找、键值映射、区间操作

补充说明

  • 序列式容器强调 “位置”,元素的价值在于其存储的内容本身;
  • 关联式容器强调 “关联关系”,元素的价值在于通过 key 快速定位(如 “根据 ID 查找用户信息”);
  • set 作为 “key” 型关联式容器,仅存储键值,核心功能是 “基于 key 的排序与查找”。

二. set 系列核心原理:红黑树赋能的高效特性

set 与 multiset 底层均基于红黑树(一种自平衡二叉搜索树)实现,这一结构赋予它们以下核心特性:

  1. 自动排序:红黑树的中序遍历结果为有序序列,因此 set 插入元素后会自动按 key 的默认规则(less升序)排序,无需手动调用排序函数,如果需要按自己的需求比较可以自行实现仿函数传给第二个模板参数。
  2. 去重与允许重复:set 不允许存储重复 key(multiset 支持重复 key);
  3. 不可修改 key:set 的迭代器为const_iterator,无法通过迭代器修改 key(修改会破坏红黑树结构);
  4. 高效操作:增删查操作的时间复杂度均为O(log N),远优于 vector 的O(N)

set的声明

template<classT,// set::key_type/value_typeclassCompare= less<T>,// set::key_compare/value_compareclassAlloc= allocator<T>// set::allocator_type>classset;

参考文档set - C++ Reference
set的构造相关接口

// empty (1) ⽆参默认构造explicitset(const key_compare& comp =key_compare(),const allocator_type& alloc =allocator_type());// range (2) 迭代器区间构造template<classInputIterator>set(InputIterator first, InputIterator last,const key_compare& comp =key_compare(),const allocator_type&=allocator_type());// copy (3) 拷⻉构造set(const set& x);// initializer list (5) initializer 列表构造set(initializer_list<value_type> il,const key_compare& comp =key_compare(),const allocator_type& alloc =allocator_type());// 迭代器是⼀个双向迭代器 iterator -> a bidirectional iterator to const value_type // 正向迭代器 iterator begin(); iterator end();// 反向迭代器 reverse_iterator rbegin(); reverse_iterator rend();

三. set 核心接口实战:基于实操代码详解

下面会通过多个测试函数覆盖 set 的核心操作,我们结合代码解析其使用方法与注意事项。

3.1 初始化与插入:去重 + 自动排序

set 支持多种插入方式,插入后自动去重并按升序排列代码示例(注意看注释)

#define_CRT_SECURE_NO_WARNINGS1#include<iostream>#include<set>usingnamespace std;// 测试set的插入与遍历(去重+自动排序)voidtest_set1(){ set<int> s;// 方式1:单个元素插入//s.insert(3);//s.insert(1);//s.insert(2);//s.insert(5);//s.insert(3);//s.insert(5);//s.insert(6);// 方式2:初始化列表批量插入 s.insert({3,1,2,5,3,5,6});// 遍历方式1:迭代器遍历(注意:*it不可修改)// 遍历结果: 去重+有序 set<int>::iterator it = s.begin();while(it != s.end()){//*it1 = 1;//不能修改 cout <<*it <<" ";++it;} cout << endl;// 遍历方式2:范围for循环for(auto& e : s){ cout << e <<" ";} cout << endl;}intmain(){test_set1();return0;}
在这里插入图片描述


关键说明

  • 若需降序排序,可指定排序仿函数:set<int, greater<int>> s

3.2 查找与删除:精准操作单个元素

set 提供find(查找)、count(统计)、erase(删除)接口,支持按 key 或迭代器操作:

// 测试set的查找与删除// 测试set的查找与删除voidtest_set2(){ set<int> s; s.insert({3,1,2,5,3,5,6});// 去重后:1 2 3 5 6int x =0; cin >> x; cout << s.erase(x)<< endl;//删掉了几个返回值就是几,在set里就是1,没删掉就是0//查找元素:find返回迭代器,未找到则返回s.end()//auto pos = s.find(x);//if (pos != s.end())//{// s.erase(pos);//找到后删除//}// 统计元素个数:set中仅返回0或1(判断存在性)if(s.count(x)){}for(auto& e : s){ cout << e <<" ";} cout << endl;}intmain(){test_set2();return0;}
在这里插入图片描述


关键说明

  • erase 的返回值是删除元素的个数,在set里要么是0要么是1,multiset删了几个就是几
  • count 在 set 中主要用于判断元素是否存在,在 multiset 中返回实际个数。

3.3 区间操作:lower_bound 与 upper_bound

set 的区间操作依赖lower_boundupper_bound,用于快速定位边界,结合erase可高效删除区间元素:

// 测试set的区间操作voidtest_set3(){ set<int> s; s.insert({3,1,2,5,3,5,6,7,9});for(auto& e : s){ cout << e <<" ";} cout << endl;// 需求:删除[3, 8]区间的元素(即>=3且<=8)// lower_bound(val):返回第一个>=val的迭代器(此处指向3)auto it1 = s.lower_bound(3);// upper_bound(val):返回第一个>val的迭代器(此处指向9)auto it2 = s.upper_bound(8);// 按迭代器区间删除:删除[it1, it2)内的元素 s.erase(it1, it2);for(auto& e : s){ cout << e <<" ";} cout << endl;}intmain(){test_set3();}

关键说明

  • lower_boundupper_bound的时间复杂度均为O(log N),是区间操作的核心;
  • 区间 [it1, it2)“左闭右开”,这样符合 STL 迭代器区间的通用设计(如[begin, end))。

四. multiset:支持重复 key 的关联式容器

multiset 与 set 接口一致,核心差异是允许重复 key,适用于需要存储相同元素并统计频率的场景:

// 测试multiset(支持重复key)voidtest_multiset(){ multiset<int> s;// 插入重复元素(不会去重) s.insert({3,1,2,5,3,5,6,3,3});// 1. 遍历:有序但保留重复元素 multiset<int>::iterator it = s.begin();while(it != s.end()){//*it = 1;//不能修改 cout <<*it <<" ";++it;} cout << endl;// 2. 查找:返回中序遍历的第一个目标元素auto pos = s.find(3);//打印所有3while(pos != s.end()&&*pos ==3){ cout <<*pos <<" ";++pos;} cout << endl;// 3.查找有3的区间,左闭右开,【)//std::pair<multiset<int>::iterator, multiset<int>::iterator> ret = s.equal_range(3);auto ret = s.equal_range(3);// 4. 统计:返回元素实际个数 cout << s.count(3)<< endl;//有几个3// 5.删除:按key删除所有匹配元素 cout << s.erase(3)<< endl;//删掉所有的3,并返回删掉的3的个数 s.erase(5);//删掉所有的5for(auto& e : s){ cout << e <<" ";} cout << endl;}intmain(){test_multiset();}
在这里插入图片描述


set 与 multiset 的核心差异总结

操作setmultiset
插入重复元素自动去重,重复元素插入失败不去重,保留所有重复元素,插入成功
find(key)返回唯一匹配元素的迭代器,未找到返回end()返回中序遍历中第一个匹配元素的迭代器
count(key)返回 0 或 1(仅用于判断元素是否存在)返回元素在容器中实际出现的次数
erase(key)若元素存在则删除 1 个,不存在则删除 0 个删除容器中所有与key匹配的元素
在这里插入图片描述

五. set 系列的实战价值:解决实际开发问题

set 系列的 “自动排序 + 高效查找” 特性在算法与工程中应用广泛,以下是两个典型题目

5.1:环形链表 II

题目链接142. 环形链表 II - 力扣(LeetCode)
题目要求:找到环形链表的入口结点
思路:用 set 存储遍历过的节点,若插入节点时发现已存在,该节点即为入口。

在这里插入图片描述


C++算法代码

classSolution{public: ListNode *detectCycle(ListNode *head){ set<ListNode*> s; ListNode* cur = head;while(cur){auto ret=s.find(cur);// 不存在就插入节点if(ret==s.end()) s.insert(cur);// 已经存在证明这就是入环节点elsereturn cur; cur=cur->next;}returnnullptr;}};

5.2 两个数组的交集(扩展差集思路)

题目链接349. 两个数组的交集 - 力扣(LeetCode)
题目要求:给定两个数组,计算它们的交集(结果需去重)。
思路:用 set 对两个数组去重 + 排序,再用双指针遍历两个 set,找到共同元素。

在这里插入图片描述


C++算法代码

classSolution{public: vector<int>intersection(vector<int>& nums1, vector<int>& nums2){ vector<int> ret;// 1. 用set对两个数组去重+排序 set<int>s1(nums1.begin(),nums1.end()); set<int>s2(nums2.begin(),nums2.end());auto it1=s1.begin();auto it2=s2.begin();// 2. 双指针遍历,找共同元素while(it1!=s1.end()&&it2!=s2.end()){//小的++if(*it1<*it2)++it1;elseif(*it1>*it2)++it2;//相等的是交集,加入结果,然后同时++else{ ret.push_back(*it1);++it1;++it2;}}return ret;}};

差集和交集的实战使用:多端文件同步的逻辑

在这里插入图片描述

通过 “差集识别新增 / 缺失文件,交集比对时间戳确定更新方向”,避免全量传输,大幅减少带宽消耗和同步时间,是云存储、多端协作工具(如网盘、协同办公软件)的常见底层逻辑之一。


结尾:

🍓 我是草莓熊 Lotso!若这篇技术干货帮你打通了学习中的卡点: 👀 【关注】跟我一起深耕技术领域,从基础到进阶,见证每一次成长 ❤️ 【点赞】让优质内容被更多人看见,让知识传递更有力量 ⭐ 【收藏】把核心知识点、实战技巧存好,需要时直接查、随时用 💬 【评论】分享你的经验或疑问(比如曾踩过的技术坑?),一起交流避坑 🗳️ 【投票】用你的选择助力社区内容方向,告诉大家哪个技术点最该重点拆解 技术之路难免有困惑,但同行的人会让前进更有方向~愿我们都能在自己专注的领域里,一步步靠近心中的技术目标! 

结语:set 系列作为 STL 关联式容器的核心,以红黑树为支撑,实现了自动排序、高效查找与去重(或允许多重复)的能力,是处理 “有序数据管理” 场景的利器。掌握其接口与特性,既能简化代码逻辑,又能在算法、工程中提升性能,是 C++ 开发者的必备技能。

✨把这些内容吃透超牛的!放松下吧✨ʕ˘ᴥ˘ʔづきらど

Read more

模板进阶:从非类型参数到分离编译,吃透 C++ 泛型编程的核心逻辑

模板进阶:从非类型参数到分离编译,吃透 C++ 泛型编程的核心逻辑

🔥草莓熊Lotso:个人主页 ❄️个人专栏: 《C++知识分享》《Linux 入门到实践:零基础也能懂》 ✨生活是默默的坚持,毅力是永久的享受! 🎬 博主简介: 文章目录 * 前言: * 一. 非类型模板参数:让模板支持 “编译期常量配置” * 1.1 什么是非类型模板参数? * 1.2 必须遵守的 2 个关键规则 * 二. 模板特化:解决 “特殊类型” 的适配问题 * 2.1 解决 “通用模板失效” 的例子 * 2.2 类模板特化:比函数特化更常用 * 2.2.1 全特化:所有模板参数都确定 * 2.3.2 偏特化:对模板参数做 “条件限制”

By Ne0inhk
基于C++构建DeepSeek大模型推理SDK:从架构设计到工程落地

基于C++构建DeepSeek大模型推理SDK:从架构设计到工程落地

这里写目录标题 * 前言 * 一、 云端环境配置与鉴权机制 * 二、 C++ SDK 核心数据结构设计 * 1. 消息与配置实体 * 2. 模型信息与会话管理 * 三、 抽象接口层设计:策略模式的应用 * 四、 DeepSeek 适配器实现 * 1. 初始化逻辑 * 2. 信息查询接口 * 五、 单元测试与质量保证 * 1. 测试环境构建 * 2. 日志系统 * 六、 CMake 构建系统配置 * 1. 依赖管理 * 2. 编译目标与链接 * 七、 编译与调试过程 前言 在高性能计算与大模型(LLM)应用开发的浪潮中,C++凭借其卓越的内存管理能力和运行时效率,成为了构建底层推理SDK的首选语言。本文将深入剖析如何从零开始,设计并实现一个能够调用DeepSeek模型的C++ SDK。全通过程涵盖了云端鉴权、面向对象架构设计、多态接口封装、

By Ne0inhk
【C++】哈希扩展

【C++】哈希扩展

🌈个人主页:秦jh_-ZEEKLOG博客 🔥 系列专栏:https://blog.ZEEKLOG.net/qinjh_/category_12575764.html?spm=1001.2014.3001.5482     目录 位图 位图相关面试题 位图的设计及实现 C++库中的位图 bitset 位图的优缺点 位图相关考察题目 布隆过滤器 什么是布隆过滤器 布隆过滤器器误判率推导 布隆过滤器删除问题 布隆过滤器的应用 海量数据处理问题 给两个文件,分别有100亿个query,我们只有1G内存,如何找到两个文件交 集? 给一个超过100G大小的log file, log中存着ip地址, 设计算法找到出现次数最 多的ip地址?查找出现次数前10的ip地址 前言 💬 hello! 各位铁子们大家好哇。              今日更新了位图的相关内容 🎉 欢迎大家关注🔍点赞👍收藏⭐

By Ne0inhk
AVL树的平衡艺术:用C++写出会“站立”的二叉树(未完待续)

AVL树的平衡艺术:用C++写出会“站立”的二叉树(未完待续)

前言         在前几日的文章中,我曾提到过map和set的底层实现是基于红黑树,可能有不少读者以为今天的文章会讲解红黑树——但NO,NO,NO,虽然红黑树我会在后续讨论,但由于其较高的难度,今天我并不会直接介绍红黑树。而是将带大家了解另一种特殊的二叉搜索树——AVL树,也就是俗称的“平衡二叉搜索树”。这里的“平衡”二字非常巧妙,接下来正文中我会详细解释这其中的奥妙。         AVL树与红黑树一样,都是非常重要的自平衡二叉搜索树,但我认为相较于红黑树,AVL树的复杂度更低,且其旋转操作与红黑树的操作非常相似。今天,我将为大家详细讲解AVL树,带大家一步步攻克这个小“BOSS”。那么,系好安全带,准备好迎接这次有趣的挑战吧! 1.AVL树的概念 1.AVL树的来源以及简单的介绍         AVL树是最先被发明出来的平衡二叉搜索树,AVL树是一颗空树(什么结点也木有),或者是具备下面性质的二叉搜索树:它的左右子树均是AVL树,并且左右子树的高度差不能大于1(后面即将叙述的平衡因子)。AVL树是一颗高度平衡二叉搜索树,通过控制它的高度来控制平衡(因为这个性质A

By Ne0inhk