【C++:unordered_set和unordered_map】C++无序容器深度解析:unordered_set和unordered_map的使用

【C++:unordered_set和unordered_map】C++无序容器深度解析:unordered_set和unordered_map的使用

🔥艾莉丝努力练剑:个人主页

专栏传送门:《C语言》《数据结构与算法》C/C++干货分享&学习过程记录Linux操作系统编程详解笔试/面试常见算法:从基础到进阶测试开发要点全知道

⭐️为天地立心,为生民立命,为往圣继绝学,为万世开太平


🎬艾莉丝的简介:


🎬艾莉丝的C++专栏简介:


目录

C++的两个参考文档

1  ~>  unordered_set

1.1  容器介绍

1.2  unordered_set和set的使用差异

2  ~>  unordered_map

2.1  容器介绍

2.2  unordered_map和map的使用差异

2.3  unordered_multimap和unordered_multiset

2.4  拓展:unordered_xxx的哈希相关接口

3  ~>  C++17切换(配置环境)

4  ~>  算法题实战

4.1  C++算法实现

完整代码示例与实践演示

Test.cpp:

运行结果一

运行结果二

结尾


C++的两个参考文档

老朋友(非官方文档):cplusplus

官方文档(同步更新):C++ 官方参考文档
set和multiset的参考文档:setmultiset

map和multimap的参考文档:mapmultimap

unordered_set和unordered_multiset的参考文档:unordered_setunordered_multiset

unordered_map和unordered_multimap的参考文档:unordered_mapunordered_multimap



1  ~>  unordered_set

1.1  容器介绍

unordered_set的声明如下,Key就是unordered_set底层关键字的类型。

unordered_set默认要求Key支持转换为整型,如果不支持或者想按自己的需求走可以自行实现支持将Key转成整型的仿函数传给第二个模板参数。

unordered_set默认要求Key支持比较相等,如果不支持或者想按自己的需求走可以自行实现支持
将Key比较相等的仿函数传给第三个模板参数。

unordered_set底层存储数据的内存是从空间配置器申请的,如果需要可以自己实现内存池,传给
第四个参数。

一般情况下,我们都不需要传后三个模板参数——

template < class Key, // unordered_set::key_type/value_type class Hash = hash<Key>, // unordered_set::hasher class Pred = equal_to<Key>, // unordered_set::key_equal class Alloc = allocator<Key> // unordered_set::allocator_type > class unordered_set;

unordered_set底层是用哈希桶实现,增删查平均效率是O(1),迭代器遍历不再有序,为了跟set
区分,所以取名unordered_set。

前面部分我们已经学习了set容器的使用,set和unordered_set的功能高度相似,只是底层结构不同,有一些性能和使用的差异,这里我们只讲他们的差异部分。

1.2  unordered_set和set的使用差异

通过查看文档,我们会发现:unordered_set容器支持增删查,且其使用跟set的使用一模一样。

pair<iterator,bool> insert ( const value_type& val ); size_type erase ( const key_type& k ); iterator find ( const key_type& k );

关于使用我们不再赘述——

unordered_set和set的第一个差异是对key的要求不同set要求Key支持小于比较,而unordered_set要求Key支持转成整形且支持等于比较,要理解unordered_set的这个两点要求得后续我们结合哈希表底层实现才能真正理解,也就是说这本质是哈希表的要求。

unordered_set和set的第二个差异是迭代器的差异set的iterator是双向迭代器unordered_set
是单向迭代器
,并且set底层是红黑树,红黑树是二叉搜索树,走中序遍历是有序的,所以set迭代器遍历是有序 + 去重;而unordered_set底层是哈希表,迭代器遍历是无序 + 去重。两者鲜明的的区别就是一个无序一个有序,其它的区别等我们介绍完底层再了解。

unordered_set和set的第三个差异是性能的差异,大多数场景下,unordered_set的增删查改更快一些因为红黑树增删查改效率是O(logN),而哈希表增删查平均效率是O(1)

注意:哈希表性能有波动——插入时大量扩容,会导致某几次的效率不高,不稳定,时间复杂度平均O(N);红黑树时间复杂度稳定O(logN)。

2  ~>  unordered_map

2.1  容器介绍

2.2  unordered_map和map的使用差异

查看文档我们会发现unordered_map的支持增删查改且跟map的使用一模一样,关于使用我们这
里就不再赘述和演示了。

unordered_map和map的第一个差异是对key的要求不同,map要求Key支持小于比较,而
unordered_map要求Key支持转成整型且支持等于比较,要理解unordered_map的这个两点要求
得后续我们结合哈希表底层实现才能真正理解,也就是说这本质是哈希表的要求。

unordered_map和map的第二个差异是迭代器的差异,map的iterator是双向迭代器,而unordered_map是单向迭代器,其次map底层是红黑树,红黑树是二叉搜索树,走中序遍历是有序的,所以map迭代器遍历是Key有序 + 去重。而unordered_map底层是哈希表,迭代器遍历是
Key无序 + 去重。

unordered_map和map的第三个差异是性能的差异,整体而言大多数场景下,unordered_map的
增删查改更快一些,因为红黑树增删查改效率是O(logN),而哈希表增删查平均效率是O(1)。

pair<iterator,bool> insert ( const value_type& val ); size_type erase ( const key_type& k ); iterator find ( const key_type& k ); mapped_type& operator[] ( const key_type& k );

2.3  unordered_multimap和unordered_multiset

unordered_multimap / unordered_multiset跟multimap / multiset功能完全类似,支持Key冗余。

unordered_multimap / unordered_multiset跟multimap / multiset的差异也是三个方面的差异,key的要求的差异、迭代器iterator及遍历顺序的差异、性能的差异。

2.4  拓展:unordered_xxx的哈希相关接口

Buckets和Hashpolicy系列的接口分别是跟哈希桶和负载因子相关的接口,我们现在不用特别关注这些,等了解完哈希的底层,这些系列的接口我们就能一目了然了。


3  ~>  C++17切换(配置环境)

结构化绑定是C++17之后的新特性,之前艾莉丝已经介绍过了,这里不再赘述——

【C++:map和set的使用】C++ map/multimap完全指南:从红黑树原理入门到高频算法实战

光改Debug版本还不够,我们切换到release版本运行会通不过——

release版本也要跟着改——

而且默认是C++14,每次使用结构化绑定的时候应该在进入VS时检查一下C++版本。


4  ~>  算法题实战

力扣链接:884. 两句话中的不常见单词

力扣题解链接:unordered_map解决【两句话中的不常见单词】问题

题目描述:

4.1  C++算法实现

class Solution { public: vector<string> uncommonFromSentences(string s1, string s2) { unordered_map<string,int> count; // 1、分割s1 string word; for(auto c : s1) { if(c == ' ') { if(!word.empty()) { count[word]++; word.clear(); } } else { word += c; } } if(!word.empty()) count[word]++; // 2、分割s2 word.clear(); for(auto c : s2) { if(c == ' ') { if(!word.empty()) { count[word]++; word.clear(); } } else { word += c; } } if(!word.empty()) count[word]++; // 收集结果 vector<string> ret; for(const auto& pair : count) { if(pair.second == 1) { ret.push_back(pair.first); } } return ret; } };

完整代码示例与实践演示

Test.cpp:

#define _CRT_SECURE_NO_WARNINGS 1 #include<iostream> using namespace std; #include<set> #include<vector> #include<unordered_set> #include<unordered_map> int Test_set1() { const size_t N = 1000000; unordered_set<int> us; set<int>s; vector<int> v; v.reserve(N); srand(time(0)); for (size_t i = 0; i < N; ++i) { v.push_back(rand()); // N比较大时重复值比较多 v.push_back(rand() + i); //sv.push_back(i); // 没有重复,有序 } size_t begin1 = clock(); for (auto e : v) { s.insert(e); } size_t end1 = clock(); cout << "set insert:" << end1 - begin1 << endl; size_t begin2 = clock(); us.reserve(N); for (auto e : v) { us.insert(e); } size_t end2 = clock(); cout << "unordered_set insert:" << end2 - begin2 << endl; int m1 = 0; size_t begin3 = clock(); for (auto e : v) { auto ret = s.find(e); if (ret != s.end()) { ++m1; } } size_t end3 = clock(); cout << "set find" << end3 - begin3 << "->" << m1 << endl; int m2 = 0; size_t begin4 = clock(); for (auto e : v) { auto ret = us.find(e); if (ret != us.end()) { ++m2; } } size_t end4 = clock(); cout << "unordered_set find:" << end4 - begin4 << "->" << m2 << endl; cout << "插入数据个数:" << s.size() << endl; cout << "插入数据个数:" << us.size() << endl << endl; size_t begin5 = clock(); for (auto e : v) { s.erase(e); } size_t end5 = clock(); cout << "set erase:" << end5 - begin5 << endl; size_t begin6 = clock(); for (auto e : v) { us.erase(e); } size_t end6 = clock(); cout << "unordered_set erase:" << end6 - begin6 << endl << endl; return 0; } int main() { //// 只去重,遍历无序 //unordered_set<int> s; //s.insert(4); //s.insert(1); //s.insert(2); //s.insert(4); //s.insert(5); //for (auto e : s) //{ // cout << e << " "; //} //cout << endl; string arr[] = { "苹果","西瓜","苹果","西瓜","苹果","苹果","西瓜","香蕉","苹果","香蕉" }; unordered_map<string, int> countMap; for (auto& e : arr) { countMap[e]++; } for (auto& [k, v] : countMap) { cout << k << ":" << v << endl; } cout << endl; Test_set1(); return 0; }

运行结果一

运行结果二


结尾

往期回顾:

【C++:封装红黑树】C++红黑树封装实战:从零实现MyMap与MySet

结语:都看到这里啦!那请大佬不要忘记给博主来个“一键四连”哦! 

🗡博主在这里放了一只小狗,大家看完了摸摸小狗放松一下吧!🗡

૮₍ ˶ ˊ ᴥ ˋ˶₎ა


Read more

优选算法——二分查找

👇作者其它专栏 《数据结构与算法》《算法》《C++起始之路》 二分查找相关题解 1.二分查找 算法思路: a.定义left,right指针,分别指向数组的左右区间。 b.找到待查找区间的中间点mid,找到后分三种情况讨论:         i.arr[mid]==target说明正好找到,返回mid的值;         ii.arr[mid]>target说明[mid,right]这段区间都是大于target的,因此舍去右边区间,在左边[left,mid-1]的区间继续查找,即让right=mid-1,然后重复b过程;         iii.arr[mid]<target说明[left,mid]这段区间的值都是小于target的,因此舍去左边区间,在右边区间[mid+1,right]

By Ne0inhk
深入理解 C++ 哈希:从概念到实战应用

深入理解 C++ 哈希:从概念到实战应用

🔥个人主页:Cx330🌸 ❄️个人专栏:《C语言》《LeetCode刷题集》《数据结构-初阶》《C++知识分享》 《优选算法指南-必刷经典100题》《Linux操作系统》:从入门到入魔 🌟心向往之行必能至 🎥Cx330🌸的简介: 目录 前言: 一、哈希的概念 1.1 直接定址法 1.2 哈希冲突 1.3 负载因子 1.4 将关键字转为整数 二、哈希函数 2.1 除法散列法 / 除留余数法 2.2 乘法散列法(了解) 2.3 全域散列法(了解)  2.4 其他方法(了解)  三、处理哈希冲突(

By Ne0inhk
【优选算法必刷100题】第031~32题(前缀和算法):连续数组、矩阵区域和

【优选算法必刷100题】第031~32题(前缀和算法):连续数组、矩阵区域和

🔥艾莉丝努力练剑:个人主页 ❄专栏传送门:《C语言》、《数据结构与算法》、C/C++干货分享&学习过程记录、Linux操作系统编程详解、笔试/面试常见算法:从基础到进阶 ⭐️为天地立心,为生民立命,为往圣继绝学,为万世开太平 🎬艾莉丝的简介: 🎬艾莉丝的算法专栏简介: 目录 031  连续数组 1.1  解法一:暴力解法 1.2  解法二:前缀和在哈希表中 1.3  算法实现 1.3.1  C++实现 1.3.2  Java实现 1.4  博主手记 032  矩阵区域和 2.1

By Ne0inhk
贪心算法篇——万千抉择中的唯一考量,最优解追寻的跬步累积(1)

贪心算法篇——万千抉择中的唯一考量,最优解追寻的跬步累积(1)

文章目录 * 引言:在选择的海洋中 * 贪心算法的哲学:局部最优,全球最优 * 贪心算法的经典应用 * 贪心算法的局限与挑战 * 结语:智者的选择,最优的未来 引言:在选择的海洋中 在人生的旅途上,每个人都要面临无数的选择。每一个选择,都是一次抉择;每一次抉择,都是命运的交汇点。数学与计算机科学的世界里,贪心算法正是对这种“选择”的一种深刻体现。在一系列的选择面前,贪心算法如同一位睿智的旅行者,始终秉持着最优的哲学:每一次决策都应基于局部最优,以期在最后抵达全局最优的境地。 贪心算法(Greedy Algorithm),正如其名所示,是一种每次都选择当前看起来最优解的算法。这种算法策略简单却充满智慧,常常能够解决很多看似复杂的问题。它通过一种局部的、贪婪的方式,一步步走向最终解。然而,正如智慧的旅行者需要对道路有所预见一样,贪心算法也有其适用的范围,只有在满足某些条件时,它才能发挥出最优解的魅力。 在这篇报告中,我们将深入探讨贪心算法的基本理念、适用范围、经典应用,并通过具体的代码示例,揭开这一算法的神秘面纱。 贪心算法的哲学:

By Ne0inhk