map和set的使用

2024-11-18 来源：个人技术集锦

map和set的使用

序列式容器和关联式容器

前⾯我们已经接触过STL中的部分容器如：string、vector、list、deque、array、forward_list等，这些容器统称为序列式容器，因为逻辑结构为线性序列的数据结构，两个位置存储的值之间⼀般没有紧密的关联关系，⽐如交换⼀下，他依旧是序列式容器。顺序容器中的元素是按他们在容器中的存储位置来顺序保存和访问的。

关联式容器也是⽤来存储数据的，与序列式容器不同的是，关联式容器逻辑结构通常是⾮线性结构，两个位置有紧密的关联关系，交换⼀下，他的存储结构就被破坏了。顺序容器中的元素是按关键字来保存和访问的。关联式容器有map/set系列和unordered_map/unordered_set系列。

本章节讲解的map和set底层是红⿊树，红⿊树是⼀颗平衡⼆叉搜索树。set是key搜索场景的结构， map是key/value搜索场景的结构

set系列的使⽤

set类的介绍

• set的声明如下，T就是set底层关键字的类型

• set默认要求T⽀持⼩于⽐较，如果不⽀持或者想按⾃⼰的需求⾛可以⾃⾏实现仿函数传给第⼆个模版参数

• set底层存储数据的内存是从空间配置器申请的，如果需要可以⾃⼰实现内存池，传给第三个参数。

• ⼀般情况下，我们都不需要传后两个模版参数。

• set底层是⽤红⿊树实现，增删查效率是的。 O(logN) ，迭代器遍历是⾛的搜索树的中序，所以是有序

• 前⾯部分我们已经学习了vector/list等容器的使⽤，STL容器接⼝设计，⾼度相似

示例代码如下：

template < class T,                        
class Compare = less<T>,        
// set::key_type/value_type
 class Alloc = allocator<T>      
> class set;
 // set::key_compare/value_compare
 // set::allocator_type

set的构造和迭代器

set的构造我们关注以下⼏个接⼝即可。

set的⽀持正向和反向迭代遍历，遍历默认按升序顺序，因为底层是⼆叉搜索树，迭代器遍历⾛的中序；⽀持迭代器就意味着⽀持范围for，set的iterator和const_iterator都不⽀持迭代器修改数据，修改关键字数据，破坏了底层搜索树的结构。

// empty (1) ⽆参默认构造
 
explicit set (const key_compare& comp = key_compare(),
 const allocator_type& alloc = allocator_type());
 // range (2) 迭代器区间构造
 
template <class InputIterator>
 set (InputIterator first, InputIterator last,
 const key_compare& comp = key_compare(),
 const allocator_type& = allocator_type());
 // copy (3) 拷⻉构造
 
set (const set& x);
 // initializer list (5) initializer 列表构造
 
set (initializer_list<value_type> il,
 const key_compare& comp = key_compare(),
 const allocator_type& alloc = allocator_type());
 // 迭代器是⼀个双向迭代器
 
// 正向迭代器
 
iterator   -> a bidirectional iterator to const value_type
 iterator begin();
 iterator end();
 // 反向迭代器
 
reverse_iterator rbegin();
 reverse_iterator rend();

set的增删查

set的增删查关注以下⼏个接⼝即可：

 Member types
 key_type   -> The first template parameter (T)
 value_type -> The first template parameter (T)
 // 单个数据插⼊，如果已经存在则插⼊失败
 
pair<iterator,bool> insert (const value_type& val);
 // 列表插⼊，已经在容器中存在的值不会插⼊
 
void insert (initializer_list<value_type> il);
 // 迭代器区间插⼊，已经在容器中存在的值不会插⼊
 
template <class InputIterator>
 void insert (InputIterator first, InputIterator last);
 // 查找val，返回val所在的迭代器，没有找到返回
end() 
iterator find (const value_type& val);
 // 查找val，返回Val的个数
 
size_type count (const value_type& val) const;
 // 删除⼀个迭代器位置的值
 
iterator  erase (const_iterator position);
 // 删除val，val不存在返回0，存在返回1 
size_type erase (const value_type& val);
// 删除⼀段迭代器区间的值
 
iterator  erase (const_iterator first, const_iterator last);
 // 返回⼤于等val位置的迭代器
 
iterator lower_bound (const value_type& val) const;
 // 返回⼤于val位置的迭代器
 
iterator upper_bound (const value_type& val) const;

insert和迭代器遍历使⽤样例：

 #include<iostream>
 #include<set>
 using namespace std;
 int main()
 {
 // 去重+升序排序
 
set<int> s;
 // 去重+降序排序（给⼀个⼤于的仿函数）
 
//set<int, greater<int>> s;
 s.insert(5);
 s.insert(2);
 s.insert(7);
 s.insert(5);
 //set<int>::iterator it = s.begin();
 auto it = s.begin();
 while (it != s.end())
 {
 // error C3892: “it”: 不能给常量赋值
 
            // *it = 1;
            cout << *it << " ";
            ++it;
    }
    cout << endl;
    // 插⼊⼀段initializer_list列表值，已经存在的值插⼊失败
 
    s.insert({ 2,8,3,9 });
    for (auto e : s)
    {
            cout << e << " ";
    }
    cout << endl;
    set<string> strset = { "sort", "insert", "add" };
    // 遍历string⽐较ascll码⼤⼩顺序遍历的
 
    for (auto& e : strset)
    {
            cout << e << " ";
    }
    cout << endl;
 }

find和erase使⽤样例：

#include<iostream>
 #include<set>
 using namespace std;
 int main()
 {
    set<int> s = { 4,2,7,2,8,5,9 };
    for (auto e : s)
    {
            cout << e << " ";
    }
    cout << endl;
    // 删除最⼩值
 
    s.erase(s.begin());
    for (auto e : s)
    {
            cout << e << " ";
    }
 cout << endl;
    // 直接删除x 
    int x;
    cin >> x;
    int num = s.erase(x);
    if (num == 0)
    {
            cout << x << "不存在！" << endl;
    }
    for (auto e : s)
    {
            cout << e << " ";
    }
    cout << endl;
    // 直接查找在利⽤迭代器删除x 
    cin >> x;
    auto pos = s.find(x);
    if (pos != s.end())
    {
            s.erase(pos);
    }
    else
    {
            cout << x << "不存在！" << endl;
    }
    for (auto e : s)
    {
            cout << e << " ";
    }
    cout << endl;
    // 算法库的查找 O(N) 
    auto pos1 = find(s.begin(), s.end(), x); 
    // set⾃⾝实现的查找O(logN) 
    auto pos2 = s.find(x);                  
    // 利⽤count间接实现快速查找
 
    cin >> x;
    if (s.count(x))                          
    {
            cout << x << "在！" << endl;
    }
    else
 {
 }
 cout << x << "不存在！" << endl;
 return 0;
 }

 #include<iostream>
 #include<set>
 using namespace std;
 int main()
 {
 std::set<int> myset;
 for (int i = 1; i < 10; i++)
 myset.insert(i * 10); // 10 20 30 40 50 60 70 80 90
 for (auto e : myset)
 {
 cout << e << " ";
 }
 cout << endl;
 // 实现查找到的[itlow,itup)包含[30, 60]区间
 
// 返回>= 30 
auto itlow = myset.lower_bound(30);
 // 返回 > 60 
auto itup = myset.upper_bound(60);
 // 删除这段区间的值
 
myset.erase(itlow, itup);
 for (auto e : myset)
 {
 cout << e << " ";
 }
 cout << endl;
 return 0;
 }

multiset和set的差异

multiset和set的使⽤基本完全类似，主要区别点在于multiset⽀持值冗余，那么 insert/find/count/erase都围绕着⽀持值冗余有所差异，具体参看下⾯的样例代码理解。

#include<iostream>
 #include<set>
 using namespace std;
 int main()
 {
 // 相⽐set不同的是，multiset是排序，但是不去重
 
multiset<int> s = { 4,2,7,2,4,8,4,5,4,9 };
 auto it = s.begin();
 while (it != s.end())
 {
 cout << *it << " ";
 ++it;
 }
 cout << endl;
 // 相⽐set不同的是，x可能会存在多个，find查找中序的第⼀个
 
int x;
 cin >> x;
 auto pos = s.find(x);
 while (pos != s.end() && *pos == x)
 {
 cout << *pos << " ";
 ++pos;
 }
 cout << endl;
 cout << s.count(x) << endl;
 // 相⽐set不同的是，count会返回x的实际个数
 
// 相⽐set不同的是，erase给值时会删除所有的x 
s.erase(x);
 for (auto e : s)
 {
 cout << e << " ";
 }
 cout << endl;
 return 0;
 }

一道OJ题：两个数组的交集

给定两个数组 nums1 和 nums2 ，返回 它们的

交集

。输出结果中的每个元素一定是唯一的。我们可以 不考虑输出结果的顺序 。

示例 1：

输入：nums1 = [1,2,2,1], nums2 = [2,2]
输出：[2]

示例 2：

输入：nums1 = [4,9,5], nums2 = [9,4,9,8,4]
输出：[9,4]
解释：[4,9] 也是可通过的

提示：

1 <= nums1.length, nums2.length <= 1000
0 <= nums1[i], nums2[i] <= 1000

代码如下：

class Solution {
public:
    vector<int> intersection(vector<int>& nums1, vector<int>& nums2) {
        //排序+去重
        set<int>s1(nums1.begin(),nums1.end());
        set<int>s2(nums2.begin(),nums2.end());
        //因为set排序是有序的
        //小的++，相等就是交集
        vector<int>ret;
        auto it1=s1.begin();
        auto it2=s2.begin();
        while(it1!=s1.end()&&it2!=s2.end())
        {
            if(*it1<*it2)
            {
                *it1++;
            }
            else if(*it1>*it2)
            {
                *it2++;
            }
            else
            {
                ret.push_back(*it1);
                *it1++;
                *it2++;
            }
        }
        return ret;
    }
};

从上一道题进行引申出来这个云端的概念

一道OJ题：环形链表2

给定一个链表的头节点 head ，返回链表开始入环的第一个节点。 如果链表无环，则返回 null。

如果链表中有某个节点，可以通过连续跟踪 next 指针再次到达，则链表中存在环。为了表示给定链表中的环，评测系统内部使用整数 pos 来表示链表尾连接到链表中的位置（索引从 0 开始）。如果 pos 是 -1，则在该链表中没有环。注意：pos 不作为参数进行传递，仅仅是为了标识链表的实际情况。

不允许修改 链表。

示例 1：

示例 2：

输入：head = [1,2], pos = 0
输出：返回索引为 0 的链表节点
解释：链表中有一个环，其尾部连接到第一个节点。

示例 3：

输入：head = [1], pos = -1
输出：返回 null
解释：链表中没有环。

提示：

链表中节点的数目范围在范围 [0, 104] 内
-105 <= Node.val <= 105
pos 的值为 -1 或者链表中的一个有效索引

数据结构初阶阶段，我们通过证明⼀个指针从头开始⾛⼀个指针从相遇点开始⾛，会在⼊⼝点相遇，理解证明都会很⿇烦。这⾥我们使⽤set查找记录解决⾮常简单⽅便，这⾥体现了set在解决⼀些问题时的价值，完全是降维打击。

代码如下：

/**
 * Definition for singly-linked list.
 * struct ListNode {
 *     int val;
 *     ListNode *next;
 *     ListNode(int x) : val(x), next(NULL) {}
 * };
 */
class Solution {
public:
    ListNode *detectCycle(ListNode *head) {
        set<ListNode*> s;
        ListNode*cur=head;
        while(cur)
        {
            if(s.count(cur))
                return cur;
                else
                    s.insert(cur);
                    cur=cur->next;
        }
        return nullptr;
    }
};

map系列的使⽤

map类的介绍

map的声明如下，Key就是map底层关键字的类型，T是map底层value的类型，set默认要求Key⽀持⼩于⽐较，如果不⽀持或者需要的话可以⾃⾏实现仿函数传给第⼆个模版参数，map底层存储数据的内存是从空间配置器申请的。⼀般情况下，我们都不需要传后两个模版参数。map底层是⽤红⿊树实现，增删查改效率是 O(logN) ，迭代器遍历是⾛的中序，所以是按key有序顺序遍历的。

template < class Key,                                     
class T,                                       
class Compare = less<Key>,                     
class Alloc = allocator<pair<const Key,T> >    
5
 map::allocator_type
 > class map;

pair类型介绍

map底层的红⿊树节点中的数据，使⽤pair存储键值对数据。

typedef pair<const Key, T> value_type;
 template <class T1, class T2>
 struct pair 
{
 typedef T1 first_type;
 typedef T2 second_type;
 T1 first;
 T2 second;
 pair(): first(T1()), second(T2())
 {}
 pair(const T1& a, const T2& b): first(a), second(b)
 {}
 template<class U, class V> 
pair (const pair<U,V>& pr): first(pr.first), second(pr.second)
 {}
 };
 template <class T1,class T2>
 inline pair<T1,T2> make_pair (T1 x, T2 y)
 {
 return ( pair<T1,T2>(x,y) );
 }

map的构造

map的构造我们关注以下⼏个接⼝即可。

map的⽀持正向和反向迭代遍历，遍历默认按key的升序顺序，因为底层是⼆叉搜索树，迭代器遍历⾛的中序；⽀持迭代器就意味着⽀持范围for，map⽀持修改value数据，不⽀持修改key数据，修改关键字数据，破坏了底层搜索树的结构。

 // empty (1) ⽆参默认构造
 
explicit map (const key_compare& comp = key_compare(),
 const allocator_type& alloc = allocator_type());
 // range (2) 迭代器区间构造
 
template <class InputIterator>
 map (InputIterator first, InputIterator last,
 const key_compare& comp = key_compare(),
 const allocator_type& = allocator_type());
 // copy (3) 拷⻉构造
 
map (const map& x);
 // initializer list (5) initializer 列表构造
 
map (initializer_list<value_type> il,
 const key_compare& comp = key_compare(),
 const allocator_type& alloc = allocator_type());
 // 迭代器是⼀个双向迭代器
 
iterator   -> a bidirectional iterator to const value_type
 // 正向迭代器
 
iterator begin();
 iterator end();
 // 反向迭代器
 
reverse_iterator rbegin();
 reverse_iterator rend();

map的增删查

map的增删查关注以下⼏个接⼝即可：

map增接⼝，插⼊的pair键值对数据，跟set所有不同，但是查和删的接⼝只⽤关键字key跟set是完全类似的，不过find返回iterator，不仅仅可以确认key在不在，还找到key映射的value，同时通过迭代还可以修改value

 Member types
 key_type     -> The first template parameter (Key)
 mapped_type  -> The second template parameter (T)
 value_type   -> pair<const key_type,mapped_type>
 //单个数据插⼊，如果已经key存在则插⼊失败,key存在相等value不相等也会插⼊失败
 
pair<iterator,bool> insert (const value_type& val);
 // 列表插⼊，已经在容器中存在的值不会插⼊
 
void insert (initializer_list<value_type> il);
 // 迭代器区间插⼊，已经在容器中存在的值不会插⼊
 
template <class InputIterator>
 void insert (InputIterator first, InputIterator last);
 // 查找k，返回k所在的迭代器，没有找到返回end() 
iterator find (const key_type& k);
 // 查找k，返回k的个数
 
size_type count (const key_type& k) const;
 // 删除⼀个迭代器位置的值
 
iterator  erase (const_iterator position);
 // 删除k，k存在返回0，存在返回1 
size_type erase (const key_type& k);
 // 删除⼀段迭代器区间的值
 
iterator  erase (const_iterator first, const_iterator last);
 // 返回⼤于等k位置的迭代器
 
iterator lower_bound (const key_type& k);
 // 返回⼤于k位置的迭代器
 
const_iterator lower_bound (const key_type& k) const;

map的数据修改

前⾯我提到map⽀持修改mapped_type数据，不⽀持修改key数据，修改关键字数据，破坏了底层搜索树的结构。

map第⼀个⽀持修改的⽅式时通过迭代器，迭代器遍历时或者find返回key所在的iterator修改，map 还有⼀个⾮常重要的修改接⼝operator[]，但是operator[]不仅仅⽀持修改，还⽀持插⼊数据和查找数据，所以他是⼀个多功能复合接⼝

需要注意从内部实现⻆度，map这⾥把我们传统说的value值，给的是T类型，typedef为 mapped_type。⽽value_type是红⿊树结点中存储的pair键值对值。⽇常使⽤我们还是习惯将这⾥的 T映射值叫做value。

 Member types
 key_type     -> The first template parameter (Key)
 mapped_type  -> The second template parameter (T)
 value_type   -> pair<const key_type,mapped_type>
 // 查找k，返回k所在的迭代器，没有找到返回end()，如果找到了通过iterator可以修改key对应的mapped_type值
 
iterator find (const key_type& k);
 // ⽂档中对insert返回值的说明
 
// The single element versions (1) return a pair, with its member pair::first 
set to an iterator pointing to either the newly inserted element or to the 
element with an equivalent key in the map. The pair::second element in the pair
 is set to true if a new element was inserted or false if an equivalent key 
already existed.
 // insert插⼊⼀个pair<key, T>对象
 
// 1、如果key已经在map中，插⼊失败，则返回⼀个pair<iterator,bool>对象，返回pair对象first是key所在结点的迭代器，second是false 
// 2、如果key不在在map中，插⼊成功，则返回⼀个pair<iterator,bool>对象，返回pair对象first是新插⼊key所在结点的迭代器，second是true 
// 也就是说⽆论插⼊成功还是失败，返回pair<iterator,bool>对象的first都会指向key所在的迭代器
 
// 那么也就意味着insert插⼊失败时充当了查找的功能，正是因为这⼀点，insert可以⽤来实现operator[]
 // 需要注意的是这⾥有两个pair，不要混淆了，⼀个是map底层红⿊树节点中存的pair<key, T>，另⼀个是insert返回值pair<iterator,bool> 
pair<iterator,bool> insert (const value_type& val);
 mapped_type& operator[] (const key_type& k);
 // operator的内部实现
 
mapped_type& operator[] (const key_type& k)
 {
    // 1、如果k不在map中，insert会插⼊k和mapped_type默认值，同时[]返回结点中存储mapped_type值的引⽤，那么我们可以通过引⽤修改返映射值。所以[]具备了插⼊+修改功能
 
    // 2、如果k在map中，insert会插⼊失败，但是insert返回pair对象的first是指向key结点的迭代器，返回值同时[]返回结点中存储mapped_type值的引⽤，所以[]具备了查找+修改的功能
 
    pair<iterator, bool> ret = insert({ k, mapped_type() });
    iterator it = ret.first;
    return it->second;
 }

构造遍历及增删查使⽤样例

#include<iostream>
 #include<map>
 using namespace std;
 int main()
 {
        // initializer_list构造及迭代遍历
 
        map<string, string> dict = { {"left", "左边"}, {"right", "右边"}, {"insert", "插⼊"},{ "string", "字符串" } };
        
        //map<string, string>::iterator it = dict.begin();
        auto it = dict.begin();
        while (it != dict.end())
        {
                //cout << (*it).first <<":"<<(*it).second << endl;
                
                // map的迭代基本都使⽤operator->,这⾥省略了⼀个-> 
                // 第⼀个->是迭代器运算符重载，返回pair*，第⼆个箭头是结构指针解引⽤取pair数据
 
                //cout << it.operator->()->first << ":" << it.operator->()>second << endl;
                cout << it->first << ":" << it->second << endl;
                ++it;
        }
        cout << endl;
 // insert插⼊pair对象的4种⽅式，对⽐之下，最后⼀种最⽅便
 
        pair<string, string> kv1("first", "第⼀个");
        dict.insert(kv1);
        dict.insert(pair<string, string>("second", "第⼆个"));
        dict.insert(make_pair("sort", "排序"));
        dict.insert({ "auto", "⾃动的" });
        // "left"已经存在，插⼊失败
 
        dict.insert({ "left", "左边，剩余" });
        
        // 范围for遍历
 
        for (const auto& e : dict)
        {
                cout << e.first << ":" << e.second << endl;
        }
        cout << endl;
        
        string str;
        while (cin >> str)
        {
                auto ret = dict.find(str);
                if (ret != dict.end())
                {
                        cout << "->" << ret->second << endl;
                }
                else
                {
                        cout << "⽆此单词，请重新输⼊" << endl;
                }
        }
        
        // erase等接⼝跟set完全类似，这⾥就不演⽰讲解了
 
        return 0;
 }

map的迭代器和[]功能样例：

#include<iostream>
 #include<map>
 #include<string>
 using namespace std;
 int main()
 {
 map<string, string> dict;
 dict.insert(make_pair("sort", "排序"));
 // key不存在->插⼊
 {"insert", string()} 
dict["insert"];
 // 插⼊+修改
 
dict["left"] = "左边"; 
     // 修改
 
dict["left"] = "左边、剩余";
 // key存在->查找
 
cout << dict["left"] << endl;
 return 0;
 }

#include<iostream>
 #include<map>
 #include<string>
 using namespace std;
 int main()
 {
// 利⽤find和iterator修改功能，统计⽔果出现的次数
 
        string arr[] = { "苹果", "西⽠", "苹果", "西⽠", "苹果", "苹果", "西⽠", "苹果", "⾹蕉", "苹果", "⾹蕉" };
        map<string, int> countMap;
        for (const auto& str : arr)
        {
                // 先查找⽔果在不在map中
 
                // 1、不在，说明⽔果第⼀次出现，则插⼊ {⽔果, 1} 
                // 2、在，则查找到的节点中⽔果对应的次数++ 
                auto ret = countMap.find(str);
                if (ret == countMap.end())
                {
                        countMap.insert({ str, 1 });
                }
                else
                {
                        ret->second++;
                }
        }
        for (const auto& e : countMap)
        {
                cout << e.first << ":" << e.second << endl;
        }
        cout << endl;
        return 0;
 }
 #include<iostream>
 #include<map>
 #include<string>
 using namespace std;
 int main()
 {
        // 利⽤[]插⼊+修改功能，巧妙实现统计⽔果出现的次数
 
        string arr[] = { "苹果", "西⽠", "苹果", "西⽠", "苹果", "苹果", "西⽠", "苹果", "⾹蕉", "苹果", "⾹蕉" };
        map<string, int> countMap;
        for (const auto& str : arr)
        {
                // []先查找⽔果在不在map中
 
                // 1、不在，说明⽔果第⼀次出现，则插⼊{⽔果, 0}，同时返回次数的引⽤，++⼀下就变成1次了
 
                // 2、在，则返回⽔果对应的次数++ 
                countMap[str]++;
 }
 for (const auto& e : countMap)
 {
 cout << e.first << ":" << e.second << endl;
 }
 cout << endl;
 return 0;
 }

显示全文

全部栏目

map和set的使用