C++ 高阶数据结构：二叉搜索树（BST）

1 二叉搜索树的概念

二叉搜索树，英文名称叫做 Binary Search Tree，简称为 BST。其是二叉树的一种，其要么是一棵空树，要么是一棵具有下列性质的二叉树：

1）若根节点的左子树不为空，那么左子树所有节点的值都小于或者等于根节点的值

2）若根节点的右子树不为空，那么右子树所有节点的值都大于或者等于根节点的值

3）根节点的左右子树又是一棵二叉搜索树

比如下面的两棵树就是二叉搜索树：

文章配图

而下面这棵树就不是一棵二叉搜索树：

文章配图

而且根据二叉搜索树的性质，左子树节点的值 <= 根节点的值 <= 右子树节点的值，所以如果对一棵 BST 进行中序遍历，那么遍历后的序列就是一个升序排列的序列。

2 二叉搜索树的性能

为什么会存在二叉搜索树这么一个数据结构呢？最主要的原因就是因为这个数据结构能够加快搜索的速度。因为根据二叉搜索树的性质，左子树节点的值 <= 根节点的值，右子树节点的值 >= 根节点的值，所以当我们查找一个值 x 时，只需要判断该值与根节点的关系，如果 root > x，那么就往左子树走；如果 root < x，那就往右子树走，查找次数就是二叉搜索树的高度。

一棵二叉搜索树具备以下性能：

1）在插入节点的最优情况下，二叉搜索树是一棵完全二叉树或者近似是一棵完全二叉树，其高度为 logN

2）在插入节点的最坏情况下，比如插入值的先后顺序为 [9, 8, 7, 6, 5, 4, 3, 2, 1]，该搜索二叉树就会退化为一棵单叉树，树的高度就是 N（如下面的图所示）

3）综合而言，二叉搜索树的增删查改的时间复杂度平均为 O(logN)，最坏情况为 O(N)

文章配图

所以对于一棵普通的二叉搜索树来说，其查找的效率并不能满足我们的要求，后续将介绍两种特殊的二叉搜索树，分别是平衡二叉树（AVLTree）与红黑树（RBTree），这两种树效率都是 O(logN) 级别，会比 BST 效率更高。

值得一提的是，二分查找算法的时间复杂度也是 O(logN)，但是二分查找算法的限制条件限制了其应用场景：

值需要存储在支持随机访问的数据结构中，一般为数组或者顺序表
插入和删除效率很低，因为需要大量移动元素

相比之下，AVLTree 与 RBTree 就自由很多，没有太多限制，所以 AVLTree 与 RBTree 是比二分查找算法更适合查找场景的两种数据结构。

3 二叉搜索树的增删查改（不同值的 BST）

基于之前的二叉树，二叉搜索树采取的依然是链式结构。所以在讲解二叉搜索树的增删查改之前，我们需要先创建其结构。

1）二叉搜索树的结构

（1）二叉搜索树的节点

对于二叉搜索树来说，我们并不需要知道每一个节点的父亲是谁，所以我们这里依然采用之前二叉树中的节点，也就是一个数据，两个指针，一个指向左孩子，一个指向右孩子，这里我们需要设计成模板的形式，以实现泛型编程：

bool Erase(const K& key) { //如果树为空，那就直接返回 false if (_root == nullptr) return false; Node* cur = _root; Node* parent = nullptr; //开始查找 key while (cur) { if (cur->_key > key) { //去左子树 parent = cur; cur = cur->_left; } else if (cur->_key < key) { //去右子树 parent = cur; cur = cur->_right; } else { if (cur->_left == nullptr) { //左子树为空 //直接让父亲的对应指针指向右孩子 if (parent->_key > key) parent->_left = cur->_right; else parent->_right = cur->_right; //删除 cur 节点 delete cur; cur = nullptr; } else if (cur->_right == nullptr) { //右子树为空 //直接让父亲的对应指针指向左孩子 if (parent->_key > key) parent->_left = cur->_left; else parent->_right = cur->_left; //删除 cur 节点 delete cur; cur = nullptr; } else { //左右子树都不为空 //先寻找左子树最大节点 //一定要走 maxleft 的父亲节点，因为 maxleft 可能有左孩子 Node* maxleftp = cur; Node* maxleft = cur->_left; while (maxleft->_right) { maxleftp = maxleft; maxleft = maxleft->_right; } //替换 cur 节点 cur->_key = maxleft->_key; //删除 maxleft 节点 //这里需要进行判断，因为 maxleft 也可能是 maxleftp 左子树的第一个节点 if (maxleftp->_right == maxleft) maxleftp->_right = maxleft->_left; else maxleftp->_left = maxleft->_left; delete maxleft; maxleft = nullptr; } return true; } } //没找到 key, 直接返回 false return false; }

//BSTree.hpp #pragma once #include <iostream> using namespace std; //BST 节点 template<class K> struct BSTNode { K _key; BSTNode<K>* _left; BSTNode<K>* _right; BSTNode(const K& key = K()) :_key(key) , _left(nullptr) , _right(nullptr) {} }; //BSTree template<class K> class BSTree { typedef BSTNode<K> Node; public: //使用编译器默认生成的构造函数 BSTree() = default; //拷贝构造函数 BSTree(const BSTree<K>& t) { _root = Copy(t._root); } //赋值重载函数 BSTree<K>& operator=(BSTree<K> t) { if (this != &t) { swap(_root, t._root); return *this; } } //析构函数 ~BSTree() { Destroy(_root); _root = nullptr; } //增删查改方法 bool Insert(const K& key) { //如果根节点为空，当前值直接作为根节点 if (_root == nullptr) { _root = new Node(key); return true; } Node* cur = _root, * parent = nullptr; //寻找插入位置 while (cur) { if (cur->_key > key) { // key 比根节点值小，插入到左子树 parent = cur; cur = cur->_left; } else if (cur->_key < key) { //key 比根节点大，插入到右子树 parent = cur; cur = cur->_right; } else return false; } //找到了该插入的位置 Node* newnode = new Node(key); if (parent->_key > key) parent->_left = newnode; else parent->_right = newnode; return true; } bool Find(const K& key) { //树为空树，直接返回 false if (_root == nullptr) return false; Node* cur = _root; while (cur) { if (cur->_key > key) //根节点的值大于 key，去左子树 cur = cur->_left; else if (cur->_key < key) //根节点的值小于 key，去右子树 cur = cur->_right; else //根节点的值与 key 相等，找到了 return true; } //cur 为空还没有找到，直接返回 false return false; } bool Erase(const K& key) { //如果树为空，那就直接返回 false if (_root == nullptr) return false; Node* cur = _root; Node* parent = nullptr; //开始查找 key while (cur) { if (cur->_key > key) { //去左子树 parent = cur; cur = cur->_left; } else if (cur->_key < key) { //去右子树 parent = cur; cur = cur->_right; } else { if (cur->_left == nullptr) { //左子树为空 //直接让父亲的对应指针指向右孩子 if (parent->_key > key) parent->_left = cur->_right; else parent->_right = cur->_right; //删除 cur 节点 delete cur; cur = nullptr; } else if (cur->_right == nullptr) { //右子树为空 //直接让父亲的对应指针指向左孩子 if (parent->_key > key) parent->_left = cur->_left; else parent->_right = cur->_left; //删除 cur 节点 delete cur; cur = nullptr; } else { //左右子树都不为空 //先寻找左子树最大节点 //一定要走 maxleft 的父亲节点，因为 maxleft 可能有左孩子 Node* maxleftp = cur; Node* maxleft = cur->_left; while (maxleft->_right) { maxleftp = maxleft; maxleft = maxleft->_right; } //替换 cur 节点 cur->_key = maxleft->_key; //删除 maxleft 节点 if (maxleftp->_right == maxleft) maxleftp->_right = maxleft->_left; else maxleftp->_left = maxleft->_left; delete maxleft; maxleft = nullptr; } return true; } } //没找到 key, 直接返回 false return false; } //添加中序遍历方法 void InOrder() { _InOrder(_root); cout << endl; } private: void _InOrder(Node* root) { if (root == nullptr) return; _InOrder(root->_left); cout << root->_key << ' '; _InOrder(root->_right); } Node* Copy(Node* root) { if (root == nullptr) return nullptr; Node* newroot = new Node(root->_key); newroot->_left = Copy(root->_left); newroot->_right = Copy(root->_right); return newroot; } void Destroy(Node* root) { if (root == nullptr) return; Destroy(root->_left); Destroy(root->_right); delete root; } //只需要有一个根节点 //不要忘记设置缺省值，当然写个构造函数也是可以的 Node* _root = nullptr; }; //test.cpp //测试代码 #include "BSTree.hpp" int main() { BSTree<int> t; //8, 3, 1, 10, 12, 7, 11, 20 t.Insert(8); t.Insert(3); t.Insert(1); t.Insert(10); t.Insert(12); t.Insert(7); t.Insert(11); t.Insert(20); t.InOrder(); cout << t.Find(1) << endl; cout << t.Find(100) << endl; //删除节点 t.Erase(20); t.InOrder(); t.Erase(10); t.InOrder(); t.Erase(3); t.InOrder(); return 0; }

//BSTree.hpp #pragma once #include <iostream> using namespace std; //BST 节点 template<class K, class V> struct BSTNode { pair<K, V> _data; BSTNode<K, V>* _left; BSTNode<K, V>* _right; BSTNode(const pair<K,V>& data) :_data(data) , _left(nullptr) , _right(nullptr) {} }; //BSTree template<class K,class V> class BSTree { typedef BSTNode<K,V> Node; public: BSTree() = default; //拷贝构造函数 BSTree(const BSTree<K, V>& t) { _root = Copy(t._root); } //赋值重载函数 BSTree<K, V>& operator=(BSTree<K, V> t) { if (this != &t) { swap(_root, t._root); return *this; } } ~BSTree() { Destroy(_root); _root = nullptr; } //增删查改方法 bool Insert(const pair<K,V>& data) { //如果根节点为空，当前值直接作为根节点 if (_root == nullptr) { _root = new Node(data); return true; } Node* cur = _root, * parent = nullptr; //寻找插入位置 while (cur) { if (cur->_data.first > data.first) { // key 比根节点值小，插入到左子树 parent = cur; cur = cur->_left; } else if (cur->_data.first < data.first) { //key 比根节点大，插入到右子树 parent = cur; cur = cur->_right; } else return false; } //找到了该插入的位置 Node* newnode = new Node(data); if (parent->_data.first > data.first) parent->_left = newnode; else parent->_right = newnode; return true; } Node* Find(const K& key) { //树为空树，直接返回 false if (_root == nullptr) return nullptr; Node* cur = _root; while (cur) { if (cur->_data.first > key) //根节点的值大于 key，去左子树 cur = cur->_left; else if (cur->_data.first < key) //根节点的值小于 key，去右子树 cur = cur->_right; else //根节点的值与 key 相等，找到了 return cur; } //cur 为空还没有找到，直接返回 false return nullptr; } bool Erase(const K& key) { //如果树为空，那就直接返回 false if (_root == nullptr) return false; Node* cur = _root; Node* parent = nullptr; //开始查找 key while (cur) { if (cur->_data.first > key) { //去左子树 parent = cur; cur = cur->_left; } else if (cur->_data.first < key) { //去右子树 parent = cur; cur = cur->_right; } else { if (cur->_left == nullptr) { //左子树为空 //直接让父亲的对应指针指向右孩子 if (parent->_data.first > key) parent->_left = cur->_right; else parent->_right = cur->_right; //删除 cur 节点 delete cur; cur = nullptr; } else if (cur->_right == nullptr) { //右子树为空 //直接让父亲的对应指针指向左孩子 if (parent->_data.first > key) parent->_left = cur->_left; else parent->_right = cur->_left; //删除 cur 节点 delete cur; cur = nullptr; } else { //左右子树都不为空 //先寻找左子树最大节点 //一定要走 maxleft 的父亲节点，因为 maxleft 可能有左孩子 Node* maxleftp = cur; Node* maxleft = cur->_left; while (maxleft->_right) { maxleftp = maxleft; maxleft = maxleft->_right; } //替换 cur 节点 cur->_data = maxleft->_data; //删除 maxleft 节点 if (maxleftp->_right == maxleft) maxleftp->_right = maxleft->_left; else maxleftp->_left = maxleft->_left; delete maxleft; maxleft = nullptr; } return true; } } //没找到 key, 直接返回 false return false; } //添加中序遍历方法 void InOrder() { _InOrder(_root); } private: void _InOrder(Node* root) { if (root == nullptr) return; _InOrder(root->_left); cout << root->_data.first << ':' << root->_data.second << endl; _InOrder(root->_right); } Node* Copy(Node* root) { if (root == nullptr) return nullptr; Node* newroot = new Node(root->_data); newroot->_left = Copy(root->_left); newroot->_right = Copy(root->_right); return newroot; } void Destroy(Node* root) { if (root == nullptr) return; Destroy(root->_left); Destroy(root->_right); delete root; } //只需要有一个根节点 //不要忘记设置缺省值，当然写个构造函数也是可以的 Node* _root = nullptr; }; //test.cpp //测试代码 #include "BSTree.hpp" #include <string> int main() { BSTree<string, string> t; t.Insert({ "right", "右边" }); t.Insert({ "algorithm", "算法" }); t.Insert({ "left", "左边" }); t.Insert({ "string", "字符串" }); t.Insert({ "sort", "排序" }); t.InOrder(); return 0; }

C++ 高阶数据结构：二叉搜索树（BST）