数据结构：B-树 | 极客日志

C++算法

数据结构：B-树

综述由AI生成B-树是一种适合外查找的平衡多叉搜索树，通过降低树高减少磁盘 IO 次数，解决大数据量无法一次性放入内存的问题。文章详细讲解了 B-树的定义、节点结构、插入分裂算法及 C++ 实现，对比分析了 B+ 树和 B* 树的特性差异，并探讨了 B-树在 MySQL 数据库索引（MyISAM 与 InnoDB 引擎）中的实际应用原理。核心在于利用多路平衡特性优化外查找效率。

beaabea发布于 2026/2/9更新于 2026/5/2824 浏览

数据结构：B-树

一、常见的搜索结构

以上结构适合用于数据量相对不是很大，能够一次性存放在内存中，进行数据查找的场景。如果数据量很大，比如有 100G 数据，无法一次放进内存中，那就只能放在磁盘上了。如果放在磁盘上，有需要搜索某些数据，那么如何处理呢？我们可以考虑将存放关键字及其映射的数据的地址放到一个内存中的搜索树的节点中，那么要访问数据时，先取这个地址去磁盘访问数据。

使用平衡二叉树搜索树的缺陷：

平衡二叉树搜索树的高度是 logN，这个查找次数在内存中是很快的。但是当数据都在磁盘中时，访问磁盘速度很慢，在数据量很大时，logN 次的磁盘访问，是一个难以接受的结果。

使用哈希表的缺陷：

哈希表的效率很高是 O(1)，但是一些极端场景下某个位置冲突很多，导致访问次数剧增，也是难以接受的。

那如何加速对数据的访问呢？

提高 IO 的速度（SSD 相比传统机械硬盘快了不少，但是还是没有得到本质性的提升）
降低树的高度---多叉树平衡树

二、B-树概念

1970 年，R.Bayer 和 E.Mccreight 提出了一种适合外查找的树，它是一种平衡的多叉树，称为 B 树（后面有一个 B 的改进版本 B+ 树，有些地方的 B 树写的是 B-树，注意不要误读成'B 减树'）。一棵 m 阶 (m>2) 的 B 树，是一棵平衡的 M 路平衡搜索树，可以是空树或者满足以下性质：

根节点至少有两个孩子
每个分支节点都包含 k-1 个关键字和 k 个孩子，其中 ceil(m/2) ≤ k ≤ m（ceil 是向上取整函数）
每个叶子节点都包含 k-1 个关键字，其中 ceil(m/2) ≤ k ≤ m
所有的叶子节点都在同一层
每个节点中的关键字从小到大排列，节点当中 k-1 个元素正好是 k 个孩子包含的元素的值域划分
每个结点的结构为：（n，A0，K1，A1，K2，A2，… ，Kn，An），其中，Ki(1≤i≤n) 为关键字，且 Ki<Ki+1(1<=i<=n-1)。Ai(0≤i≤n) 为指向子树根结点的指针。且 Ai 所指子树所有结点中的关键字均小于 Ki+1，n 为结点中关键字的个数，满足 ceil(m/2)-1≤n≤m-1

三、B-树的插入分析及实现

1. 插入分析

为了简单起见，假设 M = 3，即三叉树，每个节点中存储两个数据，两个数据可以将区间分割成三个部分，因此节点应该有三个孩子。为了后续实现简单期间，节点的结构如下：

注意：孩子永远比数据多一个

用序列 {53, 139, 75, 49, 145, 36, 101} 构建 B 树的过程如下：

插入总结:

如果树为空，直接插入新节点中，该节点为树的根节点
树非空，找待插入元素在树中的插入位置（注意：找到的插入节点位置一定在叶子节点中）
检测是否找到插入位置（假设树中的 key 唯一，即该元素已经存在时则不插入）
按照插入排序的思想将该元素插入到找到的节点中
检测该节点是否满足 B-树的性质：即该节点中的元素个数是否等于 M，如果小于则满足
如果插入后节点不满足 B 树的性质，需要对该节点进行分裂：
1. 申请新节点
2. 找到该节点的中间位置
3. 将该节点中间位置右侧的元素以及其孩子搬移到新节点中
4. 将中间位置元素以及新节点往该节点的双亲节点中插入，即继续步骤 4
如果向上已经分裂到根节点的位置，插入结束

pair<Node*, int> Find(const K& key) {
    Node* parent = nullptr;
    Node* cur = _root;
    while (cur) {
         i = ;
         (i < cur->_n) {
             (key < cur->_keys[i]) {
                ;
            }   (key > cur->_keys[i]) {
                ++i;
            }  {
                 (cur, i);
            }
        }
        parent = cur;
        cur = cur->_subs[i];
    }
     (parent, );
}

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online
Markdown转HTML
将 Markdown（GFM）转为 HTML 片段，浏览器内 marked 解析；与 HTML转Markdown 互为补充。在线工具，Markdown转HTML在线工具，online
HTML转Markdown
将 HTML 片段转为 GitHub Flavored Markdown，支持标题、列表、链接、代码块与表格等；浏览器内处理，可链接预填。在线工具，HTML转Markdown在线工具，online

template<class K, size_t M>
struct BTreeNode {
    // 为了方便插入后分裂，多开一个空间
    K _keys[M];
    BTreeNode<K, M>* _subs[M + 1];
    BTreeNode<K, M>* _parent;
    size_t _n; // 记录实际存储多少个关键字

    BTreeNode() {
        for (size_t i = 0; i < M; ++i) {
            _keys[i] = K();
            _subs[i] = nullptr;
        }
        _subs[M] = nullptr;
        _parent = nullptr;
        _n = 0;
    }
};

void InsertKey(Node* node, const K& key, Node* child) {
    int end = node->_n - 1;
    while (end >= 0) {
        if (key < node->_keys[end]) {
            node->_keys[end + 1] = node->_keys[end];
            node->_subs[end + 2] = node->_subs[end + 1];
            --end;
        } else {
            break;
        }
    }
    node->_keys[end + 1] = key;
    node->_subs[end + 2] = child;
    if (child) {
        child->_parent = node;
    }
    node->_n++;
}

bool Insert(const K& key) {
    if (_root == nullptr) {
        _root = new Node;
        _root->_keys[0] = key;
        _root->_n++;
        return true;
    }
    pair<Node*, int> ret = Find(key);
    if (ret.second >= 0) {
        return false;
    }
    Node* parent = ret.first;
    K newkey = key;
    Node* child = nullptr;
    while (1) {
        InsertKey(parent, newkey, child);
        // 满了就分裂，没有满插入结束
        if (parent->_n < M) {
            return true;
        } else {
            size_t mid = M / 2;
            // 分裂一半 [mid + 1, M - 1] 给兄弟
            Node* brother = new Node;
            size_t j = 0;
            size_t i = mid + 1;
            for (; i <= M - 1; ++i) {
                brother->_keys[j] = parent->_keys[i];
                brother->_subs[j] = parent->_subs[i];
                if (parent->_subs[i]) {
                    parent->_subs[i]->_parent = brother;
                }
                ++j;
                parent->_keys[i] = K();
                parent->_subs[i] = nullptr;
            }
            brother->_subs[j] = parent->_subs[i];
            if (parent->_subs[i]) {
                parent->_subs[i]->_parent = brother;
            }
            parent->_subs[i] = nullptr;
            brother->_n = j;
            parent->_n -= (brother->_n + 1);
            K midkey = parent->_keys[mid];
            parent->_keys[mid] = K();
            if (parent->_parent == nullptr) {
                _root = new Node;
                _root->_keys[0] = midkey;
                _root->_subs[0] = parent;
                _root->_subs[1] = brother;
                _root->_n = 1;
                parent->_parent = _root;
                brother->_parent = _root;
                break;
            } else {
                newkey = midkey;
                child = brother;
                parent = parent->_parent;
            }
        }
    }
    return true;
}

// 左根 左根 ......右
void _InOrder(Node* root) {
    if (root == nullptr) return;
    size_t i = 0;
    for (; i < root->_n; ++i) {
        _InOrder(root->_subs[i]); // 左子树
        cout << root->_keys[i] << " "; // 根
    }
    _InOrder(root->_subs[i]); // 最后的右子树
}
void InOrder() {
    _InOrder(_root);
}

#pragma once
#include <iostream>
#include <utility>
using namespace std;

template<class K, size_t M>
struct BTreeNode {
    // 为了方便插入后分裂，多开一个空间
    K _keys[M];
    BTreeNode<K, M>* _subs[M + 1];
    BTreeNode<K, M>* _parent;
    size_t _n; // 记录实际存储多少个关键字

    BTreeNode() {
        for (size_t i = 0; i < M; ++i) {
            _keys[i] = K();
            _subs[i] = nullptr;
        }
        _subs[M] = nullptr;
        _parent = nullptr;
        _n = 0;
    }
};

template<class K, size_t M>
class BTree {
    typedef BTreeNode<K, M> Node;
public:
    pair<Node*, int> Find(const K& key) {
        Node* parent = nullptr;
        Node* cur = _root;
        while (cur) {
            size_t i = 0;
            while (i < cur->_n) {
                if (key < cur->_keys[i]) {
                    break;
                } else if (key > cur->_keys[i]) {
                    ++i;
                } else {
                    return make_pair(cur, i);
                }
            }
            parent = cur;
            cur = cur->_subs[i];
        }
        return make_pair(parent, -1);
    }

    void InsertKey(Node* node, const K& key, Node* child) {
        int end = node->_n - 1;
        while (end >= 0) {
            if (key < node->_keys[end]) {
                node->_keys[end + 1] = node->_keys[end];
                node->_subs[end + 2] = node->_subs[end + 1];
                --end;
            } else {
                break;
            }
        }
        node->_keys[end + 1] = key;
        node->_subs[end + 2] = child;
        if (child) {
            child->_parent = node;
        }
        node->_n++;
    }

    bool Insert(const K& key) {
        if (_root == nullptr) {
            _root = new Node;
            _root->_keys[0] = key;
            _root->_n++;
            return true;
        }
        pair<Node*, int> ret = Find(key);
        if (ret.second >= 0) {
            return false;
        }
        Node* parent = ret.first;
        K newkey = key;
        Node* child = nullptr;
        while (1) {
            InsertKey(parent, newkey, child);
            // 满了就分裂，没有满插入结束
            if (parent->_n < M) {
                return true;
            } else {
                size_t mid = M / 2;
                // 分裂一半 [mid + 1, M - 1] 给兄弟
                Node* brother = new Node;
                size_t j = 0;
                size_t i = mid + 1;
                for (; i <= M - 1; ++i) {
                    brother->_keys[j] = parent->_keys[i];
                    brother->_subs[j] = parent->_subs[i];
                    if (parent->_subs[i]) {
                        parent->_subs[i]->_parent = brother;
                    }
                    ++j;
                    parent->_keys[i] = K();
                    parent->_subs[i] = nullptr;
                }
                brother->_subs[j] = parent->_subs[i];
                if (parent->_subs[i]) {
                    parent->_subs[i]->_parent = brother;
                }
                parent->_subs[i] = nullptr;
                brother->_n = j;
                parent->_n -= (brother->_n + 1);
                K midkey = parent->_keys[mid];
                parent->_keys[mid] = K();
                if (parent->_parent == nullptr) {
                    _root = new Node;
                    _root->_keys[0] = midkey;
                    _root->_subs[0] = parent;
                    _root->_subs[1] = brother;
                    _root->_n = 1;
                    parent->_parent = _root;
                    brother->_parent = _root;
                    break;
                } else {
                    newkey = midkey;
                    child = brother;
                    parent = parent->_parent;
                }
            }
        }
        return true;
    }

    // 左根 左根 ......右
    void _InOrder(Node* root) {
        if (root == nullptr) return;
        size_t i = 0;
        for (; i < root->_n; ++i) {
            _InOrder(root->_subs[i]); // 左子树
            cout << root->_keys[i] << " "; // 根
        }
        _InOrder(root->_subs[i]); // 最后的右子树
    }

    void InOrder() {
        _InOrder(_root);
    }

private:
    Node* _root = nullptr;
};

void TestBTree() {
    int a[] = { 53, 139, 75, 49, 145, 36, 101 };
    BTree<int, 3> t;
    for (auto e : a) {
        t.Insert(e);
    }
    t.InOrder();
}

#include<iostream>
using namespace std;
#include"BTree.h"

int main() {
    TestBTree();
    return 0;
}

数据结构：B-树

数据结构：B-树

一、常见的搜索结构

二、B-树概念

三、B-树的插入分析及实现

1. 插入分析

更多推荐文章

相关免费在线工具

2. 插入实现

1. B-树的节点设计

2. 插入 key 的过程

3. B-树的插入实现

4. B-树的验证

5. B-树的性能分析

四、B+ 树和 B* 树

1. B+ 树

2. B* 树

3. 总结

五、B-树的应用

1. 索引

2. MySQL 索引简介

1. MyISAM

2. InnoDB

六、整体代码

1. BTree.h

2. test.cpp

更多推荐文章

相关免费在线工具

数据结构：B-树

数据结构：B-树

一、常见的搜索结构

二、B-树概念

三、B-树的插入分析及实现

1. 插入分析

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

2. 插入实现

1. B-树的节点设计

2. 插入 key 的过程

3. B-树的插入实现

4. B-树的验证

5. B-树的性能分析

四、B+ 树和 B* 树

1. B+ 树

2. B* 树

3. 总结

五、B-树的应用

1. 索引

2. MySQL 索引简介

1. MyISAM

2. InnoDB

六、整体代码

1. BTree.h

2. test.cpp

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具