C++ STL 手写 String 类实现及高频易错点复盘 | 极客日志

C++算法

C++ STL 手写 String 类实现及高频易错点复盘

详细讲解了如何从零开始手写 C++ 标准库中的 string 类。内容涵盖内存结构设计（_str, _size, _capacity）、构造函数与析构函数、常用功能接口（reserve, c_str, push_back, append, insert, erase, substr, find）的实现细节，以及运算符重载（=, <, +=, <<, >>）。重点复盘了浅拷贝导致的崩溃问题、扩容策略、自赋值处理等高频易错点，并提供了完整的头文件与实现代码示例。

墨染流年发布于 2026/3/30更新于 2026/7/2159 浏览

一、整体结构

class string {
public:
private:
    char* _str;
    int _size;
    int _capacity;
};

1. char _str* 这是一个指向字符数组的指针，用来存储字符串的实际字符数据。在 C++ 标准库的 std::string 中，它指向一块动态分配的内存，里面存放着以 \0 结尾的字符序列。模拟实现时，需要自己管理这块内存的分配、扩容和释放。

2. int _size 记录当前字符串中有效字符的个数（不包括末尾的 \0）。

3. int _capacity 记录当前已分配内存能容纳的最大字符数（不包括末尾的 \0）。它代表了在不需要重新分配内存的情况下，字符串最多能存储的字符数量。当 _size 即将超过 _capacity 时，就需要触发扩容（比如申请一块更大的内存，将旧数据拷贝过去，再释放旧内存）。通常扩容会按一定倍数（如 1.5 倍或 2 倍）进行，以减少频繁扩容带来的性能开销。

二、构造/析构函数

2.1 默认构造

1. 无参构造 编写构造函数的时候需要注意的是，*char _str**不能初始化为 nullptr。需要开辟一字节的空间并默认初始化为 \0 也就是空串，因为字符串默认以 \0 结尾。否则就会导致字符串无法以 \0 结尾，打印的时候字符串尾部就会出现乱码。

string() { _str = new char[1]{\0}; _size = _capacity = 0; }

为了方便后续管理，这里开辟的一字节用来存储 \0 的空间不计入总的空间大小。

2. 字符串构造 string 类型

string(const char* str) { int len = strlen(str); _str = new char[len + 1]; strcpy(_str, str); _size = _capacity = len; }

这里需要注意的是，传进来的 str 字符串默认是带有 \0 的。strlen 会计算字符串的长度并记录在 len 变量中（不包含 \0），strcpy 会将 str（包含 \0）拷贝在 _str 这个空间中所以在开辟空间大小的时候开辟 len+1 是为了存储 \0。

2.2 拷贝构造

( string& ch) { _str =  [ch._capacity + ]; (_str, ch._str); _size = ch._size; _capacity = ch._capacity; }

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online
Markdown转HTML
将 Markdown（GFM）转为 HTML 片段，浏览器内 marked 解析；与 HTML转Markdown 互为补充。在线工具，Markdown转HTML在线工具，online
HTML转Markdown
将 HTML 片段转为 GitHub Flavored Markdown，支持标题、列表、链接、代码块与表格等；浏览器内处理，可链接预填。在线工具，HTML转Markdown在线工具，online

~string() { delete[] _str; _str = NULL; _size = _capacity = 0; }

void reserve(int n) { if (n > _capacity) { char* temp = new char[n+1]; strcpy(temp,_str); delete[] _str; _str = temp; _capacity = n; } }

const char* c_str() const { return _str; }

void string::PushBack(const char ch) { if (_size == _capacity) { reserve(_capacity == 0 ? 4 : 2 * _capacity); } _str[_size++] = ch; _str[_size] = 0; }

void string::Append(const char* str) { int len = strlen(str); if (_size + len > _capacity) { reserve(_size + len > 2*_capacity ? _size + len : 2 * _capacity); } strcpy(_str+_size,str); _size += len; }

//在指定位置插入一个字符 
void string::Insert(int pos, const char ch) { assert(pos <= _size && pos>=0); if (_size == _capacity) { reserve(_capacity == 0 ? 4 : 2 * _capacity); } int cur = _size; while (cur >= pos) { _str[cur + 1] = _str[cur]; cur--; } _str[pos] = ch; _size++; }

//在指定位置插入字符串 
void string::Insert(int pos, const char* str) { assert(pos <= _size && pos >= 0); int len = strlen(str); if (_size+len > _capacity) { reserve(_size + len > 2*_capacity ? _size + len : 2 * _capacity); } int cur = _size; while (cur >= pos) { _str[cur + len] = _str[cur]; cur--; } //这里不能 strcpy 因为 strcpy 会将\0 也拷贝进去 strncpy(_str+pos,str,len); _size+=len; }

// pos：要删除的字符的下标（从 0 开始） 
string& erase(size_t pos = 0);

// pos：起始删除下标；len：要删除的字符个数 
string& erase(size_t pos, size_t len);

// 子形式 3.1：删除迭代器 it 指向的单个字符 iterator erase(iterator it); 
// 子形式 3.2：删除 [first, last) 区间内的所有字符（左闭右开，不包含 last 指向的字符） iterator erase(iterator first, iterator last);

void string::erase(size_t pos, size_t len) { assert(pos>=0&&pos<_size); if (len >= _size - pos) { _str[pos] = 0; _size -= (_size - pos); } else { while (pos + len <= _size) { _str[pos] = _str[pos + len]; pos++; } _size -= len; } }

string string::substr(size_t pos, size_t len) const { assert(pos>=0&&pos<_size); if (len > _size - pos) { len = _size - pos; } string temp; for (int i = pos; i < pos + len; i++) { temp += _str[i]; } return temp; }

size_t string::find(char ch, size_t pos ) { assert(pos<_size); for (int i = pos; i < _size; i++) { if (_str[i] == ch) { return i; } } return npos; }
size_t string::find(const char* str, size_t pos) { assert(pos < _size); char* ret=strstr(_str+pos,str); if (ret != nullptr) { return ret - _str; } return npos; }

string& operator=(const string& str) { if(*this==str) { return; } delete[] _str; reserve(str._capacity); strcpy(_str,str._str); _size = str._size; return *this; }

void Swap(string& str) { std::swap(_str,str._str); std::swap(_size, str._size); std::swap(_capacity, str._capacity); }
string& operator=(string str) { Swap(str); return *this; }

特性	传统写法	现代写法（拷贝并交换）
异常安全	❌ 存在风险	✅ 绝对安全
代码复杂度	较高，需手动管理内存	极低，依赖拷贝构造和交换
自赋值处理	需要额外判断 `if (this != &str)`	✅ 天然支持，无需额外判断
性能	正常	与拷贝构造性能一致，无额外开销

string s2=s1;//这里调用的是拷贝构造 
string s2; s2=s1; //这里调用的才是赋值运算符重载

bool operator<(const string& s1, const string& s2) { return strcmp(s1.c_str(), s2.c_str()) < 0; }
bool operator<=(const string& s1, const string& s2) { return s1 < s2 || s1 == s2; }
bool operator>(const string& s1, const string& s2) { return !(s1 <= s2); }
bool operator>=(const string& s1, const string& s2) { return !(s1 < s2); }
bool operator==(const string& s1, const string& s2) { return strcmp(s1.c_str(), s2.c_str()) == 0; }
bool operator!=(const string& s1, const string& s2) { return !(s1 == s2); }

void operator+=(const char* str) { Append(str); }
void operator+=(const char ch) { PushBack(ch); }

void clear() { _str[0] = 0; _size = 0; }

std::ostream& operator<<(std::ostream& out, const string& s) { for (auto ch : s) { out << ch; } return out; }
std::istream& operator>>(std::istream& in, string& s) { s.clear(); const int N = 256; char buff[N]; int i = 0; char ch; //in >> ch; ch = in.get(); while (ch != ' ' && ch != '\n') { buff[i++] = ch; if (i == N - 1) { buff[i] = '\0'; s += buff; i = 0; } //in >> ch; ch = in.get(); } if (i > 0) { buff[i] = '\0'; s += buff; } return in; }

#define _CRT_SECURE_NO_WARNINGS 
#pragma once 
#include<string.h> 
#include<assert.h> 
#include<iostream> 

class string {
public:
    typedef char* iterator;
    iterator begin() const { return _str; }
    iterator end() const { return _str+_size; }
    void clear() { _str[0] = 0; _size = 0; }
    void reserve(int n) { if (n > _capacity) { char* temp = new char[n+1]; strcpy(temp,_str); delete[] _str; _str = temp; _capacity = n; } }
    //构造 
    string() { _str = new char[1]{\0}; _size = _capacity = 0; }
    //拷贝构造 (C++ 语法明确禁止拷贝构造传值传参，否则会导致无限递归)
    //string(const string ch)
    //但是可以传引用传参
    //string(const string& ch)
    string(const char* str) { int len = strlen(str); _str = new char[len + 1]; strcpy(_str, str); _size =_capacity =len; }
    string(const string& ch) { //reserve(len);构造函数中不能用 reserve，因为该 string 还没完成初始化 strcpy 会访问到 //随机值或者空指针 _str = new char[ch._capacity + 1]; strcpy(_str, ch._str); _size = ch._size; _capacity = ch._capacity; }
    const char* c_str() const { return _str; }
    //赋值运算符重载 /*string& operator=(const string& str) { if (*this == str) { return; } delete[] _str; reserve(str._capacity); strcpy(_str,str._str); _size = str._size; return *this; }*/
    void Swap(string& str) { std::swap(_str,str._str); std::swap(_size, str._size); std::swap(_capacity, str._capacity); }
    string& operator=(string str) { Swap(str); return *this; }
    //尾插一个字符 
    void PushBack(const char ch);
    //追加一个字符串 
    void Append(const char* str);
    //指定位置插入一个字符 
    void Insert(int pos, const char ch);
    //指定位置插入一个字符串 
    void Insert(int pos, const char* str);
    //删除指定位置之后的 len 个字符 (包括 pos) 
    void erase(size_t pos, size_t len);
    //将指定位置之后长度为 len 的子串返回 (包括 pos) 
    string substr(size_t pos, size_t len) const;
    //从 pos 位置开始寻找字符 ch 或者字符串 str 第一次出现的位置并返回下标 
    size_t find(char ch, size_t pos = 0);
    size_t find(const char* str, size_t pos = 0);
    void operator+=(const char* str) { Append(str); }
    void operator+=(const char ch) { PushBack(ch); }
    char operator[](int pos) { assert(pos >= 0&&pos<_size); return _str[pos]; }
    int size() { return _size; }
    int capacity() { return _capacity; }
    ~string() { delete[] _str; _str = NULL; _size = _capacity = 0; }
private:
    char* _str;
    int _size;
    int _capacity;
    static const size_t npos;
};

bool operator<(const string& s1, const string& s2);
bool operator<=(const string& s1, const string& s2);
bool operator>(const string& s1, const string& s2);
bool operator>=(const string& s1, const string& s2);
bool operator==(const string& s1, const string& s2);
bool operator!=(const string& s1, const string& s2);
std::ostream& operator<<(std::ostream& out, const string& s);
std::istream& operator>>(std::istream& in, string& s);

#include"string.h"
//npos 为无符号整形赋值为 -1 会赋值成为整形最大值 
const size_t string::npos = -1;

void string::PushBack(const char ch) { if (_size == _capacity) { reserve(_capacity == 0 ? 4 : 2 * _capacity); } _str[_size++] = ch; _str[_size] = 0; }

void string::Append(const char* str) { int len = strlen(str); if (_size + len > _capacity) { reserve(_size + len > 2*_capacity ? _size + len : 2 * _capacity); } strcpy(_str+_size,str); _size += len; }

void string::Insert(int pos, const char ch) { assert(pos <= _size && pos>=0); if (_size == _capacity) { reserve(_capacity == 0 ? 4 : 2 * _capacity); } int cur = _size; while (cur >= pos) { _str[cur + 1] = _str[cur]; cur--; } _str[pos] = ch; _size++; }

void string::Insert(int pos, const char* str) { assert(pos <= _size && pos >= 0); int len = strlen(str); if (_size+len > _capacity) { reserve(_size + len > 2*_capacity ? _size + len : 2 * _capacity); } int cur = _size; while (cur >= pos) { _str[cur + len] = _str[cur]; cur--; } //这里不能 strcpy 因为 strcpy 会将\0 也拷贝进去 strncpy(_str+pos,str,len); _size+=len; }

void string::erase(size_t pos, size_t len) { assert(pos>=0&&pos<_size); if (len >= _size - pos) { _str[pos] = 0; _size -= (_size - pos); } else { while (pos + len <= _size) { _str[pos] = _str[pos + len]; pos++; } _size -= len; } }

//值返回调用拷贝构造，默认浅拷贝，需要实现深拷贝 
string string::substr(size_t pos, size_t len) const { assert(pos>=0&&pos<_size); if (len > _size - pos) { len = _size - pos; } string temp; for (int i = pos; i < pos + len; i++) { temp += _str[i]; } return temp; }

size_t string::find(char ch, size_t pos ) { assert(pos<_size); for (int i = pos; i < _size; i++) { if (_str[i] == ch) { return i; } } return npos; }

size_t string::find(const char* str, size_t pos) { assert(pos < _size); char* ret=strstr(_str+pos,str); if (ret != nullptr) { return ret - _str; } return npos; }

bool operator<(const string& s1, const string& s2) { return strcmp(s1.c_str(), s2.c_str()) < 0; }
bool operator<=(const string& s1, const string& s2) { return s1 < s2 || s1 == s2; }
bool operator>(const string& s1, const string& s2) { return !(s1 <= s2); }
bool operator>=(const string& s1, const string& s2) { return !(s1 < s2); }
bool operator==(const string& s1, const string& s2) { return strcmp(s1.c_str(), s2.c_str()) == 0; }
bool operator!=(const string& s1, const string& s2) { return !(s1 == s2); }

std::ostream& operator<<(std::ostream& out, const string& s) { for (auto ch : s) { out << ch; } return out; }

std::istream& operator>>(std::istream& in, string& s) { s.clear(); const int N = 256; char buff[N]; int i = 0; char ch; //in >> ch; ch = in.get(); while (ch != ' ' && ch != '\n') { buff[i++] = ch; if (i == N - 1) { buff[i] = '\0'; s += buff; i = 0; } //in >> ch; ch = in.get(); } if (i > 0) { buff[i] = '\0'; s += buff; } return in; }

C++ STL 手写 String 类实现及高频易错点复盘

一、整体结构

二、构造/析构函数

2.1 默认构造

2.2 拷贝构造

更多推荐文章

相关免费在线工具

2.3 析构函数

三、功能接口

3.1 reserve

3.2 c_str

3.3 PushBack

3.4 Append

3.5 Insert

3.6 erase

3.7 substr

3.8 Find

四、运算符重载

4.1 =

4.2 <、<=、>、>=、==、!=

4.3 +=

4.4 <<、>>

五、完整代码

更多推荐文章

相关免费在线工具

C++ STL 手写 String 类实现及高频易错点复盘

一、整体结构

二、构造/析构函数

2.1 默认构造

2.2 拷贝构造

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

2.3 析构函数

三、功能接口

3.1 reserve

3.2 c_str

3.3 PushBack

3.4 Append

3.5 Insert

3.6 erase

3.7 substr

3.8 Find

四、运算符重载

4.1 =

4.2 <、<=、>、>=、==、!=

4.3 +=

4.4 <<、>>

五、完整代码

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具