跳到主要内容C++ STL:从零手写 string 及高频易错点复盘 | 极客日志C++算法
C++ STL:从零手写 string 及高频易错点复盘
综述由AI生成通过从零实现 C++ string 类,深入剖析了内存管理、构造函数、运算符重载等核心机制。重点讲解了 reserve 扩容策略、拷贝构造与赋值运算符的深拷贝处理、以及 substr 浅拷贝陷阱。结合代码实战,总结了 insert、erase、find 等常用接口的实现细节与边界条件,帮助开发者理解 STL 底层原理并规避常见错误。
abccba3 浏览 C++ STL:从零手写 string 及高频易错点复盘
一、整体结构
实现一个简易的 string 类,核心成员变量通常包含以下三个部分:
class string {
public:
private:
char* _str;
int _size;
int _capacity;
};
- char _str*:动态分配的内存块,存放以
\0 结尾的字符序列。模拟实现时需自行管理内存的分配、扩容和释放。
- int _size:记录有效长度。注意它不包含末尾的空字符。
- int _capacity:记录容量上限。当
_size 即将超过 _capacity 时触发扩容。通常采用倍数增长策略(如 1.5 倍或 2 倍),以减少频繁 realloc 带来的性能损耗。
二、构造与析构函数
1. 默认构造
编写构造函数时,_str 不能初始化为 nullptr。必须开辟至少 1 字节的空间并初始化为 \0,否则打印时会因缺少结束符导致乱码。
string() {
_str = new char[1]{\0};
_size = _capacity = 0;
}
这里开辟的 1 字节用于存储 \0,不计入总空间大小。
2. 字符串构造
传入 C 风格字符串时,需注意 strlen 计算的是不含 \0 的长度,而 strcpy 会拷贝包括 \0 在内的内容,因此空间需预留 len + 1。
string(const char* str) {
int len = strlen(str);
_str = new char[len + 1];
strcpy(_str, str);
_size = _capacity = len;
}
3. 拷贝构造
关键点:C++ 语法禁止拷贝构造传值传参,否则会导致无限递归调用栈溢出。参数必须使用引用(const string&)。
string(const string& ch) {
_str = new char[ch._capacity + 1];
strcpy(_str, ch._str);
_size = ch._size;
_capacity = ch._capacity;
}
4. 析构函数
~string() {
delete[] _str;
_str = NULL;
_size = _capacity = 0;
}
三、功能接口详解
1. reserve
该接口仅修改 _capacity,不改变 _size。常用于提前分配内存以避免后续频繁扩容。
- 只负责扩容,若传入参数小于当前容量通常不做操作。
- 预留空间包含末尾
\0 的位置。
void reserve(int n) {
if (n > _capacity) {
char* temp = new char[n+1];
strcpy(temp, _str);
delete[] _str;
_str = temp;
_capacity = n;
}
}
注意:不要在构造函数中调用 reserve。此时成员变量尚未初始化,直接访问可能导致非法访问或逻辑错误。
2. c_str
返回指向内部 C 风格字符串的常量指针,用于兼容 C 语言接口。
- 返回
const char*,不可通过该指针修改内容。
- 指针依赖对象生命周期,对象修改或销毁后指针失效。
const char* c_str() const { return _str; }
3. PushBack
void PushBack(const char ch) {
if (_size == _capacity) {
reserve(_capacity == 0 ? 4 : 2 * _capacity);
}
_str[_size++] = ch;
_str[_size] = 0;
}
扩容时需判断 _capacity 是否为 0,避免一直按 0 扩容。
4. Append
在末尾追加字符串。逻辑与 PushBack 类似,但需处理批量追加时的扩容策略。
void Append(const char* str) {
int len = strlen(str);
if (_size + len > _capacity) {
reserve(_size + len > 2*_capacity ? _size + len : 2 * _capacity);
}
strcpy(_str+_size, str);
_size += len;
}
这里采用了更智能的扩容策略:如果追加长度过大,直接按需求扩容;否则按 2 倍扩容,平衡性能与内存占用。
5. Insert
支持在指定位置插入字符或字符串。插入会导致后续字符后移,时间复杂度为 O(n)。
void Insert(int pos, const char ch) {
assert(pos <= _size && pos >= 0);
if (_size == _capacity) {
reserve(_capacity == 0 ? 4 : 2 * _capacity);
}
int cur = _size;
while (cur >= pos) {
_str[cur + 1] = _str[cur];
cur--;
}
_str[pos] = ch;
_size++;
}
void Insert(int pos, const char* str) {
assert(pos <= _size && pos >= 0);
int len = strlen(str);
if (_size + len > _capacity) {
reserve(_size + len > 2*_capacity ? _size + len : 2 * _capacity);
}
int cur = _size;
while (cur >= pos) {
_str[cur + len] = _str[cur];
cur--;
}
strncpy(_str+pos, str, len);
_size += len;
}
注意插入字符串时使用 strncpy 而非 strcpy,避免将 \0 也拷贝进去覆盖原有数据。
6. erase
删除指定位置或范围的字符。这里演示从指定位置删除指定长度的版本。
void erase(size_t pos, size_t len) {
assert(pos >= 0 && pos < _size);
if (len >= _size - pos) {
_str[pos] = 0;
_size -= (_size - pos);
} else {
while (pos + len <= _size) {
_str[pos] = _str[pos + len];
pos++;
}
_size -= len;
}
}
7. substr
返回值是 string 对象,调用拷贝构造。如果未显式定义深拷贝,编译器生成的浅拷贝会导致两个对象共享同一块内存,析构时重复释放引发崩溃。
string substr(size_t pos, size_t len) const {
assert(pos >= 0 && pos < _size);
if (len > _size - pos) {
len = _size - pos;
}
string temp;
for (int i = pos; i < pos + len; i++) {
temp += _str[i];
}
return temp;
}
务必确保拷贝构造函数实现了深拷贝,即重新开辟空间并复制数据。
8. Find
查找字符或子串首次出现的位置。失败返回 npos。
size_t find(char ch, size_t pos = 0) {
assert(pos < _size);
for (int i = pos; i < _size; i++) {
if (_str[i] == ch) return i;
}
return npos;
}
size_t find(const char* str, size_t pos = 0) {
assert(pos < _size);
char* ret = strstr(_str + pos, str);
if (ret != nullptr) return ret - _str;
return npos;
}
使用 strstr 时需注意其返回的是指针,需转换为下标。
四、运算符重载
1. 赋值运算符 (=)
推荐采用拷贝并交换(Copy-and-Swap) 惯用法,既简洁又异常安全。
void Swap(string& str) {
std::swap(_str, str._str);
std::swap(_size, str._size);
std::swap(_capacity, str._capacity);
}
string& operator=(string str) {
Swap(str);
return *this;
}
相比传统写法手动管理内存,这种方式利用临时对象的析构自动回收旧资源,且天然支持自赋值。
2. 比较运算符 (<, ==, etc.)
基础比较复用 strcmp,其余运算符基于基础运算组合实现。
bool operator<(const string& s1, const string& s2) {
return strcmp(s1.c_str(), s2.c_str()) < 0;
}
bool operator==(const string& s1, const string& s2) {
return strcmp(s1.c_str(), s2.c_str()) == 0;
}
注意:这些非成员函数声明不能放在类内,因为参数列表隐含了 this 指针。
3. 流运算符 (<<, >>)
输出较简单,逐个字符写入即可。输入则需处理缓冲区满的情况。
std::ostream& operator<<(std::ostream& out, const string& s) {
for (auto ch : s) { out << ch; }
return out;
}
std::istream& operator>>(std::istream& in, string& s) {
s.clear();
const int N = 256;
char buff[N];
int i = 0;
char ch;
ch = in.get();
while (ch != ' ' && ch != '\n') {
buff[i++] = ch;
if (i == N - 1) {
buff[i] = '\0';
s += buff;
i = 0;
}
ch = in.get();
}
if (i > 0) {
buff[i] = '\0';
s += buff;
}
return in;
}
输入流实现中使用了固定缓冲区避免频繁分配,遇到空格或换行停止读取。
五、完整代码实现
头文件 (string.h)
#define _CRT_SECURE_NO_WARNINGS
#pragma once
#include <string.h>
#include <assert.h>
#include <iostream>
class string {
public:
typedef char* iterator;
iterator begin() const { return _str; }
iterator end() const { return _str + _size; }
void clear() { _str[0] = 0; _size = 0; }
void reserve(int n);
string();
string(const char* str);
string(const string& ch);
const char* c_str() const { return _str; }
string& operator=(string str);
void PushBack(const char ch);
void Append(const char* str);
void Insert(int pos, const char ch);
void Insert(int pos, const char* str);
void erase(size_t pos, size_t len);
string substr(size_t pos, size_t len) const;
size_t find(char ch, size_t pos = 0);
size_t find(const char* str, size_t pos = 0);
void operator+=(const char* str) { Append(str); }
void operator+=(const char ch) { PushBack(ch); }
char operator[](int pos) { assert(pos >= 0 && pos < _size); return _str[pos]; }
int size() { return _size; }
int capacity() { return _capacity; }
~string();
private:
char* _str;
int _size;
int _capacity;
static const size_t npos;
};
bool operator<(const string& s1, const string& s2);
bool operator<=(const string& s1, const string& s2);
bool operator>(const string& s1, const string& s2);
bool operator>=(const string& s1, const string& s2);
bool operator==(const string& s1, const string& s2);
bool operator!=(const string& s1, const string& s2);
std::ostream& operator<<(std::ostream& out, const string& s);
std::istream& operator>>(std::istream& in, string& s);
实现文件 (string.cpp)
#include "string.h"
const size_t string::npos = -1;
void string::reserve(int n) {
if (n > _capacity) {
char* temp = new char[n + 1];
strcpy(temp, _str);
delete[] _str;
_str = temp;
_capacity = n;
}
}
string::string() {
_str = new char[1]{\0};
_size = _capacity = 0;
}
string::string(const char* str) {
int len = strlen(str);
_str = new char[len + 1];
strcpy(_str, str);
_size = _capacity = len;
}
string::string(const string& ch) {
_str = new char[ch._capacity + 1];
strcpy(_str, ch._str);
_size = ch._size;
_capacity = ch._capacity;
}
string& string::operator=(string str) {
Swap(str);
return *this;
}
void string::Swap(string& str) {
std::swap(_str, str._str);
std::swap(_size, str._size);
std::swap(_capacity, str._capacity);
}
void string::PushBack(const char ch) {
if (_size == _capacity) {
reserve(_capacity == 0 ? 4 : 2 * _capacity);
}
_str[_size++] = ch;
_str[_size] = 0;
}
void string::Append(const char* str) {
int len = strlen(str);
if (_size + len > _capacity) {
reserve(_size + len > 2 * _capacity ? _size + len : 2 * _capacity);
}
strcpy(_str + _size, str);
_size += len;
}
void string::Insert(int pos, const char ch) {
assert(pos <= _size && pos >= 0);
if (_size == _capacity) {
reserve(_capacity == 0 ? 4 : 2 * _capacity);
}
int cur = _size;
while (cur >= pos) {
_str[cur + 1] = _str[cur];
cur--;
}
_str[pos] = ch;
_size++;
}
void string::Insert(int pos, const char* str) {
assert(pos <= _size && pos >= 0);
int len = strlen(str);
if (_size + len > _capacity) {
reserve(_size + len > 2 * _capacity ? _size + len : 2 * _capacity);
}
int cur = _size;
while (cur >= pos) {
_str[cur + len] = _str[cur];
cur--;
}
strncpy(_str + pos, str, len);
_size += len;
}
void string::erase(size_t pos, size_t len) {
assert(pos >= 0 && pos < _size);
if (len >= _size - pos) {
_str[pos] = 0;
_size -= (_size - pos);
} else {
while (pos + len <= _size) {
_str[pos] = _str[pos + len];
pos++;
}
_size -= len;
}
}
string string::substr(size_t pos, size_t len) const {
assert(pos >= 0 && pos < _size);
if (len > _size - pos) {
len = _size - pos;
}
string temp;
for (int i = pos; i < pos + len; i++) {
temp += _str[i];
}
return temp;
}
size_t string::find(char ch, size_t pos) {
assert(pos < _size);
for (int i = pos; i < _size; i++) {
if (_str[i] == ch) return i;
}
return npos;
}
size_t string::find(const char* str, size_t pos) {
assert(pos < _size);
char* ret = strstr(_str + pos, str);
if (ret != nullptr) return ret - _str;
return npos;
}
bool operator<(const string& s1, const string& s2) {
return strcmp(s1.c_str(), s2.c_str()) < 0;
}
bool operator==(const string& s1, const string& s2) {
return strcmp(s1.c_str(), s2.c_str()) == 0;
}
bool operator!=(const string& s1, const string& s2) {
return !(s1 == s2);
}
bool operator<=(const string& s1, const string& s2) {
return s1 < s2 || s1 == s2;
}
bool operator>(const string& s1, const string& s2) {
return !(s1 <= s2);
}
bool operator>=(const string& s1, const string& s2) {
return !(s1 < s2);
}
std::ostream& operator<<(std::ostream& out, const string& s) {
for (auto ch : s) { out << ch; }
return out;
}
std::istream& operator>>(std::istream& in, string& s) {
s.clear();
const int N = 256;
char buff[N];
int i = 0;
char ch;
ch = in.get();
while (ch != ' ' && ch != '\n') {
buff[i++] = ch;
if (i == N - 1) {
buff[i] = '\0';
s += buff;
i = 0;
}
ch = in.get();
}
if (i > 0) {
buff[i] = '\0';
s += buff;
}
return in;
}
相关免费在线工具
- 加密/解密文本
使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online
- Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印,支持批量处理与下载。 在线工具,Gemini 图片去水印在线工具,online
- Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online
- Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。 在线工具,Base64 文件转换器在线工具,online
- Markdown转HTML
将 Markdown(GFM)转为 HTML 片段,浏览器内 marked 解析;与 HTML转Markdown 互为补充。 在线工具,Markdown转HTML在线工具,online
- HTML转Markdown
将 HTML 片段转为 GitHub Flavored Markdown,支持标题、列表、链接、代码块与表格等;浏览器内处理,可链接预填。 在线工具,HTML转Markdown在线工具,online