跳到主要内容动手实现 C++ 字符串类:从内存管理到运算符重载 | 极客日志C++
动手实现 C++ 字符串类:从内存管理到运算符重载
从零实现 C++ String 类,覆盖迭代器定义、深拷贝与 Copy-and-Swap 技巧、容量扩容策略、常用操作符重载及输入输出处理。代码完整呈现内部实现,适合巩固 C++ 内存管理、类型安全与异常安全等基础概念。

String 在标准库出现之前就广泛使用了,它的接口设计深深影响了后来的 STL 容器。这次不聊用法,动手写一个精简版 string,把迭代器、深拷贝、容量管理这些细节彻底摸一遍。
迭代器与成员变量
直接用 char* 做迭代器,typedef 一下就能兼容标准算法。const 版本顺手都配上,防止误改。
class string {
public:
typedef char* iterator;
typedef const char* const_iterator;
const char* c_str() const { return _str; }
iterator begin() { return _str; }
iterator end() { return _str + _size; }
const_iterator begin() const { return _str; }
const_iterator end() const { return _str + _size; }
size_t size() const { return _size; }
size_t capacity() { _capacity; }
:
* _str = ;
_size = ;
_capacity = ;
npos = ;
};
const
return
private
char
nullptr
size_t
0
size_t
0
static
const
size_t
-1
npos 给无符号整数的最大值,这里直接用 -1 占位,反正 size_t 会把它转成超大数。
构造 / 析构 / 拷贝
标准库的构造重载很多,挑两个典型的:用 n 个字符初始化,以及 C 字符串初始化。前者得老老实实循环赋值;后者直接 strcpy,省事。
string::string(size_t n, char ch) : _str(new char[n + 1]), _size(n), _capacity(n) {
for (size_t i = 0; i < n; i++) {
_str[i] = ch;
}
_str[_size] = '\0';
}
string::string(const char* str) : _size(strlen(str)) {
_capacity = _size;
_str = new char[_size + 1];
strcpy(_str, str);
}
string::~string() {
delete[] _str;
_str = nullptr;
_size = 0;
_capacity = 0;
}
拷贝构造需要深拷贝,下面先写个朴素的实现,顺便带个 swap。
string::string(const string& s) {
_str = new char[s._capacity + 1];
strcpy(_str, s._str);
_size = s._size;
_capacity = s._capacity;
}
void string::swap(string& s) {
std::swap(_str, s._str);
std::swap(_size, s._size);
std::swap(_capacity, s._capacity);
}
实际编码里更推荐 Copy-and-Swap 的变体,利用局部对象接管资源,异常安全而且代码更短。
string::string(const string& s) {
string tmp(s._str);
swap(tmp);
}
clear 只是把第一个字节置零,看得见的大小也归零。
void clear() {
_str[0] = '\0';
_size = 0;
}
运算符重载
string& string::operator=(const string& s) {
if (this != &s) {
string tmp(s._str);
swap(tmp);
}
return *this;
}
char& operator[](size_t pos) {
assert(pos < _size);
return _str[pos];
}
const char& operator[](size_t pos) const {
assert(pos < _size);
return _str[pos];
}
比较运算符直接调用 strcmp,省事。注意小于比较别搞反顺序。
bool string::operator==(const string& s) const {
return strcmp(_str, s._str) == 0;
}
bool string::operator!=(const string& s) const {
return !(*this == s);
}
bool string::operator<(const string& s) const {
return strcmp(_str, s._str) < 0;
}
bool string::operator<=(const string& s) const {
return *this < s || *this == s;
}
bool string::operator>(const string& s) const {
return !(*this <= s);
}
bool string::operator>=(const string& s) const {
return !(*this < s);
}
容量与修改
扩容策略很常规:新空间按需增长,没用到 realloc,用的是 new + strcpy。
void string::reserve(size_t n) {
if (n > _capacity) {
char* tmp = new char[n + 1];
strcpy(tmp, _str);
delete[] _str;
_str = tmp;
_capacity = n;
}
}
void string::push_back(char ch) {
if (_size + 1 > _capacity) {
reserve(_capacity == 0 ? 4 : _capacity * 2);
}
_str[_size] = ch;
++_size;
_str[_size] = '\0';
}
void string::append(const char* str) {
size_t len = strlen(str);
if (_size + len > _capacity) {
size_t newCapacity = 2 * _capacity;
if (_size + len > 2 * _capacity) {
newCapacity = _size + len;
}
reserve(newCapacity);
}
strcpy(_str + _size, str);
_size += len;
}
string& string::operator+=(char ch) {
push_back(ch);
return *this;
}
string& string::operator+=(const char* str) {
append(str);
return *this;
}
插入操作稍微复杂一点:先确保容量,再把数据往后挪,最后填字符。插入字符串时偷个懒,先调用上面的 insert(pos, n, 'x') 占位,再覆盖成目标串。
void string::insert(size_t pos, size_t n, char ch) {
assert(pos <= _size);
assert(n > 0);
if (_size + n > _capacity) {
size_t newCapacity = 2 * _capacity;
if (_size + n > 2 * _capacity) {
newCapacity = _size + n;
}
reserve(newCapacity);
}
size_t end = _size + n;
while (end > pos + n - 1) {
_str[end] = _str[end - n];
--end;
}
for (size_t i = 0; i < n; i++) {
_str[pos + i] = ch;
}
_size += n;
}
void string::insert(size_t pos, const char* str) {
size_t n = strlen(str);
insert(pos, n, 'x');
for (size_t i = 0; i < n; i++) {
_str[pos + i] = str[i];
}
}
void string::erase(size_t pos, size_t len) {
if (len >= _size - pos) {
_str[pos] = '\0';
_size = pos;
} else {
size_t end = pos + len;
while (end <= _size) {
_str[end - len] = _str[end];
++end;
}
_size -= len;
}
}
查找与子串
find 字符版自己循环比较;find 字符串版直接拿 strstr 帮忙,返回指针差就行。
size_t string::find(char ch, size_t pos) {
for (size_t i = pos; i < _size; i++) {
if (_str[i] == ch) {
return i;
}
}
return npos;
}
size_t string::find(const char* str, size_t pos) {
const char* p = strstr(_str + pos, str);
if (p == nullptr) {
return npos;
} else {
return p - _str;
}
}
substr 需要临时 string,逐字追加。可以提前 reserve 一下避免反复分配。
string string::substr(size_t pos, size_t len) {
size_t leftLen = _size - pos;
if (len > leftLen) len = leftLen;
string tmp;
tmp.reserve(len);
for (size_t i = 0; i < len; i++) {
tmp += _str[pos + i];
}
return tmp;
}
输入 / 输出
ostream& operator<<(ostream& out, const string& s) {
for (auto ch : s) {
out << ch;
}
return out;
}
输入用固定缓冲区,遇空格或换行停下。标准库的 >> 其实会跳过前导空白然后读到空白结束,这里模拟的是默认行为。
istream& operator>>(istream& in, string& s) {
s.clear();
const size_t N = 1024;
char buff[N];
int i = 0;
char ch = in.get();
while (ch != ' ' && ch != '\n') {
buff[i++] = ch;
if (i == N - 1) {
buff[i] = '\0';
s += buff;
i = 0;
}
ch = in.get();
}
if (i > 0) {
buff[i] = '\0';
s += buff;
}
return in;
}
getline 可以自定义分隔符,处理逻辑和 >> 类似,只是停止条件换成了分隔符。
istream& getline(istream& in, string& s, char delim) {
s.clear();
const size_t N = 1024;
char buff[N];
int i = 0;
char ch = in.get();
while (ch != delim) {
buff[i++] = ch;
if (i == N - 1) {
buff[i] = '\0';
s += buff;
i = 0;
}
ch = in.get();
}
if (i > 0) {
buff[i] = '\0';
s += buff;
}
return in;
}
这样实现下来,对内存申请、异常安全、代码复用都会有一个比较具体的认识。实际的 STL 实现还会做短字符串优化(SSO)甚至 Copy-On-Write,但这个模型已经足够理清核心行为了。
相关免费在线工具
- Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online
- Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。 在线工具,Base64 文件转换器在线工具,online
- Markdown转HTML
将 Markdown(GFM)转为 HTML 片段,浏览器内 marked 解析;与 HTML转Markdown 互为补充。 在线工具,Markdown转HTML在线工具,online
- HTML转Markdown
将 HTML 片段转为 GitHub Flavored Markdown,支持标题、列表、链接、代码块与表格等;浏览器内处理,可链接预填。 在线工具,HTML转Markdown在线工具,online
- JSON 压缩
通过删除不必要的空白来缩小和压缩JSON。 在线工具,JSON 压缩在线工具,online
- JSON美化和格式化
将JSON字符串修饰为友好的可读格式。 在线工具,JSON美化和格式化在线工具,online