Java 字符处理核心：char、String、StringBuilder 与 StringBuffer 详解 | 极客日志

Javajava算法

Java 字符处理核心：char、String、StringBuilder 与 StringBuffer 详解

详细解析了 Java 中处理字符和字符串的核心组件：char、String、StringBuilder 和 StringBuffer。文章首先介绍了 char 原始类型及其编码特性，重点阐述了 String 类的不可变性原理、内存优化及常量池机制。接着对比了 StringBuilder 和 StringBuffer 的可变性、线程安全性及底层实现差异，并通过性能测试展示了它们在字符串拼接场景下的表现。最后提供了选型指南和常见面试题解答，帮助开发者根据具体场景选择合适的工具，编写高效稳定的代码。

DataScient发布于 2026/3/25更新于 2026/7/2054 浏览

Java 字符处理核心：char、String、StringBuilder 与 StringBuffer 详解

在这里插入图片描述

在 Java 编程中，char、String、StringBuilder 和 StringBuffer 是处理字符和字符串的四个基石。理解它们的设计哲学、底层实现和性能差异，对于编写高效、健壮的代码至关重要。

第一章：一切的基础——char 原始类型

在探讨复杂的字符串类之前，我们首先需要了解构成字符串的最基本单元：char。

1.1 定义与本质

char 是 Java 中的一种原始数据类型（Primitive Type），用于表示一个单一的 16 位 Unicode 字符。在 Java 诞生之初，设计者就采用了 Unicode 字符集，这使得 Java 天生具有良好的国际化支持。

大小：16 位（2 个字节），范围从 0 到 65,535（\u0000 到 \uffff）。
无符号性：char 是一个无符号类型，这意味着它不能表示负数。

1.2 字符编码的演变：从 char 到 byte

在 JDK 9 之前，String 类的内部实现也是采用 char[] 数组来存储字符。然而，一个深刻的洞察是，大多数应用程序使用的字符串主要由 Latin-1 字符集（如英文、数字）构成，这些字符仅需一个字节（8 位）即可表示，用两个字节的 char 来存储会造成一半的内存浪费。

因此，从 JDK 9 开始，为了优化内存占用，String（以及 StringBuilder 和 StringBuffer 的底层）不再使用 char[]，而是改用了 byte[] 数组，并引入一个 coder（编码器）字段来标识使用的是 LATIN1（每个字符 1 字节）还是 UTF16（每个字符 2 字节）编码。这是一个非常重要的底层变化，但对开发者来说是透明的，我们在逻辑上依然可以将它们视为字符序列。

1.3 char 的初始化与赋值

char 的赋值方式非常灵活，可以通过以下几种方式：

转义字符：表示一些特殊功能字符。

char c7 = '\n'; // 换行符
char c8 = '\''; // 单引号字符本身
char c9 = '\\'; // 反斜杠字符本身

相关免费在线工具

Keycode 信息
查找任何按下的键的javascript键代码、代码、位置和修饰符。在线工具，Keycode 信息在线工具，online
Escape 与 Native 编解码
JavaScript 字符串转义/反转义；Java 风格 \uXXXX（Native2Ascii）编码与解码。在线工具，Escape 与 Native 编解码在线工具，online
JavaScript / HTML 格式化
使用 Prettier 在浏览器内格式化 JavaScript 或 HTML 片段。在线工具，JavaScript / HTML 格式化在线工具，online
JavaScript 压缩与混淆
Terser 压缩、变量名混淆，或 javascript-obfuscator 高强度混淆（体积会增大）。在线工具，JavaScript 压缩与混淆在线工具，online
加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online

char c6 = '\u0041'; // 对应 'A'

char c3 = 65; // 十进制，对应 'A'
char c4 = 0101; // 八进制，对应 'A'
char c5 = 0x41; // 十六进制，对应 'A'

char c1 = 'A';
char c2 = '中';

char ch = 'A';
System.out.println("ch is " + ch); // 输出：ch is A
ch = (char) (ch + 1); // 将 'A' 的码点 (65) 加 1，得到 66，再强转为 char
System.out.println("ch is now " + ch); // 输出：ch is now B
char ch2 = 'a' + 'b'; // 'a'(97) + 'b'(98) = 195，结果在 int 范围内
System.out.println(ch2); // 输出：195 对应的字符？这里实际上输出的是 195 作为 char 类型的字符，需要查码表。
int sum = 'a' + 'b';
System.out.println(sum); // 输出：195

public final class String implements java.io.Serializable, Comparable<String>, CharSequence {
    /** The value is used for character storage. */
    private final char value[]; // JDK 9 之后变为 private final byte[] value
    /** Cache the hash code for the string */
    private int hash; // Default to 0
    // ... 其他代码
}

String s1 = "hello";
String s2 = "hello";
System.out.println(s1 == s2); // 输出 true，因为指向常量池中的同一个对象

String s3 = new String("hello");
String s4 = new String("hello");
System.out.println(s1 == s3); // 输出 false，s1 指向常量池，s3 指向堆
System.out.println(s3 == s4); // 输出 false，s3 和 s4 指向堆中不同的对象

String original = "Hello";
String modified = original.concat(" World");
System.out.println(original); // 输出：Hello (原对象未变)
System.out.println(modified); // 输出：Hello World (新对象)
String upper = original.toUpperCase();
System.out.println(original); // 输出：Hello
System.out.println(upper); // 输出：HELLO

// 低效的写法
String result = "";
for (int i = 0; i < 1000; i++) {
    result = result + i; // 每次循环都会创建新的 String 对象
}

// 以 JDK 8 为例
abstract class AbstractStringBuilder implements Appendable, CharSequence {
    char[] value; // 非 final，存储字符序列，JDK 9 后变为 byte[]
    int count; // 已使用的字符个数
    // 扩容机制
    public void ensureCapacity(int minimumCapacity) {
        if (minimumCapacity > value.length) {
            expandCapacity(minimumCapacity);
        }
    }
    void expandCapacity(int minimumCapacity) {
        int newCapacity = value.length * 2 + 2; // 新容量通常是旧容量的 2 倍 +2
        if (newCapacity < minimumCapacity) { newCapacity = minimumCapacity; }
        // 创建新数组并复制原数据 value = Arrays.copyOf(value, newCapacity);
        // ...}
    // ...}

// StringBuffer 的 append 方法
@Override
public synchronized StringBuffer append(String str) {
    toStringCache = null;
    super.append(str);
    return this;
}

方法分类	常用方法	描述
构造器	`StringBuilder()` / `StringBuffer()`	创建一个初始容量为 16 字符的空对象。
	`StringBuilder(int capacity)`	指定初始容量。
	`StringBuilder(String str)`	根据字符串创建，初始容量为 `16 + str.length()`。
追加	`append(任意类型 x)`	将参数的字符串表示形式追加到序列末尾。这是最常用的方法，支持重载。
插入	`insert(int offset, 任意类型 x)`	在指定位置插入参数的字符串表示形式。
删除	`delete(int start, int end)`	删除从 `start` 到 `end-1` 的子序列。
	`deleteCharAt(int index)`	删除指定位置的字符。
替换与反转	`replace(int start, int end, String str)`	用 `str` 替换指定范围的字符。
	`reverse()`	将序列反转。
修改	`setCharAt(int index, char ch)`	修改指定位置的字符。
查询	`charAt(int index)` / `length()`	获取指定字符/长度。
	`indexOf(String str)` / `lastIndexOf(String str)`	查找子串位置。
转 String	`toString()`	返回此序列中数据的字符串表示形式。

public class PerformanceTest {
    private static final int TIMES = 20000;
    public static void main(String[] args) {
        testString();
        testStringBuffer();
        testStringBuilder();
    }
    public static void testString() {
        long start = System.currentTimeMillis();
        String str = "";
        for (int i = 0; i < TIMES; i++) {
            str += "java";
        }
        long end = System.currentTimeMillis();
        System.out.println("String 拼接耗时：" + (end - start) + "ms");
    }
    public static void testStringBuffer() {
        long start = System.currentTimeMillis();
        StringBuffer sb = new StringBuffer();
        for (int i = 0; i < TIMES; i++) {
            sb.append("java");
        }
        String str = sb.toString();
        long end = System.currentTimeMillis();
        System.out.println("StringBuffer 拼接耗时：" + (end - start) + "ms");
    }
    public static void testStringBuilder() {
        long start = System.currentTimeMillis();
        StringBuilder sb = new StringBuilder();
        for (int i = 0; i < TIMES; i++) {
            sb.append("java");
        }
        String str = sb.toString();
        long end = System.currentTimeMillis();
        System.out.println("StringBuilder 拼接耗时：" + (end - start) + "ms");
    }
}

String 拼接耗时：1500ms
StringBuffer 拼接耗时：3ms
StringBuilder 拼接耗时：1ms

特性	char	String	StringBuilder	StringBuffer
类型	原始数据类型	类	类	类
不可变性	/	不可变 (Immutable)	可变 (Mutable)	可变 (Mutable)
线程安全	/	线程安全 (通过不可变性)	非线程安全	线程安全 (通过 synchronized)
底层存储	16 位 Unicode 值	`byte[]` (JDK 9+)	`byte[]` (JDK 9+)	`byte[]` (JDK 9+)
性能（修改操作）	N/A	极差（创建大量对象）	最高	中等（有同步开销）
适用场景	存储单个字符	操作少的字符串、常量、作为键的 HashMap	单线程下大量字符串操作（如循环拼接）	多线程下共享的字符串缓冲区

Java 字符处理核心：char、String、StringBuilder 与 StringBuffer 详解

第一章：一切的基础——char 原始类型

1.1 定义与本质

1.2 字符编码的演变：从 char 到 byte

1.3 char 的初始化与赋值

更多推荐文章

相关免费在线工具

1.4 char 的运算

第二章：不可变的字符串——String 类

2.1 类的定义与不可变性

2.2 不可变性的优势

2.3 创建 String 对象的两种方式

2.4 操作的真相：总是生成新对象

2.5 字符串拼接的陷阱与优化

第三章：可变的字符序列——StringBuilder 与 StringBuffer

3.1 AbstractStringBuilder：共同的祖先

3.2 StringBuilder：非线程安全的'快枪手'

3.3 StringBuffer：线程安全的'老大哥'

3.4 核心 API 对比

3.5 性能对比

第四章：横向对比与选型指南

4.1 选型指南：到底该用谁？

第五章：常见面试题深度剖析

1. 谈谈你对 String 的理解，它为什么是不可变的？

2. String、StringBuilder、StringBuffer 的区别？

3. String s = new String('xyz'); 创建了几个对象？

4. 为什么用 StringBuilder 要好于用 String 的'+'拼接？

总结

更多推荐文章

相关免费在线工具

Java 字符处理核心：char、String、StringBuilder 与 StringBuffer 详解

第一章：一切的基础——char 原始类型

1.1 定义与本质

1.2 字符编码的演变：从 char 到 byte

1.3 char 的初始化与赋值

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

1.4 char 的运算

第二章：不可变的字符串——String 类

2.1 类的定义与不可变性

2.2 不可变性的优势

2.3 创建 String 对象的两种方式

2.4 操作的真相：总是生成新对象

2.5 字符串拼接的陷阱与优化

第三章：可变的字符序列——StringBuilder 与 StringBuffer

3.1 AbstractStringBuilder：共同的祖先

3.2 StringBuilder：非线程安全的'快枪手'

3.3 StringBuffer：线程安全的'老大哥'

3.4 核心 API 对比

3.5 性能对比

第四章：横向对比与选型指南

4.1 选型指南：到底该用谁？

第五章：常见面试题深度剖析

1. 谈谈你对 String 的理解，它为什么是不可变的？

2. String、StringBuilder、StringBuffer 的区别？

3. String s = new String('xyz'); 创建了几个对象？

4. 为什么用 StringBuilder 要好于用 String 的'+'拼接？

总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具