Java字符处理:char、String与StringBuilder详解

好的,我们来深入解析 Java 中的 charStringStringBuilderStringBuffer。理解它们之间的区别对于编写高效、正确的 Java 代码至关重要。

1. char:基本数据类型

  • 本质char 是 Java 中的基本数据类型(Primitive Type),表示一个 16 位无符号 Unicode 字符。它占用 2 个字节(16 位)内存空间。
  • 值范围:最小值为 \u0000 (即 0),最大值为 \uffff (即 65, 535)。可以表示世界上大多数字符。
  • 特点
    • 是基本类型,不是对象,没有方法。
    • 字面值用单引号 ' 表示,例如:char grade = 'A';
    • 可以直接参与算术运算(提升为 int)。
    • 存储在栈内存(如果作为局部变量)或对象内部。
  • 用途:主要用于表示单个字符。

2. String:不可变的字符序列

  • 本质String 是一个 (Class),用于表示不可变的字符序列。它内部封装了一个 char[] 数组来存储字符。
  • 核心特性 - 不可变性 (Immutability)
    • 一旦 String 对象被创建,其包含的字符序列 就不能被更改。任何看似修改 String 的操作(如 concat, substring, toUpperCase, replace 等),实际上都是 创建并返回一个全新的 String 对象
    • 优点
      • 线程安全:由于不可变,多个线程可以安全地共享同一个 String 对象,无需同步。
      • 安全性:常用于敏感信息(如密码)的传递,因为不可变,避免了内容被意外修改的风险。
      • HashCode 稳定性StringhashCode() 值在对象创建时计算一次并缓存,后续调用直接返回缓存值,效率高且稳定,非常适合作为哈希表的键(如 HashMap)。
    • 缺点
      • 频繁修改效率低:每次“修改”都会产生新的对象,如果在一个循环中反复拼接字符串,会产生大量中间临时对象,增加 GC 压力。
  • 创建方式
    • 字面量:String s = "abc"; (优先使用常量池)
    • 构造函数:String s = new String("abc"); (在堆上新建对象)
    • 字符数组:char[] data = {'a', 'b', 'c'}; String str = new String(data);
    • + 运算符拼接(底层可能编译优化为 StringBuilder)。
  • 常用方法length(), charAt(int index), concat(String str), equals(Object anObject), indexOf(String str), substring(int beginIndex), toLowerCase(), toUpperCase(), trim(), split(String regex) 等。

缓存与优化:Java 使用“字符串常量池”(String Pool)来缓存字符串字面量,减少重复创建的开销。例如:

String s1 = "hello"; // 可能从池中获取 String s2 = "hello"; // 指向池中同一个对象 String s3 = new String("hello"); // 强制在堆上创建新对象 

3. StringBuilder:可变的字符序列 (非线程安全)

  • 本质StringBuilder 也是一个类,用于表示 可变的字符序列。它也封装了一个 char[] 数组(称为缓冲区)。
  • 核心特性 - 可变性 (Mutability)
    • 对象内部的字符序列 可以被修改。修改操作(如 append, insert, delete, replace)直接在原有缓冲区上进行,不会创建新对象(除非缓冲区容量不足需要扩容)。
  • 特点
    • 高效修改:非常适合在循环中或需要多次修改字符串内容的场景(如日志拼接、动态 SQL 生成),避免了 String 拼接带来的性能问题。
    • 非线程安全StringBuilder 的方法 没有 进行同步(synchronized)处理。如果多个线程同时修改同一个 StringBuilder 实例,可能会导致数据不一致。因此,它适用于 单线程环境
    • 创建:通常通过构造函数 new StringBuilder()new StringBuilder(String str) 创建。
    • 最终字符串获取:通过 toString() 方法获取最终的不可变 String 对象。
  • 常用方法append(...)(多种重载,支持基本类型、对象等), insert(int offset, ...), delete(int start, int end), replace(int start, int end, String str), reverse(), setCharAt(int index, char ch), toString()

4. StringBuffer:可变的字符序列 (线程安全)

  • 本质StringBufferStringBuilder线程安全版本。它也用于表示可变的字符序列。
  • 核心特性 - 可变性与线程安全
    • 对象内部的字符序列可以被修改。
    • 所有对 StringBuffer 进行修改的公共方法(如 append, insert, delete, replace)都使用了 synchronized 关键字进行同步,保证了在 多线程环境 下的操作安全。
  • 特点
    • 线程安全:可以在多线程环境下安全地修改同一个 StringBuffer 实例。
    • 性能开销:由于同步锁的存在,StringBuffer 的操作性能通常 低于StringBuilder。在单线程环境中使用 StringBuffer 会带来不必要的性能损失。
    • 创建与获取:用法与 StringBuilder 类似,通过构造函数创建,通过 toString() 获取最终 String
  • 历史StringBuffer 是 JDK 1.0 就存在的类。StringBuilder 是在 JDK 1.5 引入的,作为 StringBuffer 的非线程安全替代品,旨在提高单线程下的性能。

总结对比表

特性charStringStringBuilderStringBuffer
类型基本数据类型类 (不可变)类 (可变)类 (可变)
可变性值可变不可变可变可变
线程安全不适用 (基本类型) (因不可变) (同步方法)
性能 (修改)低 (创建新对象) (单线程)中低 (因同步)
适用场景单个字符常量字符串、键值、方法参数传递等单线程下频繁修改字符串多线程下频繁修改字符串
创建方式字面量 'A'字面量 "abc" / new String(...)new StringBuilder()new StringBuffer()
最终字符串-自身toString()toString()

选用建议

  1. 单个字符:使用 char
  2. 不常修改的字符串:优先使用 String(利用常量池、线程安全、HashCode 稳定等优点)。
  3. 单线程下频繁修改字符串强烈推荐使用 StringBuilder(性能最优)。
  4. 多线程下频繁修改字符串:使用 StringBuffer(保证线程安全)。
  5. 简单拼接:少量固定字符串拼接可用 String+(编译器可能会优化成 StringBuilder)。大量或循环拼接务必使用 StringBuilder/StringBuffer

理解它们的设计意图和优缺点,有助于你在不同场景下做出最合适的选择,写出更高效、更健壮的 Java 代码。

好的,我们来深入解析 Java 中的 charStringStringBuilderStringBuffer。理解它们之间的区别对于编写高效、正确的 Java 代码至关重要。

1. char:基本数据类型

  • 本质char 是 Java 中的基本数据类型(Primitive Type),表示一个 16 位无符号 Unicode 字符。它占用 2 个字节(16 位)内存空间。
  • 值范围:最小值为 \u0000 (即 0),最大值为 \uffff (即 65, 535)。可以表示世界上大多数字符。
  • 特点
    • 是基本类型,不是对象,没有方法。
    • 字面值用单引号 ' 表示,例如:char grade = 'A';
    • 可以直接参与算术运算(提升为 int)。
    • 存储在栈内存(如果作为局部变量)或对象内部。
  • 用途:主要用于表示单个字符。

2. String:不可变的字符序列

  • 本质String 是一个 (Class),用于表示不可变的字符序列。它内部封装了一个 char[] 数组来存储字符。
  • 核心特性 - 不可变性 (Immutability)
    • 一旦 String 对象被创建,其包含的字符序列 就不能被更改。任何看似修改 String 的操作(如 concat, substring, toUpperCase, replace 等),实际上都是 创建并返回一个全新的 String 对象
    • 优点
      • 线程安全:由于不可变,多个线程可以安全地共享同一个 String 对象,无需同步。

缓存与优化:Java 使用“字符串常量池”(String Pool)来缓存字符串字面量,减少重复创建的开销。例如:

String s1 = "hello"; // 可能从池中获取 String s2 = "hello"; // 指向池中同一个对象 String s3 = new String("hello"); // 强制在堆上创建新对象 
  1. :优先使用 String(利用常量池、线程安全、HashCode 稳定等优点)。
  2. 单线程下频繁修改字符串强烈推荐使用 StringBuilder(性能最优)。
  3. 多线程下频繁修改字符串:使用 StringBuffer(保证线程安全)。
  4. 简单拼接:少量固定字符串拼接可用 String+(编译器可能会优化成 StringBuilder)。大量或循环拼接务必使用 StringBuilder/StringBuffer

理解它们的设计意图和优缺点,有助于你在不同场景下做出最合适的选择,写出更高效、更健壮的 Java 代码。

Read more

我的算法修炼之路--5——专破“思维陷阱”,那些让你拍案叫绝的非常规秒解

我的算法修炼之路--5——专破“思维陷阱”,那些让你拍案叫绝的非常规秒解

💗博主介绍:计算机专业的一枚大学生 来自重庆 @燃于AC之乐✌专注于C++技术栈,算法,竞赛领域,技术学习和项目实战✌💗 💗根据博主的学习进度更新(可能不及时) 💗后续更新主要内容:C语言,数据结构,C++、linux(系统编程和网络编程)、MySQL、Redis、QT、Python、Git、爬虫、数据可视化、小程序、AI大模型接入,C++实战项目与学习分享。 👇🏻 精彩专栏 推荐订阅👇🏻 点击进入🌌作者专栏🌌: 算法画解 ✅ C++ ✅ 🌟算法相关题目点击即可进入实操🌟 感兴趣的可以先收藏起来,请多多支持,还有大家有相关问题都可以给我留言咨询,希望希望共同交流心得,一起进步,你我陪伴,学习路上不孤单! 文章目录 * 前言 * 题目清单 * 1.Metoer Shower(流星雨) * 2.

By Ne0inhk
算法王冠上的明珠——动态规划之路径问题(第一篇)

算法王冠上的明珠——动态规划之路径问题(第一篇)

目录 1. 什么叫路径类动态规划 一、核心定义(通俗理解) 二、核心特征(识别这类问题的关键) 2. 动态规划步骤 状态表示 状态转移方程 初始化 填表顺序 返回值 3. 例题讲解 3.1 LeetCode62. 不同路径 3.2 LeetCode63. 不同路径 II 3.3 LeetCodeLCR 166. 珠宝的最高价值 今天我们来聊一聊动态规划的路径类问题。 1. 什么叫路径类动态规划 路径类动态规划是 动态规划的一个重要分支,核心解决 “从起点到终点的路径相关问题”—— 比如 “路径总数”“最短路径长度”“路径上的最大 / 最小和” 等,其本质是通过 “状态递推” 避免重复计算,高效求解多阶段决策的路径问题。 一、

By Ne0inhk
【动态规划】数位DP的原理、模板(封装类)

【动态规划】数位DP的原理、模板(封装类)

本文涉及知识点 C++动态规划 复杂但相对容易理解的解法 上界、下界的位数一样都为N。如果不一样,拆分一样。比如:[10,200],拆分[10,99]和[100,200]。由于要枚举到 1 ∼ N 1\sim N 1∼N,故实际复杂度是N倍。 动态规划的状态表示 dp[n][m][m1],n表示已经处理最高n位,m表示上下界状态:0非上下界,1下界,2上界,3上下界。m1是自定义状态。 某题范围是[110,190],处理一位后:1是上下界,无其它合法状态。处理二位后,11是下界,19是上界, 12 ∼ 18 12

By Ne0inhk
【LeetCode_27】移除元素

【LeetCode_27】移除元素

刷爆LeetCode系列 * LeetCode27题: * github地址 * 前言 * 题目描述 * 题目思路分析 * 代码实现 * 算法代码优化 LeetCode27题: github地址 有梦想的电信狗 前言 本文用C++实现LeetCode 第27题 题目描述 题目链接:https://leetcode.cn/problems/remove-element/ 题目思路分析 目标分析: 1. 将数组中等于val的元素移除 2. 原地移除,意味着时间复杂度为O(n),空间复杂度为O(1) 3. 返回nums中与val值不同的元素个数 思路:双指针 * src:用于扫描元素,从待扫描元素的第一个开始,因此初始下标为0 * dst:指向数组中,最后一个位置正确的元素的下标,因此初始值为-1 * count:记录赋值的次数,赋值的次数即为数组中与val值不同的元素个数,初始值为0 操作: * nums[

By Ne0inhk