JAVA 集合框架进阶:List 与 Set 的深度解析与实战

JAVA 集合框架进阶:List 与 Set 的深度解析与实战

JAVA 集合框架进阶:List 与 Set 的深度解析与实战

在这里插入图片描述

1.1 本章学习目标与重点

💡 掌握 List 和 Set 接口的核心特性,理解不同实现类的底层原理与适用场景。
💡 熟练运用集合的常用方法,解决数据存储、查找、去重等实际开发问题。
💡 理解集合的线程安全问题,掌握线程安全集合的使用方式。
⚠️ 本章重点是 不同集合的底层数据结构性能对比,这是面试和开发中的核心考点。

1.2 List 接口:有序可重复的集合

1.2.1 List 接口的核心特性

💡 List 是有序集合,元素的存储顺序和插入顺序一致,支持通过索引访问元素。
List 允许存储重复元素,也可以存储 null 值。
List 接口的常用实现类有 ArrayListLinkedListVector,它们的底层结构和性能各有差异。

✅ 核心结论:List 适合需要按索引操作、元素有序且允许重复的场景。

1.2.2 ArrayList:基于动态数组的实现

底层原理

💡 ArrayList 的底层是动态扩容的数组,默认初始容量为 10。
当数组容量不足时,会自动扩容为原来的 1.5 倍。
扩容过程需要新建数组并复制原数组元素,频繁扩容会影响性能。

代码实操:ArrayList 的常用操作

① 📝 创建 ArrayList 对象,添加不同类型的元素
② 📝 通过索引获取、修改元素
③ 📝 遍历集合,删除指定元素
④ 📝 判断集合是否包含某个元素

importjava.util.ArrayList;importjava.util.Iterator;importjava.util.List;publicclassArrayListDemo{publicstaticvoidmain(String[] args){// 1. 创建 ArrayList 集合List<String> list =newArrayList<>();// 2. 添加元素 list.add("Java"); list.add("Python"); list.add("C++"); list.add("Java");// 允许重复元素 list.add(null);// 允许存储null// 3. 通过索引获取元素String firstElement = list.get(0);System.out.println("第一个元素:"+ firstElement);// 4. 修改元素 list.set(1,"Go");System.out.println("修改后的集合:"+ list);// 5. 遍历集合 - 方式1:普通for循环System.out.println("普通for循环遍历:");for(int i =0; i < list.size(); i++){System.out.println(list.get(i));}// 6. 遍历集合 - 方式2:增强for循环System.out.println("增强for循环遍历:");for(String s : list){System.out.println(s);}// 7. 遍历集合 - 方式3:迭代器System.out.println("迭代器遍历:");Iterator<String> iterator = list.iterator();while(iterator.hasNext()){String s = iterator.next();// 迭代器遍历中删除元素,避免并发修改异常if(s ==null){ iterator.remove();}}System.out.println("删除null后的集合:"+ list);// 8. 判断集合是否包含指定元素boolean containsJava = list.contains("Java");System.out.println("集合包含Java:"+ containsJava);// 9. 清空集合 list.clear();System.out.println("清空后的集合是否为空:"+ list.isEmpty());}}
性能分析
  • 查询操作:基于索引的查询效率高,时间复杂度为 O(1)
  • 增删操作:在集合尾部增删元素效率高;在中间增删元素需要移动数组元素,时间复杂度为 O(n)
    ⚠️ 注意事项:ArrayList线程不安全的集合,多线程环境下使用会出现并发修改异常。

1.2.3 LinkedList:基于双向链表的实现

底层原理

💡 LinkedList 的底层是双向链表,每个节点包含前驱节点、后继节点和元素值。
链表结构无需连续的内存空间,增删元素时只需要修改节点的引用关系,不需要扩容。

代码实操:LinkedList 的特有方法

LinkedList 除了继承 List 接口的方法,还提供了操作首尾元素的特有方法,适合作为栈或队列使用。

importjava.util.LinkedList;publicclassLinkedListDemo{publicstaticvoidmain(String[] args){LinkedList<String> linkedList =newLinkedList<>();// 1. 添加元素 linkedList.addFirst("头元素"); linkedList.addLast("尾元素"); linkedList.add("中间元素");// 2. 获取首尾元素String first = linkedList.getFirst();String last = linkedList.getLast();System.out.println("头元素:"+ first +",尾元素:"+ last);// 3. 删除首尾元素 linkedList.removeFirst(); linkedList.removeLast();System.out.println("删除首尾后的集合:"+ linkedList);// 4. 作为栈使用:先进后出 linkedList.push("元素1"); linkedList.push("元素2"); linkedList.push("元素3");System.out.println("栈结构:"+ linkedList);String popElement = linkedList.pop();System.out.println("弹出的元素:"+ popElement);System.out.println("弹出后的栈:"+ linkedList);// 5. 作为队列使用:先进先出 linkedList.offer("队列元素1"); linkedList.offer("队列元素2");System.out.println("队列结构:"+ linkedList);String pollElement = linkedList.poll();System.out.println("出队的元素:"+ pollElement);System.out.println("出队后的队列:"+ linkedList);}}
性能分析
  • 查询操作:查询元素需要遍历链表,时间复杂度为 O(n)
  • 增删操作:增删元素只需修改节点引用,时间复杂度为 O(1)
    ⚠️ 注意事项:LinkedList 同样是线程不安全的集合,不适合多线程环境。

1.2.4 Vector:线程安全的动态数组

💡 Vector 的底层和 ArrayList 类似,都是动态数组。
Vector 的方法都加了 synchronized 关键字,是线程安全的集合。
它的扩容机制默认是原来的 2 倍,扩容效率低于 ArrayList

✅ 核心结论:Vector 性能较低,现代开发中更推荐使用 Collections.synchronizedList()CopyOnWriteArrayList 实现线程安全。

1.2.5 ArrayList 与 LinkedList 性能对比测试

我们通过代码测试两种集合在查询和增删操作中的耗时差异,测试数据为 10 万条元素。

importjava.util.ArrayList;importjava.util.LinkedList;importjava.util.List;publicclassListPerformanceTest{publicstaticfinalintSIZE=100000;publicstaticvoidmain(String[] args){List<Integer> arrayList =newArrayList<>();List<Integer> linkedList =newLinkedList<>();// 初始化集合for(int i =0; i <SIZE; i++){ arrayList.add(i); linkedList.add(i);}// 测试查询性能long arrayListQueryTime =testQuery(arrayList);long linkedListQueryTime =testQuery(linkedList);System.out.println("ArrayList查询耗时:"+ arrayListQueryTime +"ms");System.out.println("LinkedList查询耗时:"+ linkedListQueryTime +"ms");// 测试中间增删性能long arrayListAddRemoveTime =testAddRemove(arrayList);long linkedListAddRemoveTime =testAddRemove(linkedList);System.out.println("ArrayList中间增删耗时:"+ arrayListAddRemoveTime +"ms");System.out.println("LinkedList中间增删耗时:"+ linkedListAddRemoveTime +"ms");}// 测试查询性能:随机访问1000次privatestaticlongtestQuery(List<Integer> list){long start =System.currentTimeMillis();for(int i =0; i <1000; i++){int index =(int)(Math.random()*SIZE); list.get(index);}returnSystem.currentTimeMillis()- start;}// 测试中间增删性能:在中间位置增删1000次privatestaticlongtestAddRemove(List<Integer> list){long start =System.currentTimeMillis();int middleIndex = list.size()/2;for(int i =0; i <1000; i++){ list.add(middleIndex, i); list.remove(middleIndex);}returnSystem.currentTimeMillis()- start;}}

测试结果(仅供参考)

ArrayList查询耗时:1ms LinkedList查询耗时:15ms ArrayList中间增删耗时:8ms LinkedList中间增删耗时:2ms 

✅ 核心结论:查询多用 ArrayList,增删多用 LinkedList

1.3 Set 接口:无序不可重复的集合

1.3.1 Set 接口的核心特性

💡 Set 是无序集合,元素没有索引,存储顺序由底层数据结构决定。
Set 不允许存储重复元素,最多只能存储一个 null 值。
Set 接口的常用实现类有 HashSetLinkedHashSetTreeSet

✅ 核心结论:Set 适合需要元素去重、不关注存储顺序的场景。

1.3.2 HashSet:基于哈希表的实现

底层原理

💡 HashSet 的底层是 HashMap,它是通过 HashMap 的 key 来存储元素的,value 是一个固定的 PRESENT 对象。
HashSet 保证元素唯一的原理是:先通过 hashCode() 方法计算哈希值,再通过 equals() 方法比较元素是否相同。
如果两个元素的 hashCode() 值相同且 equals() 方法返回 true,则认为是重复元素,无法添加。

代码实操:HashSet 的常用操作
importjava.util.HashSet;importjava.util.Iterator;importjava.util.Set;publicclassHashSetDemo{publicstaticvoidmain(String[] args){Set<String> hashSet =newHashSet<>();// 1. 添加元素 hashSet.add("Apple"); hashSet.add("Banana"); hashSet.add("Orange"); hashSet.add("Apple");// 重复元素,无法添加 hashSet.add(null);// 可以存储一个nullSystem.out.println("HashSet集合:"+ hashSet);// 输出顺序与插入顺序无关// 2. 遍历集合System.out.println("增强for循环遍历:");for(String s : hashSet){System.out.println(s);}System.out.println("迭代器遍历:");Iterator<String> iterator = hashSet.iterator();while(iterator.hasNext()){System.out.println(iterator.next());}// 3. 判断元素是否存在boolean containsBanana = hashSet.contains("Banana");System.out.println("包含Banana:"+ containsBanana);// 4. 删除元素 hashSet.remove("Orange");System.out.println("删除Orange后的集合:"+ hashSet);// 5. 清空集合 hashSet.clear();System.out.println("集合是否为空:"+ hashSet.isEmpty());}}
性能分析
  • 增删查操作:效率高,时间复杂度为 O(1)
  • 当哈希冲突严重时,性能会下降到 O(n)
    ⚠️ 注意事项:
  1. HashSet线程不安全的集合。
  2. 存储自定义对象时,必须重写 hashCode()equals() 方法,否则无法保证元素唯一。
自定义对象去重案例

我们定义一个 Student 类,重写 hashCode()equals() 方法,实现基于学号的去重。

importjava.util.HashSet;importjava.util.Objects;importjava.util.Set;classStudent{privateString id;privateString name;publicStudent(String id,String name){this.id = id;this.name = name;}// 重写equals方法:根据学号判断是否相同@Overridepublicbooleanequals(Object o){if(this== o)returntrue;if(o ==null||getClass()!= o.getClass())returnfalse;Student student =(Student) o;returnObjects.equals(id, student.id);}// 重写hashCode方法:根据学号计算哈希值@OverridepublicinthashCode(){returnObjects.hash(id);}@OverridepublicStringtoString(){return"Student{id='"+ id +"',+ name +"'}";}}publicclassHashSetCustomObjectDemo{publicstaticvoidmain(String[] args){Set<Student> studentSet =newHashSet<>(); studentSet.add(newStudent("001","张三")); studentSet.add(newStudent("002","李四")); studentSet.add(newStudent("001","张三"));// 重复元素,无法添加for(Student student : studentSet){System.out.println(student);}}}

输出结果

Student{id='001', name='张三'} Student{id='002', name='李四'} 

1.3.3 LinkedHashSet:有序的哈希集合

💡 LinkedHashSetHashSet 的子类,底层是 HashMap + 双向链表
它通过双向链表维护元素的插入顺序,保证遍历顺序和插入顺序一致。
它的元素唯一性原理和 HashSet 相同,性能略低于 HashSet

代码实操:LinkedHashSet 的有序性
importjava.util.LinkedHashSet;importjava.util.Set;publicclassLinkedHashSetDemo{publicstaticvoidmain(String[] args){Set<String> linkedHashSet =newLinkedHashSet<>(); linkedHashSet.add("B"); linkedHashSet.add("A"); linkedHashSet.add("C"); linkedHashSet.add("A");// 重复元素,无法添加// 遍历顺序与插入顺序一致System.out.println("LinkedHashSet集合:"+ linkedHashSet);}}

输出结果

LinkedHashSet集合:[B, A, C] 

✅ 核心结论:需要去重且保留插入顺序时,使用 LinkedHashSet

1.3.4 TreeSet:基于红黑树的排序集合

底层原理

💡 TreeSet 的底层是 TreeMap,基于红黑树实现。
TreeSet 会自动对元素进行排序,默认是升序排列。
它保证元素唯一的原理是:通过比较元素的大小,相同元素无法添加。

排序方式
  1. 自然排序:元素实现 Comparable 接口,重写 compareTo() 方法。
  2. 定制排序:创建 TreeSet 时传入 Comparator 比较器,自定义排序规则。
代码实操1:自然排序
importjava.util.Set;importjava.util.TreeSet;publicclassTreeSetNaturalSortDemo{publicstaticvoidmain(String[] args){Set<Integer> treeSet =newTreeSet<>(); treeSet.add(3); treeSet.add(1); treeSet.add(2); treeSet.add(3);// 重复元素,无法添加// 自动升序排列System.out.println("TreeSet自然排序:"+ treeSet);}}

输出结果

TreeSet自然排序:[1, 2, 3] 
代码实操2:定制排序

我们对字符串进行降序排列,通过 Comparator 实现定制排序。

importjava.util.Comparator;importjava.util.Set;importjava.util.TreeSet;publicclassTreeSetCustomSortDemo{publicstaticvoidmain(String[] args){// 传入比较器,实现字符串降序排列Set<String> treeSet =newTreeSet<>(newComparator<String>(){@Overridepublicintcompare(String o1,String o2){return o2.compareTo(o1);// 降序排列}}); treeSet.add("Java"); treeSet.add("Python"); treeSet.add("Go");System.out.println("TreeSet定制排序:"+ treeSet);}}

输出结果

TreeSet定制排序:[Python, Java, Go] 
性能分析
  • 增删查操作:时间复杂度为 O(log n),效率低于 HashSet。
    ⚠️ 注意事项:
  1. TreeSet线程不安全的集合。
  2. 存储自定义对象时,必须指定排序规则,否则会抛出 ClassCastException

1.4 集合的线程安全问题与解决方案

1.4.1 线程不安全的表现

当多个线程同时操作一个非线程安全的集合时,会出现 ConcurrentModificationException 并发修改异常。
例如,一个线程遍历集合,另一个线程修改集合,就会触发该异常。

1.4.2 解决方案1:使用 Collections 工具类

java.util.Collections 提供了 synchronizedXxx() 方法,可以将非线程安全的集合包装成线程安全的集合。

importjava.util.ArrayList;importjava.util.Collections;importjava.util.List;publicclassCollectionsSynchronizedDemo{publicstaticvoidmain(String[] args){// 将ArrayList包装成线程安全的集合List<String> safeList =Collections.synchronizedList(newArrayList<>()); safeList.add("线程安全元素1"); safeList.add("线程安全元素2");System.out.println("线程安全集合:"+ safeList);}}

1.4.3 解决方案2:使用 JUC 包下的线程安全集合

JUC 包(java.util.concurrent)提供了性能更高的线程安全集合,常用的有:

  • CopyOnWriteArrayList:线程安全的 ArrayList,适合读多写少的场景。
  • CopyOnWriteArraySet:线程安全的 Set,底层是 CopyOnWriteArrayList。
importjava.util.Iterator;importjava.util.concurrent.CopyOnWriteArrayList;publicclassCopyOnWriteArrayListDemo{publicstaticvoidmain(String[] args){CopyOnWriteArrayList<String> cowList =newCopyOnWriteArrayList<>(); cowList.add("元素1"); cowList.add("元素2"); cowList.add("元素3");// 遍历过程中可以修改集合,不会抛出并发修改异常Iterator<String> iterator = cowList.iterator();while(iterator.hasNext()){String s = iterator.next();if(s.equals("元素2")){ cowList.remove(s);}}System.out.println("修改后的集合:"+ cowList);}}

✅ 核心结论:JUC 包下的线程安全集合性能高于 Collections 包装的集合,优先推荐使用。

1.5 实战案例:集合工具类封装

1.5.1 需求分析

💡 封装一个集合工具类 CollectionUtil,提供以下实用功能:

  1. 集合去重:去除 List 中的重复元素,保留插入顺序。
  2. 集合交集:获取两个 List 的共同元素。
  3. 集合差集:获取 List1 中有但 List2 中没有的元素。
  4. 集合排序:对 List 中的自定义对象进行排序。

1.5.2 代码实现

importjava.util.*;importjava.util.stream.Collectors;/** * 集合工具类 */publicclassCollectionUtil{/** * List去重,保留插入顺序 */publicstatic<T>List<T>distinctList(List<T> list){if(list ==null|| list.isEmpty()){returnnewArrayList<>();}returnnewLinkedHashSet<>(list).stream().collect(Collectors.toList());}/** * 获取两个List的交集 */publicstatic<T>List<T>intersection(List<T> list1,List<T> list2){if(list1 ==null|| list1.isEmpty()|| list2 ==null|| list2.isEmpty()){returnnewArrayList<>();}Set<T> set =newHashSet<>(list2);return list1.stream().filter(set::contains).collect(Collectors.toList());}/** * 获取两个List的差集(list1 - list2) */publicstatic<T>List<T>difference(List<T> list1,List<T> list2){if(list1 ==null|| list1.isEmpty()){returnnewArrayList<>();}if(list2 ==null|| list2.isEmpty()){returnnewArrayList<>(list1);}Set<T> set =newHashSet<>(list2);return list1.stream().filter(t ->!set.contains(t)).collect(Collectors.toList());}/** * 对List中的自定义对象进行排序 * @param list 待排序集合 * @param comparator 比较器 */publicstatic<T>voidsortList(List<T> list,Comparator<T> comparator){if(list ==null|| list.isEmpty()|| comparator ==null){return;}Collections.sort(list, comparator);}// 测试方法publicstaticvoidmain(String[] args){// 测试去重List<Integer> list =Arrays.asList(1,2,3,2,1,4);List<Integer> distinctList =distinctList(list);System.out.println("去重后的集合:"+ distinctList);// 测试交集List<Integer> list1 =Arrays.asList(1,2,3,4);List<Integer> list2 =Arrays.asList(3,4,5,6);List<Integer> intersection =intersection(list1, list2);System.out.println("交集:"+ intersection);// 测试差集List<Integer> difference =difference(list1, list2);System.out.println("差集:"+ difference);// 测试自定义对象排序List<Student> studentList =newArrayList<>(); studentList.add(newStudent("003","王五",20)); studentList.add(newStudent("001","张三",18)); studentList.add(newStudent("002","李四",19));// 按年龄升序排序sortList(studentList,Comparator.comparingInt(Student::getAge));System.out.println("按年龄排序后的学生集合:"); studentList.forEach(System.out::println);}}// 学生类classStudent{privateString id;privateString name;privateint age;publicStudent(String id,String name,int age){this.id = id;this.name = name;this.age = age;}publicintgetAge(){return age;}@OverridepublicStringtoString(){return"Student{id='"+ id +"',+ name +"', age="+ age +"}";}}

输出结果

去重后的集合:[1, 2, 3, 4] 交集:[3, 4] 差集:[1, 2] 按年龄排序后的学生集合: Student{id='001', name='张三', age=18} Student{id='002', name='李四', age=19} Student{id='003', name='王五', age=20} 

1.5.3 案例总结

✅ 这个工具类综合运用了 List 和 Set 的核心知识,解决了开发中常见的集合处理问题。
通过 LinkedHashSet 实现去重并保留顺序,通过 HashSet 提升交集和差集的计算效率,通过 Comparator 实现自定义排序。

1.6 本章总结

  1. List 是有序可重复集合,ArrayList 适合查询,LinkedList 适合增删。
  2. Set 是无序不可重复集合,HashSet 效率最高,LinkedHashSet 保留插入顺序,TreeSet 支持排序。
  3. 存储自定义对象时,HashSet 需要重写 hashCode()equals(),TreeSet 需要指定排序规则。
  4. 多线程环境下,优先使用 JUC 包下的 CopyOnWriteArrayListCopyOnWriteArraySet 保证线程安全。
  5. 集合工具类可以封装常用功能,提升开发效率。

Read more

Obsidian资源下载终极提速指南:告别GitHub龟速的3个快速解决方案

还在为Obsidian主题和插件下载速度慢到怀疑人生而烦恼吗?每次从GitHub获取awesome-obsidian项目资源时,那个转圈圈的加载动画是不是让你想砸键盘?本文将分享亲测有效的Obsidian加速下载方法,通过国内镜像站点让你体验飞一般的下载速度! 【免费下载链接】awesome-obsidian🕶️ Awesome stuff for Obsidian 项目地址: https://gitcode.com/gh_mirrors/aw/awesome-obsidian 痛点分析:为什么你的Obsidian资源下载这么慢? 网络瓶颈识别: * GitHub国际带宽限制导致国内访问缓慢 * 网络波动造成频繁中断 * 大文件传输时缺乏稳定的CDN支持 速度对比实测: * 原GitHub地址:平均50KB/s,经常断连 * 国内镜像站点:稳定2-5MB/s,一次成功 三大提速方案深度解析 方案一:GitCode全量镜像(推荐新手) 作为国内最稳定的代码托管平台,GitCode提供了完整的awesome-obsidian项目镜像: # 一键克隆完整项

By Ne0inhk
MiniMax AI 开源 MiniMax-M2.5

MiniMax AI 开源 MiniMax-M2.5

今天我们推出最新模型 MiniMax-M2.5。 该模型在数十万复杂现实场景中通过强化学习进行广泛训练,在编程、智能体工具使用与搜索、办公及一系列高经济价值任务上达到业界顶尖水平,其**SWE-Bench Verified通过率80.2%、Multi-SWE-Bench 51.3%、BrowseComp(含上下文管理)76.3%**的表现尤为亮眼。 经过高效推理与任务分解优化训练,M2.5执行复杂智能体任务时展现惊人速度,完成SWE-Bench Verified评估比M2.1快37%,与Claude Opus 4.6速度持平。 M2.5是首个让用户无需顾虑成本的尖端模型,真正实现"智能廉价如水电"的承诺。以每秒100 token的速度持续运行一小时仅需1美元。若降至每秒50 token,成本可低至0.3美元。我们希望M2.5的速度与成本优势能催生革命性智能体应用。 编程表现 在编程评估中,MiniMax-M2.5相较前代取得显著进步,达到业界顶尖水准。其多语言任务表现尤为突出。

By Ne0inhk
Git-TortoiseGit 小乌龟详细安装使用教程

Git-TortoiseGit 小乌龟详细安装使用教程

0、简介 Git是一款由Linus Torvalds于2005年创建的‌免费、开源、分布式版本控制系统‌,它通过为项目创建一系列‌数据快照‌而非记录文件差异来高效管理代码历史,支持本地独立操作与团队协作,已成为现代软件开发的基石。‌ TortoiseGit 是基于 Git 的 Windows Shell 界面工具,它依赖于已配置的 Git 环境才能运行。因此,在安装 TortoiseGit 之前,需要先安装 Git 工具。 一、下载安装git 1.1进入官网Git - Windows 安装 (git-scm.com) 右边有个下载链接,点击它 以 Windows 64 位系统为例,进行安装使用说明。 1.2 安装 Git 客户端

By Ne0inhk