Excel 去重实战：Python 脚本与 VBA 方案对比 | 极客日志

Python算法

Excel 去重实战：Python 脚本与 VBA 方案对比

Excel 去重是数据处理中的常见痛点，提供两种解决方案。方案一基于 Python 配合 Free Spire.XLS 库，适合批量处理多文件及自动化场景，通过逆序遍历与集合去重逻辑实现高效清洗；方案二利用 Excel 内置 VBA 脚本，无需额外安装，适合单文件快速操作，借助字典对象优化判重性能。两者均保留了原始格式与公式，可根据实际需求灵活选用。

开源信徒发布于 2026/3/15更新于 2026/7/1932 浏览

处理 Excel 数据时，重复行不仅会膨胀文件体积，更可能干扰后续的统计与分析结果。面对这一高频痛点，这里分享两套高效方案：一套基于 Python 实现批量自动化，另一套利用 Excel 内置 VBA 进行轻量级操作。你可以根据实际场景选择最合适的路径。

方案对比与选型

特性	Python (Free Spire.XLS)	Excel VBA
操作环境	需安装 Python + Spire.XLS 库	无需额外安装，Excel 原生支持
适用场景	批量处理多文件、跨平台任务	单个文件快速处理、办公场景
格式兼容性	保留 Excel 原生格式、公式、样式	完全原生操作，格式无损耗
学习成本	入门级 Python 语法，代码可复用	简单 VBA 语法，仅需掌握核心判重逻辑
自动化能力	可集成到批量脚本、定时任务	仅在 Excel 内运行，适合单次操作

方案一：Python 自动化处理

Free Spire.XLS for Python 是一款无需安装 Microsoft Excel 即可操作文件的免费库，特别适合需要批量处理多个文件或集成到自动化流程的场景。

1. 环境准备

首先通过 pip 安装依赖库：

pip install Spire.Xls.Free

注：免费版有特定功能限制，具体请参考官方文档说明。

2. 完整代码实现

from spire.xls import *

# 创建 Workbook 实例
workbook = Workbook()
workbook.LoadFromFile("duplicates.xlsx")
sheet = workbook.Worksheets[0]

# 配置关键参数
key_column = 1  # A 列（Spire.XLS 中列号从 1 开始）
last_row = sheet.LastRow

# 定义要处理的范围
data_range = sheet.Range[f"A1:A{last_row}"]

# 用于跟踪已出现的值（去重核心）
seen_values = set()
rows_to_remove = []

# 获取总行数
row_count = data_range.Rows.Length

# 核心逻辑：从最后一行向前遍历
for i in range(row_count, 0, -1):
    # 获取单元格值并标准化
    cell = data_range[i, key_column]
    cell_value = (cell.DisplayedText).strip()
    
    
      cell_value  cell_value  seen_values:
        rows_to_remove.append(i)
    :
        seen_values.add(cell_value)


 row  rows_to_remove:
    sheet.DeleteRow(row)


workbook.SaveToFile(, ExcelVersion.Version2016)
workbook.Dispose()

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online
Markdown转HTML
将 Markdown（GFM）转为 HTML 片段，浏览器内 marked 解析；与 HTML转Markdown 互为补充。在线工具，Markdown转HTML在线工具，online

Sub VBA_RemoveDuplicates_SpecCol() 
    Dim ws As Worksheet 
    Dim lastRow As Long 
    Dim dict As Object 
    Dim targetCol As String 
    Dim cellVal As String 
    Dim i As Long 
    
    ' 指定判重列（如 "A" 列）
    targetCol = "A"
    Set ws = ActiveSheet
    Set dict = CreateObject("Scripting.Dictionary")
    lastRow = ws.UsedRange.Rows.Count
    
    If lastRow < 2 Then
        MsgBox "数据不足！", vbInfo
        Exit Sub
    End If
    
    ' 倒序遍历，仅按指定列判重
    For i = lastRow To 2 Step -1
        cellVal = IIf(IsEmpty(ws.Cells(i, targetCol).Value), "", ws.Cells(i, targetCol).Value)
        If dict.Exists(cellVal) Then
            ws.Rows(i).Delete
        Else
            dict.Add cellVal, i
        End If
    Next i
    
    Set dict = Nothing
    Set ws = Nothing
    MsgBox "按" & targetCol & "列去重完成！", vbInfo
End Sub

Excel 去重实战：Python 脚本与 VBA 方案对比

方案对比与选型

方案一：Python 自动化处理

1. 环境准备

2. 完整代码实现

更多推荐文章

相关免费在线工具

3. 代码关键点解析

方案二：VBA 脚本原生操作

1. 准备工作

2. 完整 VBA 代码

3. 代码关键点解析

更多推荐文章

相关免费在线工具

Excel 去重实战：Python 脚本与 VBA 方案对比

方案对比与选型

方案一：Python 自动化处理

1. 环境准备

2. 完整代码实现

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

3. 代码关键点解析

方案二：VBA 脚本原生操作

1. 准备工作

2. 完整 VBA 代码

3. 代码关键点解析

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具