LeetCode 692. 前 K 个高频单词 Python 实现 | 极客日志

Python算法

LeetCode 692. 前 K 个高频单词 Python 实现

综述由AI生成LeetCode 692 题要求返回前 K 个高频单词，频率高者在前，同频按字典序排序。提供两种 Python 解决方案：一是哈希表配合自定义排序，逻辑直观但时间复杂度为 O(nlogn)；二是哈希表结合小顶堆，仅维护 K 个元素，时间复杂度优化至 O(nlogk)，适合大数据量场景。重点解析了堆排序中自定义比较类的实现细节及翻转结果的必要性。

颠三倒四发布于 2026/3/24更新于 2026/5/2010 浏览

LeetCode 692. 前 K 个高频单词

给定一个非空的单词列表，返回前 k 个出现频率最高的单词。

要求：

频率高的单词排在前面；
若多个单词频率相同，按字典序升序排列；
保证答案唯一，且 1 ≤ k ≤ 单词列表中不同单词的数量。

示例

输入： words = ["i","love","leetcode","i","love","coding"], k = 2
输出： ["i","love"]
解释： "i" 和 "love" 分别出现 2 次，"i" 字典序小于 "love"，故排在前。

解法一：哈希表 + 自定义排序

思路分析

这个方案最直观。核心步骤其实就三步：统计频率、排序、截取。

统计频率：用哈希表（Python 的 dict）遍历一遍列表，记录每个单词出现的次数。
自定义排序：对哈希表的键值对进行排序。规则是优先按频率降序，频率相同时按单词字典序升序。
截取结果：取排序后的前 k 个单词即可。

代码实现

from typing import List

class Solution:
    def topKFrequent(self, words: List[str], k: int) -> List[str]:
        # 1. 统计每个单词的出现频率
        dictword = {}
        for word in words:
            dictword[word] = dictword.get(word, 0) + 1
        
        # 2. 自定义排序
        # key=lambda x: (-x[1], x[0])
        # -x[1]：按频率降序（负号实现降序）
        # x[0]：频率相同时按单词字典序升序
        dictword_sorted = sorted(dictword.items(), key=lambda x: (-x[1], x[0]))
        
        # 3. 截取前 k 个单词，组装结果列表
        res = []
         key, val  dictword_sorted[:k]:
            res.append(key)
         res

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online
Markdown转HTML
将 Markdown（GFM）转为 HTML 片段，浏览器内 marked 解析；与 HTML转Markdown 互为补充。在线工具，Markdown转HTML在线工具，online

import heapq
from typing import List

class Solution:
    class Node:
        def __init__(self, key, val):
            self.key = key      # 单词
            self.value = val    # 出现频率
        
        # 核心：自定义小于（__lt__）规则，适配小顶堆的排序逻辑
        def __lt__(self, other):
            # 规则 1：频率相同 → 字典序大的单词'更小'（优先被弹出）
            if self.value == other.value:
                return self.key > other.key
            # 规则 2：频率不同 → 频率小的单词'更小'（优先被弹出）
            else:
                return self.value < other.value

    def topKFrequent(self, words: List[str], k: int) -> List[str]:
        # 1. 统计频率
        mapping = {}
        for word in words:
            mapping[word] = mapping.get(word, 0) + 1
        
        # 2. 初始化小顶堆
        heap = []
        for key, val in mapping.items():
            heapq.heappush(heap, self.Node(key, val))
            # 保持堆大小为 k，超过则弹出'最小'的元素
            if len(heap) > k:
                heapq.heappop(heap)
        
        # 3. 提取并反转
        res = []
        while len(heap) > 0:
            temp = heapq.heappop(heap)
            res.append(temp.key)
        
        # 堆弹出顺序是小→大，需要反转得到大→小
        res.reverse()
        return res

LeetCode 692. 前 K 个高频单词 Python 实现

LeetCode 692. 前 K 个高频单词

示例

解法一：哈希表 + 自定义排序

思路分析

代码实现

更多推荐文章

相关免费在线工具

核心解析

解法二：哈希表 + 小顶堆

思路分析

代码实现

难点说明

复杂度对比

总结

更多推荐文章

相关免费在线工具

LeetCode 692. 前 K 个高频单词 Python 实现

LeetCode 692. 前 K 个高频单词

示例

解法一：哈希表 + 自定义排序

思路分析

代码实现

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

核心解析

解法二：哈希表 + 小顶堆

思路分析

代码实现

难点说明

复杂度对比

总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具