Python 数据分析：Numpy 的 6 种高效函数 | 极客日志

PythonAI算法

Python 数据分析：Numpy 的 6 种高效函数

NumPy 库中六种高效函数的使用方法与适用场景。包括 argpartition 用于快速查找极值索引，allclose 用于浮点数近似比较，clip 用于限制数值区间，extract 用于基于布尔掩码提取元素，where 用于条件选择与替换，percentile 用于计算百分位数。文章提供了详细的代码示例和参数说明，旨在帮助开发者优化数据处理流程，提升代码执行效率与可读性。

未来可期发布于 2025/2/7更新于 2026/7/2039 浏览

Python 数据分析：Numpy 的 6 种高效函数

NumPy（Numerical Python）是 Python 环境下用于科学计算的核心扩展库。它支持大量的维度数组与矩阵运算，并提供大量高阶数学函数。在日常的数据分析、机器学习及工程计算中，NumPy 发挥着至关重要的作用。如果没有 NumPy 的支持，许多高性能数据处理任务将变得异常困难且效率低下。

为了提升数据处理的速度和便捷性，掌握 NumPy 中的高效函数至关重要。本文将详细介绍 6 种常用的高效函数，帮助开发者优化代码逻辑并提升执行效率。

1. argpartition()：快速查找最大/最小值索引

argpartition() 函数用于找出数组中 N 个最大或最小数值的索引位置。与完全排序相比，它的优势在于时间复杂度更低，因为它只保证分区内的元素有序，而不需要全局排序。

应用场景： 当只需要获取前 K 大或前 K 小的数据索引，而不需要对整个数组进行排序时，使用此函数性能最佳。

import numpy as np

x = np.array([12, 10, 12, 0, 6, 8, 9, 1, 16, 4, 6, 0])
# 找出最后 4 个元素的索引（即最大的 4 个）
index_val = np.argpartition(x, -4)[-4:]
print("Top 4 indices:", index_val)

# 根据索引获取对应的数值并排序
sorted_values = np.sort(x[index_val])
print("Sorted values:", sorted_values)

输出示例：

Top 4 indices: [1 8 2 0]
Sorted values: [10 12 12 16]

2. allclose()：浮点数近似比较

allclose() 用于判断两个数组是否在容差范围内相等。由于浮点数运算存在精度误差，直接使用 == 比较往往不可靠。该函数通过相对容差（rtol）和绝对容差（atol）来检查两个数组是否相似。

参数说明：

a, b: 待比较的两个数组。
rtol: 相对容差，默认为 1e-05。
atol: 绝对容差，默认为 1e-08。

应用场景： 适用于验证算法结果的一致性，特别是在涉及浮点运算的迭代过程中。

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

array1 = np.array([0.12, 0.17, 0.24, 0.29])
array2 = np.array([0.13, 0.19, 0.26, 0.31])

# 设置容差为 0.1，如果差异在范围内则返回 True
result = np.allclose(array1, array2, rtol=0.1)
print("Result with tolerance 0.1:", result)

# 设置容差为 0.2
result2 = np.allclose(array1, array2, rtol=0.2)
print("Result with tolerance 0.2:", result2)

x = np.array([3, 17, 14, 23, 2, 2, 6, 8, 1, 2, 16, 0])
# 将数值限制在 [2, 5] 之间
clipped_x = np.clip(x, 2, 5)
print("Clipped array:", clipped_x)

Clipped array: [3 5 5 5 2 2 5 5 2 2 5 2]

# 生成随机整数数组
array = np.random.randint(20, size=12)
print("Original array:", array)

# 定义条件：除以 2 余数为 1（即奇数）
cond = np.mod(array, 2) == 1
print("Condition mask:", cond)

# 提取满足条件的值
extracted = np.extract(cond, array)
print("Extracted values:", extracted)

# 直接应用复杂条件：小于 3 或大于 15
complex_cond = ((array < 3) | (array > 15))
print("Complex extraction:", np.extract(complex_cond, array))

y = np.array([1, 5, 6, 8, 1, 7, 3, 6, 9])

# 返回大于 5 的元素的索引位置
indices = np.where(y > 5)
print("Indices > 5:", indices[0])

# 根据条件返回不同字符串：大于 5 为 "Hit"，否则为 "Miss"
result = np.where(y > 5, "Hit", "Miss")
print("Conditional replacement:", result)

a = np.array([1, 5, 6, 8, 1, 7, 3, 6, 9])
# 计算 50 百分位数（中位数）
p50 = np.percentile(a, 50, axis=0)
print(f"50th Percentile of a: {p50}")

# 多维数组示例
b = np.array([[10, 7, 4], [3, 2, 1]])
# 计算第 30 百分位数，沿第 0 轴（行方向）
p30 = np.percentile(b, 30, axis=0)
print(f"30th Percentile of b: {p30}")

Python 数据分析：Numpy 的 6 种高效函数

Python 数据分析：Numpy 的 6 种高效函数

1. argpartition()：快速查找最大/最小值索引

2. allclose()：浮点数近似比较

更多推荐文章

相关免费在线工具

3. clip()：数值区间限制

4. extract()：条件提取元素

5. where()：条件选择与替换

6. percentile()：百分位数计算

总结

更多推荐文章

相关免费在线工具

Python 数据分析：Numpy 的 6 种高效函数

Python 数据分析：Numpy 的 6 种高效函数

1. argpartition()：快速查找最大/最小值索引

2. allclose()：浮点数近似比较

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

3. clip()：数值区间限制

4. extract()：条件提取元素

5. where()：条件选择与替换

6. percentile()：百分位数计算

总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具