Python 数据科学基础：NumPy 入门详细教程 | 极客日志

PythonAI算法

Python 数据科学基础：NumPy 入门详细教程

综述由AI生成NumPy 是 Python 数据科学的核心库，提供高效的多维数组对象和数学函数。系统梳理了 NumPy 的基础用法，包括数组创建、增删改查、变形拼接、统计计算、视图与拷贝机制、随机数生成及线性代数运算。重点解析了 axis 参数含义与广播机制原理，辅以代码示例帮助初学者快速掌握数值计算核心技能。

蓝绿部署发布于 2025/2/6更新于 2026/6/920 浏览

Python 数据科学基础：NumPy 入门详细教程

前言

Python 数据科学基础库主要是三剑客：NumPy、Pandas 以及 Matplotlib。每个库都集成了大量的方法接口，配合使用功能强大。平时虽然一直在用，也看过很多教程，但纸上得来终觉浅，还是需要自己系统梳理总结才能印象深刻。本篇先从 NumPy 开始，对 NumPy 常用的方法进行思维导图式梳理，多数方法仅拉单列表，部分接口辅以解释说明及代码案例。

NumPy：Numerical Python 缩写，提供了底层基于 C 语言实现的数值计算库。与 Python 内置的 list 和 array 数据结构相比，其支持更加规范的数据类型和极其丰富的操作接口，速度也更快。
NumPy 的两个重要对象是 ndarray 和 ufunc。其中前者是数据结构的基础，后者是接口方法的基础。
Ufunc（通用函数）：其意义是可以像执行标量运算一样执行数组运算，本质即是通过隐式的循环对各个位置依次进行标量运算。只不过这里的隐式循环交由底层 C 语言实现，因此相比直接用 Python 循环实现，ufunc 语法更为简洁、效率更为高效。
索引、迭代和切片操作方式与普通列表比较类似，但是支持更为强大的 bool 索引。

这部分内容比较基础，仅补充一个个人认为比较有用的 ufunc 加聚合的例子。ufunc 本身属于方法（方法即是类内的函数接口），ufunc 之上还支持 4 个方法：

reduce：聚合方法
accumulate：累计聚合
reduceat：按指定轴向、指定切片聚合
outer：外积

当然，后两个用处较少也不易理解，前两个在有些场景下则比较有用：

import numpy as np

arr = np.array([1, 2, 3, 4])
print(np.add.reduce(arr))        # 输出：10 (1+2+3+4)
print(np.add.accumulate(arr))    # 输出：[1 3 6 10]

01 数组创建

NumPy 中支持 5 类创建数组的方式：

1. 从普通数据结构创建

如列表、元组等。

list_data = [1, 2, 3]
tuple_data = (4, 5, 6)
arr1 = np.array(list_data)
arr2 = np.array(tuple_data)
print(arr1)  # [1 2 3]

2. 从特定的 array 结构创建

支持大量方法，例如 ones、zeros、empty 等等。

empty：接收指定大小创建空数组，这里空数组的意义在于未进行数值初始赋值，随机产生，因而速度要更快一些。

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

ones_arr = np.ones((2, 3))      # 全 1 数组
zeros_arr = np.zeros((2, 3))    # 全 0 数组
empty_arr = np.empty((2, 3))    # 空数组（未初始化）
linspace_arr = np.linspace(0, 10, 5)  # 0 到 10 之间均匀分布 5 个数
arange_arr = np.arange(0, 10, 2)      # 0 到 10 步长为 2

# np.loadtxt('data.txt')
# np.save('data.npy', arr)

arr = np.array([[1, 2], [3, 4]])

# append: 沿 axis=1 追加
appended = np.append(arr, [[5, 6]], axis=1)
print(appended)

# insert: 在 axis=0 的第 1 行插入
inserted = np.insert(arr, 1, [7, 8], axis=0)
print(inserted)

# delete: 删除 axis=1 的第 0 列
deleted = np.delete(arr, 0, axis=1)
print(deleted)

arr = np.arange(6)
reshaped = arr.reshape(2, 3)
print(reshaped)

arr = np.array([1, 2, 3])
resized = np.resize(arr, (2, 3))  # 会自动填充重复元素
print(resized)

arr = np.array([[1, 2], [3, 4]])
print(arr.ravel())       # 返回数组
print(type(arr.flat))    # 返回迭代器

arr = np.array([[1, 2], [3, 4]])
print(arr.T)
print(arr.transpose())

arr = np.array([1, 2])
print(np.tile(arr, 2))   # [1 2 1 2]
print(np.repeat(arr, 2)) # [1 1 2 2]

a = np.array([[1, 2], [3, 4]])
b = np.array([[5, 6]])
result = np.concatenate((a, b), axis=0)
print(result)

a = np.array([1, 2, 3])
b = np.array([4, 5, 6])
print(np.hstack((a, b)))     # 水平
print(np.vstack((a, b)))     # 垂直
print(np.stack((a, b)))      # 升维

arr = np.arange(9).reshape(3, 3)
print(np.hsplit(arr, 3))     # 水平切分为 3 份
print(np.vsplit(arr, 3))     # 垂直切分为 3 份

arr = np.array([[1, 2, 3], [4, 5, 6]])
print(np.mean(arr, axis=1))  # 每行的均值
print(np.sort(arr, axis=0))  # 每列排序

a = np.array([1, 2, 3])
b = a          # 引用
b_view = a.view()
b_copy = a.copy()

b[0] = 100
print(a)       # [100  2  3] (a 变了)
print(b_view)  # [100  2  3] (b_view 变了)
print(b_copy)  # [1 2 3] (b_copy 没变)

arr = np.array([1, 2, 3])
print(arr[np.newaxis, :].shape)  # (1, 3)
print(arr[:, np.newaxis].shape)  # (3, 1)

print(np.random.rand(2, 2))      # 0-1 均匀分布
print(np.random.uniform(0, 10))  # 0-10 均匀分布
print(np.random.randint(0, 10))  # 0-10 整数

print(np.random.randn(2, 2))     # 标准正态分布
print(np.random.normal(loc=5, scale=2)) # 均值 5，标准差 2

np.random.seed(42)
print(np.random.rand())  # 固定种子后结果可复现

a = np.array([1, 2, 3])
b = np.array([4, 5, 6])
print(np.dot(a, b))      # 点积
print(np.linalg.det(np.eye(3))) # 行列式

a = np.array([[1, 2, 3], [4, 5, 6]])
b = np.array([10, 20, 30])
print(a + b)  # b 会被广播到与 a 相同的形状

a = np.array([[1, 2], [3, 4]])
b = np.array([1, 2, 3])
# print(a + b)  # 会抛出 ValueError

Python 数据科学基础：NumPy 入门详细教程

Python 数据科学基础：NumPy 入门详细教程

前言

01 数组创建

1. 从普通数据结构创建

2. 从特定的 array 结构创建

更多推荐文章

相关免费在线工具

3. 从磁盘读取特定的文件格式

4. 从缓存或字符读入数组

5. 从特定的库函数创建

02 数组增删

03 数组变形

1. reshape

2. resize

3. ravel 和 flat

4. transpose 与 T

5. tile 和 repeat

04 数组拼接

1. concatenate

2. stack 系列

3. 魔法方法

05 数组切分

06 基本统计量

07 视图与拷贝

08 特殊常量

09 随机数包

1. 均匀分布

2. 正态分布

3. 排列与种子

10 线性代数包

11 关于 axis 的理解

12 关于广播机制

结语

更多推荐文章

相关免费在线工具

Python 数据科学基础：NumPy 入门详细教程

Python 数据科学基础：NumPy 入门详细教程

前言

01 数组创建

1. 从普通数据结构创建

2. 从特定的 array 结构创建

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

3. 从磁盘读取特定的文件格式

4. 从缓存或字符读入数组

5. 从特定的库函数创建

02 数组增删

03 数组变形

1. reshape

2. resize

3. ravel 和 flat

4. transpose 与 T

5. tile 和 repeat

04 数组拼接

1. concatenate

2. stack 系列

3. 魔法方法

05 数组切分

06 基本统计量

07 视图与拷贝

08 特殊常量

09 随机数包

1. 均匀分布

2. 正态分布

3. 排列与种子

10 线性代数包

11 关于 axis 的理解

12 关于广播机制

结语

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具