Python 数据分析入门：基础统计与 Excel 处理 | 极客日志

PythonAI算法

Python 数据分析入门：基础统计与 Excel 处理

Python 数据分析入门教程涵盖环境搭建、基础统计检验及 Excel 数据处理。内容包含 Python 与 PyCharm 安装步骤，利用 SciPy 库进行卡方检验和 T 检验的方法，以及使用 Pandas 读取和分析 Excel 数据的实操示例。适合医疗数据或通用统计分析初学者参考。

ByteFlow发布于 2025/2/6更新于 2026/7/2034 浏览

Python 数据分析入门：基础统计与 Excel 处理

在医疗卫生机构及各类科研场景中，经常需要对大量的数据进行分析和挖掘。Python 具有简洁、高效、易学易用的特点，能够帮助快速处理数据，发现规律并制定相应策略。本文将介绍使用 Python 进行基础医学统计数据分析的简单步骤。

一、Python 与开发环境获取与安装

与 R 语言类似，Python 也有其集成开发环境（IDE），如 PyCharm。PyCharm 提供调试、语法高亮、项目管理、代码跳转、智能提示等功能。此外，Anaconda 是一个流行的 Python 发行版，包含大量科学计算和机器学习模块。

1. 安装 Python

2. 安装 IDE

3. 验证安装

打开 PyCharm，将输入法调整为英文格式，输入第一行代码：

print("Hello World")

点击运行，若输出 Hello World 即代表安装成功。可进行简单运算测试，例如：

a = 3
b = 4
result = a * b
print(result)

出现 "Process finished with exit code 0" 代表代码运行成功。

二、简单的统计分析

Python 的数据分析主要依赖第三方程序包，以 SciPy 库为例。

1. 卡方检验

卡方检验用于计算两种或多种分类变量之间的独立性。我们需要 scipy.stats 中的 chi2_contingency 函数。

from scipy import stats
import numpy as np

# 示例四格表数据
observed = np.array([[50, 30], [20, 40]])
chi2, p, dof, expected = stats.chi2_contingency(observed)

print(f"卡方统计量：{chi2}")
print(f"P 值：{p}")
print(f"自由度：")
()

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

# 生成模拟数据
np.random.seed(42)
group1 = stats.norm.rvs(loc=5.5, scale=1, size=50)
group2 = stats.norm.rvs(loc=4, scale=0.8, size=50)

# 独立样本 t 检验
t_stat, p_val = stats.ttest_ind(group1, group2)
print(f"T 统计量：{t_stat}, P 值：{p_val}")

# 方差齐性检验 (Levene Test)
levene_stat, levene_p = stats.levene(group1, group2)
print(f"方差齐性 P 值：{levene_p}")

import pandas as pd

# 读取 Excel 文件
data = pd.read_excel('data.xlsx')

# 概览数据
print(data.head())
print(data.info())

# 假设数据框中有 'Group' 和 'Outcome' 两列
cross_tab = pd.crosstab(data['Group'], data['Outcome'])
chi2, p, dof, expected = stats.chi2_contingency(cross_tab)

print(f"卡方结果 - P 值：{p}")

# 独立样本 t 检验
t_stat, p_val = stats.ttest_ind(
    data[data['Group'] == 1]['Value'], 
    data[data['Group'] == 2]['Value']
)
print(f"T 检验 P 值：{p_val}")

Python 数据分析入门：基础统计与 Excel 处理

Python 数据分析入门：基础统计与 Excel 处理

一、Python 与开发环境获取与安装

1. 安装 Python

2. 安装 IDE

3. 验证安装

二、简单的统计分析

1. 卡方检验

更多推荐文章

相关免费在线工具

2. T 检验

三、读取分析 Excel 里的数据

1. 读取 Excel

2. 基于 Excel 数据的卡方检验

3. 基于 Excel 数据的 T 检验

四、总结

更多推荐文章

相关免费在线工具

Python 数据分析入门：基础统计与 Excel 处理

Python 数据分析入门：基础统计与 Excel 处理

一、Python 与开发环境获取与安装

1. 安装 Python

2. 安装 IDE

3. 验证安装

二、简单的统计分析

1. 卡方检验

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

2. T 检验

三、读取分析 Excel 里的数据

1. 读取 Excel

2. 基于 Excel 数据的卡方检验

3. 基于 Excel 数据的 T 检验

四、总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具