py-xiaozhi Python 语音客户端本地部署与配置指南 | 极客日志

PythonAI

py-xiaozhi Python 语音客户端本地部署与配置指南

py-xiaozhi 是一款基于 Python 的本地语音交互客户端。详细阐述了从环境搭建、依赖安装到系统权限配置的全过程。内容涵盖音频设备选择、唤醒词设置、MQTT 网络集成及项目目录结构解析。此外，针对麦克风无法访问、唤醒无响应、多设备不同步等常见问题提供了具体的排查步骤与解决方案，帮助用户快速实现智能语音助手的本地化部署与个性化定制。

橘子海发布于 2026/3/30更新于 2026/7/2040 浏览

py-xiaozhi：Python 语音客户端本地部署与配置指南

py-xiaozhi 是一款基于 Python 开发的小智 AI 客户端，专为没有硬件设备却想体验智能语音交互的用户设计。通过本地部署和个性化配置，你可以快速搭建属于自己的智能语音助手系统，实现语音控制、设备管理等多种功能。本文将带你从环境准备到高级配置，一步步掌握这款工具的使用方法。

核心功能

py-xiaozhi 整合了多项实用功能：

语音交互系统：支持语音唤醒和自然对话
多设备管理：控制各类智能设备
音频处理中心：提供专业级音效优化和回声消除
MCP 服务集成：连接丰富的第三方服务生态

环境部署准备

安装基础依赖

确保系统已安装 Python 3.8+ 环境，然后执行以下命令克隆项目并安装依赖：

# 克隆项目仓库
git clone https://gitcode.com/gh_mirrors/py/py-xiaozhi
# 进入项目目录
cd py-xiaozhi
# 安装核心依赖
pip install -r requirements.txt

如果是 macOS 系统，请使用 requirements_mac.txt 文件安装依赖：

pip install -r requirements_mac.txt

配置系统权限

语音应用需要访问麦克风和扬声器，执行以下脚本授权：

# 为 Python 授予必要的系统访问权限
chmod +x authorize_python_access.sh
./authorize_python_access.sh

在 Linux 系统中，可能需要额外安装脉冲音频库：sudo apt-get install pulseaudio

验证依赖完整性

运行检查脚本确保所有依赖库正确加载：

# 检查 opus 音频编解码器
chmod +x check_opus.sh
./check_opus.sh

如果看到 "Opus codec loaded successfully" 提示，说明环境准备就绪！

快速启动流程

首次启动应用

在项目根目录执行主程序：

python main.py

首次启动时，应用会自动创建默认配置文件并显示初始化向导。

完成基础设置

根据向导提示完成：

选择音频输入设备（麦克风）
选择音频输出设备（扬声器）
设置唤醒词（默认为"你好小智"）
配置网络连接

验证核心功能

启动成功后，你可以：

点击"按住后说话"按钮进行语音命令
尝试说"你好小智，今天天气怎么样"测试基础交互
通过"手动对话"输入文本命令

定制专属配置方案

相关免费在线工具

RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online

# 音频配置示例（带详细注释）
AUDIO_CONFIG = {
    # 采样率：音频信号的"帧率"，越高音质越好但资源消耗越大
    "sample_rate": 16000,
    # 唤醒词灵敏度：0-1 之间，越高越灵敏但可能误触发
    "wake_word_sensitivity": 0.8,
    # 回声消除开关：是否启用背景噪音过滤
    "echo_cancellation": True,
    # 语音超时时间：无操作后自动退出对话模式（秒）
    "speech_timeout": 5
}

# 调整特定设备音量示例
from src.utils.volume_controller import VolumeController
# 创建音量控制器实例
vc = VolumeController()
# 设置"卧室扬声器"音量为 70%
vc.set_device_volume("卧室扬声器", 70)

# MQTT 服务器配置
MQTT_CONFIG = {
    "host": "your_mqtt_server_ip", # MQTT 服务器地址
    "port": 1883, # MQTT 端口
    "username": "your_username", # 认证用户名
    "password": "your_password", # 认证密码
    "keepalive": 60 # 心跳间隔（秒）
}

py-xiaozhi Python 语音客户端本地部署与配置指南

py-xiaozhi：Python 语音客户端本地部署与配置指南

核心功能

环境部署准备

安装基础依赖

配置系统权限

验证依赖完整性

快速启动流程

首次启动应用

完成基础设置

验证核心功能

定制专属配置方案

更多推荐文章

相关免费在线工具

理解配置文件结构

多设备音频配置

高级网络配置

目录结构速查

核心功能目录

资源与配置目录

扩展功能目录

常见问题解决

问题 1：麦克风无法访问

问题 2：唤醒词无响应

问题 3：多设备音频不同步

问题 4：应用启动后闪退

问题 5：语音识别准确率低

更多推荐文章

相关免费在线工具

py-xiaozhi Python 语音客户端本地部署与配置指南

py-xiaozhi：Python 语音客户端本地部署与配置指南

核心功能

环境部署准备

安装基础依赖

配置系统权限

验证依赖完整性

快速启动流程

首次启动应用

完成基础设置

验证核心功能

定制专属配置方案

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

理解配置文件结构

多设备音频配置

高级网络配置

目录结构速查

核心功能目录

资源与配置目录

扩展功能目录

常见问题解决

问题 1：麦克风无法访问

问题 2：唤醒词无响应

问题 3：多设备音频不同步

问题 4：应用启动后闪退

问题 5：语音识别准确率低

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具