py-xiaozhi:Python 语音客户端本地部署与配置指南
py-xiaozhi 是一款基于 Python 开发的小智 AI 客户端,专为没有硬件设备却想体验智能语音交互的用户设计。通过本地部署和个性化配置,你可以快速搭建属于自己的智能语音助手系统,实现语音控制、设备管理等多种功能。本文将带你从环境准备到高级配置,一步步掌握这款工具的使用方法。
核心功能
py-xiaozhi 整合了多项实用功能:
- 语音交互系统:支持语音唤醒和自然对话
- 多设备管理:控制各类智能设备
- 音频处理中心:提供专业级音效优化和回声消除
- MCP 服务集成:连接丰富的第三方服务生态
环境部署准备
安装基础依赖
确保系统已安装 Python 3.8+ 环境,然后执行以下命令克隆项目并安装依赖:
# 克隆项目仓库
git clone https://gitcode.com/gh_mirrors/py/py-xiaozhi
# 进入项目目录
cd py-xiaozhi
# 安装核心依赖
pip install -r requirements.txt
如果是 macOS 系统,请使用 requirements_mac.txt 文件安装依赖:
pip install -r requirements_mac.txt
配置系统权限
语音应用需要访问麦克风和扬声器,执行以下脚本授权:
# 为 Python 授予必要的系统访问权限
chmod +x authorize_python_access.sh
./authorize_python_access.sh
在 Linux 系统中,可能需要额外安装脉冲音频库:sudo apt-get install pulseaudio
验证依赖完整性
运行检查脚本确保所有依赖库正确加载:
# 检查 opus 音频编解码器
chmod +x check_opus.sh
./check_opus.sh
如果看到 "Opus codec loaded successfully" 提示,说明环境准备就绪!
快速启动流程
首次启动应用
在项目根目录执行主程序:
python main.py
首次启动时,应用会自动创建默认配置文件并显示初始化向导。
完成基础设置
根据向导提示完成:
- 选择音频输入设备(麦克风)
- 选择音频输出设备(扬声器)
- 设置唤醒词(默认为"你好小智")
- 配置网络连接
验证核心功能
启动成功后,你可以:
- 点击"按住后说话"按钮进行语音命令
- 尝试说"你好小智,今天天气怎么样"测试基础交互
- 通过"手动对话"输入文本命令

