Python 文字转语音：使用 pyttsx3 实现文本朗读与避坑指南 | 极客日志

PythonAI

Python 文字转语音：使用 pyttsx3 实现文本朗读与避坑指南

介绍如何使用 Python 库 pyttsx3 实现离线文本转语音功能。内容包括环境安装、基础代码示例、音频文件保存方法以及服务器端无扬声器时的解决方案。此外还提供了缓存机制以避免重复合成消耗资源，并列举了不同操作系统下中文语音包的配置问题及排查步骤。

魔尊发布于 2026/3/28更新于 2026/7/2054 浏览

Python 文字转语音：使用 pyttsx3 实现文本朗读与避坑指南

pyttsx3 是一个跨平台的文字转语音（TTS）库，支持 Windows、macOS、Linux。它直接调用系统自带的语音引擎，不需要网络，也不需要申请 API 密钥，完全离线使用。

特点：

简单易用，几行代码就能朗读文本。
可调节语速、音量，选择不同的语音（比如中文、英文）。
支持将语音保存为音频文件（.wav）。

1. 环境准备

首先确保你的电脑已经安装了 Python（推荐 3.6 及以上版本）。然后用 pip 安装 pyttsx3：

pip install pyttsx3

安装完成后，你就可以开始写代码了。

2. 基础代码：让电脑开口说话

下面是一个最简示例，朗读一句中英文混合的话。

import pyttsx3

def text_to_speech(text, rate=160, volume=1.0):
    # 初始化引擎
    engine = pyttsx3.init()
    # 设置语速 (默认 200，建议 120-180)
    engine.setProperty('rate', rate)
    # 设置音量 (0.0~1.0)
    engine.setProperty('volume', volume)
    # 设置中文语音（需要系统已安装中文语音包）
    voices = engine.getProperty('voices')
    for voice in voices:
        if "chinese" in voice.name.lower():
            # 根据系统语音名称匹配
            engine.setProperty('voice', voice.id)
            break
    # 播报文本
    engine.say(text)
    engine.runAndWait()

# 使用示例
text_to_speech("hello world，欢迎使用 pyttsx3！")

运行这段代码，如果你的电脑有扬声器，就能听到语音了。

代码解释

pyttsx3.init()：初始化语音引擎。
setProperty('rate', ...)：设置语速，数值越大越快，一般 120~180 比较自然。
setProperty('volume', ...)：音量，范围 0.0~1.0。
getProperty('voices')：获取系统所有可用的语音。我们遍历找到包含'chinese'的语音，设为中文发音。如果找不到，就会用默认语音（通常是英文），读中文会很不自然。

相关免费在线工具

RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online

import pyttsx3

def text_to_speech_file(text, filename='output.wav', rate=160, volume=1.0):
    engine = pyttsx3.init()
    engine.setProperty('rate', rate)
    engine.setProperty('volume', volume)
    # 设置中文语音
    voices = engine.getProperty('voices')
    for voice in voices:
        if "chinese" in voice.name.lower():
            engine.setProperty('voice', voice.id)
            break
    # 保存到文件
    engine.save_to_file(text, filename)
    engine.runAndWait()
    print(f"音频已保存到 {filename}")

# 使用示例
text_to_speech_file("这是一段保存成文件的语音。", "test.wav")

import os
import hashlib

def text_to_speech_cached(text, cache_dir='tts_cache'):
    # 创建缓存目录
    os.makedirs(cache_dir, exist_ok=True)
    # 根据文本生成文件名（哈希）
    hash_value = hashlib.md5(text.encode('utf-8')).hexdigest()
    filename = os.path.join(cache_dir, f'{hash_value}.wav')
    if os.path.exists(filename):
        print("使用缓存的音频文件")
        return filename
    else:
        print("合成新的音频文件")
        text_to_speech_file(text, filename)
        return filename

# 使用示例
file1 = text_to_speech_cached("你好，欢迎光临")
file2 = text_to_speech_cached("你好，欢迎光临")
# 第二次直接返回缓存文件

engine = pyttsx3.init()
voices = engine.getProperty('voices')
for v in voices:
    print(v.name, v.id)

Python 文字转语音：使用 pyttsx3 实现文本朗读与避坑指南

Python 文字转语音：使用 pyttsx3 实现文本朗读与避坑指南

1. 环境准备

2. 基础代码：让电脑开口说话

代码解释

更多推荐文章

相关免费在线工具

3. 进阶功能：保存为音频文件

4. 避坑指南（非常重要！）

4.1 必须有扬声器/功放才能听到声音？

4.2 Linux / Windows Server 无法直接播放怎么办？

4.3 相同文字重复合成浪费资源

4.4 中文语音包问题

5. 总结

更多推荐文章

相关免费在线工具

Python 文字转语音：使用 pyttsx3 实现文本朗读与避坑指南

Python 文字转语音：使用 pyttsx3 实现文本朗读与避坑指南

1. 环境准备

2. 基础代码：让电脑开口说话

代码解释

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

3. 进阶功能：保存为音频文件

4. 避坑指南（非常重要！）

4.1 必须有扬声器/功放才能听到声音？

4.2 Linux / Windows Server 无法直接播放怎么办？

4.3 相同文字重复合成浪费资源

4.4 中文语音包问题

5. 总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具