1、基础实现:纯 TXT 文本内容总结
最开始的核心需求是对语音转写的文本做 AI 总结,先从最简单的TXT 文本读取 + AI 总结入手,实现基础逻辑:
- 直接读取本地 TXT 格式的语音转写文本,加载全部文本内容
- 调用通义千问 AI 接口,传入 prompt 要求提炼核心知识点、去除口语化内容
- 控制台直接输出总结结果,完成最基础的文本总结功能
核心逻辑代码(极简版):
import openai
# AI 配置
client = openai.OpenAI(api_key="你的密钥", base_url="https://dashscope.aliyuncs.com/compatible-mode/v1")
# 读取 TXT 文本
with open("transcript.txt", "r", encoding="utf-8") as f:
content = f.read()
# AI 总结
prompt = f"总结以下语音转写内容,分点提炼核心:\n{content}"
res = client.chat.completions.create(model="deepseek-v3", messages=[{"role":"user","content":prompt}])
print(res.choices[0].message.content)
这一步完成了文本总结的核心功能验证,但 TXT 格式无法存储语音转写的时间、角色等附加信息,实用性有限。
2、优化升级:CSV 格式语音转写数据总结
实际语音转写导出的文件为CSV 格式,包含时间、角色、内容三列,TXT 方案无法适配,因此优化为 CSV 专属总结方案:
- 使用
pandas读取 CSV 文件,适配中文列名内容,精准提取语音转写文本 - 过滤空值、拼接有效文本,避免无效内容干扰 AI 总结
- 保留原有的 AI 总结逻辑,仅替换文本读取方式,适配结构化数据
核心优化点:
- 兼容语音转写 CSV 的列名(新增
内容列匹配) - 批量处理多行转写文本,自动拼接成完整内容
- 数据更规范,可拓展性更强(后续可筛选角色、时间段)
优化后 CSV 读取核心代码:
import pandas as pd
# 读取 CSV,提取内容列
df = pd.read_csv("test_processed_sentences.csv", encoding="utf-8")
# 匹配语音转写的文本列
text_col =
transcript = .join(df[text_col].dropna().astype())

