博客作者

flc

这位作者暂未填写个人简介。

加入于 2026/4/20统计更新于 2026/7/29

179

已发布文章

博客获赞

6.7K

博客浏览

发布的文章

第 2 页

PythonAI算法

Whisper-WebUI 使用指南：本地语音转文字工具部署与配置

Whisper-WebUI 是基于 Gradio 的开源语音识别工具，集成 Whisper 引擎实现音频转文字。支持 Docker 或本地脚本部署，提供 OpenAI Whisper、faster-whisper 等多种引擎选项。具备语音活动检测、背景音乐分离及说话人识别等预处理功能。用户可上传本地文件、YouTube 链接或录音，输出 SRT/WebVTT…

发布于 2026/4/931 浏览0 点赞

PythonAI算法

Whisper 多语言识别数据标注与自定义数据集训练指南

Whisper large-v3 虽支持 99 种语言，但在垂直领域常遇瓶颈。如何构建高质量自定义数据集进行微调。涵盖音频标准化（16kHz 单声道）、JSONL 元数据构建、Hugging Face 微调流程及 WER 评估。重点解决小语种识别不准、专业术语错误等问题，提供从预处理到部署的完整工程化方案，帮助开发者提升特定场景下的语音转录精度。

flc

发布的文章

Whisper-WebUI 使用指南：本地语音转文字工具部署与配置

Whisper 多语言识别数据标注与自定义数据集训练指南

飞书机器人对接 Claude Code 实现移动端 AI 编程助手

F5 刷新后浏览器前端发生了什么：缓存与渲染机制详解

Vue Router 进阶实战：导航守卫、嵌套路由与状态管理

基于 OpenAI Whisper 与 Claude 的播客内容矩阵自动化实战

RuoYi-Vue3 跨平台实践：基于 Electron 的桌面化迁移方案

前端异常捕获与统一格式化：从 console.log 到服务端上报

AI 赋能原则 5 解读：当“最聪明的大脑”也会犯低级错误

Llama-3.2-3B 本地部署实测：中文会议文本摘要压缩与信息保留分析

Google I/O 2025 发布 Stitch：AI 一键生成 UI 与前端代码

AI Agent 安全警示与 Python 开发工具演进

VSCode 集成 GitHub Copilot 快速上手

Microi 吾码开源低代码平台部署与实战指南

ClawdBot 本地化语音转写与多语言翻译端到端实战

AI 小说创作工具对比：炼字工坊、豆包、千问及文心一言实测

AI Agent 生产级框架实战：架构设计与核心实现

vLLM、SGLang 与 llama.cpp 深度对比：大模型推理引擎选型指南

Antigravity 工具实测：集成 Gemini 3 与 Claude 4.5 的 AI 编程 IDE

AI 驱动 Web UI 自动化：Playwright + Robot Framework 实践