前言
CapsWriter-Offline 是一款语音转文字工具,支持本地及远程部署。本文将介绍如何在 Windows 系统中安装并使用该工具,包括本地测试与通过内网穿透实现异地远程访问的配置方法。
CapsWriter-Offline 是一款语音转文字工具,支持本地及远程部署。安装需下载客户端与模型文件,本地运行服务端与客户端即可实现语音输入。通过内网穿透工具可配置公网隧道实现异地远程访问,修改配置文件中的连接地址和端口即可完成绑定。固定公网地址可避免频繁更换隧道,提升远程连接的稳定性与效率。

CapsWriter-Offline 是一款语音转文字工具,支持本地及远程部署。本文将介绍如何在 Windows 系统中安装并使用该工具,包括本地测试与通过内网穿透实现异地远程访问的配置方法。
本例演示环境为 Windows 系统,需要准备麦克风。
首先,下载 CapsWriter-Offline 的 64 位版本(服务端/客户端)以及 models.zip 模型文件。
将软件和模型下载好后进行解压,然后将解压好的模型文件夹 models 复制到解压好的 CapsWriter-Offline 的文件夹中并替换原有的同名文件夹。

双击打开服务端(start_server),会弹出窗口对模型进行加载,加载完成后会提示开始服务:

此时双击打开客户端(start_client),会弹出窗口连接服务端并检测音频输入设备:

显示连接成功即可开始使用。
软件在 Windows 系统中默认使用大小写切换键 caps lock 进行语音输入(可以在配置文件中进行修改),一直按住说话,松手即可识别语音并在聊天软件对话窗口等界面进行输出:

可以看到对语音的识别非常准确,连标点符号也是。
除了支持无限时长语音的转写,更新后软件还支持文件转录字幕。即在客户端可以转写音视频文件为 srt 字幕了,只需将音视频文件拖动到客户端 exe 上打开即可。
若想在异地也能远程使用在本地部署的工具,可以通过内网穿透工具实现公网环境远程访问内网部署的服务,无需公网 IP。
安装内网穿透工具步骤:
登录成功后,下载内网穿透工具到本地并安装(一路默认安装即可)。本教程选择下载 Windows 版本。
安装成功后,在浏览器上访问 http://localhost:9200,使用账号登录,登录后即可看到 Web 配置界面,接下来在 web 管理界面配置即可。

接下来配置一下修改 CapsWriter-Offline 客户端文件需要用到的公网地址。
登录后,点击左侧仪表盘的隧道管理——创建隧道,创建一个 CapsWriter-Offline 的公网 TCP 地址隧道。
123点击创建。

隧道创建成功后,点击左侧的状态——在线隧道列表,查看所生成的公网访问地址,可以看到生成了 tcp 公网地址,复制即可。

现在可以在异地使用另一台 Windows 系统电脑,下载好 CapsWriter-Offline 软件(无需下载模型文件)。
进入 CapsWriter-Offline 文件夹,使用 VSCode 打开 config 文件对客户端配置进行修改:

我们需要对客户端配置中的地址和端口进行修改,使用刚才内网穿透工具生成的公网地址替换 127.0.0.1,使用公网地址后的端口替换 6016,保存文件即可。


在本地电脑服务端(start_server)运行的前提下,现在使用这台异地电脑双击打开客户端(start_client),可以看到通过使用内网穿透工具生成的公网地址异地也能远程访问本地服务端,使用它进行语音转文字啦!

小结
如果我们需要经常异地远程访问本地配置的服务,由于刚才创建的是随机的公网地址,24 小时会发生变化。可以把地址设置成固定的 TCP 地址,不仅能够享受更多功能和更快的带宽,而且不用每次都重新创建隧道来访问。
接下来为 CapsWriter-Offline 配置固定的 TCP 公网地址,该地址不会变化,方便查看且无需每天重复修改访问地址。
点击左侧的预留,选择保留的 TCP 地址,地区选择 China VIP,填写一个备注(自己能记住就行)点击保留。

保留成功后复制这个 tcp 地址:

返回登录 Web UI 管理界面,点击左侧仪表盘的隧道管理——隧道列表,找到所要配置的隧道:123,点击右侧的编辑:

修改隧道信息,将保留成功的二级子域名配置到隧道中。
3.tcp.vip.cpolar.cn:12635点击 更新 (注意,点击一次更新即可,不需要重复提交)。

然后我们需要再次对客户端配置中的地址和端口进行修改,使用刚才配置的固定 tcp 公网地址替换之前的地址,使用固定公网地址后的端口替换之前的端口,保存文件即可。

同样在本地电脑服务端(start_server)运行的前提下,现在使用这台异地电脑双击打开客户端(start_client),现在就可以通过使用内网穿透工具配置的固定 tcp 公网地址远程访问本地服务端使用它进行语音转文字啦!不用每天修改公网地址,也能获得更快的访问速度。


微信公众号「极客日志」,在微信中扫描左侧二维码关注。展示文案:极客日志 zeeklog
使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online
生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online
基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online
将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online
将字符串、文件或图像转换为其 Base64 表示形式。 在线工具,Base64 文件转换器在线工具,online
将 Markdown(GFM)转为 HTML 片段,浏览器内 marked 解析;与 HTML转Markdown 互为补充。 在线工具,Markdown转HTML在线工具,online