魔改豆包输入法变电脑版,立即拥有千元AI语音输入法typeless平替

魔改豆包输入法变电脑版,立即拥有千元AI语音输入法typeless平替
图片

哈喽大家好,我是阿星👋

最近在用一款语音输入工具 Typeless ,体验确实不错—— 按住一个键说话,松开后自动插入,完全不打断思路 。但有个问题: 每个月要 84 块钱 ……

图片

所以……我自己用豆包客户端的AI语音输入功能魔改了个平替,效果看大屏幕👇:

录屏展示

因为用了一段豆包手机输入法我就爱上了,苦于电脑不能用啊,我就在想:

1、虽然它手机版app不能电脑上用,但是豆包pc客户端有个语音输入功能啊~

2、虽然它pc端用起来中断感比较明显,每次说完话都要按enter,搞得没有用typeless时那种指挥飞机塔台的感觉。

3、虽然总是说完话覆盖我的剪贴板,这个我真的好想打人

但是我有AI啊!于是我花了2小时, 用豆包做了平替——和typeless一样,按住就说,松开就写入输入框,且不会冲掉原先剪贴板内容。

图片

核心原理(100字看懂,看不懂也无所谓)

豆包自带的语音输入需要 Ctrl+D 唤醒 → 说话 → 手动按 Enter 插入 。我的工具通过 Python 监听你的 右侧 Command 键 ,当你按住时自动触发豆包的 Ctrl+D,松开时自动隐形地按 Enter 完成插入。同时在触发前保存你的剪贴板,插入后立即恢复,避免豆包的识别结果覆盖你复制的内容。 

本质是把豆包的三步操作,变成按住说话一步完成。


成本对比:一年省1000

其实阿星也想过自己写个AI输入法,但豆包已经免费提供了语音识别能力。

那我只需要写个插件,让它更好用就差不多了。我自己感觉没必要重头再来。

图片

如何使用?(3分钟上手)

第1步:配置豆包(一劳永逸)

  1. 1. 打开豆包电脑版应用,别找错了,是豆包电脑客户端app。就你平常用的豆包网页版的左下角。
  2. 然后→ 设置 → 快捷键
图片
图片

2. 将"语音输入"设为 Control + D

(为了避免自定义快捷键冲突先固定了)

图片

3. 建议关闭语音悬浮球 (虽然不是必须的,但是容易误触,无伤大雅)确认改好了,保存

第2步:下载并打开应用(1分钟)

图片

1. 下载 阿星AI输入-v2.0-macOS-final.zip (20 MB)

2. 解压得到 :阿星AI输入.app,就第二个icon

3. 首次打开 :右键点击 → 打开(macOS 安全限制)

图片

4. 授予权限 (必须!):系统会要求授予「辅助功能」权限

- 打开 系统设置 → 隐私与安全性 → 辅助功能

图片
  • • 点击 ➕ 添加「阿星AI输入.app」
  • • 确保勾选已启用

5. 浏览器自动打开 ,显示控制界面(http://localhost:8899)

  • • 启动时间:首次 5-10 秒,后续 3-5 秒

首次启动可能比较慢

图片

第3步:启动语音输入(1分钟)

在浏览器中:点击 🚀 启动语音输入,看到日志显示「✓ 语音输入已启动!」后,就可以使用了

第4步:开始使用

  1. 1. 在任何输入框里(浏览器、编辑器、微信...)
  2. 2. 按住 右侧 Command 键说话

就这么简单!


核心功能详解

功能1:自动插入(对标 Type Less)

豆包原生流程稍微顿感了 :

Ctrl+D → 说话 → 看预览框 → 手动按 Enter → 插入

我的工具给它修补下体感 :

按住 Command → 说话 → 松开 → 自动 Enter → 插入

这就是 Typeless值 80 元/月的丝滑输入体验啊。 现在免费用了。

功能2:剪贴板保护

问题场景 :

1. 你复制了一段代码 2. 用语音输入了一句话 3. 豆包把识别结果复制到剪贴板 4. 你去粘贴 → 粘贴出来的是语音文字,不是代码 5. 代码没了

我的解决方案 :

按下 Command → 保存你的剪贴板 → 触发豆包语音 → 豆包识别并复制 → 松开 Command → 自动插入 → 0.2秒内恢复你的剪贴板

你去粘贴,粘贴出来的还是你复制的。 完美!

功能3:Web GUI 界面)

在 Web 控制界面(http://localhost:8899):

主界面功能 :

- 🚀 启动/停止 :一键控制语音输入

- 📋 实时日志 :查看运行状态和诊断信息

- ⚙️ 打开配置 :点击按钮进入配置页面

图片

配置界面 :滑块调整冷启动/正常延迟时间

不用改代码,不用命令行,和 Type Less 一样小白友好。


三大核心技术原理

1. 全局键盘监听(pynput + macOS CGEventTap)

为什么没用 Electron? 

虽然 Electron 稳定,但它太“重”了——哪怕一个简单的功能也要背着几百 MB 的浏览器内核。先选了 macOS 原生打包。

  1. 1. 选择 Onedir:告别“发呆”启动
  • • Onefile (弃用) :本质是压缩包,每次启动需 10 秒解压,慢得像死机。
  • • Onedir (选用) :直接加载已解压库,实现 .app 秒开 。
  1. 2.通过 AppDelegate 架构实现了与系统的“握手”。在系统反馈“已就绪” (DidFinishLaunching) 的瞬间挂载 RunLoop。

Onedir (秒开) + AppDelegate (官方权限挂载) ,绕开了 Electron 的臃肿,解决了原生打包的权限魔咒。

2. 剪贴板保护(pbpaste/pbcopy)

豆包自己的的语音识别会把结果复制到剪贴板,然后用系统快捷键(Cmd+V)自动粘贴。这会覆盖用户原有的剪贴板内容。

所以我通过脚本改成了预存的方式 :

  1. 1. 按下 Command 键 → 用 pbpaste 保存当前剪贴板
  2. 2. 触发豆包语音识别(Ctrl+D)
  3. 3. 等待识别完成(冷启动 3.5 秒,热启动 1.5 秒)
  4. 4. 松开 Command 键 → 按 Enter 插入文字
  5. 5. 等待 0.2 秒 (让豆包完成自动复制)
  6. 6. 用 pbcopy 恢复用户原剪贴板

豆包的自动复制在 Enter 后立即发生,但我们在 0.2 秒后强制恢复,这个时间差足够让插入完成,又不会让用户察觉到剪贴板被篡改 过。

3. 智能延迟(冷启动 vs 热启动)

如果你说完了结果工具的等待时间不够,按 Enter 时豆包还没识别完,结果就是空白或不完整。

改进 :豆包第一次启动语音识别需要初始化 AI 模型,耗时较长(约 3.5 秒)。后续识别时模型已在内存中,速度更快(约 1.5 秒)。用户可在 Web 界面通过滑块自定义这些延迟时间

图片

ok。我已经打包成 .app 文件,放到星球上了,双击即用

图片

我是阿星

更多AI应用

我们下期再见!

Read more

从 Webhook 到 OpenClaw:一个钉钉周报提醒机器人的进化史

从 Webhook 到 OpenClaw:一个钉钉周报提醒机器人的进化史

前言:一个开源项目的"现象级"爆发 2026年初,GitHub 上出现了一个"怪物级"开源项目:OpenClaw1。 * 2天,GitHub Star 从 0 冲到 10万+(Kubernetes 达到 10万 Star 用了 3年、React 达到 10万 Star 用了 4年) * 1个月,成为 GitHub Trending 榜首,Star 数突破 15万 * 3个月,衍生出数十个商业闭源版本,包括网易有道的 LobsterAI2(龙虾) 更疯狂的是,这个项目最初只是奥地利独立开发者 Peter Steinberger

ROS 机器人工程师30 天突击学习计划(超详细・日更版)第一天 Linux

第 1 周:Linux + C++/Python + ROS 基础(Day1~7) Day1:Linux 终端命令(ROS 90% 操作都靠它) 上午 9:00–11:30 | 必背命令 查看日志 / 进程bash运行 top # 看CPU htop # 更直观 dmesg # 系统日志 文件操作bash运行 ls -la # 看所有文件 cd # 进入目录 pwd # 显示当前路径 mkdir -p # 递归创建文件夹 rm -rf # 删除(谨慎) cp -r # 复制文件夹 mv # 移动/

FPGA实现任意角度图像旋转_(图像旋转原理部分)

1.摘要         书接上回,介绍完Cordic原理部分FPGA实现任意角度图像旋转_(Cordic算法原理部分),和代码FPGA实现任意角度图像旋转_(Cordic算法代码部分),得到了至关重要的正余弦数值就可以进行旋转公式的计算了。        旋转没什么太多原理,看了很多资料感觉是描述的非常复杂, 其实本质就是实现两个公式,非整那么多花里胡哨的。所以我就按照我当时的编写思路记录一下。 2.图像旋转代码设计思路         2.1 旋转后的图像尺寸                 在一副图像经过旋转后,原本像素的位置肯定会发生变化,图像总的面积虽然保持不变但是各别位置的尺寸会改变,这个应该很好理解。比如一副100x100像素的图像进行旋转,我们只需要获得它的最长距离也就是对角线的尺寸作为旋转后的图像的显示范围。这样无论怎样旋转都能完整显示图像。                 如下代码,Pixel_X和Pixel_Y为旋转后图像的尺寸。ROW和COL为原始图像尺寸,利用勾股定理求出对角线的值即可。 reg [12:0] row_size ; reg [

智能车竞赛实战:如何用地瓜机器人打造智慧医疗解决方案(附完整代码)

智能车竞赛实战:基于地瓜机器人的智慧医疗系统开发指南 在当今技术驱动的医疗创新浪潮中,智能车竞赛为大学生创客提供了绝佳的实践平台。地瓜机器人作为一款开源硬件平台,其灵活的可扩展性和丰富的传感器生态,使其成为开发智慧医疗解决方案的理想选择。本文将深入探讨如何从零开始构建一套完整的智慧医疗系统,涵盖硬件选型、算法设计到实战优化的全流程。 1. 硬件架构设计与环境搭建 构建智慧医疗系统的第一步是搭建可靠的硬件基础。地瓜机器人平台的核心优势在于其模块化设计,允许开发者根据具体需求灵活配置传感器和执行机构。 1.1 核心硬件选型建议 对于医疗应用场景,我们需要特别关注数据的准确性和系统的稳定性。以下是经过实战验证的硬件配置方案: * 主控单元:推荐使用地瓜机器人V3.2开发板,其搭载的STM32H743芯片提供充足的算力资源 * 环境传感器: * 温湿度:SHT31高精度数字传感器(±1.5%RH精度) * 空气质量:SGP30 VOC传感器 * 医疗监测模块: * 红外测温:MLX90614非接触式传感器 * 心率血氧:MAX30102光电传感器