AI 龙虾第一天就给我写了个程序，还会定时爬数据

优质文章学习记录

07 Apr 2026 — 6 min read

大家好，我是极客老墨。

经过昨天的艰难跋涉（详见上篇），OpenClaw 终于在 Windows 上跑起来了。第一天使用下来，说实话，这玩意儿比我想象的能干。

让它帮我写代码：经典贪吃蛇游戏

作为技术控，第一个尝试必须是代码！我还是让小墨（我的AI助理）帮我写一个经典的贪吃蛇网页游戏。

我直接告诉他：“小墨，帮我写一个贪吃蛇的网页游戏，最后文件直接发给我”。结果他没反应，后来才知道，原来他正卖力的写代码去了，顾不上理我，因为现在数据还没有能力流式返回，必须等他写完了给我我才知道（晚上的「飞书龙虾会直播」我看了，已经有流式返回数据的插件了，后边研究了再来讲）

写完之后，他并没有直接给我文件，而是问我怎么给我这个文件。这里应该是我的提示词没优化好，第一次配合，有点翻车。

再次确认让他发给我，这次就对了。打开游戏一看——界面还不错，完成度100%。就是速度太快了，我玩了几次才适应过来。

第二个任务：自动搜索小红书爆款文案

我的想法很简单：让 AI 助手自动搜索小红书上某个类目的爆款视频标题和内容。

OpenClaw 的做法很硬核——直接本地打开浏览器，像真人一样操作。这也是它完成工作的主要方式：模拟真人操作电脑。

让他搜索小红书，结果告诉我要登录：

登录后，他成功打开浏览器并返回了数据给我：

再次让他搜索 OpenClaw：

这是他打开的网页：

他能够读取网页并返回准确的数据回来。

第三个任务：每日早报功能

我很关注 AI 领域的新闻，所以想让小墨每天定时给我报告最新的新闻和 AI 资讯。我直接告诉他：

你好，小墨。整理下边的信息发给我 1. 获取今天成都天气 2. 获取今日微博全球新闻榜前10条，标题为微博新闻 3. 获取今日最新的AI相关的新闻资讯前10条，标题为AI咨询 4. 整理成自带链接可以直接点击的简洁文字内容发给我

一开始 prompt 忘记加链接了，补上后，他返回了正确的数据。同样地，他会打开本地浏览器，输入网址自己看，最后返回正确的数据：

最后，我需要每天定时给我，他成功帮我搞定：

一个小插曲，他干完活浏览器没关闭，我提醒他之后他认识到了自己的错误。

可以看到，gateway 控制页面上的“定时任务”菜单中查看，已经加上了这个任务：

晚上看了飞书玩虾大会，几点感悟

晚上看了飞书的玩虾大会直播，看大牛们都是怎么玩龙虾的，有几点感悟：

1. 自动化办公真的来了

飞书与 OpenClaw 集成之后，抓数据、做报表、整理知识库这些日常工作都可以交给 OpenClaw 了。

2. 多只龙虾协同配合

多个龙虾搞到群组中，一起协同配合，形成工作流。这比传统的工作流工具方便得多，而且更智能。龙虾之间在不同的工程中可以互相促进，并变得更智能。

3. 一人公司真的来了

有了 OpenClaw，你只管养虾，每个部门都由虾组成。从请假审批到财务报账，龙虾可能比人配合得更好。你只是总指挥，只负责最后的验收。

4. 安全第一

⚠️ 养虾之路也没那么容易。平时玩千万不要用自己的工作电脑，因为龙虾的系统权限非常大。万一哪天数据误删了或者给你误发到外网了，你后悔莫及。

5. 技术人的天然优势

一般人玩的是提示词，而技术人还可以用代码来创新技能、创新玩法。

踩过的几个坑

坑1：API Key 报错

⚠️ API provider returned a billing error — your API key has run out of credits or has an insufficient balance. Check your provider's billing dashboard and top up or switch to a different API key.

我明明订阅了 MiniMax 的 Coding Plan，却仍然报错。后来才知道，Coding Plan 的 Key 与原来创建的 key 是独立分开的。

解决方案：

$ cd C:\Users\hankm\.openclaw\agents\main\agent # 2. 修改这两个文件中的 api-key# auth-profiles.json# models.json# 3. 重启网关 $ openclaw gateway restart

搞定！又能愉快地玩耍了。

坑2：Websocket 卡住

发消息过去龙虾没反应。目前看可能是因为 Windows 没有安装成服务，会启动一个 terminal 窗口，这个窗口可能会导致卡住。

后边我可能需要研究一下怎么直接装成 Windows 服务，不要这个命令窗口。

老墨总结

养虾实操第一天，我的龙虾已经开始为我工作了。

能写代码
能爬数据
能定时任务

龙虾确实能做很多实实在在的事情，还得继续探索、发现！

你的 AI 助手都在帮你做什么？欢迎评论区讨论！

极客老墨，继续折腾！

3小时攻克：解决WebDriver工具的5类配置难题

3小时攻克：解决WebDriver工具的5类配置难题【免费下载链接】geckodriverWebDriver for Firefox 项目地址: https://gitcode.com/gh_mirrors/ge/geckodriver 在软件开发过程中，WebDriver工具的下载与配置常常成为开发者的首个拦路虎，尤其是面对版本兼容性、系统架构匹配和环境变量配置等问题时，即便是经验丰富的开发者也可能陷入困境。本文将通过"问题诊断-系统分析-多维解决方案-预防机制"四个阶段，帮助你全面掌握WebDriver工具的正确获取与配置方法，让你不再为工具准备工作浪费宝贵的开发时间。诊断：WebDriver配置失败的典型症状当WebDriver工具配置出现问题时，系统通常会通过各种错误信息向我们发出求救信号。这些症状看似五花八门，实则都指向特定的配置问题。症状一：命令未找到错误 webdriver: command not found 这种情况通常意味着工具未被正确安装，或者安装路径未添加到系统环境变量中。就像你把钥匙藏在家里某个角落，却忘了告诉系统去哪里找。症状二

浏览器缓存机制详解：如何彻底解决前端代码更新后的缓存问题

目录 * 浏览器缓存机制详解：如何彻底解决前端代码更新后的缓存问题 * 引言：被缓存支配的恐惧 * 一、浏览器缓存机制详解 * 1. 强缓存（无需询问服务器） * 2. 协商缓存（需要询问服务器） * 二、前端代码更新的缓存难题 * 三、终极解决方案：基于文件内容的哈希命名 * 1. 给静态文件加上哈希值 * 2. HTML文件：不缓存或短缓存 * 3. CDN 缓存控制 * 4. 处理旧版本资源 * 四、其他辅助策略 * 1. 使用 `immutable` 指令 * 2. 服务端配置 ETag 和 Last-Modified * 3. 动态资源（如API）的缓存控制 * 五、实战案例：从混乱到清晰 * 改造前 * 改造后 * 六、可能遇到的坑及解决方案

告别“打字机”：Generative UI 如何重塑 AI 时代的前端交互？

自从大语言模型（LLM）爆发以来，前端开发者接到了无数“给系统加个 AI 对话框”的需求。我们熟练地接入 API，处理流式（Streaming）响应，看着文字像打字机一样一个个蹦出来。但这真的是 AI 时代前端交互的终点吗？想象一下这个场景：用户问“帮我对比一下苹果和微软的近期股价”。传统的聊天机器人只能吐出一堆干瘪的文字，或者勉强渲染一个 Markdown 表格。但作为一名前端工程师，你的组件库里明明躺着精美的 Echarts K线图、带有交互提示的卡片和丝滑的动画。为什么我们不能让大模型直接“生成”一个可交互的 React 或 Vue 组件呢？答案是：可以。这就是目前前端领域最具颠覆性的范式——Generative UI（生成式 UI）。什么是 Generative UI？ Generative UI 是指结合 AI

MedGemma-1.5-4B实战教程：医学影像多模态理解从模型调用到Web集成

MedGemma-1.5-4B实战教程：医学影像多模态理解从模型调用到Web集成 1. 为什么你需要一个医学影像“看图说话”工具？你有没有遇到过这样的情况：手头有一张CT扫描图，想快速了解它大致显示了什么结构，但又不是放射科医生；或者在带学生做AI医疗实验时，需要一个能即时响应影像提问的演示系统，而不是等半天跑完一整套预处理+模型推理流程；又或者，你刚跑通了一个多模态模型，却卡在“怎么让别人一眼看懂它到底能干啥”这一步。 MedGemma-1.5-4B 就是为这类真实需求而生的——它不是泛泛而谈的“多模态大模型”，而是 Google 针对医学影像专门优化过的 40 亿参数多模态模型。它不生成假报告，也不编造诊断结论，但它能准确识别肺部纹理、脊柱节段、脑室轮廓，能理解“这张MRI里左侧海马区信号是否增高”这样的专业问题，并用清晰、克制、符合医学表达习惯的语言给出回应。本文不讲论文里的指标曲线，也不堆砌训练细节。我们直接带你从零开始：下载并本地加载 MedGemma-1.5-4B 模型写三行代码完成一张X光片+中文问题的联合推理