AI 龙虾第一天就给我写了个程序,还会定时爬数据

AI 龙虾第一天就给我写了个程序,还会定时爬数据

大家好,我是极客老墨。

经过昨天的艰难跋涉(详见上篇),OpenClaw 终于在 Windows 上跑起来了。第一天使用下来,说实话,这玩意儿比我想象的能干。

让它帮我写代码:经典贪吃蛇游戏

作为技术控,第一个尝试必须是代码!我还是让 小墨(我的AI助理) 帮我写一个经典的贪吃蛇网页游戏。

我直接告诉他:“小墨,帮我写一个贪吃蛇的网页游戏,最后文件直接发给我”。结果他没反应,后来才知道,原来他正卖力的写代码去了,顾不上理我,因为现在数据还没有能力流式返回,必须等他写完了给我我才知道(晚上的「飞书龙虾会直播」我看了,已经有流式返回数据的插件了,后边研究了再来讲)

图片

写完之后,他并没有直接给我文件,而是问我怎么给我这个文件。这里应该是我的提示词没优化好,第一次配合,有点翻车。

再次确认让他发给我,这次就对了。打开游戏一看——界面还不错,完成度100%。就是速度太快了,我玩了几次才适应过来。

图片

第二个任务:自动搜索小红书爆款文案

我的想法很简单:让 AI 助手自动搜索小红书上某个类目的爆款视频标题和内容。

OpenClaw 的做法很硬核——直接本地打开浏览器,像真人一样操作。这也是它完成工作的主要方式:模拟真人操作电脑。

让他搜索小红书,结果告诉我要登录:

图片

登录后,他成功打开浏览器并返回了数据给我:

图片

再次让他搜索 OpenClaw:

图片

这是他打开的网页:

图片

他能够读取网页并返回准确的数据回来。

第三个任务:每日早报功能

我很关注 AI 领域的新闻,所以想让小墨每天定时给我报告最新的新闻和 AI 资讯。我直接告诉他:

你好,小墨。整理下边的信息发给我 1. 获取今天成都天气 2. 获取今日微博全球新闻榜前10条,标题为微博新闻 3. 获取今日最新的AI相关的新闻资讯前10条,标题为AI咨询 4. 整理成自带链接可以直接点击的简洁文字内容发给我 

一开始 prompt 忘记加链接了,补上后,他返回了正确的数据。同样地,他会打开本地浏览器,输入网址自己看,最后返回正确的数据:

图片

最后,我需要每天定时给我,他成功帮我搞定:

图片

一个小插曲,他干完活浏览器没关闭,我提醒他之后他认识到了自己的错误。

可以看到,gateway 控制页面上的“定时任务”菜单中查看,已经加上了这个任务:

图片

晚上看了飞书玩虾大会,几点感悟

晚上看了飞书的玩虾大会直播,看大牛们都是怎么玩龙虾的,有几点感悟:

1. 自动化办公真的来了

飞书与 OpenClaw 集成之后,抓数据、做报表、整理知识库这些日常工作都可以交给 OpenClaw 了。

2. 多只龙虾协同配合

多个龙虾搞到群组中,一起协同配合,形成工作流。这比传统的工作流工具方便得多,而且更智能。龙虾之间在不同的工程中可以互相促进,并变得更智能。

3. 一人公司真的来了

有了 OpenClaw,你只管养虾,每个部门都由虾组成。从请假审批到财务报账,龙虾可能比人配合得更好。你只是总指挥,只负责最后的验收。

4. 安全第一

⚠️ 养虾之路也没那么容易。平时玩千万不要用自己的工作电脑,因为龙虾的系统权限非常大。万一哪天数据误删了或者给你误发到外网了,你后悔莫及。

5. 技术人的天然优势

一般人玩的是提示词,而技术人还可以用代码来创新技能、创新玩法。

alt text

踩过的几个坑

坑1:API Key 报错

⚠️ API provider returned a billing error — your API key has run out of credits or has an insufficient balance. Check your provider's billing dashboard and top up or switch to a different API key. 

我明明订阅了 MiniMax 的 Coding Plan,却仍然报错。后来才知道,Coding Plan 的 Key 与原来创建的 key 是独立分开的。

解决方案:

$ cd C:\Users\hankm\.openclaw\agents\main\agent # 2. 修改这两个文件中的 api-key# auth-profiles.json# models.json# 3. 重启网关 $ openclaw gateway restart 
图片

搞定!又能愉快地玩耍了。

坑2:Websocket 卡住

发消息过去龙虾没反应。目前看可能是因为 Windows 没有安装成服务,会启动一个 terminal 窗口,这个窗口可能会导致卡住。

后边我可能需要研究一下怎么直接装成 Windows 服务,不要这个命令窗口。

老墨总结

养虾实操第一天,我的龙虾已经开始为我工作了。

  • 能写代码
  • 能爬数据
  • 能定时任务

龙虾确实能做很多实实在在的事情,还得继续探索、发现!

你的 AI 助手都在帮你做什么?欢迎评论区讨论!

极客老墨,继续折腾!

Read more

3小时攻克:解决WebDriver工具的5类配置难题

3小时攻克:解决WebDriver工具的5类配置难题 【免费下载链接】geckodriverWebDriver for Firefox 项目地址: https://gitcode.com/gh_mirrors/ge/geckodriver 在软件开发过程中,WebDriver工具的下载与配置常常成为开发者的首个拦路虎,尤其是面对版本兼容性、系统架构匹配和环境变量配置等问题时,即便是经验丰富的开发者也可能陷入困境。本文将通过"问题诊断-系统分析-多维解决方案-预防机制"四个阶段,帮助你全面掌握WebDriver工具的正确获取与配置方法,让你不再为工具准备工作浪费宝贵的开发时间。 诊断:WebDriver配置失败的典型症状 当WebDriver工具配置出现问题时,系统通常会通过各种错误信息向我们发出求救信号。这些症状看似五花八门,实则都指向特定的配置问题。 症状一:命令未找到错误 webdriver: command not found 这种情况通常意味着工具未被正确安装,或者安装路径未添加到系统环境变量中。就像你把钥匙藏在家里某个角落,却忘了告诉系统去哪里找。 症状二

浏览器缓存机制详解:如何彻底解决前端代码更新后的缓存问题

浏览器缓存机制详解:如何彻底解决前端代码更新后的缓存问题

目录 * 浏览器缓存机制详解:如何彻底解决前端代码更新后的缓存问题 * 引言:被缓存支配的恐惧 * 一、浏览器缓存机制详解 * 1. 强缓存(无需询问服务器) * 2. 协商缓存(需要询问服务器) * 二、前端代码更新的缓存难题 * 三、终极解决方案:基于文件内容的哈希命名 * 1. 给静态文件加上哈希值 * 2. HTML文件:不缓存或短缓存 * 3. CDN 缓存控制 * 4. 处理旧版本资源 * 四、其他辅助策略 * 1. 使用 `immutable` 指令 * 2. 服务端配置 ETag 和 Last-Modified * 3. 动态资源(如API)的缓存控制 * 五、实战案例:从混乱到清晰 * 改造前 * 改造后 * 六、可能遇到的坑及解决方案

告别“打字机”:Generative UI 如何重塑 AI 时代的前端交互?

告别“打字机”:Generative UI 如何重塑 AI 时代的前端交互?

自从大语言模型(LLM)爆发以来,前端开发者接到了无数“给系统加个 AI 对话框”的需求。我们熟练地接入 API,处理流式(Streaming)响应,看着文字像打字机一样一个个蹦出来。 但这真的是 AI 时代前端交互的终点吗? 想象一下这个场景:用户问“帮我对比一下苹果和微软的近期股价”。传统的聊天机器人只能吐出一堆干瘪的文字,或者勉强渲染一个 Markdown 表格。但作为一名前端工程师,你的组件库里明明躺着精美的 Echarts K线图、带有交互提示的卡片和丝滑的动画。 为什么我们不能让大模型直接“生成”一个可交互的 React 或 Vue 组件呢?答案是:可以。这就是目前前端领域最具颠覆性的范式——Generative UI(生成式 UI)。 什么是 Generative UI? Generative UI 是指结合 AI

MedGemma-1.5-4B实战教程:医学影像多模态理解从模型调用到Web集成

MedGemma-1.5-4B实战教程:医学影像多模态理解从模型调用到Web集成 1. 为什么你需要一个医学影像“看图说话”工具? 你有没有遇到过这样的情况:手头有一张CT扫描图,想快速了解它大致显示了什么结构,但又不是放射科医生;或者在带学生做AI医疗实验时,需要一个能即时响应影像提问的演示系统,而不是等半天跑完一整套预处理+模型推理流程;又或者,你刚跑通了一个多模态模型,却卡在“怎么让别人一眼看懂它到底能干啥”这一步。 MedGemma-1.5-4B 就是为这类真实需求而生的——它不是泛泛而谈的“多模态大模型”,而是 Google 针对医学影像专门优化过的 40 亿参数多模态模型。它不生成假报告,也不编造诊断结论,但它能准确识别肺部纹理、脊柱节段、脑室轮廓,能理解“这张MRI里左侧海马区信号是否增高”这样的专业问题,并用清晰、克制、符合医学表达习惯的语言给出回应。 本文不讲论文里的指标曲线,也不堆砌训练细节。我们直接带你从零开始: 下载并本地加载 MedGemma-1.5-4B 模型 写三行代码完成一张X光片+中文问题的联合推理