【Agent】那个搞远程的向日葵也出 AI 了？！不用买设备，不用复杂配置，还支持多平台

优质文章学习记录

08 Apr 2026 — 9 min read

那个搞远程的向日葵也出 AI 了？！不用买设备，不用复杂配置，还支持多平台

写在最前面
结语

🌌你好！这里是晓雨的笔记本在所有感兴趣的领域扩展知识，感谢你的陪伴与支持~👋 欢迎添加文末好友，不定期掉落福利资讯

写在最前面

版权声明：本文为原创，遵循 CC 4.0 BY-SA 协议。转载请注明出处。

最近一段时间，“AI 操作电脑”这件事越来越火。很多人第一次看到这类演示时，都会觉得有点神奇：原来 AI 不只是会聊天、会写文案，居然真的开始会“用电脑”了。

也正因为这样，很多人会下意识觉得，所有“AI 控电脑”的东西，应该都差不多。无非就是让 AI 帮你点点鼠标、输输文字、开开网页、跑跑流程。

但真往下看，其实不是这么回事。

因为有的方案，本质上更像是让 AI 在当前这台电脑上学会干活；而有的方案，更像是把一整套远程控制能力直接交给 AI，让它不只是操作眼前这一台电脑，而是能去连接、查看、操作更多设备。

向日葵 MCP 更接近后者。它真正值得关注的地方，也不只是“向日葵也做 AI 了”，而是那个大家熟悉的远程控制工具，开始让 AI 真正接手远程设备操作这件事了。

比openclaw更简单的配置过程，没有特定环境的需求

很多人一听到“AI + 远程控制”，第一反应就是复杂。

是不是要额外买设备？

是不是要单独搭环境？

是不是要学很多配置？

是不是只有技术人员才能用？

但向日葵 MCP 比较有吸引力的一点，就是它不是让你为了 AI 再重建一套远程控制系统，而是把原本已有的远控能力，直接接到了 AI 这一侧。

这件事的意义其实很现实：普通用户最怕的，不是功能不够多，而是门槛太高。一旦某个东西上来就要求你买一堆设备、改一堆环境、理解一堆概念，很多人其实第一步就放弃了。

如果只是先体验一次，我更建议直接接入 OpenCode。路径比较直观，也更容易快速看到效果。

参考配置链接：https://service.oray.com/question/50091.html?utm_source=client&utm_medium=redirect&utm_campaign=slrc&utm_term=mcp_help&redirect_id=1991

打开向日葵客户端，进入「设置」> 「MCP服务器」。点击「启用MCP服务器」

根据使用场景选择适合的通信方式：

Stdio（推荐）：本地进程通信，适用于本地运行的 AI 客户端
Streamable HTTP：基于 HTTP 的远程通信，适用于需要跨网络调用的场景

可将如下提示词和上述通信方式发送给AI，让AI来完成配置工作。

AI完成配置后，手动检查对应的配置文件是否写入完毕。

确保配置文件写入完毕后，需要先重启OpenCode客户端才能生效，按如下步骤执行操作验证。

重启 OpenCode 客户端
在输入框输入指令 /mcp 检查MCP服务器连接状态

如上所示，如果显示awesun-mcp-server已连接，并且处理开启状态，则配置完成。

整套流程更像是在已有远控能力上，多接了一层 AI 可以调用的接口，而不是重新搭一套很重的系统。这也是它对普通用户更友好的地方。

真正实用的地方，是它更接近现实场景

很多 AI 控电脑的演示都很酷，但对普通用户来说，真正重要的不是演示有多炫，而是它能不能进入日常场景。

向日葵 MCP 的优势就在这里。因为它本来就是从远程设备控制出发的，所以更适合处理那些和“另一台电脑”有关的事情。

比如你人在外面，但文件、软件、资料都在另一台电脑上。以前要自己远程连回去，一步步找、一点点操作。现在如果 AI 能直接接入这套远程控制能力，很多事情就有机会从“我亲自操作”，变成“我告诉 AI 要做什么，它先替我去做”。

再比如，不少人手上本来就不止一台设备。有主力电脑，也有备用电脑；有时还会有挂着程序的机器。真到要看状态、确认界面、做一些基础操作时，最麻烦的就是来回切换。向日葵 MCP 这种能力，正好能让 AI 接手一部分原本必须人反复折腾的远程操作。

还有一种很实用的场景，就是**“先帮我看一眼”** 。很多时候，我们不是马上要做复杂操作，只是想知道另一台设备现在是什么状态：开着没有、卡在哪个界面、有没有报错。AI 如果能先去看、先去判断、先把情况整理出来，人再决定要不要接手，整个体验会轻很多。

发送一句简单指令，比如：帮我查询下设备列表中XXX
设备的配置信息

多平台、可查看、可接手，才是它更适合大众的原因

很多 AI 产品在演示里看起来都很顺，是因为环境通常很理想：一台电脑、一个系统、一个固定流程。

但真实世界不是这样。有人用 Windows，有人用 macOS；有的人有办公电脑，也有家里电脑；有时候甚至还会碰到 Linux 设备、安卓终端。设备一多、平台一杂，很多看起来简单的自动化就会突然变得麻烦。向日葵 MCP 的价值就在于，它不是只盯着单一环境，而是尽量把更多真实设备场景纳入进来。

另外，很多人对 AI 自动化感兴趣，但也会担心：如果它乱点怎么办？如果它看错了怎么办？

这也是为什么**“可查看、可接手”** 很重要。向日葵 MCP 这类能力的一个优势，就是操作过程更容易被看到和监管。用户可以随时查看过程，必要时也能介入。这样一来，AI 不再是一个完全黑盒的执行者，而更像一个可以先帮你做事、你随时能接回来的助手。

awesun-mcp-example-claude/CLAUDE.md记忆文件，预设系统提示词写的很有意思，感兴趣的朋友可以去看看他实际的逻辑。

结语

所以，那个“搞远程的向日葵也出 AI 了”这件事，真正值得看的，不只是它赶上了 AI 这波热度。

更重要的是，它本来就擅长远程控制设备，现在又把这套能力正式开放给了 AI。这样一来，AI 不只是会在你眼前这台电脑上干活，还有机会开始接手更多远程设备相关的事情。

如果你只是想让 AI 帮你处理本机任务，市面上已经有很多很吸引人的方案；但如果你关心的是跨设备、跨地点、多平台、可查看、可接手的远程操作体验，那向日葵 MCP 这条路，确实会更值得普通用户认真看一眼。

hello，这里是晓雨的笔记本。如果你喜欢我的文章，欢迎三连给我鼓励和支持：👍点赞 📁 关注 💬评论，我会给大家带来更多有用有趣的文章。
原文链接 👉 ，⚡️更新更及时。

欢迎大家点开下面名片，添加好友交流。

深度解析KBQA常用数据集：WebQSP与CWQ

深度解析KBQA常用数据集：WebQSP与CWQ 一、引言知识图谱问答（KBQA）是自然语言处理领域的关键任务，其核心挑战在于将自然语言问题转换为可执行的逻辑形式（如SPARQL查询）并从知识图谱中获取答案。WebQSP和CWQ是当前KBQA研究中最具代表性的两个数据集，分别覆盖了从多跳到复杂组合性问题的全场景。本文将从数据形式、标注特点、核心挑战等维度对两者进行深度解析，并对比其在KBQA研究中的定位与价值。二、WebQSP数据集：多跳推理的基石 2.1 数据集概况 * 全称：WebQuestionsSP（扩展自WebQuestions） * 来源：基于Freebase知识图谱构建，由Berant等人于2013年提出，后经扩展支持多跳推理。 * 规模：训练集约4,700条，测试集约2,000条。 * 问题类型：多跳关系推理（最多4跳），需结合实体、关系和约束条件。 2.2 数据形式详解（基于WebQSP-train实例深度解析） WebQSP的每条数据以JSON格式组织，包含从原始问题到逻辑形式、推理路径、答案的完整标注。以下结合WebQTrn-0实例（关于

清明后，致所有准备面试的前端人...

金三银四已然过半，清明假期结束，2026年的Q2正式按下启动键。如果你此刻还在犹豫“现在开始准备是否来得及”，不妨把这个问题换成另一个：从今天开始，到5月初，你还有整整四周。四周时间，足够一个前端开发者完成一轮完整的面试体系搭建——从HTML/CSS的底层渲染机制，到JS的原型链与事件循环，再到Vue/React的响应式原理与核心源码思路，甚至包括一道手写Promise、一道防抖节流、一道算法中的二叉树层序遍历。关键是，你需要的不是零散的八股文背诵，而是一份经过验证的、覆盖高频考点的题库作为练习主线。 👇下面涵盖HTML/CSS、JS原理、Vue/React框架、TS、工程化、网络与安全等模块... 链接： https://github.com/encode-studio-fe-coder/natural_traffic/wiki/scan_material3 JavaScript（323题） 1.不会冒泡的事件有哪些? 2.mouseEnter 和 mouseOver 有什么区别?

5分钟部署GLM-4.6V-Flash-WEB，单卡实现多模态AI应用

5分钟部署GLM-4.6V-Flash-WEB，单卡实现多模态AI应用你有没有试过这样一种场景：刚拍下一张超市货架照片，想立刻知道“第三排左数第二个商品的保质期还剩几天”，却只能打开手机相册反复放大、手动识别——而旁边的朋友已经用AI工具三秒读完整张图并给出答案。这不是科幻电影，而是GLM-4.6V-Flash-WEB正在让这件事变成现实。它不依赖云端API调用，不用等模型加载十分钟，更不需要A100集群和运维工程师。一块RTX 4060 Ti显卡，一条命令，五分钟内，你就能拥有一个能看图、会思考、懂提问的本地多模态助手。它不是实验室里的演示原型，而是真正为“今天就要上线”设计的开箱即用镜像。这篇文章不讲论文公式，不堆参数指标，只聚焦一件事：怎么在最短时间里，把一个能理解图像+回答问题的AI，稳稳跑在你自己的机器上，并马上用起来。 1. 为什么是GLM-4.6V-Flash-WEB？轻量≠妥协很多人一听“轻量级多模态模型”，第一反应是“那效果肯定打折扣”。但GLM-4.6V-Flash-WEB打破了这个惯性认知——它没有牺牲核心能力，只是把冗余的部分全部砍掉。它

OpenClaw 中 web_search + web_fetch 最佳实践速查表

OpenClaw 中 web_search + web_fetch 最佳实践速查表摘要：本文帮助读者明确 OpenClaw 网络搜索工具和不同搜索技能的的职责边界，理解“先搜索、再抓取、后总结”的最佳实践，并能更稳定地在 OpenClaw 中使用 tavily-search 与 web_fetch 完成网络信息搜索任务。主要内容包括：解决 OpenClaw 中 web_search、tavily-search、web_fetch、原生 provider 与扩展 skill 容易混淆的问题、网络搜索能力分层说明、OpenClaw 原生搜索 provider 与 Tavily/Firecrawl 扩展 skill 的区别、标准工作流、提示词模板、