Agent-OS:用AI掌控你的电脑!!这个 AI 代理可以控制你的电脑并做任何事情!(生成应用程序、代码、RAG 等)

Agent-OS:用AI掌控你的电脑!!这个 AI 代理可以控制你的电脑并做任何事情!(生成应用程序、代码、RAG 等)

介绍Open interpreter最佳功能之一:OS 模式,如果不太了解这个开源项目,让我给你一个快速概述:

Open interpreter 是一个 AI 代理,它几乎可以做任何你想做的事情,你只需给它一个提示,它就可以使用各种工具执行各种任务。

它使用 LLMS 运行Python、JavaScript、Shell 和其他更多本地代码,从而能够完成你需要的几乎任何任务。

OS 模式允许开放解释器查看屏幕上的内容并控制计算机输入、然后通过鼠标和键盘直观地控制操作系统,它提供了一个多模式 LLM ,如 GPT 4V。

它会尝试使用最直接的方法来实现其目标,例如在 Mac 上使用 Spotlight 打开应用程序,使用 URL 中的查询参数打开包含附加信息的网站,这样它基本上就可以控制你的电脑并做很多很酷的事情。

Open interpreter捕捉你的屏幕,并将其提供给 LLM 来确定屏幕上发生了什么,并决定下一步的操作 —— 这可能是AI控制整个操作的有效工作流程系统。

但由于它目前处于实验模式,可能会出错,所以无论如何请谨慎使用,现在让我们尝试一下,看看它是否真的可以实现它的目标。

首先,我们需要安装开放解释器,要安装它,只需打开你的终端并运行此命令 pip install open-interpreter

www.zeeklog.com  - Agent-OS:用AI掌控你的电脑!!这个 AI 代理可以控制你的电脑并做任何事情!(生成应用程序、代码、RAG 等)

OS 模式,我们想尝试一下

www.zeeklog.com  - Agent-OS:用AI掌控你的电脑!!这个 AI 代理可以控制你的电脑并做任何事情!(生成应用程序、代码、RAG 等)

使用它只需运行带有 OS 标志的 Interpreter 命令,它将在 OS 模式下启动,第一次运行它时,它会要求安装一些软件包并请求权限。

只需批准它,它就会启动,你还需要输入 OpenA****I API 密钥

www.zeeklog.com  - Agent-OS:用AI掌控你的电脑!!这个 AI 代理可以控制你的电脑并做任何事情!(生成应用程序、代码、RAG 等)

你没有OpenAI Key?没关系这个其实很好解决(但是有些没视觉):

国内很多模型比如Kimi、智谱(GLM-4-Flash 免费今天了)等等大模型都兼容OpenAI格式,你只需要把你运行open-interpreter项目环境里的openai包的base_url改掉就行,

除此以外使用One-API也可以把其他大模型转为Openai格式

当然,还有许多免费的Chatgpt API项目,都可以。

www.zeeklog.com  - Agent-OS:用AI掌控你的电脑!!这个 AI 代理可以控制你的电脑并做任何事情!(生成应用程序、代码、RAG 等)

配置好之后,现在你可以要求它做任何事情,所以让我们要求它做一些简单的事情,让我们要求它打开 vs code,让我们发送提示,

www.zeeklog.com  - Agent-OS:用AI掌控你的电脑!!这个 AI 代理可以控制你的电脑并做任何事情!(生成应用程序、代码、RAG 等)

你可以看到 vs code 已经打开了,它首先编写了一个苹果脚本来打开应用程序,然后截取屏幕截图,将其提供给 llm,llm 确认它已经打开,

一旦它验证了这一点,它就会将任务标记为已完成(上面他最终输出已完成),这很棒,因为它不只是假设任务已经完成,它确保了这一点。

现在让我们让它做一些更复杂的事情,让我们让它打开 Safari 浏览器,去谷歌搜索 Groq:

www.zeeklog.com  - Agent-OS:用AI掌控你的电脑!!这个 AI 代理可以控制你的电脑并做任何事情!(生成应用程序、代码、RAG 等)

他完成了,相当酷。

现在让我们尝试一些更具挑战性的事情,让我们要求它从互联网上获取一些数据,比如苹果股票的当前价格,你可以看到它100%正确,这意味着它在这方面也做得很好:

www.zeeklog.com  - Agent-OS:用AI掌控你的电脑!!这个 AI 代理可以控制你的电脑并做任何事情!(生成应用程序、代码、RAG 等)

让我们再要求它创建一个新的项目目录并在 vs code 中打开它,这将帮助我们了解它是否可以处理文件管理和其他任务。

www.zeeklog.com  - Agent-OS:用AI掌控你的电脑!!这个 AI 代理可以控制你的电脑并做任何事情!(生成应用程序、代码、RAG 等)

你可以看到它有能力做到这一点,这也非常令人印象深刻。

我认为它几乎可以做任何事情,是的,它可能会消耗大量的代币,但我认为人工智能可以控制你的整个电脑真是太疯狂了!

它比过时的代理如 Agent Zero 或 Agent K 要好得多,我认为Open interpreter可能是最好的人工智能代理之一,因为它工作得很好,速度极快,它在一分钟内完成任务,这真的很酷,


最后分享

AI大模型作为人工智能领域的重要技术突破,正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口,掌握AI大模型的知识和技能将变得越来越重要。

学习AI大模型是一个系统的过程,需要从基础开始,逐步深入到更高级的技术。

这里给大家精心整理了一份全面的AI大模型学习资源,包括:AI大模型全套学习路线图(从入门到实战)、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等,资料免费分享!

www.zeeklog.com  - Agent-OS:用AI掌控你的电脑!!这个 AI 代理可以控制你的电脑并做任何事情!(生成应用程序、代码、RAG 等)

1. 成长路线图&学习规划

要学习一门新的技术,作为新手一定要先学习成长路线图方向不对,努力白费

这里,我们为新手和想要进一步提升的专业人士准备了一份详细的学习成长路线图和规划。可以说是最科学最系统的学习成长路线。

www.zeeklog.com  - Agent-OS:用AI掌控你的电脑!!这个 AI 代理可以控制你的电脑并做任何事情!(生成应用程序、代码、RAG 等)

2. 大模型经典PDF书籍

书籍和学习文档资料是学习大模型过程中必不可少的,我们精选了一系列深入探讨大模型技术的书籍和学习文档,它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础。(书籍含电子版PDF)

www.zeeklog.com  - Agent-OS:用AI掌控你的电脑!!这个 AI 代理可以控制你的电脑并做任何事情!(生成应用程序、代码、RAG 等)

3. 大模型视频教程

对于很多自学或者没有基础的同学来说,书籍这些纯文字类的学习教材会觉得比较晦涩难以理解,因此,我们提供了丰富的大模型视频教程,以动态、形象的方式展示技术概念,帮助你更快、更轻松地掌握核心知识

www.zeeklog.com  - Agent-OS:用AI掌控你的电脑!!这个 AI 代理可以控制你的电脑并做任何事情!(生成应用程序、代码、RAG 等)

4. 大模型项目实战

学以致用 ,当你的理论知识积累到一定程度,就需要通过项目实战,在实际操作中检验和巩固你所学到的知识,同时为你找工作和职业发展打下坚实的基础。

www.zeeklog.com  - Agent-OS:用AI掌控你的电脑!!这个 AI 代理可以控制你的电脑并做任何事情!(生成应用程序、代码、RAG 等)

5. 大模型面试题

面试,不仅是技术的较量,更需要充分的准备。在你已经掌握了大模型技术之后,就需要开始准备面试,我们将提供精心整理的大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余。

www.zeeklog.com  - Agent-OS:用AI掌控你的电脑!!这个 AI 代理可以控制你的电脑并做任何事情!(生成应用程序、代码、RAG 等)

全套的AI大模型学习资源已经整理打包,有需要的小伙伴可以微信扫描下方CSDN官方认证二维码,免费领取【保证100%免费

www.zeeklog.com  - Agent-OS:用AI掌控你的电脑!!这个 AI 代理可以控制你的电脑并做任何事情!(生成应用程序、代码、RAG 等)


如有侵权,请联系删除。

Read more

零基础学AI大模型之Milvus实战:Attu可视化安装+Python整合全案例

零基础学AI大模型之Milvus实战:Attu可视化安装+Python整合全案例

大家好,我是工藤学编程 🦉一个正在努力学习的小博主,期待你的关注实战代码系列最新文章😉C++实现图书管理系统(Qt C++ GUI界面版)SpringBoot实战系列🐷【SpringBoot实战系列】SpringBoot3.X 整合 MinIO 存储原生方案分库分表分库分表之实战-sharding-JDBC分库分表执行流程原理剖析消息队列深入浅出 RabbitMQ-RabbitMQ消息确认机制(ACK)AI大模型零基础学AI大模型之Milvus部署架构选型+Linux实战:Docker一键部署+WebUI使用 前情摘要 1、零基础学AI大模型之读懂AI大模型 2、零基础学AI大模型之从0到1调用大模型API 3、零基础学AI大模型之SpringAI 4、零基础学AI大模型之AI大模型常见概念 5、零基础学AI大模型之大模型私有化部署全指南 6、零基础学AI大模型之AI大模型可视化界面 7、零基础学AI大模型之LangChain 8、零基础学AI大模型之LangChain六大核心模块与大模型IO交互链路 9、零基础学AI大模型之Prompt提示词工程 10、零基础

By Ne0inhk

教程:从零开始构建你的本地AI长视频生成智能体(使用 Python 基于阿里的通义万相Wan2.2 模型)-2025年

目录 第一部分:基石搭建 - 环境配置与模型API调用 步骤 1.1:硬件与软件准备 步骤 1.2:在LM Studio中下载并配置模型 步骤 1.3:编写Python脚本测试API调用 第二部分:核心引擎 - 视频序列的生成与拼接 步骤 2.1:设计并创建项目结构 步骤 2.2:封装模型接口 (src/model_interface.py) 步骤 2.3:开发批量生成逻辑 (src/generator.py) 步骤 2.4:实现基础视频拼接 (src/editor.py) 步骤 2.

By Ne0inhk
Browser-use:基于 Python 的智能浏览器自动化 AI 工具调研与实战

Browser-use:基于 Python 的智能浏览器自动化 AI 工具调研与实战

Browser-use:基于 Python 的智能浏览器自动化 AI 工具调研与实战 一、概述 Browser-use 是一个旨在将 AI “智能体”(Agents)与真实浏览器进行交互的 Python 库,可以轻松实现浏览器自动化。在配合 LLM(如 GPT 系列)使用时,浏览器-use 能够让你的智能体发起对网页的访问、操作页面元素、收集信息、执行脚本等,从而扩展 AI 应用的落地场景。 * GitHub: browser-use/browser-use * 官网: browser-use.com * 文档: docs.browser-use.com 目前 Browser-use 最低需要 Python 3.11 及以上,才能正常使用其封装的 Playwright

By Ne0inhk
在线浏览“秀人网合集”的新思路:30 行 Python 把封面图链接秒变本地可点图库

在线浏览“秀人网合集”的新思路:30 行 Python 把封面图链接秒变本地可点图库

用 30 行 Python 把秀人网公开合集“搬”进本地数据库 “秀人网”近日上线的新主题合集页采用前端渲染,数据通过 /api/v2/theme/list 接口一次性返回 JSON,无需模拟点击“加载更多”。接口无登录限制,但带 5 秒滑动窗口的 IP 频次校验:单 IP >30 次/分即返回 429。本文示范如何遵守 robots 协议、放缓速率,仅采集“公开可见”字段,并给出断点续抓、User-Agent 随机化、异常重试等常用技巧。 核心思路三步走: 分析列表接口:在浏览器 DevTools 里筛选 XHR,发现真实请求 URL

By Ne0inhk