简介
最近发现了一个超厉害的开源项目——Page-Agent,这是阿里巴巴开源的浏览器内 GUI Agent 框架,只需要一行代码就能让你的网站秒变 AI 原生应用。

Page-Agent 是阿里巴巴开源的纯前端浏览器内 GUI Agent 框架,无需后端部署即可集成 AI 能力。支持多种大语言模型如 OpenAI、Claude、Qwen 等,具备隐私优先、人机协同确认面板等特点。适用于智能表单填写、SaaS 助手、无障碍增强及多页面任务控制场景。通过引入一行代码即可为网站添加 AI 交互能力,适合开发者快速构建智能化应用。
最近发现了一个超厉害的开源项目——Page-Agent,这是阿里巴巴开源的浏览器内 GUI Agent 框架,只需要一行代码就能让你的网站秒变 AI 原生应用。

Page-Agent 可以自动识别网页中的表单字段,根据用户指令智能填写,大大提升工作效率。
为 SaaS 应用添加 AI 助手,让用户通过自然语言即可完成复杂操作。
帮助残障人士更好地使用网页,提供语音控制和智能导航功能。
通过浏览器扩展支持跨页面的复杂任务执行,实现真正的自动化工作流。
使用 Page-Agent 非常简单,只需要在你的网站中引入一行代码:
import { PageAgent } from '@alibaba/page-agent';
const agent = new PageAgent({
model: 'gpt-4',
apiKey: 'your-api-key'
});
agent.run('帮我填写这个表单');

Page-Agent 支持市面上主流的几乎所有大语言模型:
Page-Agent 采用纯前端架构,主要包含以下模块:
Page-Agent 作为一个开源的浏览器内 GUI Agent 框架,为我们提供了一种全新的网站智能化方案。它不需要后端部署,支持多种大模型,隐私安全,非常适合想要快速为网站添加 AI 能力的开发者。
如果你也在寻找一种简单高效的方式来为你的网站或应用添加 AI 交互能力,那么 Page-Agent 绝对值得一试!

微信公众号「极客日志」,在微信中扫描左侧二维码关注。展示文案:极客日志 zeeklog
生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online
基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online
查找任何按下的键的javascript键代码、代码、位置和修饰符。 在线工具,Keycode 信息在线工具,online
JavaScript 字符串转义/反转义;Java 风格 \uXXXX(Native2Ascii)编码与解码。 在线工具,Escape 与 Native 编解码在线工具,online
使用 Prettier 在浏览器内格式化 JavaScript 或 HTML 片段。 在线工具,JavaScript / HTML 格式化在线工具,online
Terser 压缩、变量名混淆,或 javascript-obfuscator 高强度混淆(体积会增大)。 在线工具,JavaScript 压缩与混淆在线工具,online