前言
企业还在手动处理重复性网页任务?Browser-Use 通过 AI 驱动模拟真人操作,自动完成数据抓取、表单填写、价格监控等任务,支持本地大模型(如 Gemma)分析结果。但本地部署仅限内网使用,异地任务管理困难——通过内网穿透技术实现公网控制,让自动化机器人 24 小时运行。
Browser-Use 核心功能:视觉识别(模拟鼠标点击/输入)、流程录制(一键生成自动化脚本)、抗反爬机制(随机 User-Agent、操作间隔)。适用场景:电商运营(竞品价格监控)、市场调研(问卷自动填写)、客服支持(故障诊断自动提交)。其优点在于零代码(纯自然语言指令)、多浏览器支持(Chrome/Edge/Firefox),且可集成 Ollama 本地模型,数据不上云更安全。
部署需先安装 Ollama(ollama run gemma3:27b),再启动 Browser-Use:python webui.py --port 7788。关键步骤:在'Agent Settings'中关闭'视觉识别'(非多模态模型需关闭);'LLM Settings'选择 Ollama,模型名填'gemma3:27b'。实用技巧:复杂任务拆分为多步指令(如'先登录→再搜索→最后截图');用'断言'验证操作结果(如'确认按钮是否出现')。
本地部署时,异地无法启动/暂停任务,只能让同事远程协助,响应滞后;客户演示自动化流程需投屏,无法让对方亲自操作。某运营团队反馈:'国外竞品的价格波动快,等我们上班看到数据,已经错过调价时机。'
通过创建 HTTP 隧道映射 7788 端口,生成公网地址,管理者即可下发指令。安全配置:启用'操作日志',追溯所有自动化行为;设置'指令白名单',仅允许预定义任务(如'仅允许监控京东价格')。
本文主要介绍如何在本地 Windows 系统部署 Browser-Use WebUI,并结合内网穿透工具实现远程使用 Browser-Use 操作浏览器智能抓取数据并通过本地 AI 大模型进行分析,执行任务,打造个人全自动 AI 助理。
1. 安装 Ollama
在部署 Browser-Use 之前,我们首先需要先准备好 Ollama 和你要使用的本地大模型以及虚拟环境配置。
本例中使用的是 Windows 11 系统专业版,通过 Ollama 运行本地大模型。访问 Ollama 的官网下载对应版本的安装程序并安装。
2. Gemma3 模型安装与运行
本例中我打算使用的本地模型是 Gemma3:27b,因为它有多模态能力,可以识别图片,稍后测试一下实际效果。
在 Ollama 的官网点击 Models,就能找到安装命令:
ollama run gemma3:27b
PS:默认会下载模型到 C 盘,如果想修改下载位置,可以在终端中执行下方命令来指定模型文件的存放目录,这里以 d:\ollama 为例,大家可以提前自定义位置:
如果你之前安装过 Ollama,在执行命令后出现提示,那么关闭终端,请先升级 ollama 到最新版本才能正常下载 gemma3 模型。
模型下载完成之后,安装成功后会提示 success。
3. 虚拟环境准备
3.1 安装 Python
本例使用 Windows 11 专业版系统进行演示:
首先需要安装 python 3.12。下载地址:Python Release Python 3.12.0 | Python.org
安装时需要注意,勾选下边两个选项,不然后续有可能报错:
安装结束后,如出现提示更改您的机器配置,以允许程序 (包括 Python) 绕过 260 字符的'最大路径'限制,同意即可。
确认后,点击 close 关闭即可完成 Python 环境安装。
3.2. 安装 conda
这里我使用的是本地已有的 conda 环境,大家也可以通过 UV 来创建虚拟环境:
conda 下载地址:Anaconda Installers and Packages
安装时需要注意的是在这一步,需要勾选第三个选项,自动加载刚才安装的 Python3.12 环境:
安装完成后,点击 Finish 即可。
4. 本地部署 Browser-Use WebUI
接下来开始在 Windows 系统使用 conda 本地部署 Browser-Use WebUI。


