Fara-7B：微软推出高效计算机代理模型

Fara-7B 简介

Fara-7B 是微软的第一个代理小语言模型（SLM），专门设计用于计算机使用。Fara-7B 仅具有 70 亿个参数，是一种超紧凑的计算机使用代理（CUA），在其尺寸类别内实现了最先进的性能，并可与更大、更资源密集型代理系统竞争。

本地使用指南

尝试在本地使用 Fara-7B，如下所示（请参见 GitHub 仓库安装部分有关 Windows 的详细指示）或通过 Magentic-UI：

# 1. Clone repository
git clone https://github.com/microsoft/fara.git
cd fara

# 2. Setup environment
python3 -m venv .venv
source .venv/bin/activate
pip install -e .
playwright install

然后在一个过程中，托管模型:

vllm serve "microsoft/Fara-7B" --port 5000 --dtype auto

然后，您可以用以下方式迭代查询它:

fara-cli --task "whats the weather in new york now"

要尝试在 Magentic-UI 中使用 Fara-7B，请按照以下说明。你需要像以前一样为模型提供服务，但你可以使用 Magentic-UI，而不是 fara-cli，Magentic-UI 有一个漂亮的 UI。

注意事项:

如果您使用的是 Windows，我们强烈建议使用 WSL2（Linux 的 Windows 子系统）。
你可能需要做 --tensor-parallel-size 2 如果内存不足，使用 vllm 命令

任务类型	演示
购物	[视频演示]
GitHub 问题	[视频演示]
配有奶酪的说明	[视频演示]

Fara-7B 的独特之处

与传统的基于文本的聊天模式不同，Fara-7B 利用计算机界面——鼠标和键盘——代表用户执行多步任务。该模式:

视觉操作: 通过感知网页并执行滚动、输入和直接点击预测坐标等操作，而不使用无障碍树或单独的解析模型
支持设备端部署: 由于其紧凑的 7B 参数大小，减少了延迟并提高了隐私性，因为用户数据保持在本地
高效完成任务: 平均每项任务只有~~16 个步骤，而可比模型为~~41 个

Fara-7B 是使用一种基于 Magentic-One 多代理框架的新型合成数据生成管道进行训练的，具有 14.5 万条轨迹，涵盖各种网站、任务类型和难度级别。该模型基于 Qwen2.5-VL-7B 并通过有监督微调进行训练。

关键能力

Fara-7B 可以自动化日常的网络任务，包括:

搜索信息和总结结果
填写表格和管理账户
预订旅行、电影票和餐厅预订
在各零售商之间购物和比较价格
查找招聘信息和房地产信息

演出亮点

Fara-7B 在多个 Web 代理基准测试中实现了最先进的结果，性能优于同类大小的模型和更大的系统:

模型	参数	WebVoyager	在线 M2W	DeepShop	WebTailBench
SoM 代理人 (GPT-4o-0513)	-	90.6	57.7	49.1	60.4
SoM 代理人 (o3-mini)	-	79.3	55.4	49.7	52.7
SoM 代理人 (GPT-4o)	-	65.1	34.6	16.0	30.8
GLM-4.1V-9B-思考	9B	66.8	33.9	32.0	22.4
OpenAI 计算机使用预览	-	70.9	42.9	24.7	25.7
UI-TARS-1.5-7B	7B	66.4	31.3	11.6	19.5
法拉 -7B	7B	73.5	34.1	26.2	38.4

任务分段	任务	SoM GPT-4o-0513	SoM o3-mini	SoM GPT-4o	GLM-4.1V-9B	OAI 应用程序使用	UI-TARS-1.5	法拉 -7B
单点任务	购物	56	62.5	71.4	38.1	31.0	42.3	41.1
单点任务	航班	51	60.1	39.2	11.1	10.5	17.6	10.5
单点任务	酒店	52	68.6	56.4	31.4	19.9	26.9	35.3
单点任务	餐馆	52	67.9	59.6	47.4	32.1	35.9	22.4
单点任务	活动	80	70.4	62.9	41.7	26.3	30.4	9.6
单点任务	票务	57	58.5	56.7	37.4	35.7	49.7	30.4
单点任务	房地产	48	34.0	17.4	20.1	16.0	9.0	9.7
单点任务	工作/职业生涯	50	49.3	44.0	32.7	22.7	20.7	20.7
多步骤任务	购物清单（2 项）	51	66.0	62.7	17.0	7.8	34.0	20.9
多步骤任务	比较购物	57	67.3	59.1	27.5	22.8	1.2	8.8
多步骤任务	组成任务	55	51.5	39.4	26.7	17.0	10.3	9.1
全部的	宏观平均值	609	59.7	51.7	30.1	22.0	25.3	19.9
全部的	微观平均值	609	60.4	52.7	30.8	22.4	25.7	19.5

Fara-7B：微软推出高效计算机代理模型

Fara-7B 简介

本地使用指南

Fara-7B 的独特之处

关键能力

演出亮点

更多推荐文章

相关免费在线工具

WebTailBench: 现实世界 Web 任务的新基准

WebTailBench 详细结果

评价基础设施

安装

Linux

Windows

托管模型

Azure Foundry 托管（推荐）

使用 vLLM 或 LM Studio/Ollama 进行自助托管

可重复性

WebEval 包安装

运行评估

注释

评估结果分析

评价产出结构

运行分析

引用

更多推荐文章

相关免费在线工具

Fara-7B：微软推出高效计算机代理模型

Fara-7B 简介

本地使用指南

Fara-7B 的独特之处

关键能力

演出亮点

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

WebTailBench: 现实世界 Web 任务的新基准

WebTailBench 详细结果

评价基础设施

安装

Linux

Windows

托管模型

Azure Foundry 托管（推荐）

使用 vLLM 或 LM Studio/Ollama 进行自助托管

可重复性

WebEval 包安装

运行评估

注释

评估结果分析

评价产出结构

运行分析

引用

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具