Qclaw AI 智能体深度测评:本地执行与跨端能力实战
摘要 本文记录了 Qclaw 在真实 Windows 环境下的核心执行能力。测试涵盖本地文件系统的高级操作、带有思维链(CoT)的复杂文献检索,跨端传输能力以及核心的自主安全排雷与 Skill(插件)动态装载能力。
与传统的 ChatBot 不同,Qclaw 的核心差异在于它具备对本地环境的感知与执行权限。本文所有测试均在真实环境下完成,包含完整的执行逻辑分析与遇到的 Bug 记录。
一、测试环境说明
在进行 Agent 介入测试前,先界定基础的运行环境与预置条件:
OS: Windows 10 x64 (19045)
QClaw 版本:2026.3.8
工作区路径:E:\桌面(非默认 C:\Users 路径,用以测试路径解析能力)
前置依赖:wechat-access 插件(已配置,用以测试跨应用通信)
二、测试场景一:本地文件系统的自动化治理
1. 场景背景
测试目录(E:\桌面)内存在 57 个散落的异构文件,包含 .docx, .rar, .exe, .pdf, .lnk 等。传统脚本需要通过正则匹配扩展名来分类,无法基于'文件语义'进行归档。
2. 核心执行逻辑
在接收到 帮我整理一下桌面上散落的文档 指令后,Qclaw 自动读取了系统环境变量并定位到实际桌面路径。其整理过程展现了清晰的三阶段处理机制:
-
Phase 1:关键词匹配与归类 系统优先基于文件名进行精准或模糊匹配。通过底层日志可以看出,其对匹配结果输出了置信度评估:
{"file":"论文摘要.docx","destination_folder":"论文","method":"关键词匹配已有文件夹","confidence":"high"} -
Phase 2:基于语义的隐式分类 对于无法通过表面关键词匹配的文件,Qclaw 动用了大模型的语义理解能力。例如将
1 绪论.docx和创新点.docx统一归属于'毕设'分类,将智能垃圾桶技术方案.docx归入'实验室资料'。 -
Phase 3:兜底策略与异常处理 剩余文件按照扩展名(如 .exe 归入安装包)处理,并引入了时间戳维度(提取超 60 天未访问的文件)。
3. 执行结果与系统安全性评估
耗时不到 2 分钟,57 个文件全部归位。值得关注的是其底层的安全设计:
- 零破坏原则: 核心操作仅为 ,不涉及 或覆写。

