Cursor 3来了:内置Codex,前端福音Design Mode,WorkTree多开

Cursor 3来了:内置Codex,前端福音Design Mode,WorkTree多开

Cursor 3来了:内置Codex,前端福音Design Mode,WorkTree多开

用Cursor这种编辑器,经常遇到两个小痛点:一是他就一个聊天框,如果一个任务时间长一点,侧边栏就被占用,就没法干别的;二是害怕 Agent “一顿操作猛如虎”,直接把当前的主干分支改坏。

刚刚发布的 Cursor 3,重点就在解决这类工作流层面的问题。总体来看,它好像不太满足于做一个带对话窗的编辑器,而是在加强多任务并行和代码环境的安全隔离。

具体有三个最直接影响日常开发的新特性:

1. Agents Window:跑并行的任务控制台

快捷键Cmd+Shift+P 输入 Agents Window

以前的对话基本是一个单向的线性流。Cursor 3 将 Agent 抽离出了独立的面板区,你可以跨仓库、跨环境(本地、云端或远程 SSH)同时运行多个任务。

配合新增的 Agent Tabs,你可以在并排或网格视图下查看多个对话。
功能背后的思路很直白:让 AI 编程从“一次等一件事”变成“同时派发几个需求”。遇到修改范围大、耗时长的场景,把它丢在 Agents Window 里跑,自己切回主编辑器继续写代码,两边不会互相打扰。

你可能会问,这和在编辑器里装一个 Codex Plugin(或其它第三方 AI 侧边栏)有什么区别?

区别在于原生环境的接管深度底层任务编排能力

像 Codex Plugin 重点是打包复用单个工作流(比如一套 GitHub Code Review 加发布流程);而 Cursor 3 的 Agents Window 直接把自己变成了全局控制台。它不仅局限于“读写当前打开的文件”,还能直接接管 Git 底层机制(分配独立 Worktree、对比代码状态),并在多个并行的仓库(Multi-repo)间穿梭。如果你觉得过去的插件就像是装了个带对话框的侧边栏,那这次的 Agents Window 就是直接在编辑器里给你配了一个能跑多个项目的“带队经理”。

2. Git Worktree:物理隔离保护你的主干代码

触发方式:在对话区使用 /worktree/best-of-n 命令

过去让 Agent 操作大范围重构,它直接在你的当前文件上动刀。一旦它中途跑偏或者中断,人工去恢复或清理中间报错的代码非常头疼。

新加入的 /worktree 指令利用了 Git 原生特性提供了一个物理隔离方案:强制让 Agent 的改动全在一个独立的 Git Worktree 里跑,且全面支持多个仓库(Multi-repo)联动。这意味着即使项目包含好几个微服务或者不同的包,Agent 也可以在一个干净的“平行宇宙”里大刀阔斧地改。在这个沙盒里,无论它怎么折腾怎么卡顿,都不会弄乱你当前工作区里正在写的半成品代码,验证靠谱后再一键 Merge 即可。

顺着这个逻辑,Cursor 3 顺势把 /best-of-n 也移进了新的 Agent 窗口。你可以直接让几个不同的大模型,在各自隔离的 Worktree 里并行处理同一个需求。跑完之后像裁判一样直观对比 outcomes 结果,哪个模型写的顺眼就合并哪个,相当于发起了多场并行的“代码竞标”。

3. Design Mode:用框选代替语言描述

快捷键:在 Agents 窗口里按 Cmd+Shift+D 切换,Shift + 拖拽 选中页面区域,Cmd+L 添加到对话。

如果你写过前端,会知道用语言描述 UI 问题费时费力。比如“让导航菜单右数第二个蓝色登录按钮向下对齐2像素”,这种描述给到 Agent,它还得去猜对应的 CSS Class 和 DOM 层级。

Design Mode 允许你直接在浏览器里像使用截图软件一样,框选并提取特定界面元素。选好区域后用 Cmd+L 直接“指”给 Agent 看就行,免去了无穷无尽的口舌。对于开发者而言,这也额外治好了一个顽疾:当系统通过脚本自动点击网页 DOM 元素经常失效跑偏时,直观的视觉框选比猜前端 class 结构要准太多了。

(注:不仅是 Design Mode 加了基于截图定位的备选方案,这次更新对底层浏览器 Agent 也做了一波减法。官方严格收窄了它的工具权限,强制它专注于纯粹的浏览器操作,这能大幅减少之前它在网页里乱点导致的跑偏和报错死循环。)

4. 生态与性能细节扫除盲点

除了上面这三个大件,还有几个值得普通开发者留意的细节提升:

  • MCP 支持结构化输出(Structured Content):当你让 Agent 调用外部 MCP 接口或者 App 时,它现在能接收和解析出更富媒体、结构更清晰的数据。
  • 大文件 Diff 渲染变流畅了:以前只要 Agent 生成或比对几十上百行的长代码,编辑器必卡。这次更新重写了长文件比对,内存占用大幅缩减。
  • 过往聊天记录直接参与搜索:现在用到 At-mention(@ 提及)时,你的历史对话也会出现在搜索结果里,用来捞以前解决过的老 Bug 非常省事。

总结

Cursor 3 并没有一味追求所谓“更强”的模型噱头,而是回归到了人机交互的工程细节。

开个自带隔离环境的 Worktree,哪怕把最复杂的脏活丢给它,也不怕它把你正在写的状态干碎。如果遇到不好形容的样式 Bug,直接用 Design Mode 框选出来也就完事了。

如果你曾经也被 Agent 一顿乱改搞炸过本地分支,光是冲着能放开手脚瞎折腾的 Worktree,就值得立刻去升个级试一把。

Read more

融合满足多种条件:基于无人机的多模态目标检测的高多样性基准和基线

大家读完觉得有帮助记得关注和点赞!!! 摘要 (Abstract) 基于无人机(UAV)的可见光(RGB)与红外(IR)图像融合目标检测,借助深度学习技术的进步和高质量数据集的推动,实现了全天候的鲁棒检测。然而,现有数据集难以充分捕捉真实世界的复杂性,因其成像条件受限。为此,我们提出了一个高多样性数据集 ATR-UMOD,覆盖多样场景,飞行高度从 80m 到 300m,相机角度从 0° 到 75°,并包含全天候、全年份的时间变化,涵盖丰富的天气和光照条件。此外,每对 RGB-IR 图像标注了 6 个条件属性,提供有价值的高层上下文信息。 为应对如此多样条件带来的挑战,我们提出了一种新颖的 提示引导的条件感知动态融合(PCDF) 方法,利用标注的条件线索自适应地重新分配多模态贡献。通过将成像条件编码为文本提示,PCDF 通过任务特定的软门控变换,有效建模了条件与多模态贡献之间的关系。一个提示引导的条件解耦模块进一步确保了在无标注条件下的实际可用性。在 ATR-UMOD

【无人机路径规划】无人机三维路径规划中蚁群算法、A* 与 RRT* 算法对比(Matlab代码实现)

💥💥💞💞欢迎来到本博客❤️❤️💥💥 💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。 ⛳️座右铭:行百里者,半于九十。 📋📋📋本文目录如下:🎁🎁🎁 💥1 概述 随着无人机技术的快速发展,其在军事侦察、物流配送、环境监测等众多领域的应用日益广泛。在实际应用场景中,无人机需要在复杂的三维空间内规划出一条安全、高效的飞行路径,以避开障碍物并满足任务需求。蚁群算法、A* 算法和 RRT* 算法是目前无人机三维路径规划中常用的算法,它们各自具有独特的原理和特点,对其进行详细对比有助于根据具体应用场景选择最合适的算法。 蚁群算法 蚁群算法是一种模拟蚂蚁觅食行为的启发式优化算法。蚂蚁在寻找食物的过程中,会在走过的路径上释放信息素,信息素浓度越高的路径对其他蚂蚁的吸引力越大。在无人机路径规划中,将三维空间划分为多个节点,每只“虚拟蚂蚁”从起点开始,根据信息素浓度和启发式信息选择下一个节点,不断迭代更新信息素浓度,最终找到一条从起点到终点的最优路径。 A* 算法 A*

【实战教程】MATLAB GUI实现多算法雷达CFAR检测:从原理到可视化分析

1. 什么是雷达CFAR检测? 雷达恒虚警检测(CFAR)是雷达信号处理中的一项核心技术,简单来说就是在复杂多变的噪声环境中,始终保持稳定的目标检测能力。想象一下你在一个嘈杂的派对上试图听清朋友的谈话,CFAR就像是你的大脑自动调节"听力阈值"的过程——当环境噪音变大时,你会不自觉地提高注意力阈值;当环境安静时,又能降低阈值捕捉细微声音。 在雷达系统中,CFAR技术通过动态调整检测门限来实现这个功能。传统固定门限检测在噪声变化时要么漏检目标(门限过高),要么产生大量误报(门限过低)。而CFAR算法能够根据周围环境的噪声水平,实时计算出最合适的检测门限值。 MATLAB GUI实现的最大优势在于可视化交互。通过图形界面,我们可以直观地看到: * 原始噪声信号的波形特征 * 不同CFAR算法计算出的动态门限曲线 * 目标检测结果的标记位置 * 算法在不同信噪比下的表现差异 2. CFAR核心算法原理解析 2.1 均值类CFAR算法 均值类算法是CFAR家族中最基础的成员,其核心思想可以用"邻里比较"来理解。就像通过比较周围房屋的价格来评估某处房产价值一样,这些算法通