1. 【AI Coding 工具】Claude Code 终于补上了'长期记忆'——claude-mem 走红
Claude Code 好用,但它有个老问题:每开一个新会话,之前的项目背景、处理过的决策、踩过的坑都得重新说一遍,像是把搭档的记忆清空了。现在有个开源插件 claude-mem 专门在补这块短板。
它的做法不复杂:自动记录每次会话里的工具调用信息,包括读了哪些文件、改了哪些代码、执行了什么命令;会话结束后再用 AI 把这些内容压缩成结构化摘要,下次启动时自动注入。原本一万 Token 左右的操作记录,最后能压到 500 Token 左右,还支持自然语言检索历史,比如直接问'上次那个 React 重复渲染是怎么解的?'
现在它已经有超过 3 万收藏,官方/项目方宣称能节省 90% 的 Token。对重度依赖 Claude Code 的人来说,这类插件很实用,至少比等官方慢慢补齐要省事得多。
2. 【AI Coding 框架】LangChain 推出 DeepAgents:Agent 不再只会聊天
LangChain 这周在 GitHub 上放出了一个新框架 DeepAgents,基于 LangGraph,重点是三件事:任务规划、文件系统持久化、子智能体动态派生。
它的思路比较工程化。主智能体接到任务后先写计划,再把子任务拆给专门的子智能体去跑,过程中产生的数据直接落到文件系统,而不是一股脑堆在上下文窗口里。这样做是为了解决长流程任务里最常见的几个麻烦:上下文容易爆、步骤一多就跑偏、任务结果没地方沉淀。
LangChain 创始人 Harrison Chase 最近说过一句话:'模型能力正在商品化,真正决定 Agent 上限的,是运行框架。' DeepAgents 基本就是这句话的落地版本。它不花哨,但方向很明确。
3. 【具身智能产业】融资继续升温,重心开始从'四肢'转向'大脑'
36 氪最近整理的这组数据挺能说明问题:2026 年开年两个月,具身智能赛道融资总额已经逼近 150 亿元,百亿估值独角兽也冒出了 7 家,包括宇树科技、智元机器人、银河通用机器人、星海图等。
更关键的是,资本关注点在变。以前更看重机器人'四肢'——关节、驱动器、机械性能;现在开始往'大脑'上压,核心就是多模态大模型和决策系统。千寻智能开源了 Spirit v1.5 物理交互模型,智平方推出 GOVLA 全身 VLA 大模型,星海图则在尝试绕过语言中介,让机器人直接从动作里学习物理逻辑。
但这条路离真正成熟还远。全球实际部署的机器人数量还不足千台,数据规模也只有自动驾驶的十分之一左右,很多公司的估值更多还是建立在未来预期上,不是今天的订单。
4. 【前沿技术】NVIDIA 把 AI 数据中心往太空上推
GTC 2026 上,黄仁勋拿出了一张很科幻的牌:Vera Rubin 太空模块。它是专门面向轨道数据中心设计的 AI 计算单元,目标是在太空里直接跑大语言模型和基础模型。
这套方案在架构上用了紧耦合 CPU-GPU 和高带宽互连,AI 算力号称是 H100 的 25 倍,可以实时处理太空仪器产生的大量数据流。整套设计走的是 100% 液冷和无缆路线,方便在轨道环境里部署。
地面部分也同步在扩张。Vera Rubin 平台单 POD 含 2 万枚芯片,Token 生成速率达到 7 亿/秒,比两年前快了 350 倍。NVIDIA 的算力版图,已经不满足于地面机房了。
5. 【行业活动】AI Show 2026 在北京开幕,人形机器人量产元年的第一次集体亮相
今天,2026 北京国际人工智能应用与机器人创新博览会(AI Show 2026) 在中国国际展览中心(朝阳馆)开幕,为期三天,超过 200 个品牌参展。
展会覆盖大模型、具身智能、人形机器人、AI+ 制造等方向。行业里普遍把 2026 年看作'人形机器人量产元年',这场展会算是一次很直接的检验:到底能不能量产、能不能真正落地,现场看真机比看 PPT 靠谱得多。
接下来几天,大概率会有不少一手产品信息和落地案例流出来,值得继续盯着。


