2026年3月18日 AI 每日动态

2026年3月18日 AI 每日动态

1. 【AI Coding 工具】Claude Code 终于有了"长期记忆"——claude-mem 爆红

Claude Code 用起来顺手,但每次开新会话就像把同事的记忆清零——项目背景要重新交代,之前做过的决策一问三不知。现在有个叫 claude-mem 的开源插件彻底改变了这件事。

它的工作方式很直接:自动抓取每次会话里的工具调用记录(读了哪些文件、改了哪些代码、跑了什么命令),会话结束后用 AI 把这些信息压缩成结构化摘要,下次开工时自动注入进来。一万 Token 的操作记录,最终压缩到 500 Token 左右,同时还支持自然语言检索历史("上次那个 React 重复渲染是怎么解的?")。

目前已有超 3 万人收藏,宣称能节省 90% 的 Token 消耗。对重度使用 Claude Code 的开发者来说,这东西值得装一装看看。

📌 为什么值得关注:记忆问题是目前所有 AI 编程助手的共同痛点,claude-mem 用了一种轻量但很务实的方式切入,比等 Anthropic 官方"原生解决"要实际得多。


2. 【AI Coding 框架】LangChain 发布 DeepAgents:Agent 从"聊天"走向"干活"

LangChain 这周在 GitHub 悄悄推送了一个新框架 DeepAgents,基于 LangGraph 构建,主打三件套:任务规划工具 + 文件系统持久化 + 子智能体动态派生

说白了就是:主智能体接到任务后先写计划、可以把子任务分包给专门的子智能体去跑、过程中产生的数据实时存文件系统而不是靠上下文窗口撑着。这套架构解决了 Agent 处理长流程任务时最头疼的几个问题:上下文撑不住、多步骤走着走着就偏了、任务结果没地方落地。

LangChain 创始人 Harrison Chase 最近也公开说了一句让人印象深刻的话:"模型能力正在商品化,真正决定 Agent 上限的,是运行框架。" DeepAgents 可以理解为他对这句话的实践版答案。

📌 为什么值得关注:Agent 领域不缺想法,缺的是能跑起来的工程框架。DeepAgents 完全开源,架构设计偏实战,值得有 Agent 落地需求的团队认真看一下。


3. 【具身智能产业】7 家百亿独角兽,"四肢"生意让位给"大脑"

36氪今天发了一篇很有意思的产业梳理:2026 年开年两个月,具身智能赛道融资总额已经逼近 150 亿元,百亿估值独角兽冒出了整整 7 家,包括宇树科技、智元机器人、银河通用机器人、星海图等。

更值得关注的是资本押注方向在悄悄转移——从机器人"四肢"(关节、驱动器等机械性能)转向"大脑"(多模态大模型与决策系统)。千寻智能开源了 Spirit v1.5 物理交互模型,智平方推出 GOVLA 全身 VLA 大模型,星海图则在尝试绕过语言中介、让机器人直接从动作里学物理逻辑。

当然,真实情况也没那么完美:全球实际部署机器人还不足千台,数据规模不到自动驾驶的十分之一,部分企业估值靠的是对未来的想象而非今天的订单。

📌 为什么值得关注:产业正从"做出来"走向"怎么用起来",VLA 路线基本收敛,谁能在真实产线跑通闭环,谁就拿到了下一轮的底牌。


4. 【前沿技术】NVIDIA 把 AI 数据中心送上了太空轨道

在 GTC 2026 上,黄仁勋亮出了这届发布会最科幻的一张牌:Vera Rubin 太空模块——专门为轨道数据中心设计的 AI 计算单元,目标是在太空里直接跑大型语言模型和基础模型。

技术上,它采用紧耦合 CPU-GPU 架构配合高带宽互连,AI 算力是 H100 的 25 倍,能实时处理太空仪器产生的海量数据流,整体走 100% 液冷 + 无线缆路线,方便轨道部署。

配合地面的 Vera Rubin 平台(单 POD 含 2 万枚芯片,Token 生成速率 7 亿/秒,比两年前快了 350 倍),NVIDIA 的算力版图正在从地面向太空延伸。

📌 为什么值得关注:太空轨道 AI 计算不是概念,是 NVIDIA 针对地球观测、通信卫星、深空探测等实际需求的系统性押注,这条线会和具身智能、自动驾驶的数据采集需求紧密咬合。


5. 【行业活动】AI Show 2026 今日北京开幕,人形机器人量产元年的第一次集体亮相

今天,2026 北京国际人工智能应用与机器人创新博览会(AI Show 2026) 在中国国际展览中心(朝阳馆)正式开幕,为期三天,超过 200 个品牌集中参展。

展会覆盖大模型、具身智能、人形机器人、AI+制造等核心方向。业界普遍把 2026 年称为"人形机器人量产元年",这届展会算是这个判断的第一次产业级检验——能不能量产、能不能用,在展馆里一看便知。

📌 为什么值得关注:技术发布会看的是 PPT,展会看的是真机。这几天会有大量一手产品信息和落地案例流出,值得持续关注。

Read more

LazyLLM 测评 | 低代码颠覆 AI 开发!代码专家智能体进阶模块实战

LazyLLM 测评 | 低代码颠覆 AI 开发!代码专家智能体进阶模块实战

摘要: LazyLLM 是商汤大装置推出的开源低代码框架,作为构建和优化多 Agent 应用的一站式开发框架,覆盖应用搭建、数据准备、模型部署、微调、评测等全流程开发环节,提供丰富的工具支持。其以模块化设计打破传统开发壁垒,通过数据流驱动重构开发逻辑,能让开发者用极简代码实现工业级复杂 AI 应用,摆脱冗余编码束缚,聚焦核心业务场景,降低 AI 应用构建成本并支持持续迭代优化。堪称 AI 开发者的 “效率神器”,其技术普惠理念为 AI 开发领域带来新的实践范式,推动了更高效的开发模式。本文将以Python编程为切入点,带你深入了解LazyLLM框架。 LazyLLM 是构建和优化多 Agent 应用的一站式开发工具,为应用开发过程中的全部环节(包括应用搭建、数据准备、模型部署、模型微调、评测等)提供了大量的工具,协助开发者用极低的成本构建 AI 应用,并可以持续地迭代优化效果。 LazyLLM作为商汤大装置推出的开源低代码框架,简直是AI开发者的“效率神器”

By Ne0inhk

低代码AI平台:Coze与Dify深度对比

低代码 AI 平台(如 Coze 和 Dify)旨在降低 AI 应用开发门槛,使开发者甚至非技术人员也能快速构建基于大模型(LLM)的智能应用。它们通常提供可视化编排、插件集成、知识库管理、对话流程设计等功能。在实际项目中,常常需要将这些平台与现有系统集成,或进行二次开发以满足特定业务需求。 以下从 集成方式 与 二次开发能力 两个维度,分别介绍 Coze 和 Dify 的特点及实践建议: 一、Coze(字节跳动) 1. 集成方式 * Webhook / API 调用 Coze 支持通过 Bot ID 和 API Token 调用其提供的 RESTful API,可将 Bot

By Ne0inhk
【机器人】复现 RoboBrain2.0 具身大脑模型 | 统一感知、推理和规划能力

【机器人】复现 RoboBrain2.0 具身大脑模型 | 统一感知、推理和规划能力

RoboBrain 2.0是一个机器人的具身大脑模型,具备统一感知、推理和规划能力; 同时适应对物理环境中复杂的具身任务; 它提供不同版本:轻量级的3B、7B模型和全尺寸的 32B 模型,包含视觉编码器和语言模型。 代码地址:https://github.com/FlagOpen/RoboBrain2.0 论文地址:RoboBrain 2.0 Technical Report 目录 快速了解模型 1、创建Conda环境 2、安装依赖库 3、安装torch 4、模型推理 示例1:图文问答,使用RoboBrain2.0-7B模型,不开思考模式 示例2:图文问答,使用RoboBrain2.0-7B模型,开启思考模式 示例3:图文问答,使用RoboBrain2.0-3B模型 示例4:

By Ne0inhk
汽车雷达在多径存在下的幽灵目标检测——论文阅读

汽车雷达在多径存在下的幽灵目标检测——论文阅读

汽车雷达在多径存在下的幽灵目标检测 D. Sharif, S. Murtala and G. S. Choi, “A Survey of Automotive Radar Misalignment Detection Techniques,” in IEEE Access, vol. 13, pp. 123314-123324, 2025, doi: 10.1109/ACCESS.2025.3584454. 摘要 共置多输入多输出(MIMO)技术已被广泛应用于汽车雷达系统,因为它能够以相对较少的发射和接收天线数量提供精确的角度估计。由于视距目标的发射方向(DOD)和到达方向(DOA)重合,MIMO信号处理允许形成更大的虚拟阵列用于角度查找。然而,多径反射是一个主要的限制因素,雷达信号可能从障碍物反弹,创建DOD不等于DOA的回波。因此,在具有多个散射体的复杂场景中,目标的直接路径可能被其他物体的间接路径破坏,导致不准确的角度估计或产生幽灵目标。

By Ne0inhk