AI 日报 - 2026年3月25日

AI 日报 - 2026年3月25日

1. "龙虾"OpenClaw史上最大更新翻车,腾讯微信插件也遭殃

OpenClaw("龙虾")在3月23日推出v2026.3.22版本——史上规模最大的一次重构,插件系统全面改头换面,结果翻车了。升级包甚至漏掉了控制台,创始人公开道歉并紧急热修,腾讯微信官方插件直接被系统警告为"危险代码",海量第三方插件瞬间失效。有用户调侃:OpenClaw把测试工作"光荣外包"给了全体用户。目前v2026.3.23修复版已上线,WorkBuddy和QClaw不受影响。

📎 来源:澎湃新闻


2. Luma AI发布Uni-1:让图像模型先"想"再"画"

Luma AI在3月23日推出Uni-1图像模型,技术路线反传统——放弃了主流扩散模型,改用Decoder-only自回归架构,把文本和像素"混排"进同一序列同步生成,生成过程的推理链甚至肉眼可见。基准测试里,空间推理能力超越谷歌Nano Banana 2,逻辑推理约是GPT Image的两倍,API成本比对手低10%~30%,整体偏好人类评测排名第一。"DDIM之父"宋佳铭带队华人团队打造,目前已开放免费试用。

📎 来源:AIBase


3. 国家数据局官宣:Token中文名正式叫"词元"

给用了这么久的Token补一个官方中文名——国家数据局正式将其定名为"词元"。解释是:它是AI理解语言的最小单位,切分粒度介于字和词之间,比"令牌"更准确、比"标记"更直观。别小看这一纸命名,统一术语意味着从此各部门的AI统计数据有了共同语言,监管和标准化都方便多了。

📎 来源:腾讯新闻


4. 博鳌论坛2026年年会聚焦AI:专家警告别只盯着"省人工"

博鳌亚洲论坛2026年年会(3月24日~27日,海南)今日密集讨论AI议题。国务院原副秘书长江小涓在分论坛直接说了大实话:要谨慎发展"单纯节约劳动力"的AI,不能光想着降成本,要同步解决被替代低端劳动者的生存问题。思客会同步围绕AI产业趋势与挑战展开讨论,多位专家呼吁完善监管机制,推动AI真正赋能千行百业,而不仅仅是"裁员工具"。

📎 来源:财新网 / 新华网


5. 阿里达摩院玄铁C950刷新全球RISC-V纪录,能跑千亿参数大模型

阿里达摩院3月24日亮出新成果:玄铁C950处理器单核性能突破70分,创下全球RISC-V新纪录。更关键的是,它内置了自研AI加速引擎,原生支持千亿参数大模型推理,同时集成机密计算安全隔离功能。中科院院士倪光南评价:RISC-V正走向主流,国产芯片借此开辟了一条新路子。

📎 来源:AIBase / IT之家

Read more

路灯故障识别:通过GLM-4.6V-Flash-WEB自动巡检

路灯故障识别:通过GLM-4.6V-Flash-WEB自动巡检 在城市夜晚的街道上,一盏熄灭的路灯可能意味着安全隐患,也可能只是定时关闭。但对运维人员来说,如何快速、准确地判断这盏灯是“正常关灯”还是“设备故障”,长期以来都是个难题。传统依赖人工巡查的方式不仅耗时耗力,还容易遗漏偏远路段或夜间突发问题。而如今,随着多模态大模型技术的成熟,我们终于有了一种更聪明的解决方式——用AI做“城市夜视员”。 智谱AI推出的 GLM-4.6V-Flash-WEB 模型,正悄然改变这一局面。它不像传统图像识别系统那样只能告诉你“这里有灯”或“没亮”,而是能结合时间、环境和视觉细节,像人类专家一样推理:“当前是深夜23点,周围道路无施工迹象,该路灯未点亮且灯罩有裂痕,判定为损坏。”这种从“看到”到“理解”的跃迁,正是智慧运维迈向真正智能化的关键一步。 从“看得见”到“看得懂”:GLM-4.6V-Flash-WEB 的能力本质 GLM-4.

MogFace人脸检测模型-WebUI多场景实践:教育OMO平台课堂专注度分析数据源

MogFace人脸检测模型-WebUI多场景实践:教育OMO平台课堂专注度分析数据源 1. 服务简介与教育应用价值 MogFace人脸检测模型是一个基于ResNet101架构的高精度人脸检测解决方案,在CVPR 2022会议上发表并获得了学术界认可。这个模型特别适合教育OMO(Online-Merge-Offline)平台的课堂专注度分析场景,能够为教学评估提供可靠的数据支撑。 在教育场景中,传统的课堂观察往往依赖人工记录,存在主观性强、覆盖面有限、数据难以量化等问题。MogFace通过自动化人脸检测,可以准确识别课堂中的每个学生,记录他们的位置、朝向和基本表情特征,为后续的专注度分析提供标准化数据输入。 核心教育价值: * 客观数据采集:自动识别并记录课堂中所有学生的人脸信息,消除人工记录的主观偏差 * 全时段覆盖:支持对整个课堂过程进行持续监测,不漏掉任何重要时刻 * 多维度分析:提供人脸位置、大小、角度等基础数据,为专注度算法提供输入 * 隐私保护:本地化部署确保学生影像数据不出校园,符合教育数据安全要求 2. 快速上手:教育场景专用配置 2.1 访问教

【笔记】Trae+Andrioid Studio+Kotlin开发安卓WebView应用

【笔记】Trae+Andrioid Studio+Kotlin开发安卓WebView应用

文章目录 * 简介 * 依赖 * 步骤 * AS(Andriod Studio)创建项目 * AS创建虚拟机 * TRAE CN 修改项目 * 新增按键捕获功能 * 新增WebView * WebView加载本地资源 * 在按键回调中向WebView注入JS代码 * 最终关键代码 * 吐槽 简介 使用Trae配合Andriod Studio开发一个内嵌WebView的安卓应用, 在WebView中加载本地资源, 在APP中捕获按键事件对WebView中的内容进行操作; 依赖 * Trae CN (https://www.trae.com.cn/) * Andriod Studio (https://developer.android.google.cn/studio?hl=zh-cn), 以下简称AS * 吃内存, 占用了我大约6GB内存 * 下载项目依赖和安卓虚拟机(约2GB)依赖网络 * 基础的编程知识 步骤 AS(

Qwen3-VL-WEBUI税务申报辅助:发票识别部署教程

Qwen3-VL-WEBUI税务申报辅助:发票识别部署教程 1. 引言 1.1 业务场景描述 在企业财务和税务管理中,发票识别与信息提取是高频且繁琐的重复性任务。传统方式依赖人工录入,效率低、出错率高。随着大模型技术的发展,尤其是多模态视觉语言模型(VLM)的进步,自动化处理发票成为可能。 阿里云最新开源的 Qwen3-VL-WEBUI 提供了一个开箱即用的图形化界面工具,内置 Qwen3-VL-4B-Instruct 模型,具备强大的 OCR 能力、结构化解析能力和自然语言理解能力,非常适合用于税务申报中的发票自动识别与数据提取。 本教程将带你从零开始,在单张 NVIDIA 4090D 显卡上完成 Qwen3-VL-WEBUI 的部署,并实现对增值税发票、电子普通发票等常见票据的精准识别,助力企业财税流程智能化升级。 1.2 痛点分析 当前发票处理面临以下挑战: - 发票格式多样(PDF、JPG、扫描件),倾斜、模糊、光照不均影响识别效果;