人形机器人放无人机,还能上天入海!有点过于赛博了吧

金磊 发自 凹非寺
量子位 | 公众号 QbitAI

现在的人形机器人啊,真的城会玩儿了。

这不,他们已经开始放!无!人!机!了!

你没听错,画面是酱紫的:

这还不算完。

这个被机器人放飞的无人机,飞着飞着,竟然开始潜水了!

以为是哪家机器人独角兽搞的花活儿?

No,No,No。

这场机器人和无人机联动的背后,正是中国电信 TeleAI

这一次,由中国电信集团CTO、首席科学家、中国电信人工智能研究院(TeleAI)院长李学龙教授团队领衔,直接甩出了一套具身智能组合:

  • 首款自研人形机器人:TeleBot-M
  • 全自研空海跨域具身智能体:TeleAqua-Bee

或许在大众的印象里,中国电信的形象还停留在拉网线、办宽带、通信号;但恰恰就是这家最懂通信的运营商,正在试图解决具身智能领域目前最大的隐形成本——协同与传输。

毫不夸张地说,机器人放无人机,实则是中国电信一次 “端-边-云”全栈自研体系的总验收。

机器人怎么放好无人机?

在“机器人放无人机”这个场景中,“机器人”和“无人机”,这两个本体自然是技术中的关键。

中国电信首款自研人形机器人
TeleBot-M

从外观上来看,它和那些全尺寸金属外壳的人形机器人不同,为了把TeleBot-M亲和力拉满、机身做小,同时在与无人机协同时,实现操作性和轻量化的完美平衡,团队将TeleBot-M的上肢简化到单臂4自由度,而下肢则保留单腿6自由度的设计,使其跑跳稳如老狗。

为了支撑这副躯体,TeleAI给它装上了一套自研的高性能神经系统TeleBotOS。这套系统对底层电气拓扑进行了重构,采用了自研创新的机器人嵌入式控制框架,为同时实现身体平衡控制和放飞指令发出提供了可靠的系统基石,实现不抢算力、不卡顿,无论后台任务多重,机器人的运动控制始终连贯精准。

TeleBot-M之所以能如此听话,离不开一颗由5000万条仿真数据喂出来的自主大脑

它依托业界首创的纯仿真评测平台NavGBench,在由世界模型TeleWorld生成的超5000个高保真3DGS虚拟场景中持续强化学习,打破了固定规则束缚,获得了在复杂动态环境中自主决策、路径规划与任务拆解的能力。

此外,TeleBot-M的小脑也值得好好说道说道。它引入了上下肢课程式对抗强化学习,研发团队在训练中故意给它的上肢施加随机干扰,就像有人在推搡它一样。

即便TeleBot-M机器人的上肢受到剧烈扰动,它就像练了太极似的,下肢依然能保持高鲁棒性,甚至还能同时完成毫米级的轨迹规划。

这套大小脑协同的认知体系,让机器人不仅能看懂世界,更能想明白该做什么。如果说小脑负责运动协调与抗扰平衡,大脑则掌舵全局思考,让TeleBot-M真正成为“有脑子、能进化”的具身智能体。

上天入海的TeleAqua-Bee

从外观上来看,它只有巴掌大,不足1kg,是可以直接塞进背包的那种。

它的桨叶还自带保护罩,不仅为了安全,更是为了适应复杂的流体环境。

TeleAqua-Bee最大的亮点是涵道推进器水空两用

在天上,它是无人机,续航10分钟;一头扎进水里,它就是潜航器,能潜航30分钟,最大潜深10米。

并且不只是防水那么简单,TeleAqua-Bee具备水面自回正功能,甚至能在水下稳定悬停。

除了Bee(掌上交互版),TeleAqua其实是一个家族:

例如TeleAqua-H8,主打一个“快速响应+高负载”,能扛5kg负载,空中续航15分钟,水下续航长达1小时,10米最大潜深应对长时间原位观测完全没压力。

TeleAqua-H4Z可以折叠机臂,水下航速超2m/s,专钻狭窄空间。

最后的TeleAqua-Edu,专为二次开发打造,是首款可分舱拼接的四轴飞潜航行器。

如此一来,TeleAqua家族系列的空海跨域具身智能体便全方位地覆盖了低空、水面和水下。

机器人和无人机介绍完了,接下来的问题就是,怎么连接

智传网(AI Flow),了解一下

在实验室里连根线当然容易,但如果是在远洋货轮、深山老林,或者信号只有一格的救灾现场呢?

这就触及到了中国电信的核心护力。

机器人和无人机算力是分开的,但数据流绝不能断。为此,TeleAI从理论到工程系统化布局了智传网(AI Flow)架构,而生成式视频压缩技术(GVC)正是智传网(AI Flow)信容律理论落地最硬核的一把尖刀。

智传网(AI Flow)不是简单的物联网,它是基于“信容律、同源律、集成律”三大定律构建的智能分发网络。

GVC则把信容律“用计算换带宽”的理念推向极致——传输语义与运动Token,而非像素本身。传统视频编码搬的是画面,GVC传的是经过高度抽象的语义特征。

原生1GB视频压缩至200KB,压缩率干到惊人的0.02%,靠的正是这种“像素不进网,画面靠生成”的代际革命。

这是TeleAI从2024年就开始布局的理论地基。

在这个架构下,端-边-云不再是割裂的:

  • 端侧(机器人/无人机): 小模型负责即时反应,比如避障、保持平衡。
  • 边侧:边缘节点负责实时决策与任务调度,在靠近现场的位置完成异构指令融合、多智能体协同,既减轻云端压力,也守住毫秒级响应底线。
  • 云侧: 大模型负责全局规划,比如“去哪里搜救”、“路线怎么走”。

TeleAI下的一盘大棋

看到这里,你可能明白了。

TeleAI花了两年时间,织出了一条清晰的技术路线:智传网(AI Flow)、人形机器人、跨域潜航器。

今天展示的“机器人放无人机”,就是这两年织网收上来的第一网鱼。

这不仅仅是具身智能和水下具身智能设备之间的连接与交互,而是为异构具身智能本体之间构建了一个紧密协同的社群。未来,空中无人机、地面机器人、水下潜航器与云端大脑将通过智传网(AI Flow)实现无障碍沟通与协作,每一个智能体既是独立的个体,又是群体智慧的无限延伸。

民企做机器人,卷的是运动性能、卷的是BOM成本。而中国电信TeleAI 做机器人,卷的是“云网融合+AI原生”

TeleAI的选择也非常清醒:

首先就是最苦、最险、人最不想去的地方。

想象一下这样的场景:洪水冲断了道路,地震堵死了大门,或者深海光缆需要检修。

以前,是救援人员冒着生命危险,赌运气往里冲。

现在,TeleBot-M作为先遣队员,背着TeleAqua进入毒气弥漫或极度缺氧的区域。遇到水域阻隔,TeleAqua起飞、入水,钻入狭窄的水下空间。

借助智传网(AI Flow),哪怕基站全损,只剩微弱的卫星信号,指挥中心依然能通过指令重绘,看清现场的每一个细节。

而且不仅是抢险救援,比如临地安防、城市管理、工业巡检、海洋勘探相关等等,反正这种人干有危险或者不好实现的场景,就可以派它们去。

传像素是19世纪的思维,传指令才是未来的逻辑。

这不仅是两个设备的物理连接,更是有温度的科技。

正如TeleAI所期望的那样:

替人赴险的勇气,守护生命的底气。

有了这对具身智能搭子:险地可闯,困境可破;生命有托,希望不落。

还有,从一个机器人+无人机,其实这是一个起点,我们所看到的是群体智能的未来。

这,或许才是硬核科技最大的浪漫。

Read more

【实战】Windows 下为 Stable Diffusion WebUI 编译 Flash-Attention 2.8.0 专属 Wheel(RTX 3090 sm_86)

【实战】Windows 下为 Stable Diffusion WebUI 编译 Flash-Attention 2.8.0 专属 Wheel(RTX 3090 sm_86)

【实战】Windows 下为 Stable Diffusion WebUI 编译 Flash-Attention 2.8.0 专属 Wheel(RTX 3090 sm_86) 系列:Windows AI 环境 “没有轮子(.whl)就自己造” 从零到一 · 第 N 期 难度:⭐⭐⭐⭐ 适用场景:SD WebUI + xformers 0.0.31.post1 + flash-attn 版本冲突修复 适用场景:其他版本的 Flash-Attention 编译实战请见文末引用链接 一、背景与问题描述 彻底解决 Stable Diffusion WebUI 启动报错:

轻量级前端革命:为什么 Lit 和 Alpine.js 正在悄悄取代你的“重量级”框架?

作为一名摸爬滚打十年的前端老炮儿,我最近在代码仓库里发现一个有趣现象:越来越多的开发者开始“戒掉” React/Vue 的庞大生态,转而拥抱两个名字简单到近乎“冷门”的库——Lit 和 Alpine.js。它们不依赖 Webpack 或 Rollup,直接以纯 ESM(ECMAScript Modules)形式运行,体积小到只有 10KB 左右(压缩后),却能解决日常开发中的高频痛点。今天,咱们就来扒一扒这两位“低调的狠人”,看看它们如何用极简设计,重新定义现代 Web 开发的效率边界。 一、纯 ESM:轻量级库的“灵魂”所在 先搞清楚一个关键点:为什么 ESM 是轻量级库的基石? 传统前端库依赖打包工具(如 Webpack)将代码“打包”

【前端】HTTP请求方式:GET、POST 与其他请求方法详解

【前端】HTTP请求方式:GET、POST 与其他请求方法详解

文章目录 * * 前言 * 定义概念 + 缩写 * 一、HTTP 是什么? * 二、常见请求方式 * 性质 * 一、GET 请求 * 特点 * 示例 * 适用场景 * 二、POST 请求 * 特点 * 示例 * 适用场景 * 三、PUT 请求 * 特点 * 示例 * 四、PATCH 请求 * 特点 * 五、DELETE 请求 * 特点 * 六、GET 与 POST 核心区别总结 * 使用步骤 * 一、在 Axios 中的标准写法 * 统一写法(推荐) * 二、什么时候用 GET?

Shannon:让 AI 替你当黑客,自动找出 Web 应用的真实漏洞

Shannon:让 AI 替你当黑客,自动找出 Web 应用的真实漏洞

Shannon:让 AI 替你当黑客,自动找出 Web 应用的真实漏洞 你的代码每天都在更新,但渗透测试一年只做一次?Shannon 来填补这 364 天的安全空白。 了解 Shannon Shannon 是一个全自动 AI 渗透测试工具,由 Keygraph 团队开源(AGPL-3.0 协议)。它不是传统的漏洞扫描器——它模拟真正的黑客行为,自主分析你的源代码,操控浏览器执行真实攻击,最终交付一份的渗透测试报告。 在 XBOW 基准测试中,Shannon Lite 取得了 96.15% 的成功率。GitHub 上已获得 10.6k Star,是近期安全领域最受关注的开源项目之一。 运行原理 Shannon 模拟人类渗透测试人员的工作方法,采用多智能体架构,分四个阶段执行: