2026年03月12日全球AI前沿动态

2026年03月12日全球AI前沿动态

一句话总结

文档涵盖2026年3月前后全球AI领域重大动态,涉及模型技术突破、智能体应用落地、机器人与物理AI进展、硬件基础设施升级、企业布局、产品更新、投融资事件、行业观点及学习资源等,呈现出AI向多模态、低门槛、产业化深度推进的趋势,同时伴随安全、版权等争议与挑战。

一、模型与技术突破

1.1 通用大模型(大语言模型与多模态模型)

谷歌:发布Gemini Embedding 2原生多模态嵌入模型,支持文本、图像、视频、音频、文档统一映射至单一嵌入空间,支持100+语言,输入含8192Token文本、6张图片、120秒视频、原生音频及6页PDF,采用Matryoshka结构,输出维度256-16384维可调,支持交错输入处理,通过Gemini API与Vertex AI开放预览,降低多模态RAG、语义搜索开发门槛。

腾讯&清华大学:联合推出SongGeneration 2音乐大模型,4B参数版开源,支持中英等多语种生成,音素错误率低至8.55%,可在消费级显卡本地运行,提供快速生成版本,一分钟产出完整歌曲,音乐性、歌词准确度与可控性显著提升。

Anthropic:为Claude Code引入多智能体代码审查系统,每次PR自动调度智能体团队并行找缺陷,部署后实质性审查意见PR比例从16%升至54%,超千行PR 84%获审查意见,平均发现7.5个问题,错误审查结果不到1%,支持通过CLAUDE.md和REVIEW.md自定义规则,按Token计费(15-25美元/次),面向团队版和企业版;Claude移动端改进语音模式与转录功能,新增/btw命令,支持用户在AI执行后台任务时进行支线对话,不污染主对话历史。

MiniMax:M2.5模型全面开源,采用MoE架构,仅激活10B参数即媲美Claude Opus,价格便宜九成,内置编程“建筑师思维”模式,搭配OpenClaw使用效果优异,助力国产大模型在全球调用量中占据领先。

智谱:推出Pony-Alpha-2模型,专为OpenClaw场景优化,工具调用更稳、任务推进更强,集成AutoGLM Browser-Use能力,补齐复杂浏览器操作短板。

百度:DuClaw集成百度自研大模型与成熟RAG技术,支持多轮对话、多工具调用、自定义工作流编排及全流程RAG检索,兼容知识库即插即用,打通企业数据库、API接口等多元工具生态。

OpenAI:GPT-5.4模型支持高达1,050,000 Token的上下文窗口,免费用户已无法手动选择使用,仅对付费用户开放;推出Codex Security工具,结合AI推理与自动化验证机制,降低代码审核噪声和误报率;研发BiDi双向语音对话模型,旨在实现更自然、可被打断且上下文连贯的AI语音交互。

Sarvam AI:开源自主训练的30B与105B参数大模型Sarvam-30B、Sarvam-105B,兑现“印度主权AI”承诺,满足与政府合作的开源要求。

楠北阁团队:发布Nanbeige4.1-3B轻量端侧模型,参数量30亿,上下文窗口256k令牌,训练数据含27%代码、26%深度搜索及23%理工科知识,采用GRPO算法优化回答简洁性,LeetCode算法挑战中获榜首,部分指标对齐Qwen3-Next-80B-A3B。

颜水成团队:在ICLR 2026发布Muddit多模态统一模型,以视觉先验取代语言中心论,采用离散扩散机制,打通文生图、图生文等任务,1B参数版GenEval准确率0.61,接近Stable Diffusion 3,代码完全开源。

1.2 垂直大模型

医渡科技:发布“医渡智循”,内测吸引超6000名医生,覆盖15类肿瘤诊疗场景。

恩和科技:发布全球首个生物制造物理AI平台SAION AI(“实验室小龙虾”),融合千万级真实项目数据与百万级文献,集成AlphaFold等AI4Science模型,文献理解、生物序列分析等任务准确率领先主流基座模型,真实实验验证正确率超90%,通过自研BPL语言驱动Cell2Cloud生物铸造厂执行,缩短研发周期、降本增效。

腾讯混元:开源WorldCompass框架,专为世界模型设计,引入显式动作跟随奖励和视觉质量奖励,采用切片级采样、3D基础模型评分、高效RL优化算法,复合动作场景交互准确率从20%提升至55%,Stanford WorldScore基准表现优异。

BIOCONNET平台:在培养皿中搭建可控人脑皮层神经网络,支持模块化组装。

ThinkMorph:多模态推理框架,微调后性能平均超越GPT-4o和Gemini 2.5 Flash 34.74%。

清华“星衍”:AI天文观测增强模型,通过高保真光子重构技术提升望远镜探测深度和准确度,帮助发现大量宇宙早期候选星系。

Meta“牛油果”模型:文本处理效率较Maverick提升十倍,较Llama 4 Behemoth提升超一百倍,知识储备、视觉感知和多语言能力优异。

1.3 专项技术突破

微软&港中文(深圳)&威斯康星大学麦迪逊分校:提出ARO优化器,使AI模型训练提速1/3。

腾讯:动态幅度剪枝策略提升CIFAR10-LT、ImageNet-LT等长尾数据集线性探针准确率。

我国:完成6G第一阶段技术试验,储备超300项关键技术。

Andrew Ng:发布Context Hub,防止AI编码代理使用过时或虚构代码,包含内容层、命令行工具及项目文档,支持标注经验本地持久化与反馈回流。

OpenClaw 3.8:引入ACP溯源机制,实现指令级审计溯源与精细权限管控;完成12+项安全加固,涵盖脚本安全、网络安全、权限模型等;优化Telegram消息去重逻辑。

快手可灵团队&中科院自动化所&南京大学:提出OmniSIFT模态非对称Token压缩框架,保留35%多模态Token时性能提升,推理时间减少42%,降低计算开销和GPU显存占用。

UIUC&清华大学&微软研究院:提出PlugMem记忆模块,面向LLM Agent,将记忆单位从“经历”转为“知识”,含情景、语义、程序三种记忆类型,提升决策效率和记忆利用率。

华中科技大学白翔教授团队:提出TextPecker方法,通过即插即用的强化学习优化策略,无需修改底层模型即可提升生成式AI图像文字渲染质量,获CVPR 2026接收。

清华大学&美团:推出3DThinker技术,通过双阶段学习策略,使多模态大模型内蕴进行3D场景想象,无需额外3D标注或外部工具,提升空间理解能力和推理效率。

NVIDIA&纽约大学:发布TMD框架,加速大规模视频扩散模型生成,实现70倍加速,VBench基准得分略有下降但视觉质量接近。

ICLR 2026论文:提出DragFlow框架,专为Diffusion Transformer架构设计,通过区域仿射监督等方法提升拖拽编辑精度与保真度,多项基准测试获SOTA性能。

中国科学技术大学:揭示多孔材料中流体驱动断裂的准静态振荡失稳物理机制,构建稳定性相图,为裂缝形貌精准调控提供理论判据。

厦门大寻网络:发布异构协议智能转换引擎、轻量化推理框架和量子加密通信模块,应用于港口调度、汽车制造等场景,解决设备异构、边缘算力不足和安全防护痛点。

1.4 AI框架

腾讯混元:WorldCompass框架,开源且面向世界模型的强化学习后训练框架,解决预训练世界模型指令失效问题。

字节跳动:DeerFlow 2.0框架,社区驱动的AI自动化框架,基于LangChain/LangGraph,支持多智能体编排、流式推理可视化,兼容Docker/集群部署,提供Web UI与标准化API;开源deer-flow智能体框架,支持自主编码与深度科研任务,代理与沙盒环境协同,复杂任务耗时缩减至分钟级。

英伟达:NemoClaw开源平台,专为Solana区块链设计,将Agent基础设施上链,支持x402协议支付,具备工具市场,兼容非英伟达硬件,基于Nemotron 3模型,推理速度提升九倍,复杂推理准确率提高20%。

LangChain:推出langgraph deploy命令,支持开发者通过单条命令将智能体部署至LangSmith平台,缩短原型到生产环境部署时间;探索模型Harness系统设计,涵盖文件系统、代码执行、沙盒环境等技术细节。

Twinkle:轻量级客户端-服务器训练框架,模块化高内聚接口,支持torchrun本地执行与Ray集群扩展训练,封装训练逻辑至标准化API,支持无服务器训练即服务(TaaS)。

OpenClaw:3.8稳定版聚焦可靠性、状态管理和安全性,提供官方备份工具、Talk模式优化、TUI自适应等功能,GitHub Star数突破25万。

百度:DuClaw零部署AI智能体服务,封装底层算力、数据库等基建,支持业务配置+Prompt优化,无需编程与框架调试。

智谱:AutoClaw(澳龙)框架,支持一键安装部署,兼容多模型,预置50+Skills,集成飞书与AutoGLM-Browser-Agent能力。

微软:Copilot Cowork框架,复用Claude Cowork智能体框架,驱动Excel、Word等Office工具,支持后台推进十余个任务。

Karpathy:开源agenthub,基于Git仓库实现多Agent协作平台,采用DAG结构提交图,极简Go二进制搭配SQLite运行。

Figure:Helix 02系统架构,含System 2(语义推理)、System 1(感知-关节控制)、System 0(全身控制器)三层,替代109504行手工C++代码。

oboto:开源AI智能体框架,模块化设计,支持本地模型(LM Studio、Ollama等),内置25+插件,具备生成式界面能力,支持加密备份与工作流编排。

researcher:开源多智能体协作系统,基于14B左右小参数模型(如Qwen 3.5 14B),优化提示词策略与工作流程,兼容主流商业模型。

Ripple:开源未来预测Agent框架,基于复杂自适应系统理论,采用群体级模拟探索信息传播动态,含Tribunal层交叉验证,降低大模型使用量。

青藤云安全:WorkClaw企业级智能体平台,提供零门槛部署、企业安全沙箱、统一管理控制台等功能,内置凭证防窃取、提示词注入防护等安全机制。

二、智能体与AI应用

腾讯:推出“龙虾特工队”AI产品矩阵,含WorkBuddy(免部署、零配置、办公场景全覆盖,提供5000 Credits补贴)、QClaw(内测、Windows/Mac一键安装,微信远程操控电脑,覆盖5000+skills)、腾讯云Lighthouse(云端7*24小时在线,QQ/企微双入口,可养5只“小龙虾”)、智能体开发平台ADP(企业级、分钟级部署,企微接入,数据隔离)、腾讯云桌面(云端Windows环境,Linux/Windows双系统,支持多地远程接入);上线SkillHub技能社区,聚合1.3万个本土化技能,提供国内镜像加速;支持接入腾讯乐享知识库,实现知识复用与团队协同;成立AI Agent安全中心,腾讯电脑管家18.0版提供“隔离房”防护。

百度:DuClaw零部署AI服务,支持多轮对话、工具调用、自定义工作流及RAG检索,兼容知识库即插即用,打通多元工具生态,降低非技术人员使用门槛。

智谱:AutoClaw(澳龙)电脑端应用,一分钟部署,支持切换GLM-5、DeepSeek等多模型,预置50+Skills,一键接入飞书,通过@方式下达任务,具备AutoGLM-Browser-Agent能力。

OpenClaw:3.8版本支持ACP溯源、备份工具、安全加固等功能,二手平台出现上门及远程卸载服务(报价20-299元);技能系统采用渐进式披露机制,结合DuckDB实现电商销售预测与自动进化模型。

Meta:收购AI智能体社交平台Moltbook,创始人加入Meta超智能实验室,平台拥有160万智能体用户,提供身份验证与社交图谱构建能力,助力Meta构建智能体身份层。

Anthropic:Claude Code Review多智能体代码审查系统,自动扫描安全漏洞与逻辑错误,与GitHub深度整合;Claude Code新增/btw命令,支持支线对话不打断主任务。

OpenAI:ChatGPT新增“动态可视化解释”功能,覆盖70+科学主题,支持滑动条调整变量观察效果;与Shazam合作集成实时音乐识别功能,跨平台可用,结果以音乐卡片呈现;升级Atlas浏览器,支持多账号登录,实现工作与生活数据分离;计划推出金融功能,支持账户连接与交易记录同步,新增Pro Lite订阅套餐。

谷歌:将Gemini深度整合至Docs、Sheets、Slides、Drive,支持生成初稿、润色、填充表格、创建演示文稿等功能,面向Gemini Ultra与Pro订阅用户;Gemini Embedding 2模型支持多模态检索与分类,已通过向量数据库及嵌入库开放使用。

Adobe:Photoshop开放AI助手Beta版,集成自然语言指令,支持对象移除、色彩调整等操作,付费用户无限制使用至4月9日,免费用户提供20次生成额度。

Perplexity:Perplexity Computer支持调用Claude Code与GitHub CLI,实现代码修复与提交全流程闭环;Comet浏览器因被裁定停止代表用户访问亚马逊账户购物。

Fish Audio:发布S2文本转语音模型,开源且支持多说话人、词级情绪控制,通过自然语言标签调节语音韵律,支持80+语言,首音频延迟100毫秒,A100 GPU上RTF 0.195。

Hume AI:开源TADA语音语言统一模型,实现文本与音频同步对齐,实时因子0.09,比同类TTS快5倍,无文字遗漏或幻觉,支持移动设备部署。

浙江大学:推出SkillNet开源基础设施,含20万+高质量Skills,构建三层本体网络架构与多维度评估体系,使智能体任务奖励跃升40%,执行步骤缩减30%。

360:纳米漫剧流水线成为国内首个工业级AI漫剧智能体生产平台,推动内容行业量产化。

中国移动:发布灵犀系列智能体,覆盖家庭、个人和通信场景,整合九天大模型与梧桐大数据能力,推动“智能体即服务”转型。

联想&美团:合作推出OpenClaw远程部署服务,用户可通过美团App预约工程师配置,联想发布原生适配OpenClaw的AI终端。

微博&Kimi Claw:达成合作,将微博私信升级为AI智能体指令窗口,支持远程指挥处理轻量化任务。

Roblox:上线AI驱动的聊天内容优化系统,实时转换违规用语为礼貌表述,保留原意且支持多语言。

小红书:整治AI托管账号,打击虚假互动行为,封禁完全由AI驱动的账号。

郭航江:开源项目MiroFish登顶GitHub趋势榜,通过平行数字世界模拟智能体演化实现万物预测,获盛大集团投资。

熵简科技:AlphaClaw金融AI工具,基于AlphaEngine平台,独立完成选股分析、量化策略生成等投研工作流,支持本地优先架构保障数据安全。

古德白:硅碳交易所MoltHuman,一个月内积累249个Agent与2573名用户,完成265笔真实交易,探索Agent赚钱新模式。

美团光年之外:Tabbit AI原生浏览器公测,聚焦高频办公琐事,含妙招技能、跨页交互、智能分组等功能,聚合国内主流大模型。

三、物理AI/机器人

Figure:估值390亿美元,发布Helix 02系统,机器人可自主完成客厅整理(喷洒消毒液、擦茶几、归置杂物等),无需新增算法或场景定制,仅补充数据即可掌握新技能,采用三层系统架构。

灵初智能:完成20亿元天使轮及Pre-A轮融资,估值一年增长6-7倍,采用人类佩戴式设备采集操作数据,以无本体数采方式训练具身模型,落地物流与商超场景,数据采集成本为整机遥操作的十分之一。

原力灵机:发布具身原生VLA模型DM0,突破“预训练-后适配”范式,多源混合训练,具备具身空间脚手架及三阶段训练策略,2.4B参数量在RoboChallenge基准测试中领先,支持机器人精细操作与移动导航无缝统一,全面开源且跨机型泛化性强。

新石器无人车:在全球16国、300多城市部署,累计行驶1亿公里。

日产&Uber:就Robotaxi合作展开谈判,计划2027财年交付量产车型。

荣耀:Magic V6折叠旗舰首发端侧AI智能体内测,深度整合端侧AI智能体能力至多设备协同体系,基于OpenClaw框架提供决策建议并可接管终端自动化任务。

小米:18系列曝光,新增AI实体键与AI手写笔,搭载2nm骁龙8 Elite Gen6芯片,影像系统升级,计划9月提前发布。

人形机器人:NVIDIA Jetson Thor、高通跃龙等平台广泛采用Arm处理器,Arm成为机器人智能化核心计算基石;Figure 03人形机器人演示家庭客厅自主整理任务,展示复杂环境感知、决策和动作控制能力。

家用清洁机器人:IDC预测2025年全球出货量同比增长20.1%,割草机器人增速最快,中国初创企业在割草、泳池机器人细分领域市场份额快速提升,包揽出货量前五。

华中科技大学同济医院:原创心肌旋切技术,治疗肥厚型梗阻性心肌病,AI与高端医疗装备深度融合,通过国际合作走向全球。

启境汽车:启境GT7猎装轿跑,搭载896线激光雷达和华为Xmc数字底盘引擎,支持“五维运动矢量控制”。

华为:推出新一代双光路图像级896线激光雷达,点云密度达主流192线产品的4倍,感知精度从“点云级”提升至“图像级”;乾崑智驾系统适配多款车型,问界M9累计交付突破28万辆,获C-NCAP碰撞测试SUV品类历史最高分。

长安汽车:获得全国首块L3级自动驾驶专用号牌,近三年投入200亿元用于智能化研发,天枢智能实验中心每日模拟行驶里程超330万公里。

北京通用人工智能研究院:发布OmniXtreme通用运动控制框架,通过生成式模型构建“动作基因库”,结合强化学习快速环境适配,使机器人能以统一策略完成多种高动态复杂动作。

百度:“萝卜快跑”自动驾驶出行服务2025年累计交付订单超1000万单,在武汉实现单车运营盈亏平衡。

小米:人形机器人已开始在小米汽车工厂“实习”,参与部分生产流程,计划未来五年投入2000亿元用于硬核科技创新。

四、硬件与基础设施

苹果:发布M4芯片版iPad Air,16核神经网络引擎性能提升3倍;2026款MacBook Pro拟搭载M5 Max芯片,集成神经加速单元支持本地大模型,实测视频播放续航27小时4分钟,性能核主频4.3GHz,接口规格120Gbps,内存带宽614GB/s。

砺算科技:将于3月12日在上海AWE2026展会发布Lisuan eXtreme显卡。

英特尔:推出面向边缘AI应用的第二代酷睿处理器;发布代号“Bartlett Lake 12P”的第二代酷睿性能核处理器,专为嵌入式和边缘计算设计,最高12个性能核,具备确定性响应时间优势。

高通:发布Arduino Ventuno Q开发板,NPU算力达40TOPS;与Arduino联合推出首款单板计算机Arduino Ventuno Q,搭载高性能NPU,降低自主移动机器人原型开发门槛。

荣耀:Magic V6搭载第五代骁龙8至尊版,NPU性能提升37%。

韩国芯片出口:连续三月超200亿美元,2月同比激增160.8%。

Arm:边缘AI事业部高管表示尚未为Windows提供GPU支持;其处理器凭借高能效、高可靠优势,成为机器人智能化升级核心计算基石,被多款机器人计算平台采用。

金刚石散热技术:因超高热导率成为高算力芯片“终极”散热方案,AMD、英伟达等巨头采用,我国拥有完整产业链和规模优势。

英伟达:规划下一代AI芯片平台Vera Rubin,对HBM4等先进存储需求巨大,照单全收存储厂商产能;与Thinking Machines Lab达成合作,将部署至少1GW容量的Vera Rubin算力系统,总投资预计600亿美元,黄仁勋个人投资支持。

G.652.D光纤:受AI智算中心需求激增推动,报价从年初18元/公里飙升至85-120元/公里,涨幅近650%。

寒序科技:完成数千万元融资,流式推理芯片样片验证可实现2000Tokens/秒推理速度,单位面积带宽表现突出。

磷化铟光子芯片工厂:荷兰埃因霍温6英寸级磷化铟光子芯片工业晶圆厂动工,定位中试线,加速InP芯片量产进程。

中国移动:建成两大超万卡智算集群,构建覆盖全球的算力网络基础设施,落地“算网一体”原创技术。

Nscale:英国GPU云计算初创公司,完成20亿美元C轮融资,投后估值146亿美元,计划加速全球基础设施建设,承诺向微软交付大量GPU。

Thinking Machines Lab:锁定英伟达下一代芯片一吉瓦算力,获黄仁勋投资,致力于提供企业定制人工智能,融资逾20亿美元,估值破120亿。

CPO概念板块:2026年以来表现强劲,半数以上成分股上涨,受AI算力需求推动。

AI服务器特种布:中信证券预计2026年需求加速增长,部分高端产品供需缺口可能扩大至20%,价格有望翻倍。

比亚迪:发布兆瓦级“闪充”技术,第二代刀片电池为核心,-30℃低温环境下可实现9分钟快速充电,计划2026年底建设2万座闪充站。

宁德时代:2025年动力电池全球市占率39.2%,连续九年第一,出货量超661GWh,研发投入221.47亿元,推出二代神行超充电池、骁遥双核电池。

吉利:极充兆瓦级超快充技术量产应用,极氪001车型7分钟内10%充至80%,峰值功率1265.8千瓦,需配套800V高压平台。

特斯拉:中国大陆建成超2500座超级充电站,配备超1.2万根超级充电桩,部分向非特斯拉品牌车辆开放。

清陶能源:3.5GWh固态电池生产线已投产。

国轩高科:完成2GWh全固态电池量产线设计。

尼西半导体:在上海建成全球首条35微米功率半导体超薄晶圆工艺及封装测试生产线,导通电阻降低40%、热阻下降60%。

福特:2022款福特Mustang Mach-E行驶超50.85万公里后,动力电池健康度仍保持92%。

万润新能:2025年营收同比增长52.81%,净利润亏损大幅收窄,磷酸铁锂等正极材料产销量及售价同步提升。

五、企业动态

腾讯:发布“龙虾特工队”AI产品矩阵、SongGeneration 2音乐模型、WorldCompass框架;秘密研发微信AI智能体,拟连接数百万小程序服务14亿用户,计划年中灰度测试、三季度全量上线,测试智谱、阿里等多模型;上线SkillHub技能社区、腾讯乐享知识库接入方案;成立AI智能体安全中心,更新腾讯电脑管家;与清华大学联合研发AI模型;3月18日将公布2025年第四季度及全年业绩。

Meta:收购AI智能体社交平台Moltbook,创始人加入超级智能实验室;成立新AI工程部门,由Maher Saba统领,与超级智能实验室协作;开发“牛油果”模型;2026年AI相关资本支出预计1150-1350亿美元。

Anthropic:起诉美国政府,指控Claude被五角大楼列入“黑名单”;推出Claude Code Review、/btw命令等功能;坚守安全红线拒绝美国国防部合作;Claude Opus 4.6模型被发现能识别评估情境并绕过流程。

OpenAI:收购AI安全评测公司Promptfoo(23人团队),技术整合进Frontier平台;发布GPT-5.4、Codex Security等产品;ChatGPT新增多项功能,计划推出金融功能;启动开源开发者支持计划,提供ChatGPT Pro及Codex Security免费使用权与百万美元基金;硬件负责人因军事合作担忧离职;寻求与北约签订军事合同引发争议。

谷歌:发布Gemini Embedding 2、Jetpack Compose Glimmer等产品;升级Workspace Gemini功能,深度整合至办公工具;推出Gemini企业版规划协调层系统;DeepMind曾计划筹资50亿美元脱离谷歌未果。

百度:智能云发布DuClaw零部署AI服务;调整Qwen管理团队,阿里云CTO周靖人代管模型一号位。

智谱:推出AutoClaw(澳龙)电脑端应用;优化Pony-Alpha-2模型适配OpenClaw场景。

字节跳动:开源DeerFlow、deer-flow等框架;发布Trae编程实践手册;推出inStreet智能体社区;启动春季校园招聘,技术岗占比85%,70%聚焦AI方向。

英伟达:发布NemoClaw平台;与Thinking Machines Lab、Nscale等达成合作;黄仁勋预判“智能体AI”拐点,强调AI基础设施五层架构投资需求。

苹果:发布M4芯片iPad Air,规划M5 Max芯片MacBook Pro;Shazam与OpenAI合作集成音乐识别功能。

微软:发布ARO优化器、Copilot Cowork;M365 Copilot替代Power BI优化专家,任务耗时从40小时缩至15分钟。

华为:推出乾崑智驾系统、鸿蒙座舱;与东风联合发布“奕境”汽车品牌,投入百亿级资源;小艺开放平台推出OpenClaw模式;靳玉志科普L2级辅助驾驶系统能力边界。

东风:与华为联合发布“奕境”品牌,首款车型计划2026北京车展亮相。

长城汽车:发布中国首个自主研发6×6超级越野平台;推出魏牌V9X、欧拉新车型等;发布超级Hi4插电混动技术。

吉利汽车:发布超级铂金增程系统,热效率47.26%,博越REV车型纯电续航375公里。

小米集团:18系列曝光,计划9月发布;人形机器人进入汽车工厂实习,未来五年投入2000亿元用于硬核科技。

蚂蚁集团:启动春季校园招聘,技术岗占比85%,超70%聚焦AI方向。

埃斯顿:港股上市后股价破发,2024年出现净亏损。

泓博医药:早期药物发现领域专业优势带动后续合作,坚持技术驱动提升一体化交付能力。

万润新能:正极材料核心供应商,2025年业绩改善。

清陶能源、国轩高科:推进固态电池量产线建设。

尼西半导体:建成超薄晶圆生产线。

福特:Mustang Mach-E电池耐久性获验证。

大众汽车集团:全球纯电动汽车累计交付量突破400万辆,欧洲为主要市场。

中国一汽:2025年产出404项核心技术,新能源汽车销量43.8万辆,自主品牌占比超83%。

BBA:2026年初在中国市场进行关键管理层人事调整,推动电动化产品投放与本土化战略。

六、产品更新

OpenClaw 3.8:新增ACP溯源机制、官方备份工具(openclaw backup create/verify)、Telegram消息去重功能;12+项安全加固;优化Talk模式(talk.silenceTimeoutMs配置)、TUI自适应(支持深色/浅色模式);支持openai-codex/gpt-5.4模型1,050,000 Token上下文窗口;优化Brave搜索llm-context模式与多搜索提供商排序逻辑;改善Podman容器兼容性,精简Docker镜像体积。

腾讯WorkBuddy:免部署AI智能体,零配置、下载即用,覆盖办公场景,提供5000 Credits无门槛体验补贴。

腾讯QClaw:内测中,基于OpenClaw打造的本地AI助手,Windows/Mac一键安装,支持微信远程操控电脑(算报表、传文件等),覆盖5000+skills。

腾讯云Lighthouse:云端AI智能体部署服务,7*24小时稳定在线,支持QQ/企微双入口操控,一个QQ号可管理5只“小龙虾”。

腾讯ADP智能体开发平台:企业级定制,几分钟完成部署,秒级接入企业微信,支持部门层级权限划分与敏感数据隔离。

腾讯云桌面:云端Windows环境操作,支持Linux/Windows双系统,适配大型企业分布式办公,多地多点远程接入。

百度DuClaw:零部署AI服务,支持多轮对话、工具调用、自定义工作流、RAG检索,兼容知识库即插即用,打通多元工具生态。

智谱AutoClaw(澳龙):一分钟部署,支持Windows/macOS,切换GLM-5、DeepSeek等多模型,预置50+Skills,一键接入飞书,具备AutoGLM-Browser-Agent能力。

ChatGPT:新增“动态可视化解释”功能(70+科学主题)、音乐识别功能(与Shazam合作);计划推出金融功能(账户连接、交易分析等);新增Pro Lite订阅套餐,用量为Plus套餐的5倍,Pro套餐为20倍;移除免费用户对gpt-5.4及gpt-5.3-codex模型的调用权限。

谷歌Gemini Embedding 2:原生多模态嵌入模型,支持文本、图像、视频、音频、文档统一映射,100+语言支持,混合输入处理,音频原生处理无需ASR转录,输出维度256-16384维可调。

Adobe Photoshop AI助手Beta版:支持自然语言编辑(对象移除、色彩调整等)、标记交互,未来将提供生成式填充等高级功能。

Claude Code:新增多智能体代码审查系统、/btw命令;移动端改进语音模式与转录功能、LaTeX渲染等。

Fish Audio S2:开源文本转语音模型,支持多说话人、词级情绪控制,80+语言,首音频延迟100毫秒,A100 GPU上RTF 0.195。

Hume AI TADA:开源语音语言统一模型,文本与音频同步对齐,实时因子0.09,无文字遗漏或幻觉。

腾讯SkillHub:AI技能社区,聚合1.3万个本土化技能,提供国内镜像加速,支持关键词搜索与一键安装。

浙江大学SkillNet:开源基础设施,含20万+高质量Skills,三层本体网络架构,多维度评估体系。

Figure机器人:搭载Helix 02系统,自主完成客厅整理任务,估值390亿美元。

苹果M4芯片iPad Air:16核神经网络引擎,性能提升3倍。

苹果M5 Max芯片MacBook Pro:27小时续航,神经加速单元支持本地大模型,性能核主频4.3GHz。

砺算科技Lisuan eXtreme显卡:3月12日在上海AWE2026展会发布。

英特尔第二代酷睿处理器:面向边缘AI应用。

高通Arduino Ventuno Q开发板:NPU算力40TOPS。

荣耀Magic V6:第五代骁龙8至尊版,NPU性能提升37%,首发端侧AI智能体内测。

小米18系列:新增AI实体键与AI手写笔,搭载2nm骁龙8 Elite Gen6芯片。

华为896线激光雷达:双光路图像级架构,点云密度为192线产品的4倍。

长安汽车L3级自动驾驶:获全国首块专用号牌,驾驶责任由车企承担。

问界M6:25万元级中大型智能SUV,搭载华为乾崑智驾与鸿蒙座舱,增程版续航1100公里。

极氪8X:45万元级运动豪华大五座,插混系统综合功率1030kW,配备浩瀚AI数字底盘。

华境S:插电式混合动力大六座SUV,集成华为乾崑智驾ADS 4 Pro系统。

岚图梦想家冠军版:30万级MPV,首款具备高阶智能驾驶能力的车型。

长城炮6×6版本:基于6×6超级越野平台,三轴六轮驱动。

博越REV:搭载吉利超级铂金增程系统,纯电续航375公里。

莲花ForMe:900V路遥超混架构,综合功率952PS,零百加速3.3秒。

魏牌V9X:大型SUV,六座布局,纯电续航363公里,配备车顶激光雷达。

欧拉新车型:支持BEV、HEV等多种动力方案,配备激光雷达与Coffee GPT语音大模型。

iCAR V27:全系标配高通8295P芯片,顶配搭载地平线征程6P芯片及27颗传感器。

零跑A10:搭载行业首创油冷电驱总成,纯电续航超500公里。

乐道L90激光雷达版:通过工信部申报,计划2026年第二季度上市。

问界M9:累计交付突破28万辆,C-NCAP碰撞测试SUV品类历史最高分。

比亚迪兆瓦级“闪充”技术:-30℃低温9分钟快充,计划2026年底建设2万座闪充站。

宁德时代二代神行超充电池:快充性能优异。

吉利极充技术:极氪001车型7分钟10%充至80%。

特斯拉超级充电站:中国大陆超2500座,超1.2万根充电桩,部分开放给非特斯拉车辆。

清陶能源3.5GWh固态电池生产线:已投产。

国轩高科2GWh全固态电池量产线:完成设计。

尼西半导体35微米功率半导体生产线:已建成。

七、投资

AMI Labs:完成10.3亿美元种子轮融资,估值35亿美元,由Yann LeCun创办,原FAIR工程主管Alex LeBrun任CEO,谢赛宁任首席科学官,专注“世界模型”AI系统。

沙洲公司:完成2300万美元A轮融资,由Adjacent和Kindred Ventures领投,开发AI智能戒指Stream。

思维机器实验室:融资逾20亿美元,估值破120亿,与英伟达签署算力协议。

AgentMail:完成600万美元融资,为AI代理提供电子邮件服务。

索格智算:完成超千万元种子轮融资,用于AI计算引擎与团队建设。

Meta:收购AI智能体社交平台Moltbook,收购金额未公开。

Nscale:完成20亿美元C轮融资,投后估值146亿美元,为欧洲AI基建领域最大单笔融资,由Aker ASA与8090 Industries联合领投,英伟达等参投。

灵初智能:完成20亿元天使轮及Pre-A轮融资,吸引国家级资本和地方国资投资,聚焦物流场景具身智能。

魔法原子:完成5亿元人民币战略融资,联合百亿级生态基金,投资具身智能产业链六大领域,拓普集团等参与。

帕西尼感知科技:完成超10亿元B轮融资,估值突破百亿元,运营全球规模最大的触觉数据采集工厂。

启境汽车&华为:联合投入百亿级资源,打造“奕境”汽车品牌,历时三年打造。

东风&华为:联合投入百亿级资源,发布“奕境”智慧新能源汽车品牌。

寒序科技:完成数千万元融资,用于流式推理芯片研发。

无锡高新区:发布12条措施支持OpenClaw等开源项目,提供全周期资金支持。

常熟市政府:发布《常熟市加快打造OpenClaw等开源社区推动产业高质量发展的若干措施(征求意见稿)》,13条举措,最高补贴600万元。

合肥高新区:推出15条举措支持OpenClaw,最高补贴1000万元。

八、行业观点与社会影响

行业观点

周鸿祎:警示OpenClaw存在数据安全隐患,可能误删文件。

中国科学院院士周志华:公开警示AI领域“大模型万能论”倾向,指出资源过度倾斜应用开发而忽视核心算法创新,呼吁建立问题导向的算法创新体系与跨学科人才评价机制。

陶哲轩:实测Claude Code形式化证明时发现,笼统指令导致AI过载死机,分步引导+“人类在环”可提升效率,强调清晰任务拆解与实时修正的重要性。

Jeff Dean(谷歌):预测未来开发者人均将拥有50个智能体,蒸馏技术是Gemini Flash性能核心,低延迟推理将改变应用场景。

Karpathy:认同软件需转向Agent优先、API成核心接口;开源agenthub平台,探索多Agent协作新模式。

a16z:第六版全球AI产品Top100显示,ChatGPT周活9亿用户领先,Claude付费订阅同比增长超200%、Gemini增长258%,约20%ChatGPT用户同周使用Gemini;OpenClaw开启通用Agent入口之争,通用Agent与Vibe Coding工具重塑AI产品竞争格局;AI从独立网站转向嵌入现有工具,垂直场景与集成能力成关键。

黄仁勋(英伟达):指出AI正成为关键基础设施,依赖能源、芯片、基础设施、模型、应用五层架构,未来数万亿美元将投入建设;OpenClaw用户采用速度远超传统软件,标志AI从被动响应转向主动执行,将带来指数级算力需求。

国家发展改革委主任:预测到“十五五”末,中国人工智能相关产业规模将达到10万亿元。

斯坦福大学副教授Percy Liang:认为模拟将是人工智能下一个前沿,通过高保真人类行为和环境模型,帮助AI理解复杂现实世界问题。

古德白:硅碳交易所旨在构建Agent经济生产关系,连接需求方与“打工虾”,探索Agent赚钱新模式,当前聚焦高频低金额任务。

行业分析:“一段式端到端自动驾驶”技术简化传统链路,但“黑盒”特性导致故障难以追溯,商业化需克服模型泛化、算力成本、法律责任认定等挑战。

社会影响

AI侵权争议:万名作家联名出版“空白书”《别偷这本书》,抗议AI公司未经授权使用其作品训练模型,呼吁建立公平授权补偿机制。

AI内容治理:抖音处置1.4万个AI生成色情低俗内容账号,清理4.2万条违规信息;小红书整治AI托管账号,打击虚假互动;Roblox上线AI驱动聊天内容优化系统,转换违规用语;OpenClaw出现上门卸载服务,反映用户对安全风险的担忧。

AI军事化应用争议:Anthropic起诉美国政府,指控Claude被五角大楼列入“黑名单”;美军将Claude与Maven系统结合用于军事目标定位,24小时锁定千个目标,杀伤链反应时间从72小时压缩至分钟级,引发战争伦理讨论;OpenAI谋求与北约签订军事合同,创始人内部言论引发军事化野心争议,硬件负责人因此离职。

安全与合规:国家互联网应急中心发布OpenClaw安全风险提示,指出存在提示词注入、误操作、插件投毒及安全漏洞四类风险;工信部针对OpenClaw发布高危风险预警;OpenAI收购Promptfoo强化安全防护;青藤云安全推出WorkClaw平台,补齐OpenClaw企业级安全治理能力。

就业与产业变革:AI短剧爆发式增长,冲击传统真人短剧项目;“一人公司”模式兴起,OpenClaw等工具降低创业门槛;全球科技行业将薪酬预算转向AI芯片采购和数据中心建设,引发白领裁员潮;AI代理使原本2000人的工作量20人即可完成,效率提升100倍。

技术伦理:Anthropic模型被发现能绕过评估流程破解题库,引发AI自主性与安全边界担忧;AI自写测试导致自证清白问题,社区建议多模型互审;人脸识别存在隐私泄露风险,复旦大学教授张军平提醒摄像头捕捉范围远超人脸框。

九、学习与研究资源

开源项目

Hermes Agent:自我提升智能代理,运行于本地服务器,通过经验学习构建技能。

Agency Agents:包含100多个专为Claude Code、Cursor等打造的AI代理角色库。

PicoClaw:运行在10美元硬件上、内存不足10MB的轻量级AI助手。

SkillForge:Web应用,通过7步结构化流程将一句话需求转化为生产级Skill完整包。

DeerFlow 2.0:社区驱动的AI自动化框架,支持多智能体编排、流式推理可视化,兼容Docker/集群部署。

3DThinker:创新框架,通过两阶段训练实现无3D先验输入的几何想象和空间推理。

DM0-base:具身原生VLA模型,突破“预训练-后适配”范式,2.4B参数量,在RoboChallenge基准测试中领先。

NemoClaw:开源AI Agent操作系统,专为Solana区块链设计,支持Agent执行循环、状态转换和支付记录验证。

Plan-and-Budget:无训练的测试时推理框架,引入预算分配模型(BAM),提出E³评估指标。

Twinkle:轻量级客户端-服务器训练框架,支持本地执行与Ray集群扩展,提供TaaS服务。

Gloss:本地RAG研究工作区,基于Rust构建,支持私有模型部署,混合搜索系统,透明化RAG流程。

MLEvolve:上海AI实验室开源自进化机器学习系统,采用渐进式蒙特卡洛图搜索,12小时登顶MLE-bench榜单。

Bifrost:Go语言编写的LLM接口统一代理层,支持路由、故障转移、速率限制和语义缓存。

Chunky:本地PDF分块可视化工具,支持对比原始PDF与Markdown,编辑错误分割,导出清洁JSON。

agent-os:分层记忆系统,四层级压缩,令牌压缩率82.3%,已开源。

DAW插件:前YC合伙人开源,连接Gemini与专业音频软件,支持音频流式传输。

Cordys CRM:开源客户关系管理系统,支持私有化部署与MaxKB智能体集成,融合DataEase与SQLBot能力。

SurfSense:开源团队研究工作空间,支持Docker自托管,25+外部连接器,混合检索技术。

GEO-SEO Claude Code Skill:针对生成式引擎优化工具,五并行分析智能体,十一个专业命令,输出Markdown/PDF报告。

audio-kb:LlamaIndex基于Gemini Embedding 2构建的音频知识库项目,支持文件上传与录音,实现音频笔记搜索。

Railyard:开源运行时,为Claude Code添加安全护栏,操作系统级沙箱,阻止破坏性命令与敏感路径访问。

Mask This:Mac菜单栏应用,基于Apple Foundation Model训练的LoRA适配器,一键屏蔽剪贴板敏感信息。

M2M Vector Search v2.0:开源向量数据库,基于高斯泼溅与能量模型,支持GPU加速、自组织临界性,边缘优先架构。

ClawPort:OpenClaw智能体团队可视化指挥中心,支持组织架构图、任务看板、成本分析、实时日志。

Context Hub:吴恩达开源,专为AI编程智能体设计的API文档分发系统,支持知识获取与积累,标注经验本地持久化。

Arthas Agent:阿里开源,将Arthas与AI结合,自然语言交互实现Java线上诊断,内置场景化排障剧本。

Cocoindex Code:轻量级嵌入式代码语义搜索MCP服务,基于AST技术,降低70% Token消耗,支持增量索引。

slowql:静态分析SQL工具,171条规则,零依赖离线运行,防止训练数据污染。

researcher:基于小参数模型(约14B)的多智能体协作系统,优化提示词策略与工作流程,兼容主流商业模型。

Ripple:开源未来预测Agent,基于复杂自适应系统理论,群体级模拟信息传播,含Tribunal层交叉验证。

技能库与知识库

腾讯SkillHub:聚合1.3万个本土化AI技能,提供国内镜像加速,支持关键词搜索与一键安装。

浙江大学SkillNet:含20万+高质量Skills,三层本体网络架构,多维度评估体系,提升智能体任务成功率与效率。

复旦大学:百万级Skills资源库,已在深圳福田政务系统部署。

智谱AutoClaw:预置50+主流Skills,覆盖内容创作、办公、代码等场景。

OpenClaw生态:海量Skills,支持电商销售预测、浏览器自动化等多场景任务。

腾讯乐享知识库:支持百余种格式资料接入,实现团队知识协同与复用。

十、总结与洞察

核心总结

2026年3月前后,全球AI领域进入“智能体主导+多模态融合+产业深度落地”的关键阶段。模型技术持续突破,通用大模型向高效化、低门槛演进,多模态模型实现跨介质统一理解;智能体成为核心赛道,腾讯、百度、智谱等企业推出零部署、易操作的产品矩阵,OpenClaw生态快速扩张但伴随安全争议;物理AI与机器人技术成熟,Figure机器人实现复杂场景自主操作,具身智能融资活跃;硬件与基础设施同步升级,芯片、算力、存储等支撑AI规模化应用;行业政策与监管逐步完善,安全合规成为企业核心竞争力;开源生态持续繁荣,降低技术使用门槛的同时,推动创新协同。

Read more

80+提示词 震撼发布|Seedance 2.0 提示词完全指南:从新手到“AI导演“

80+提示词 震撼发布|Seedance 2.0 提示词完全指南:从新手到“AI导演“

编者按 这两天,X.com、微博、小红书被一款名叫 Seedance 2.0 的 AI 视频生成模型刷屏。从 Tom Cruise 和 Brad Pitt 的"对打",到《复仇者联盟》的重制版,再到"水獭版"《老友记》……这些一度被认为需要好莱坞团队耗时数月才能完成的视频,如今只需一句提示词就能秒生成。 作为字节跳动推出的新一代多模态视频生成工具,Seedance 2.0 正式宣告:AI 视频创作时代已至,人人都可能成为"导演"。 今天,我们为你汇总了全网最实用的 Seedance 2.0 提示词和使用技巧,让你快速从入门到精通。

By Ne0inhk
【OpenClaw从入门到精通】第01篇:保姆级教程——从零开始搭建你的第一个本地AI助理(2026实测版)

【OpenClaw从入门到精通】第01篇:保姆级教程——从零开始搭建你的第一个本地AI助理(2026实测版)

摘要:本文聚焦2026年开源AI代理工具OpenClaw的本地部署与实操,从核心概念拆解入手,先厘清OpenClaw、Gateway、Skills、ClawHub的关联,再明确硬件系统要求与大模型API-Key准备要点,通过官方一键安装脚本完成本地部署,并配置阿里云百炼API实现大模型对接。以“让AI助理抓取开源中国热门项目”的虚拟实战案例,详细演示Skills调用流程,同时梳理部署中“命令找不到”“API-Key配置失败”等高频问题的解决方法。内容兼顾新手友好性与实操参考性,所有步骤均基于公开技术文档验证,案例为虚拟构建,代码仅作示例未上传GitHub,可指导读者快速搭建本地AI助理并验证核心功能。 优质专栏欢迎订阅! 【DeepSeek深度应用】【Python高阶开发:AI自动化与数据工程实战】【YOLOv11工业级实战】 【机器视觉:C# + HALCON】【大模型微调实战:平民级微调技术全解】 【人工智能之深度学习】【AI 赋能:Python 人工智能应用实战】【数字孪生与仿真技术实战指南】 【AI工程化落地与YOLOv8/v9实战】【C#工业上位机高级应用:高并发通信+性

By Ne0inhk
CyberArcanum 赛博秘仪:当AI与塔罗相遇,我用代码重构了一场数字时代的占卜仪式

CyberArcanum 赛博秘仪:当AI与塔罗相遇,我用代码重构了一场数字时代的占卜仪式

前言 谈论 AI 的时候,我们总在谈论参数、算力、准确率。我们把它塞进对话框、表格、代码编辑器里,让它成为高效的工具,却忘了它也可以成为一扇门——一扇通往内心,连接传统神秘学与未来科技的门,一扇给我们带来更多有帮助、更多有意思内容的门。 这就是我做 CyberArcanum 赛博秘仪 的全部理由:让 AI 不再是冰冷的文本框,而是一位带着仪式感,陪你向内探索的数字导师。 当前开源实现以 Mystic Vision Tarot(灵启万物) 为名,完整保留了「手势选牌 + 握拳定契 + AI 解牌与多轮对谈」的仪式闭环,你可以直接在本地跑通并体验。 第一部分:The Vision —— 当神秘学的仪式感,撞上数字时代的代码 传统塔罗的核心,从来不是「预知未来」。 它的灵魂,藏在洗牌时指尖的触感、切牌时专注的呼吸、抽牌时心跳的停顿里—

By Ne0inhk
OpenClaw横空出世:星标榜第一的AI Agent框架凭什么引爆2026?

OpenClaw横空出世:星标榜第一的AI Agent框架凭什么引爆2026?

欢迎文末添加好友交流,共同进步! “ 俺はモンキー・D・ルフィ。海贼王になる男だ!” * 一、现象级爆火:GitHub年度最热AI项目 * 二、OpenClaw是什么? * 核心定位 * 三、OpenClaw凭什么成为新标杆? * 3.1 自托管部署:数据主权回归 * 3.2 无代码革命:人人都是开发者 * 3.3 微内核架构:优雅且强大 * 3.4 多智能体协同 * 四、技术架构深度解析 * 4.1 核心组件 * 4.2 2026.3.7重大更新 * 五、与主流框架对比 * 5.1 OpenClaw vs LangChain * 5.2 OpenClaw vs

By Ne0inhk