【WAIC 2025】AI安全的攻防前线:合合信息AI鉴伪检测技术

【WAIC 2025】AI安全的攻防前线:合合信息AI鉴伪检测技术

【WAIC 2025】AI安全的攻防前线:合合信息AI鉴伪检测技术


请添加图片描述

🌈你好呀!我是 是Yu欸🚀 感谢你的陪伴与支持~ 欢迎添加文末好友🌌 在所有感兴趣的领域扩展知识,不定期掉落福利资讯(*^▽^*)


在这里插入图片描述

2025年7月27日 @WAIC

01|写在前面

版权声明:本文为原创,遵循 CC 4.0 BY-SA 协议。转载请注明出处。

7月WAIC展会上,我看到了“AI全景图”:底层硬件、上层应用、终端设备、具身智能机器人…… 其中,大模型与具体行业应用深度融合的创新成果大量涌现,展现出百花齐放的产业活力。

几年前还很难想象,一张完整、高清、逼真的护照照片,仅仅需要喂Prompt给Midjourney,再用PS简单拼接一下就能搞定;一个视频会议中的“我”,其实是deepfake模型在后台实时换脸,还能根据语音同步表情。

在这里插入图片描述


随着扩散模型(diffusion models)和多模态大语言模型(MLLM)技术爆发,内容伪造的成本正在逐步降低。

当我这几天在 WAIC 2025世界人工智能大会 上看到合合信息展出的完整AI鉴伪产品矩阵时,意识到在业界,内容安全已经不是“后处理问题”,而是AI时代基础设施级的问题

而合合信息,正是国内这个赛道中的一家公司。

这篇文章,既是一份我和他们团队线下技术交流的记录,也是一份AI图像鉴伪方向的系统观察。希望能帮更多对AI内容安全有兴趣的技术同仁,快速建立完整的技术地图(p.s.一些敏感的技术内容删了)。


02|AI安全的攻防

我在WAIC 2025 展台上体验了三款产品:人脸视频篡改检测、AIGC图像鉴别、TextIn通用篡改检测平台,就是他们这个安全体系的三个支柱。


1️⃣ 人脸视频篡改检测:从“假脸”识别,到AI诈骗预防

在展台的交互区,我体验了一个项目:我站在摄像头前,系统实时生成了一个“数字假面”,然后平台用它自研的人脸鉴伪模型对换脸视频做实时检测。

结果显示,系统不仅判断“这是伪造”,还能直接在画面上打出伪造评分,其评分依据是伪造区域——包括光影不合理、光影冲突、纹理冲突等。

在这里插入图片描述

这类伪造视频,很多是实时生成的。我们知道,这类算法已经非常成熟,几秒钟就能合成大量视频片段。

合合信息的方案采用了多尺度视觉编码网络 + 跨帧一致性检测 + 高频纹理偏差捕捉等技术,保证模型能在毫秒级检测出伪造区域,且具有跨算法的泛化能力

并且,对主流Deepfake方法(Roop、FaceSwap、Face2Face等)均有良好鲁棒性。

并且,这套系统可以在多个银行、保险、远程核身场景中使用,支持网页API接入、SaaS部署,可以在CPU上运行,适配国产环境


2️⃣ AIGC图像鉴别:用MLLM给图像真伪做逻辑推理

现场的“名画找茬”活动里,我肉眼都分不清真假,但模型一眼判别名画真假,很有意思。

在这里插入图片描述

它可以有效识别 MidJourney、Stable Diffusion、StyleGAN、GPT-4o 等主流AIGC图像,准确率超90%。

传统方法大多是判别式模型,输出 0/1。而这里开始往解释性推理靠近,提取图像频谱、压缩特征、视角不一致点。比如:

  • “这个图像假,是因为人物的影子与光源方向不一致”
  • “画面中的远景比例异常,与真实透视冲突”

这个技术方向感觉很符合未来可信AI的趋势,如何让模型不仅判断真假,还能“说清楚为什么”

期待合合信息后续的表现。


3️⃣ TextIn通用篡改检测平台:图文双模检测护航真实合规

相比人脸图像,文档伪造往往隐藏得更深:一个身份证改个出生日期,一张发票涂掉金额,哪怕是10个像素级的修改,就足以骗过OCR和人眼。

在这里插入图片描述

合合信息的TextIn平台支持十几种常见证照类型(身份证、护照、行驶证、驾驶证、港澳台证件等),毫秒级检测。在适配场景下,误检率低至 千分之一。并且,适配压缩、裁剪、转码、截图等各种现实“干扰因素”。

这种技术是内容可信合规系统的底层模块,尤其适用于金融级风控场景。

目前结合上百万文档伪造样本训练,已落地银行、证券、保险等多个领域。


03|产业化:数据、比赛、标准

很多人提起合合信息,第一反应是“扫描全能王”。确实,它们开始时是做文档图像处理起家的,OCR、名片识别、发票解析都是强项。

但正是因为这个出身,它们比很多“大模型热”背景下的新AI公司,更早地意识到一个事实:

伪造图像不是单一问题,而是“图像识别-数据抽取-内容合规”整个链条的挑战。

所以这几年,合合信息把视觉安全相关的工作系统性整合,在图像内容安全上构建了“三大检测系统”,同时搭配完整的文字识别、结构化解析、流程集成,实现了真正的 端到端闭环能力


技术再好,没有数据和标准支撑也很难走向产业化。合合信息在这方面也下了苦功:

数据集:

  • 图像伪造类:CASIA、MIML;
  • 文档伪造类:TextTamper、DocTamper;
  • 自建标注数据用于训练和微调,推动了算法从“小样本实验”走向“大规模泛化”。

比赛成绩:

  • ICDAR 2023“文本篡改检测”赛道总冠军;
  • 全球AI攻防挑战赛金融场景赛道冠军;
  • AFAC金融数据验证挑战赛(700+参赛队)。

标准与治理:

  • 参编《文本图像篡改检测系统技术要求》;
  • 入选“护证计划”首批技术支撑单位(中国信通院发起);
  • 联合推动伪造检测行业平台建设与数据共享机制。

这些工作表明:他们不仅做技术,更在构建AI安全的产业生态闭环


04 | QA环节

这一部分,在活动的技术交流环节中,合合信息请来了图像算法研发总监郭丰俊博士,向我们介绍了这一领域正在进行的探索。

伪造检测的“两个世界”:局部篡改 vs 整体生成

和我们展开聊了聊:

传统图像篡改,往往是局部的,比如修改证件号码、删改合同金额、合成发票的时间戳。这样的伪造属于图像局部篡改类问题,往往肉眼可以察觉,但由于分布不一,检测依然具有挑战性。

而AIGC图像,是整体生成出来的“假图”,它的视觉一致性往往更高,尤其在Midjourney、SD等模型多次训练下,表面上几乎完美。但这类图反而在语义逻辑、结构完整性、视觉错位等层面存在微妙的漏洞。

所以,他们有两个针对性的检测策略:

  • 对PS等局部篡改,强调像素级感知、局部掩膜输出、图像与OCR结构比对;
  • 对AIGC整体生成,更侧重频域残留、视觉推理逻辑、全图合理性建模。

合合信息在产品设计上就按照这两个方向做了系统区分。

部署闭环、平台协同:合合信息的系统思维值得借鉴

在交流时,还了解了一些实际落地细节。比如:

  • 支持网页API(可配置参数)、SaaS云平台、私有部署,甚至支持国产CPU运行;
  • 所有检测模块支持与自家OCR系统联动,形成完整业务闭环;
  • 业务场景包括接入金融、保险、互联网等场景中,与RPA流程、企业风控系统深度融合;
  • 图像安全体系还在逐步扩展,未来会融入更多内容审计模块,打造“图像可信生态”;

也就是说,他们不仅在做检测模型,而是在做“可信内容中台”


05|总结:图像伪造检测已进入“系统战”阶段,单点技术远远不够

图像伪造检测,已经不是模型层面的“点状对抗”,而是跨数据 → 模型 →流程 →解释的“系统工程”。

我在读论文过程中,有一点感受:仅靠一个F1值高的检测器,根本无法应对实际场景中的压缩图、截图、拼图、调色伪造。而合合信息在产业落地中走出的路径,或许正是我们研究者需要补的一课。

期待未来“内容信任时代”的技术建设,可能会有越来越多研究者、开发者、产品团队,关注到这条“伪造攻防战线”背后的真正技术挑战。

🧭完结撒花。

Read more

豆包AI视频去水印,我试了几个简单方法,手机就能搞定

首选方案:微信小程序一键解析(免费便捷) 豆包AI生成的视频带水印,想保存个干净版其实没那么麻烦。我最近找到一个挺省事的办法,不用下载软件,也不用注册登录,全程在手机上操作,不占内存,画质也没影响。 具体操作就三步: 1. 在豆包APP里找到想保存的视频,点右上角的“分享”按钮,左滑功能栏找到“更多”,然后选“复制视频链接”。不同手机界面可能不太一样,有的直接显示“复制链接”,有的是个网址,点旁边的复制标志就行。 2. 打开微信,在微信中搜索并打开一款去水印小程序,如“‌图视去水印‌”、“‌兜宝去水印‌”,进去后把刚才复制的链接粘贴进去,点解析,几秒钟就能处理好。 3. 解析成功后直接下载,无水印的视频就存到手机相册里了。整个过程一分钟都用不了。 这类工具能处理的不止豆包 我试了一下,这种小程序对即梦AI、千问这些AI平台生成的水印也能处理,抖音、快手、小红书、B站这些常见短视频平台的水印也支持。大部分都不限次数,画质也挺清晰,偶尔遇到一次解析失败的,

【保姆级教程】无成本零门槛安装配置OpenClaw龙虾AI全能助手

【保姆级教程】无成本零门槛安装配置OpenClaw龙虾AI全能助手

哈喽大家好!最近爆火的 OpenClaw(龙虾AI)全能助手大家体验了吗?它不仅能帮你自动整理邮件、查询天气,还能全自动写小红书笔记并发布,简直是打工人和自媒体人的摸鱼神器! 很多小伙伴想玩但又怕配置太复杂、花销太大。今天给大家带来一篇零门槛、保姆级的安装配置教程!教你如何低成本获取云服务器,轻松实现 AI 大模型自由。全程图文指引,小白也能轻松搞定,赶紧跟着操作起来吧! 一、获取云服务器 想要畅玩 OpenClaw,首先我们需要一个服务器。这次教大家如何获取腾讯云轻量服务器来进行配置。 ⏰ 活动时间:2026年1月21日 - 3月31日 腾讯推出了登录 CodeBuddy 送 2C2G4M 轻量服务器的限时活动:登录先送1个月,活跃7天再送2个月。 👉 【官方地址】:https://www.codebuddy.cn/promotion/?ref=ie2rwhd1loq 根据页面提示安装好软件并登录账号后,直接选择一个月的轻量应用服务器即可。 之后只要累计活跃7天就能续费两个月(每天和 AI

分享12个AI免费一键生成PPT的网站【2025年最新】

分享12个AI免费一键生成PPT的网站【2025年最新】

一、引言 制作PPT演示文稿是许多场合中必不可少的技能,包括商务会议、教育课程和各种演讲。尽管PowerPoint自带多种设计工具和模板,有时我们仍需要额外的支持来提高演示文稿的专业性和吸引力。幸运的是,随着人工智能技术的进步,现已有一些在线工具通过AI技术协助我们快速生成演示文稿。 ✅本文给大家推荐12个免费一键生成PPT的AI网站,部分网站支持免费无限制下载。 二、一键生成PPT的网站 1. 轻竹AIPPT 传送入口:https://sourl.cn/2y6JKz 推荐指数:⭐⭐⭐⭐⭐ 输入标题30秒自动生成PPT,适用于论文答辩、商业计划、述职汇报等场景,支持word转PPT,在线编辑自动排版。PPT生成是无限制免费的。 例如:介绍人工智能的发展历程及应用场景 如果对模板不满意,还可以切换其他PPT模板 2. 博思AIPPT 传送入口:https://ai-to.cn/url/?u=pptgo 推荐指数:⭐⭐⭐⭐⭐ 用户仅需输入主题、上传文件或选择模板,即可快速生成专业级演示文稿。 例如:生成产品经理年中总结报告PPT

Python + AI:打造你的智能害虫识别助手

Python + AI:打造你的智能害虫识别助手

Python + AI:打造你的智能害虫识别助手 在农业生产中,病虫害是影响作物产量和品质的“隐形杀手”。传统的害虫识别依赖人工巡查,不仅耗时耗力,还容易因经验不足导致误判、漏判。而随着智慧农业的普及,AI技术正成为破解这一难题的关键——今天,我们就用Python从零搭建一个智能害虫识别助手,让电脑替你“火眼金睛”辨害虫,轻松搞定农作物病虫害预警! 一、为什么要做这个项目? 智慧农业的核心是“精准、高效、低成本”,而害虫识别正是其中的典型场景: * 对农户:无需专业植保知识,拍照就能识别害虫种类,快速匹配防治方案; * 对开发者:这是一个“小而美”的实战项目,覆盖AI开发全流程,从数据处理到模型部署,学完就能落地; * 技术价值:融合Python、深度学习、Web部署,是入门AI+垂直领域应用的绝佳案例。 这个项目不需要你有深厚的AI功底,只要掌握Python基础,跟着步骤走,就能做出一个能实际使用的智能识别工具。 二、项目核心技术栈 先明确我们要用到的工具,都是行业主流、