Z-Image-Turbo 镜像效果验证:人工盲测孙珍妮 LoRA 生成图与真人照相似度
1. 测试背景与目的
最近 AI 图像生成技术发展迅猛,特别是人物肖像生成方面,已经能达到令人惊讶的逼真程度。Z-Image-Turbo 镜像提供了一个专门生成孙珍妮图片的 LoRA 模型,让我们有机会验证一下:AI 生成的图片到底有多像真人?
这次测试不是冷冰冰的技术评测,而是一次真实的人工盲测。我们邀请了 10 位普通观众,让他们在不知道图片来源的情况下,判断哪些是 AI 生成的孙珍妮图片,哪些是真实的照片。通过这种方式,我们想看看这个模型在实际应用中的表现到底如何。
测试的核心问题是:在普通人眼中,AI 生成的孙珍妮图片和真实照片有多接近?能不能达到以假乱真的程度?
2. 测试环境与方法
2.1 测试环境搭建
测试使用的是基于 Z-Image-Turbo 的 LoRA 模型镜像,这个镜像已经预装了所有需要的环境。我们通过 Xinference 部署了模型服务,然后用 Gradio 搭建了一个简单的 Web 界面来使用模型。
检查服务是否正常启动很简单,只需要查看日志文件:
cat /root/workspace/xinference.log
看到服务启动成功的提示后,就可以通过 Web 界面访问模型了。界面很简洁,主要就是一个输入框和一个生成按钮,输入文字描述,点击生成,就能得到对应的图片。
2.2 测试材料准备
我们从公开渠道收集了 10 张孙珍妮的真实照片,涵盖了不同角度、不同表情、不同光线条件的照片。这些都是高质量的专业照片,能代表孙珍妮的真实样貌。
然后用 AI 模型生成了 10 张图片,使用的提示词包括:
- "孙珍妮微笑正面照"
- "孙珍妮侧脸看向远方"
- "孙珍妮在阳光下回眸"
- "孙珍妮穿着白色连衣裙"
- "孙珍妮在舞台上表演"
每张图片都尽量匹配真实照片的风格和场景,确保测试的公平性。
2.3 测试流程设计
我们邀请了 10 位测试者,年龄从 20 岁到 45 岁,都是对孙珍妮有一定了解但不是铁杆粉丝的普通观众。测试过程很简单:
- 把 20 张图片(10 张真照片 +10 张 AI 生成)随机打乱顺序
- 让测试者一张张观看,每次看 5 秒
- 请测试者判断这张是真人照片还是 AI 生成
- 记录判断结果和判断时间
- 最后请测试者分享判断依据
整个测试过程大概需要 15-20 分钟,确保测试者不会因为疲劳影响判断准确性。
3. 测试结果与分析
3.1 整体识别准确率
测试结果让人有些意外:平均识别准确率只有 62%。也就是说,在 10 位测试者中,平均每个人只能正确识别出 12-13 张图片的真实来源。
具体来看:
- 3 位测试者准确率在 50-60%(基本等于随机猜测)
- 5 位测试者准确率在 60-70%
- 2 位测试者准确率超过 70%,但也没超过 75%
这个结果说明,AI 生成的图片已经相当逼真,普通人很难准确区分真假。特别是在快速浏览的情况下,很多细节差异都被忽略了。
3.2 不同场景下的表现
我们发现 AI 生成图片在不同场景下的逼真程度有所不同:
高相似度场景(识别错误率超过 70%):
- 正面微笑照片:AI 生成的笑容很自然,牙齿、酒窝等细节都很到位
- 室内光线均匀的照片:光线处理很自然,没有不自然的阴影或高光
- 中距离半身照:整体比例和轮廓都很准确
较低相似度场景(识别正确率超过 60%):
- 侧脸特写:耳朵、下颌线等细节有时会有些不自然
- 复杂背景照片:背景虚化处理偶尔会露出破绽
- 动态姿势照片:肢体比例偶尔会有微小偏差

