RetinaFace+CurricularFace 人脸识别实战指南
本文介绍如何使用预置环境快速部署 RetinaFace 和 CurricularFace 进行人脸检测与识别。跳过底层依赖冲突,直奔核心能力:检测人脸、提取特征、比对身份。整个过程不需要安装额外软件,只要运行环境就绪,即可完成首次人脸比对。
1. 先搞懂这两个名字:RetinaFace 负责'找',CurricularFace 负责'认'
1.1 RetinaFace:不挑图的'人脸定位专家'
RetinaFace 是一个专门用于人脸定位的模型。它能精准定位一张图里所有人脸的位置,并标出五个关键点:左眼中心、右眼中心、鼻尖、左嘴角、右嘴角。这些点就像人脸的'坐标锚点',为后续对齐和识别打下基础。
它的强项在于鲁棒性,不怕复杂场景。比如光线很暗、逆光导致脸部发黑、人脸侧着甚至只露出半张脸、戴着口罩墨镜或有头发遮挡,RetinaFace 依然能稳定输出可用的检测框和关键点。
注意:RetinaFace 只输出'这张图里有几张脸,每张脸在哪',它完全不知道这些人是谁。
1.2 CurricularFace:会'记脸'的识别模型
找到脸之后,下一步才是真正的'识别':这是谁?
CurricularFace 把每张检测出来的人脸,转换成一串 512 维的数字向量(你可以把它想象成这张脸的'数字指纹')。然后通过计算两串数字之间的余弦相似度,来判断它们是否属于同一个人。
为什么叫 CurricularFace?因为它的训练方式借鉴了'课程学习'理念:先让模型学会区分差异大的人脸,再逐步挑战更难的样本。这种由易到难的训练方式,让它在真实场景中表现更稳、泛化能力更强。
国际权威评测 LFW 上,CurricularFace 的准确率超过 99.8%,属于当前开源模型中的第一梯队。
1.3 它们合在一起,才是一套完整方案
单独用 RetinaFace,你只能看到'框';单独用 CurricularFace,它根本不知道该处理哪块区域。只有把它们串起来,才能形成闭环:
- 输入一张原始图片
- RetinaFace 自动检测 → 找出最大人脸区域 + 五个关键点
- 系统根据关键点进行仿射变换 → 对齐成标准正脸姿态
- 将对齐后的人脸送入 CurricularFace → 提取 512 维特征向量
- 计算两张图对应向量的余弦相似度 → 输出 0~1 之间的分数
这个流程全自动,无需人工裁剪、无需手动对齐、无需调整姿态。
2. 启动镜像:三步进入可运行环境
2.1 镜像已就绪,你只需启动
镜像预装了所有必要组件,目录结构清晰,脚本封装完整。你不需要从 GitHub clone 仓库、不需要 pip install 一堆包、不需要手动下载模型权重。
镜像启动后,所有内容都已就位:
- Python 3.11.14(稳定、兼容性强)
- PyTorch 2.5.0 + CUDA 12.1 + cuDNN 8.9(最新稳定版组合)
- ModelScope 1.13.0(支持魔搭模型一键加载)
- 核心代码位于
/root/Retinaface_CurricularFace
2.2 进入工作目录并激活环境
镜像启动成功后,首先进入预设的工作目录,并激活专用 Conda 环境:
cd /root/Retinaface_CurricularFace conda activate torch25
这条命令的作用是切换到代码所在路径,避免路径错误,并激活名为 torch25 的 Conda 环境,确保使用的是镜像预装的 PyTorch 2.5 版本。
2.3 运行默认测试:验证一切正常
镜像内置了一个开箱即用的推理脚本 inference_face.py,它会自动加载两张示例图片,完成端到端的人脸检测 + 特征提取 + 相似度计算。
直接运行:
python inference_face.py
你会看到类似这样的输出:
[INFO] Loading model... [INFO] Detecting face in input1... [INFO] Detected 1 face, using largest one. [INFO] Detecting face in input2... [INFO] Detected 1 face, using largest one. [INFO] Extracting features... [INFO] Cosine similarity: 0.872 [INFO] Result: Same person
这个结果说明 RetinaFace 成功在两张图中各找到了一张人脸,CurricularFace 提取了特征,并计算出 0.872 的相似度。默认阈值为 0.4,因此判定为'同一人'。
3. 实战操作:用你的照片完成一次真实比对
3.1 快速比对两张本地图片
假设你有两张自己的照片,分别存放在 /home/user/photo1.jpg 和 /home/user/photo2.jpg,你想确认 AI 是否能识别出是同一个人。
只需一条命令:
python inference_face.py --input1 /home/user/photo1.jpg --input2 /home/user/photo2.jpg
注意:
- 路径必须是绝对路径(以
/开头),相对路径可能报错 - 图片格式支持
.jpg,.jpeg,.png,.bmp - 如果路径含中文或空格,请用英文引号包裹,例如:
--input1 "/home/user/我的照片.jpg"
3.2 直接比对网络图片(免下载)
你甚至不需要把图片保存到本地。只要图片有公开 URL,脚本可以直接拉取:
python inference_face.py -i1 https://example.com/face_a.jpg -i2 https://example.com/face_b.jpg
这个功能特别适合测试社交媒体头像匹配、验证证件照与现场抓拍照一致性、快速比对不同来源的人脸图像。
3.3 自定义判定阈值:让结果更符合你的需求
默认阈值是 0.4,意味着相似度大于 0.4 就判为'同一人'。但在实际业务中,这个值往往需要调整:
- 考勤打卡:要求严格,建议设为 0.6~0.7,避免误识别
- 社交推荐:允许一定宽松,0.3~0.5 即可
- 初筛过滤:可设为 0.2,先保留更多候选再人工复核
修改方式很简单:
python inference_face.py -i1 a.jpg -i2 b.jpg --threshold 0.65
你也可以用缩写 -t:
python inference_face.py -i1 a.jpg -i2 b.jpg -t 0.65
4. 关键参数详解与避坑指南
4.1 输入参数全解析
| 参数 | 缩写 | 说明 | 建议用法 |
|---|---|---|---|
--input1 | -i1 | 第一张图片路径或 URL | 必填,支持本地路径和网络地址 |
--input2 | -i2 | 第二张图片路径或 URL | 必填,同上 |
--threshold | -t | 判定阈值(余弦相似度) | 默认 0.4,按需调整 |
重要提醒:脚本默认会自动选取每张图中面积最大的人脸进行比对。这意味着如果你上传的是多人合影,它不会比对所有人,只选最显眼的一张。
4.2 余弦相似度怎么理解?分数高低意味着什么?
输出的相似度是一个介于 -1 到 1 之间的浮点数:
- 1.0:两张图完全一致(理论上极限值)
- 0.8~0.99:极高概率是同一人(日常使用中常见)
- 0.6~0.79:大概率是同一人,建议结合业务场景判断
- 0.4~0.59:有一定相似性,但需谨慎对待
- < 0.4:基本可排除为同一人
- 负数:方向相反,几乎不可能是同一人(通常说明其中一张图质量极差或非人脸)
实测参考(使用普通手机拍摄):
- 同一人正面照 vs 正面照:0.82 ~ 0.91
- 同一人正面照 vs 侧脸照:0.68 ~ 0.77
- 同一人戴眼镜照 vs 不戴眼镜照:0.75 ~ 0.84
- 不同人(同性别同年龄):0.21 ~ 0.38
4.3 常见问题与快速解决
Q:运行报错 ModuleNotFoundError: No module named 'torch'?
A:忘记激活环境。请务必先执行 conda activate torch25,再运行脚本。
Q:提示 No faces detected?
A:检查图片是否满足基本条件:
- 是否为人脸图像(非文字、Logo、风景)?
- 分辨率是否过低(建议不低于 320×240)?
- 光线是否严重不足或过曝?
- 可尝试降低检测灵敏度:添加参数
--threshold 0.3(仅限 RetinaFace 内部调参,如需可修改代码配置)
Q:输出相似度很低(如 0.12),但明明是同一人?
A:优先排查以下三点:
- 两张图是否都是正面、清晰、无遮挡?侧脸/遮挡会显著影响特征提取
- 是否存在明显妆容/发型/配饰差异?(如戴帽子、墨镜、浓妆)
- 图片是否被过度压缩?模糊会导致关键点定位偏移
推荐做法:用手机原相机拍两张标准正面照(无滤镜、无美颜),效果最佳。
Q:想批量比对多组图片,怎么办?
A:当前脚本为单次双图比对设计。如需批量处理,可在 Python 中循环调用,或使用如下 Shell 脚本模板:
for i in {1..10}; do python inference_face.py -i1 ./batch/img${i}_a.jpg -i2 ./batch/img${i}_b.jpg -t 0.5 >> results.log done
总结
- RetinaFace 是高鲁棒性的人脸检测器,擅长在复杂光照、角度、遮挡条件下准确定位人脸及五官关键点;
- CurricularFace 是基于课程学习思想训练的人脸识别模型,特征表达能力强,在 LFW 等基准上达到 SOTA 水平;
- 本方案将二者无缝集成,提供开箱即用的推理脚本
inference_face.py,支持本地路径、网络 URL、阈值调节等多种实用功能; - 从启动环境到完成首次比对,全程无需前置配置;
- 实际使用中,建议优先采用正面、清晰、无遮挡的照片,并根据业务场景合理设置判定阈值(0.4~0.7 之间);
- 遇到检测失败或相似度偏低时,应首先检查图像质量,而非急于调参或重装环境。
现在,你已经掌握了用 RetinaFace+CurricularFace 完成一次专业级人脸比对的全部技能。只需要一个能联网的终端,就能跑通工业级人脸识别流程。

