HivisionIDPhotos 是一款开源 AI 证件照工具,旨在解决证件照制作中遇到的底色不符、隐私泄露及商业软件收费等问题。该工具支持纯离线运行,具备轻量高效、完全免费的特性。

一、核心功能
HivisionIDPhotos 定位为轻量级 AI 证件照全流程解决方案,将证件照制作拆解为'人脸检测 - 人像抠图 - 尺寸适配 - 底色替换 - 排版输出'五大环节,全程自动化处理。
1. 精准 AI 抠图
提供三款差异化模型供选择,兼顾速度与精度:
- MODNet:官方默认模型,仅 24.7MB 大小,适合纯色背景场景,CPU 推理毫秒级完成;
- RMBG-1.4:BRIA AI 开源模型,176.2MB 容量,抠图精度更高,能精准识别发丝、衣领等边缘细节;
- BiRefNet-v1-lite:专业级精细抠图模型,搭配 RetinaFace 人脸检测,细节误差可控制在 2 像素以内。
2. 全场景适配
内置 30 余种国际标准规格,涵盖一寸、二寸、护照、签证、驾驶证等场景,支持自定义尺寸和 HEX 色值换底(红/蓝/白/渐变均可),一键生成六寸排版照。2024 年 9 月更新后,新增了布局裁剪线、模板共享功能。
对企业和机构,支持批量处理与 API 集成,HR 可统一配置新员工工牌照片规格,学校可批量生成学生学籍证件照,全程标准化输出。
3. 纯离线运行
所有操作均在本地设备完成,照片不上传任何云端服务器,断网环境下也能正常使用。对于身份证、护照等敏感证件照制作,彻底杜绝隐私泄露风险,临时文件自动清理。
二、技术架构
HivisionIDPhotos 采用现代化轻量技术栈,兼顾易用性与扩展性。
| 技术模块 | 核心工具/框架 | 核心作用 |
|---|---|---|
| 编程语言 | Python 3.7+(推荐 3.10) | 跨平台兼容,生态完善 |
| 模型推理 | ONNX Runtime、PyTorch | 支持 CPU/GPU 加速,实现高效离线推理 |
| 核心算法 | MTCNN/RetinaFace(人脸检测)、MODNet 等(抠图) | 精准定位人脸,实现高质量人像分割 |
| 交互与服务 | Gradio、FastAPI | 可视化 Web 界面 + 高性能 API 接口 |
| 部署方案 | Docker、Conda | 一键部署,环境隔离,跨平台运行 |
项目采用'流水线式'模块化设计,四大核心模块(人脸检测、图像分割、图像处理、交互服务)完全解耦。开发者可轻松替换组件,比如用自定义人脸检测模型替换 MTCNN,或基于 FastAPI 接口搭建专属小程序、网页应用。
三、使用指南
1. 普通用户:零代码 Gradio 界面
无需编程基础,3 分钟即可搞定:
- 下载模型:
python scripts/download_model.py --models all(网络受限情况下可手动从 Release 页面下载,放入指定目录); - 启动 Web 界面:
python app/web.py,访问 http://127.0.0.1:7860 即可上传照片、选择参数、生成证件照。
克隆仓库并搭建环境:


