HivisionIDPhotos:开源离线 AI 证件照工具
证件照制作常面临底色不符、隐私泄露或商业软件收费高等痛点。HivisionIDPhotos 是一款开源 AI 工具,支持纯离线运行,保障数据安全。它集成了人脸检测、智能抠图及多规格适配功能,提供 MODNet 等多种模型选择。通过 Docker 或源码部署,既满足个人应急需求,也支持企业批量处理与 API 集成,实现高效免费的证件照生成流程。

核心功能直击刚需
HivisionIDPhotos 定位为轻量级 AI 证件照全流程解决方案,而非简单的抠图换底工具。它将证件照制作拆解为'人脸检测 - 人像抠图 - 尺寸适配 - 底色替换 - 排版输出'五大环节,全程自动化处理,既专业又省心。
精准 AI 抠图,细节拉满
抠图是证件照的核心门槛,这款工具提供了三款差异化模型供选择,兼顾速度与精度:
- MODNet:官方默认模型,仅 24.7MB 大小,适合纯色背景场景,CPU 推理毫秒级完成,老旧电脑也能流畅运行;
- RMBG-1.4:BRIA AI 开源模型,176.2MB 容量,抠图精度更高,能精准识别发丝、衣领等边缘细节,适合复杂背景照片;
- BiRefNet-v1-lite:专业级精细抠图模型,适合对边缘质感要求极高的场景,搭配 RetinaFace 人脸检测,细节误差可控制在 2 像素以内。
全场景适配,从应急到批量处理
无论是个人应急还是企业批量制作,它都能轻松应对:
对普通用户,内置 30 余种国际标准规格,涵盖一寸、二寸、护照、签证、驾驶证等场景,支持自定义尺寸和 HEX 色值换底(红/蓝/白/渐变均可),一键生成六寸排版照,直接冲印无需额外裁剪。2024 年 9 月更新后,还新增了布局裁剪线、模板共享功能,打印体验更友好。
对企业和机构,支持批量处理与 API 集成,HR 可统一配置新员工工牌照片规格,学校可批量生成学生学籍证件照,全程标准化输出,人力成本直降 60%。
纯离线运行,隐私安全拉满
这是它最打动用户的亮点之一。所有操作均在本地设备完成,照片不上传任何云端服务器,断网环境下也能正常使用。对于身份证、护照等敏感证件照制作,彻底杜绝隐私泄露风险,甚至通过了公安部安全检测中心认证,临时文件自动清理,安全性拉满。
技术架构解析
HivisionIDPhotos 采用现代化轻量技术栈,兼顾易用性与扩展性,既适合普通用户快速上手,也为开发者预留了充足的定制空间。
核心技术栈
| 技术模块 | 核心工具/框架 | 核心作用 |
|---|---|---|
| 编程语言 | Python 3.7+(推荐 3.10) | 跨平台兼容,生态完善 |
| 模型推理 | ONNX Runtime、PyTorch | 支持 CPU/GPU 加速,实现高效离线推理 |
| 核心算法 | MTCNN/RetinaFace(人脸检测)、MODNet 等(抠图) | 精准定位人脸,实现高质量人像分割 |
| 交互与服务 | Gradio、FastAPI | 可视化 Web 界面 + 高性能 API 接口 |
| 部署方案 | Docker、Conda | 一键部署,环境隔离,跨平台运行 |
模块化架构优势
项目采用'流水线式'模块化设计,四大核心模块(人脸检测、图像分割、图像处理、交互服务)完全解耦。开发者可轻松替换组件,比如用自定义人脸检测模型替换 MTCNN,或基于 FastAPI 接口搭建专属小程序、网页应用。社区已衍生出微信小程序、ComfyUI 工作流、Windows 客户端、NAS 部署方案等多个扩展应用,充分体现了开源生态的活力。
从零上手:不同用户的使用指南
HivisionIDPhotos 做到了'新手友好,进阶有趣',不同技术背景的用户都能找到适合自己的使用方式。
普通用户:零代码 Gradio 界面
无需编程基础,3 分钟即可搞定:
- 下载模型:
python scripts/download_model.py --models all(无法科学上网可手动从 Release 页面下载,放入指定目录); - 启动 Web 界面:
python app/web.py,访问 http://127.0.0.1:7860 即可上传照片、选择参数、生成证件照。
克隆仓库并搭建环境:
git clone https://github.com/Zeyi-Lin/HivisionIDPhotos.git
cd HivisionIDPhotos
conda create -n hivision python=3.10
conda activate hivision
pip install -r requirements.txt -r requirements-app.txt
懒人必备:Docker 一键部署
无需配置依赖,一条命令即可启动服务:
docker run -d -p 7860:7860 linzeyi/hivision_idphotos
开发者/企业:API 集成与批量处理
通过 FastAPI 提供的接口,可快速集成到现有系统。例如企业 HR 批量处理员工照片:
import requests
import base64
def process_employee_photos(api_url, image_data, background_color=(255, 255, 255)):
# 调用 API 生成证件照
idphoto_response = requests.post(
f"{api_url}/idphoto",
files={"file": image_data},
data={"size": "(413,295)"} # 一寸照片规格
)
if idphoto_response.status_code == 200:
# 添加白色背景
add_bg_response = requests.post(
f"{api_url}/add_background",
files={"file": idphoto_response.content},
data={"color": str(background_color)}
)
return add_bg_response.content
return None
对比同类工具
在证件照工具赛道,HivisionIDPhotos 的开源属性和离线能力形成了独特竞争力,我们通过对比看看它的优势:
| 特性 | HivisionIDPhotos | 在线证件照网站 | 商业证件照软件 |
|---|---|---|---|
| 价格 | 完全免费,无水印无会员 | 基础功能免费,高级功能收费 | 通常按年付费或单次收费 |
| 隐私保护 | 纯本地运行,数据不上传 | 需上传云端,存在泄露风险 | 部分支持本地处理,视软件而定 |
| 自定义性 | 高,支持模型替换与二次开发 | 低,仅支持固定参数调整 | 中,提供有限定制选项 |
| 部署方式 | 本地、Docker、NAS 等多方案 | 仅云端访问 | 本地安装,部分支持企业部署 |
总结与展望
HivisionIDPhotos 的走红,本质上是击中了用户对'高效、隐私、免费'证件照工具的核心需求。它没有复杂的功能堆砌,却将每一个核心环节做到了极致——轻量的模型让老旧设备也能流畅运行,模块化设计让开发者能自由发挥,纯离线运行守住了隐私底线。
目前项目仍在高频迭代,智能换装、高级美颜等功能已列入开发计划,社区贡献也日益活跃,从 C++ 版本到微信小程序,不断丰富着应用场景。对于普通用户,它是应急必备的证件照神器;对于开发者,它是入门 AI 图像处理、二次开发的优质范本。
项目托管于 GitHub,欢迎开发者参与贡献与二次开发。


