HeyGem.ai 开源AI数字人完整安装与配置指南

Ne0inhk

21 Mar 2026 — 5 min read

HeyGem.ai 开源AI数字人完整安装与配置指南

【免费下载链接】HeyGem.ai 项目地址: https://gitcode.com/GitHub_Trending/he/HeyGem.ai

项目概述

HeyGem.ai（又名Duix.Avatar）是一款革命性的开源AI视频合成工具，能够在本地环境中精确克隆用户的外貌和声音，实现数字人形象的全数字化。用户只需提供一段约10秒的视频，即可快速完成数字人形象和声音的克隆，通过输入文案或上传音频就能驱动数字人口型，自动生成高质量的口播视频内容。

核心技术特性

智能视觉引擎：基于深度学习的面部特征捕捉与重建系统，高精度捕捉真人外貌特征，包括五官形状、面部轮廓等，构建逼真虚拟模型。

语音合成技术：精准克隆声音，捕捉并还原人声的细微特征，支持多种声音参数设置，创造与原声高度相似的克隆效果。

多模态融合：通过自然语言处理技术理解文本内容，将文字转换为自然流畅的语音，实现文字和语音驱动虚拟形象。

全离线操作：无需联网即可使用，有效保护用户隐私，让用户在安全、独立的环境中创作。

系统环境要求

Windows系统要求

操作系统：Windows 10 19042.1526或更高版本
硬件配置：
- CPU：第13代英特尔酷睿i5-13400F或更高
- 内存：32GB及以上（必要）
- 显卡：RTX 4070或更高（必须配备NVIDIA显卡）
- 存储空间：C盘100GB以上，D盘30GB以上

Ubuntu系统要求

操作系统：Ubuntu 22.04 Desktop版本
硬件配置：与Windows要求相同

安装部署流程

第一步：环境准备

安装Docker环境：

检查WSL状态：wsl --list --verbose
更新WSL：wsl --update
下载并安装Docker for Windows
首次运行时接受协议并跳过登录

第二步：拉取Docker镜像

执行以下命令拉取必要的Docker镜像：

docker pull guiji2025/fun-asr docker pull guiji2025/fish-speech-ziming docker pull guiji2025/duix.avatar

第三步：服务端部署

进入deploy目录执行部署命令：

cd deploy docker-compose up -d

等待约30分钟，系统将自动下载并启动三个核心服务：

ASR语音识别服务
TTS语音合成服务
视频生成服务

第四步：客户端安装

下载官方构建的安装包
双击Duix.Avatar-x.x.x-setup.exe完成安装

核心功能使用

数字人模型训练

将视频分离为静音视频和音频
音频文件放置在指定目录：D:\duix_avatar_data\voice\data
调用模特训练接口进行模型训练

音频合成

调用音频合成接口，传入训练好的模型参数和需要合成的文本内容，即可生成自然流畅的语音。

视频合成

通过视频合成接口，将生成的音频与数字人模型结合，自动生成口型匹配的视频内容。

开放API接口

项目提供了完整的API接口，支持开发者进行二次开发和集成：

模特训练API：http://127.0.0.1:18180/v1/preprocess_and_train

音频合成API：http://127.0.0.1:18180/v1/invoke

视频合成API：http://127.0.0.1:8383/easy/submit

常见问题解决

服务状态检查

确保三个Docker服务都处于Running状态
确认NVIDIA显卡驱动正确安装
检查客户端和服务端是否为最新版本

故障排查步骤

查看客户端日志获取错误信息
检查服务端Docker容器日志
确认硬件配置满足最低要求

技术优势

成本效益：相比传统3D数字人制作成本降低99%以上

易用性：操作界面简洁直观，无需技术背景即可快速上手

灵活性：支持导入多个模型，根据不同创作需求选择合适的数字人形象

隐私保护：全离线操作模式，数据完全本地处理，无泄露风险

应用场景

在线教育：教师数字人制作教学视频
内容创作：自媒体创作者制作口播内容
企业宣传：制作企业介绍视频
个人品牌：创建个人数字形象用于各种场合

后续优化建议

性能调优：根据硬件配置调整渲染分辨率 效果提升：合理设置声音采样率和面部细节精度 功能扩展：研究AI功能源码模块，解锁更多高级功能

注意事项

安装过程需要稳定的网络连接，建议使用WiFi
确保系统盘有足够的存储空间
NVIDIA显卡驱动必须正确安装
遇到问题时可参考官方文档中的常见问题章节

通过本教程，您可以快速掌握HeyGem.ai的安装配置方法，开启AI数字人创作之旅，享受便捷高效的数字化体验。

【免费下载链接】HeyGem.ai 项目地址: https://gitcode.com/GitHub_Trending/he/HeyGem.ai

【保姆级教程】llama.cpp大模型部署全攻略：CPU/GPU全兼容，小白也能轻松上手！

一、简介 * • llama.cpp 是一个在 C/C++ 中实现大型语言模型（LLM）推理的工具 * • 支持跨平台部署，也支持使用 Docker 快速启动 * • 可以运行多种量化模型，对电脑要求不高，CPU/GPU设备均可流畅运行 * • 开源地址参考：https://github.com/ggml-org/llama.cpp • 核心工作流程参考：二、安装与下载模型（Docker方式） 1. 搜索可用模型 • 这里以 qwen3-vl 模型为例，提供了多种量化版本，每种版本的大小不一样，根据自己的电脑性能做选择，如选择（模型+量化标签）：Qwen/Qwen3-VL-8B-Instruct-GGUF:Q8_0 • 可以在huggingface官网中搜索可用的量化模型：https://huggingface.co/models?search=

2026 年 AI 辅助编程工具全景对比：Copilot、Cursor、Claude Code 与 Codex 深度解析

引言 2026 年，AI 辅助编程已经从"尝鲜"变成了"标配"。从 GitHub Copilot 的横空出世，到 Cursor 的异军突起，再到 Claude Code 的强势入局，AI 编程助手正在重塑开发者的工作方式。但面对市面上琳琅满目的工具，你是否也有这样的困惑：哪个工具最适合我？它们之间到底有什么区别？本文将深入对比四款主流 AI 编程工具，帮你找到最适合自己的那一款。 AI 辅助编程的演进之路从代码补全到智能协作早期的 AI 编程工具，如 OpenAI Codex，主要聚焦于代码补全——你写一行，它接下一行。但到了 2026 年，AI 编程助手已经进化成真正的&

github copilot接入第三方openai-compatible模型的方法

审核有点严，我修改了很多敏感词汇，看原文可以去我个人博客：https://kashima19960.github.io/2025/07/28/github%20copilot%E6%8E%A5%E5%85%A5openai-compatible%E6%A8%A1%E5%9E%8B%E4%BB%A5%E5%8F%8A%E5%8E%BB%E9%99%A4%E5%AE%89%E5%85%A8%E9%99%90%E5%88%B6%E7%9A%

Obsidian Copilot API密钥配置终极指南：OpenRouter、Gemini、OpenAI一步到位

Obsidian Copilot 是一个强大的AI助手插件，它能将智能对话功能直接集成到你的Obsidian笔记中。要充分发挥其潜力，正确配置API密钥是关键第一步。本指南将手把手教你如何配置OpenRouter、Google Gemini和OpenAI等主流AI提供商的API密钥，让你轻松享受智能笔记体验。✨ 【免费下载链接】obsidian-copilotA ChatGPT Copilot in Obsidian 项目地址: https://gitcode.com/gh_mirrors/ob/obsidian-copilot 🔑 为什么需要配置API密钥？ Obsidian Copilot 本身不提供AI模型服务，它需要连接外部的AI服务提供商。配置API密钥后，你可以： * 在笔记中直接与AI对话 * 智能分析和总结笔记内容 * 自动生成文章大纲和草稿 * 基于你的知识库进行问答 🚀 快速开始：配置API密钥步骤1：打开API密钥设置在Obsidian Copilot的设置界面中，点击"API Keys"区域的"Set Keys&