跳到主要内容
极客日志极客日志面向AI+效率的开发者社区
首页博客GitHub 精选镜像工具UI配色美学隐私政策关于联系
搜索内容 / 工具 / 仓库 / 镜像...⌘K搜索
注册
博客列表
编程语言Node.jsAI

Jan:一款支持 100% 本地运行的开源 LLM 客户端

Jan 是一款开源的本地大模型客户端,支持在 Windows、Mac 和 Linux 系统上 100% 离线运行。它基于 Llama.cpp 构建,支持 Nvidia GPU 和 Apple M 系列芯片加速,具备本地数据存储、OpenAI API 兼容性及插件扩展能力。用户可以通过二进制包或源码方式进行安装,内置模型 Hub 可下载 GGUF 格式模型。 Jan 的核心特性、安装步骤、模型管理及 API 集成方法,适用于希望构建私有化 AI 应用的开发者。

苹果系统发布于 2025/2/6更新于 2026/6/619 浏览
Jan:一款支持 100% 本地运行的开源 LLM 客户端

Jan:一款支持 100% 本地运行的开源 LLM 客户端

简介

在人工智能大模型应用日益普及的今天,数据隐私与离线运行需求愈发重要。Jan 是一款开源的 ChatGPT 替代品,旨在让用户能够在自己的计算机上 100% 离线运行大型语言模型(LLM)。该项目目前在 GitHub 上已获得超过 6K Star,因其跨平台支持和强大的本地化能力而受到开发者关注。

Jan 界面展示

Jan 基于 Llama.cpp 构建,支持从个人 PC 到多 GPU 集群的各种环境。它不仅仅是一个聊天客户端,更是一个本地优先的 AI 原生框架,允许用户构建自定义的 AI 应用。

核心特性

1. 广泛的环境支持

Jan 支持多种操作系统和硬件架构,确保在不同设备上都能流畅运行:

  • Nvidia GPU:提供快速推理加速。
  • Apple M 系列芯片:针对 Apple Silicon 优化,性能优异。
  • 苹果英特尔架构:兼容旧款 Mac 设备。
  • Linux Debian:支持主流 Linux 发行版。
  • Windows x64:覆盖最广泛的桌面用户群体。

2. 本地数据存储与安全

所有对话历史、模型配置及用户数据均存储在本地,不存在云端泄露风险。用户可以随时导出和迁移数据,完全掌握数据主权。

3. 本地 API Server

Jan 内置了一个兼容 OpenAI API 格式的本地服务器。这使得其他应用程序可以直接调用 Jan 提供的模型服务,无需修改代码即可实现私有化部署。

4. 扩展性与架构

Jan 遵循 Clean Architecture 设计原则,支持插件扩展。开发者可以自行开发功能模块,满足特定场景需求。它支持 GGUF 和 TensorRT 等多种开源模型格式。

系统要求

为了获得最佳的运行体验,建议参考以下硬件配置:

  • CPU:支持 AVX2 指令集的现代处理器。
  • 内存 (RAM):至少 8GB,推荐 16GB 或更高以加载较大参数量的模型。
  • 显存 (VRAM):若使用 GPU 加速,建议 Nvidia 显卡拥有 4GB 以上显存。
  • 存储:根据模型大小预留足够空间,通常一个 7B 参数模型占用约 4-8GB 磁盘空间。

安装指南

Jan 提供了两种主要的安装方式:安装包安装和源码编译安装。

方法一:安装包安装(推荐)

对于大多数用户,直接下载预编译的二进制包是最便捷的方式。

  1. 访问 Jan 官方发布页面。
  2. 根据你的操作系统选择对应的安装包(如 macOS 的 .dmg 或 Windows 的 .exe)。
  3. 下载完成后,双击运行安装程序,按照向导完成安装。
  4. 启动应用后,即可进入主界面。

方法二:源码安装

如果你需要参与开发或测试最新功能,可以通过源码进行构建。此方法需要一定的开发环境配置经验。

前置条件

确保你的环境中已安装以下工具:

  • Node.js 版本:20.0.0 及以上
  • Yarn 版本:1.22.0 及以上
构建步骤
  1. 克隆仓库

    git clone https://github.com/janhq/jan.git
    cd jan
    
  2. 切换分支 根据需要切换到特定的稳定版本分支:

    git checkout DESIRED_BRANCH
    
  3. 安装依赖 使用 Yarn 安装项目所需的依赖包:

    yarn install
    
  4. 构建核心模块 编译项目的核心部分:

    yarn build:core
    
  5. 打包插件与 UI 构建基础插件和用户界面:

    yarn build:plugins
    yarn build:uikit
    
  6. 启动开发模式 运行开发服务器进行测试:

    yarn dev
    

使用教程

1. 模型管理

Jan 内置了模型 Hub,用户可以直接在应用内搜索并下载开源模型。

  • 模型格式:主要支持 GGUF 格式,这是目前本地运行 LLM 的主流格式,兼容性极佳。
  • 推荐模型:初学者可以从 Mistral 7B 或 Llama 3 等热门模型开始尝试。
  • 下载流程:点击左侧边栏的"Models"图标,浏览可用模型列表,点击"Download"即可自动拉取至本地。

2. 会话管理

在 Jan 中,"Thread"相当于一次独立的对话会话。

  • 新建会话:在右侧区域点击"New Thread"按钮,即可开始新的对话。
  • 预设参数:每个会话都可以配置不同的系统提示词(System Prompt)、温度(Temperature)和最大生成长度。
  • 模型切换:支持在同一个会话中动态切换正在使用的模型,方便对比不同模型的效果。

3. 高级编辑

Jan 提供了灵活的 JSON 编辑功能,适合高级用户调试。

  • 点击会话旁边的三个点菜单。
  • 选择"Edit as JSON"。
  • 直接在 JSON 视图中修改对话内容、元数据或配置参数。

4. API 服务器集成

Jan 的 API 服务器功能是其区别于普通聊天软件的关键特性。

  • 启用方式:在设置中找到"API Server"选项并开启。
  • 默认端口:通常为 1337。
  • 兼容性:完全兼容 OpenAI API 标准接口。

使用示例: 假设你启用了 API 服务,可以使用 curl 命令进行测试:

curl http://localhost:1337/v1/chat/completions \
  -H "Content-Type: application/json" \
  -d '{
    "model": "mistral",
    "messages": [{"role": "user", "content": "你好"}]
  }'

这使得你可以将 Jan 作为后端服务集成到你的 Python 脚本、Web 应用或其他自动化流程中。

常见问题与排查

1. 模型加载失败

如果模型无法加载,请检查以下几点:

  • 模型文件是否完整下载。
  • 磁盘空间是否充足。
  • 文件格式是否为支持的 GGUF 格式。

2. 运行速度慢

  • 确认是否开启了 GPU 加速(在设置中查看)。
  • 检查 CPU 是否支持 AVX2 指令集。
  • 尝试减小模型的量化等级(如从 Q4_K_M 改为 Q8_0 可能会变慢但精度更高,反之亦然)。

3. 内存溢出

  • 关闭不必要的后台程序释放内存。
  • 选择参数量较小的模型(如 3B 或 7B 版本)。
  • 增加物理内存或使用 Swap 分区。

总结

Jan 为希望在不依赖云服务的条件下使用大模型的用户提供了一个优秀的解决方案。通过其跨平台支持、本地数据安全和开放的 API 接口,Jan 不仅是一个聊天工具,更是构建私有化 AI 基础设施的理想起点。无论是个人开发者还是企业用户,都可以通过 Jan 探索本地大模型的无限可能。

目录

  1. Jan:一款支持 100% 本地运行的开源 LLM 客户端
  2. 简介
  3. 核心特性
  4. 1. 广泛的环境支持
  5. 2. 本地数据存储与安全
  6. 3. 本地 API Server
  7. 4. 扩展性与架构
  8. 系统要求
  9. 安装指南
  10. 方法一:安装包安装(推荐)
  11. 方法二:源码安装
  12. 前置条件
  13. 构建步骤
  14. 使用教程
  15. 1. 模型管理
  16. 2. 会话管理
  17. 3. 高级编辑
  18. 4. API 服务器集成
  19. 常见问题与排查
  20. 1. 模型加载失败
  21. 2. 运行速度慢
  22. 3. 内存溢出
  23. 总结
  • 💰 8折买阿里云服务器限时8折了解详情
  • Magick API 一键接入全球大模型注册送1000万token查看
  • 🤖 一键搭建Deepseek满血版了解详情
  • 一键打造专属AI 智能体了解详情
极客日志微信公众号二维码

微信扫一扫,关注极客日志

微信公众号「极客日志V2」,在微信中扫描左侧二维码关注。展示文案:极客日志V2 zeeklog

更多推荐文章

查看全部
  • AI 安全治理与生成式人工智能风险应对技术分享
  • C 语言快速排序详解:从基础到非递归实现
  • LangChain 提示模板类型与应用详解
  • 初识 AI 语言大模型:概念、能力与挑战
  • PHP PDO SQL Server 分页 SQL 实现方案
  • LangGraph 工具调用实战:构建 ReAct 搜索机器人
  • Linux 普通用户切换为 root 用户的常用命令
  • OpenClaw 入门指南:安装、配置与自动化实战
  • Rust 路由匹配与参数提取:从 match 语句到 axum 的类型魔法
  • 前端数据库 IndexedDB 详解:构建离线 Web 应用
  • 机器学习中的逻辑回归
  • C++ 命名空间详解:从 std 角度理解作用域与最佳实践
  • 使用 AI 在 Figma 中自动生成 UI 设计稿
  • 设计支持万人并发抢购的秒杀系统架构方案
  • Python 基于 Spotlight 的网络拼车司机推荐系统设计与实现
  • 基于 Flask 的语音转写 AI 总结:从 TXT 到 CSV 部署实践
  • 零基础网络安全入门学习路线与技术指南
  • Python 库 addict 使用指南:字典属性化访问
  • 基于 AR 眼镜的春节亲戚称呼助手实现
  • 通义万相 2.1 API 集成实战:Python 实现文生图与文本生成

相关免费在线工具

  • RSA密钥对生成器

    生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online

  • Mermaid 预览与可视化编辑

    基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online

  • 随机西班牙地址生成器

    随机生成西班牙地址(支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选),支持数量快捷选择、显示全部与下载。 在线工具,随机西班牙地址生成器在线工具,online

  • Base64 字符串编码/解码

    将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online

  • Base64 文件转换器

    将字符串、文件或图像转换为其 Base64 表示形式。 在线工具,Base64 文件转换器在线工具,online

  • Markdown转HTML

    将 Markdown(GFM)转为 HTML 片段,浏览器内 marked 解析;与 HTML转Markdown 互为补充。 在线工具,Markdown转HTML在线工具,online