跳到主要内容
极客日志极客日志面向AI+效率的开发者社区
首页博客GitHub 精选镜像工具UI配色美学隐私政策关于联系
搜索内容 / 工具 / 仓库 / 镜像...⌘K搜索
注册
博客列表
编程语言AI算法

CherryStudio 使用指南:本地 AI 模型管理与知识库配置

CherryStudio 是一款支持多模型聚合的桌面客户端,具备本地部署与 API 调用能力,注重隐私保护。教程涵盖模型接入(API/Ollama)、联网搜索配置(Tavily)、RAG 知识库构建及重排模型优化,同时提供跨设备配置迁移方案,适合开发者高效管理 AI 工作流。

PgDevote发布于 2026/4/10更新于 2026/5/2212 浏览
CherryStudio 使用指南:本地 AI 模型管理与知识库配置

为什么选择 CherryStudio

CherryStudio 是一个聚合型 AI 客户端,支持多模型对话、知识库管理及 AI 绘画等功能。其核心优势在于数据本地化处理,隐私性较强,能有效提升工作效率。

下载与安装

前往官网 cherry-ai.com/download 获取客户端。

双击 exe 文件启动安装向导。建议勾选'为所有用户安装',并根据需要更改安装路径,避免占用 C 盘空间。整个过程较为直观,无需复杂配置。

基础使用

详细文档可参考官方说明。以下是核心功能的操作流程。

添加模型

点击右下角设置按钮,进入模型服务页面。支持 API 调用或本地部署两种模式。

API 调用

以硅基流动为例。注册账号并获取 API Key 后,填入对应输入框。点击检查按钮验证有效性,开启开关即可启用。状态显示为绿色 on 表示连接成功。

本地调用

推荐使用 Ollama 或 LM Studio。若使用 Ollama,需确保本地服务已启动。

  1. API 密钥通常留空。
  2. API 地址默认为 localhost,若跨设备访问需修改为实际 IP。
  3. 添加模型时,名称需与 Ollama 中的 Model ID 严格一致(例如 deepseek-r1:14b)。
测试交互

返回主界面,顶部切换已接入的模型,下方即可开始对话。本地模型响应速度取决于硬件性能。

联网功能

部分大模型自带联网能力(如 Gemini 2.0 Flash),但本地部署模型通常不具备此功能,需额外配置。

添加网络搜索

默认使用 Tavily 作为搜索服务。在设置中选择网络搜索,复制 Tavily 的 API Keys 填入即可。

注意免费额度通常为 1000 次,每次搜索消耗一个配额。可在设置中调整增强模式和搜索结果数量(默认 5 个,上限 20 个)。

启用搜索

在输入框底部点击网络图标激活联网模式。提问语言不同,返回的搜索结果来源也会相应变化(如中文偏向国内平台,英文偏向国际平台)。

数据设置

主要用于持久化保存对话记录。当前版本功能相对基础,按需配置即可。

MCP 使用

MCP(Model Context Protocol)扩展了模型的能力边界,具体配置可查阅相关技术文档。

知识库

目前主流方案采用 RAG(检索增强生成)。流程包括:文件切片 -> 向量化存储 -> 检索匹配 -> 归纳总结。

现有痛点主要集中在切片粒度粗糙、检索精准度不足及缺乏全局上下文。可通过引入重排模型和优化向量数据库来改善。

添加重排模型

在模型列表中添加重排模型,用于优化检索结果的排序精度。

添加知识库

  1. 在侧边栏选择知识库,点击添加。
  2. 设置嵌入模型和重排模型。注意 Pro 版嵌入模型会消耗 Token,且处理大量材料时耗时较长。
  3. 拖入资料文件。蓝点表示正在向量化,绿色表示就绪。
  4. 重要:文件编码建议使用 UTF-8,GB2312 可能导致乱码。

搜索知识库内容时,右上角会显示得分情况。由于涉及大模型调用,非本地部署环境需保持联网。

使用知识库

在聊天栏底部关联已创建的知识库。提问时,系统会自动引用相关内容并在回复中标注来源。

迁移配置

若需在多台设备间同步配置,可使用内置的迁移功能。

备份

进入数据设置,选择备份选项,将配置文件导出为 zip 包保存至指定文件夹。

恢复

在新设备上打开相同设置页面,选择恢复,加载之前的 zip 文件。等待数据同步完成后,知识库向量索引及 MCP 配置将一并生效,无需重复搭建环境。

目录

  1. 为什么选择 CherryStudio
  2. 下载与安装
  3. 基础使用
  4. 添加模型
  5. API 调用
  6. 本地调用
  7. 测试交互
  8. 联网功能
  9. 添加网络搜索
  10. 启用搜索
  11. 数据设置
  12. MCP 使用
  13. 知识库
  14. 添加重排模型
  15. 添加知识库
  16. 使用知识库
  17. 迁移配置
  18. 备份
  19. 恢复
  • 💰 8折买阿里云服务器限时8折了解详情
  • Magick API 一键接入全球大模型注册送1000万token查看
  • 🤖 一键搭建Deepseek满血版了解详情
  • 一键打造专属AI 智能体了解详情
极客日志微信公众号二维码

微信扫一扫,关注极客日志

微信公众号「极客日志V2」,在微信中扫描左侧二维码关注。展示文案:极客日志V2 zeeklog

更多推荐文章

查看全部
  • 机器学习核心算法实战笔记:从 KNN 到集成学习
  • MetaLlama 大模型系列介绍与本地部署指南
  • 从树到森林:决策树、随机森林与可解释性
  • Stable Diffusion 模型版本演进与核心差异解析
  • Qwen3-VL 果园采摘机器人:果实定位与可采摘性判断
  • 第二届人工智能、虚拟现实与交互设计国际学术会议(AIVRID 2026)
  • 基于 Spark 与机器学习的电影票房预测及推荐系统
  • Linux 是什么与如何学习
  • FPGA 入门:基于 Altera EP4CE10 的 LED 点亮工程
  • AI 绘画在商业设计中的应用与版权探讨
  • 昇腾 NPU 部署 Llama-2-7b:六大核心场景性能实测
  • Python 自动化脚本:8 个实用场景与代码实现
  • 基于 openJiuwen 记忆库新特性的 AI 职业规划助手搭建
  • Promise 多请求 finally 链式调用避坑指南
  • AI 时代产品经理全流程落地管控方法:从需求到上线
  • Java 高德地图面检索中 WGS84 坐标转换与 POI 查询实战
  • 企业应用探秘:大模型 AI Agent 的六种基础类型
  • Vivado 开发全流程实战:从工程创建到硬件烧录
  • Capacitor 实战指南:将 Web 项目打包为跨平台应用
  • GitHub Copilot 版本差异解析与课程适配建议

相关免费在线工具

  • 加密/解密文本

    使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online

  • RSA密钥对生成器

    生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online

  • Mermaid 预览与可视化编辑

    基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online

  • 随机西班牙地址生成器

    随机生成西班牙地址(支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选),支持数量快捷选择、显示全部与下载。 在线工具,随机西班牙地址生成器在线工具,online

  • Gemini 图片去水印

    基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印,支持批量处理与下载。 在线工具,Gemini 图片去水印在线工具,online

  • Base64 字符串编码/解码

    将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online