用 CherryStudio 搭建本地 AI 工作流：模型接入与知识库实战

CherryStudio 是一个聚合型 AI 客户端，支持多模型对话、知识库和 AI 绘画。它的数据留在本地，隐私性不错，日常用起来也挺顺手。

下载与安装

从官网 cherry-ai.com/download 下载客户端。安装过程很常规：双击 exe，勾选'为所有用户安装'，把路径改到非 C 盘。其他默认就行。

模型接入

点击右下角设置，进入模型服务。这里可以接线上 API，也能连本地部署的模型。

线上 API

以硅基流动为例。注册拿到 API Key，填进去，点检查。绿色 on 就说明通了，开关打开即可。

本地模型

推荐用 Ollama 或 LM Studio 把模型跑起来。用 Ollama 的话，本地服务要保持运行。

API 密钥一般空着。
API 地址默认 localhost，跨机器访问要改成实际 IP。
添加模型时，'模型名称'必须和 Ollama 里的 Model ID 一模一样，比如 deepseek-r1:14b。

配好后回主界面，顶部切换模型就能对话了。本地模型快不快得看你的硬件。

联网搜索

有些在线模型自带联网（比如 Gemini 2.0 Flash），但本地模型没这能力，得单独配置。

CherryStudio 默认用 Tavily 做搜索后端。去设置里找到网络搜索，填上 Tavily 的 API Key。免费额度是 1000 次，每次搜索耗一次。你还可以调'增强模式'和结果数量（默认 5 条，最多 20）。

用的时候，在输入框底部点那个网络图标激活。提问语言不同，结果来源偏向也不同——中文多出国内平台，英文更偏国际站点。

对话记录

数据设置里可以持久化保存聊天记录。当前版本功能比较基础，按需开就行了。

MCP

MCP（Model Context Protocol）能扩展模型的能力边界，具体配置参考官方文档。

知识库

现在主流是 RAG（检索增强生成），流程就是：文件切片 → 向量化 → 检索匹配 → 归纳。常见的槽点：切片太粗，检索不准，缺少全局上下文。加个重排模型、调好向量库能改善一些。

重排模型

先在模型列表里把重排模型加上，用来优化检索结果的排序。

建库

侧边栏选知识库，点添加。
设置嵌入模型和重排模型。注意 Pro 版嵌入模型会消耗 Token，文件多了速度也慢。
把资料拖进去。蓝点表示正在向量化，绿点亮了就绪。
编码一定要用 UTF-8，GB2312 很可能乱码。

知识库里搜索内容，右上角会显示匹配得分。因为得调大模型，非本地跑的环境要保持联网。

关联使用

聊天栏底部选上已建的知识库。提问时，系统会自动拉取相关内容，并在回复里标出来源。

迁移配置

多台设备同步配置可以用内置的迁移功能。

备份：数据设置 → 备份 → 导出 zip 包。
恢复：新设备同样位置，选恢复，加载之前的 zip。等同步完，知识库向量和 MCP 配置都会生效，不用再重搭环境。

用 CherryStudio 搭建本地 AI 工作流：模型接入与知识库实战

下载与安装

模型接入

线上 API

本地模型

联网搜索

对话记录

MCP

知识库

重排模型

建库

关联使用

迁移配置

更多推荐文章

相关免费在线工具

更多推荐文章

相关免费在线工具

用 CherryStudio 搭建本地 AI 工作流：模型接入与知识库实战

下载与安装

模型接入

线上 API

本地模型

联网搜索

对话记录

MCP

知识库

重排模型

建库

关联使用

迁移配置

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具