CherryStudio 是一个聚合型 AI 客户端,支持多模型对话、知识库和 AI 绘画。它的数据留在本地,隐私性不错,日常用起来也挺顺手。
下载与安装
从官网 cherry-ai.com/download 下载客户端。 安装过程很常规:双击 exe,勾选'为所有用户安装',把路径改到非 C 盘。其他默认就行。
模型接入
点击右下角设置,进入模型服务。这里可以接线上 API,也能连本地部署的模型。
线上 API
以硅基流动为例。注册拿到 API Key,填进去,点检查。绿色 on 就说明通了,开关打开即可。
本地模型
推荐用 Ollama 或 LM Studio 把模型跑起来。用 Ollama 的话,本地服务要保持运行。
- API 密钥一般空着。
- API 地址默认
localhost,跨机器访问要改成实际 IP。 - 添加模型时,'模型名称'必须和 Ollama 里的 Model ID 一模一样,比如
deepseek-r1:14b。
配好后回主界面,顶部切换模型就能对话了。本地模型快不快得看你的硬件。
联网搜索
有些在线模型自带联网(比如 Gemini 2.0 Flash),但本地模型没这能力,得单独配置。
CherryStudio 默认用 Tavily 做搜索后端。去设置里找到网络搜索,填上 Tavily 的 API Key。免费额度是 1000 次,每次搜索耗一次。你还可以调'增强模式'和结果数量(默认 5 条,最多 20)。
用的时候,在输入框底部点那个网络图标激活。提问语言不同,结果来源偏向也不同——中文多出国内平台,英文更偏国际站点。
对话记录
数据设置里可以持久化保存聊天记录。当前版本功能比较基础,按需开就行了。
MCP
MCP(Model Context Protocol)能扩展模型的能力边界,具体配置参考官方文档。
知识库
现在主流是 RAG(检索增强生成),流程就是:文件切片 → 向量化 → 检索匹配 → 归纳。常见的槽点:切片太粗,检索不准,缺少全局上下文。加个重排模型、调好向量库能改善一些。
重排模型
先在模型列表里把重排模型加上,用来优化检索结果的排序。
建库
- 侧边栏选知识库,点添加。
- 设置嵌入模型和重排模型。注意 Pro 版嵌入模型会消耗 Token,文件多了速度也慢。
- 把资料拖进去。蓝点表示正在向量化,绿点亮了就绪。
- 编码一定要用 UTF-8,GB2312 很可能乱码。
知识库里搜索内容,右上角会显示匹配得分。因为得调大模型,非本地跑的环境要保持联网。
关联使用
聊天栏底部选上已建的知识库。提问时,系统会自动拉取相关内容,并在回复里标出来源。
迁移配置
多台设备同步配置可以用内置的迁移功能。
- 备份:数据设置 → 备份 → 导出 zip 包。
- 恢复:新设备同样位置,选恢复,加载之前的 zip。等同步完,知识库向量和 MCP 配置都会生效,不用再重搭环境。


