前言
花了一段时间,终于把小遥搜索 XiaoyaoSearch做出来了。这是一个支持语音、文本、图片多模态输入的本地 AI 搜索桌面应用。

设计初衷
作为知识工作者,经常遇到这些痛点:
- 文件太多找不到:电脑里存了成千上万个文档、图片、音视频,想找个特定内容翻半天
- 搜索不够智能:系统自带的搜索只能匹配文件名,搜不到文件内容
- 隐私安全担忧:很多搜索工具要上传数据到云端,不太放心
- AI 工具太复杂:想用 AI 提升效率,但不会配置,门槛太高
所以就想:能不能做一个本地运行的、支持多种输入方式的 AI 搜索工具?
核心功能
简单来说,它是一个本地 AI 搜索桌面应用,核心特点如下。
多模态输入
- 语音搜索:点一下录音,说出你要找的内容,30 秒内语音自动转文字搜索
- 文本搜索:输入关键词,AI 理解语义,精准匹配文件内容
- 图片搜索:上传一张图片,AI 理解图像内容,帮你搜索相关文件
深度检索
- 文档:TXT、Markdown、Word、Excel、PPT、PDF 全文检索
- 音视频:MP4、AVI、MP3、WAV 内容索引和搜索(支持 10 分钟内音视频字幕提取)
- 文件名:传统的文件名搜索也不缺席
AI 技术栈
集成了多个先进 AI 模型:
- BGE-M3:文本嵌入,理解语义
- FasterWhisper:语音识别,语音转文字
- CN-CLIP:图像理解,以图搜图
- Ollama:本地大语言模型
隐私安全
- 完全本地:所有数据处理都在本地,不上传云端
- 隐私模式:可选不记录搜索历史
- 自主可控:数据完全由你自己掌控
界面展示
搜索主界面

文本搜索






