69元!爆改百度小度音箱,适配小智AI,接入DeepSeek、豆包、Qwen、元宝大模型

文末联系小编,获取项目源码

小度蓝牙智能音箱基于小智AI 源码二次开发,使用ESP32S3R8控制板、外置16M NOR FLASH 双麦克风、 AXP173电源管理芯片,得益于小度的5W大腔体,音质非常的不错。

小度蓝牙音箱,3个实体按键,从左到右为电源和音量+键,唤醒键,音量-键5W音腔喇叭,500MA电池。为更好的发挥大音腔喇叭,采用了自带升压的功放芯片,大音量功耗较大平时建议音量在60%以内,电池供电在低电量大音量下,可能会触发电源芯片保护关机!

改造后,小度蓝牙音箱按键使用方式:

  • 左键:短按 开机键 开机,长按4s关机键关机。
  • 播放声音中:短按音量+,长按不要超过4S 最大音量
  • 中键:boot键 说话键 打断键
  • 右键:音量-键


小智AI 改造方案 

硬件相关基本参数

  • ESP32-S3R8
  • 16MB NOR FLASH
  • ES8311
  • ES7210
  • NS4830
  • ZTS6216 MEMS麦克风*2
  • 12pin 屏幕接口 ST7789 驱动
  • 1.25喇叭和电池插座
  • Typec 充电和烧录接口
  • 预留串口插针

重新烧录自编译固件:

1.下载附件中的代码,覆盖到完整项目代码中

2.编辑main/CMakeLists.txt文件在  # 根据 BOARD_TYPE 配置添加对应的板级文件  下添加如下代码

elseif(CONFIG_BOARD_TYPE_JIANGLIAN_S3)

    set(BOARD_TYPE "jianglian-s3")

3.编辑main/Kconfig.projbuild文件在  #Board type. 开发板类型  下添加如下代码

    config BOARD_TYPE_JIANGLIAN_S3

    bool "匠联未来·ESP32-S3"

在config USE_DEVICE_AEC 中添加 BOARD_TYPE_JIANGLIAN_S3

4.按照官方编译方式进行编译,版子进入menuconfi 选择 匠联未来·ESP32-S3

原理图

PCB板

开源小智AI聊天机器人项目 

图片


小智AI聊天机器人是一款基于乐鑫ESP32-S3核心板,搭载多种开源AI大模型( DeepSeek、OpenAI 、通义Qwen),通过对话角色自定义、海量知识库、长期记忆、语音声纹识别等功能。它不仅是智能工具,更是一个真正“懂你”的AI助理,致力于为每一天增添温暖和便利。无论是在解决问题还是分享快乐,小智AI聊天机器人都以独特的智慧和温柔的方式,使科技更加有温度,生活更美好。

  • 通信协议基于 xiaozhi-esp32 协议,通过 WebSocket 实现数据交互。
  • 对话交互支持唤醒对话、手动对话及实时打断。长时间无对话时自动休眠
  • 多语言识别支持国语、粤语、英语、日语、韩语(默认使用 FunASR)。
  • LLM 模块支持灵活切换 LLM 模块,可选阿里通义Qwen、DeepSeek、OpenAI 等
  • TTS 模块支持 EdgeTTS(默认)、火山引擎豆包 TTS 等多种 TTS 接口,满足语音合成需求。
图片

语音交互系统

  • • 支持中文、粤语、英语等多语言语音识别
  • • 高质量语音合成输出,支持多种音色
  • • 声纹识别功能,可识别不同说话者

智能对话能力

• 集成 Qwen2.5 大语言模型

• 支持上下文理解和对话记忆

• 可自定义对话风格和人设

硬件功能

  • •支持 Wi-Fi 和 4G 双网络接入
  • • OLED/LCD 屏幕显示交互内容
  • • 按键唤醒和打断功能
  • • 支持多款主流开发板

拓展性与定制

  • • 开放的插件系统,支持功能扩展
  • • 可自定义提示词和对话模板
  • • 支持脚本化任务处理

 小智AI聊天机器人服务端源码  

图片

服务端每个功能模块采用独立的目录,便于开发和维护,提高系统的可扩展性和可维护性。

  • asr-server+asr-worker:提供语音活动监测、语音转文本、说话人识别等服务;
  • tts-server:提供音色管理、音色克隆、语音合成等服务,对接本地部署的语音模型;
  • main-server:主服务,负责协调语音识别、大模型、语音合成等各种服务,并对接后端数据库。

小智AI 后台服务端功能清单

功能模块

描述

核心服务架构

基于WebSocket和HTTP服务器,提供完整的控制台管理和认证系统

语音交互系统

支持流式ASR(语音识别)、流式TTS(语音合成)、VAD(语音活动检测),支持多语言识别和语音处理

智能对话系统

支持多种LLM(大语言模型),实现智能对话

视觉感知系统

支持多种VLLM(视觉大模型),实现多模态交互

意图识别系统

支持LLM意图识别、Function Call函数调用,提供插件化意图处理机制

记忆系统

支持本地短期记忆、mem0ai接口记忆,具备记忆总结功能

工具调用

支持客户端IOT协议、客户MCP协议、服务端MCP协议、MCP接入点协议、自定义工具函数

管理后台

提供Web管理界面,支持用户管理、系统配置和设备管理

测试工具

提供性能测试工具、视觉模型测试工具和音频交互测试工具

部署支持

支持Docker部署和本地部署,提供完整的配置文件管理

插件系统

支持功能插件扩展、自定义插件开发和插件热加载

小智AI 服务端组件

LLM 语言模型:任何支持 openai 接口调用的 LLM 均可接入使用。

图片

VLLM 视觉模型:任何支持 openai 接口调用的 VLLM 均可接入使用。

图片

TTS 语音合成模块

图片

ASR 语音识别模块

图片

Memory 记忆存储模块

图片

Intent 意图识别模块

图片

如有IoT 源码采购和项目交付需求,请扫码联系小编,微信号: beacon0418

图片
图片

往期推荐

乐鑫ESP32+豆包智能AI聊天机器人

一周赚2万,搞定智慧农业项目交付

源码交付 IoT智慧水务、污水处理

这才是老板想要的IoT可视化大屏

上班摸鱼, 智能AI 监控老板行踪

图片
图片

免责声明:本公众号所发布的内容来源于互联网,我们会尊重并维护原作者的权益。由于信息来源众多,若文章内容出现版权问题,或文中使用的图片、资料、下载链接等,如涉及侵权,请告知我们,我们将尽快处理。

Read more

前端 SSG:别让你的网站加载速度慢得像蜗牛

前端 SSG:别让你的网站加载速度慢得像蜗牛 毒舌时刻 这网站加载速度慢得能让我泡杯咖啡回来还没好。 各位前端同行,咱们今天聊聊前端 SSG(静态站点生成)。别告诉我你还在使用纯客户端渲染,那感觉就像在没有预加载的情况下开车——能开,但起步慢得要命。 为什么你需要 SSG 最近看到一个项目,每次加载都要重新获取数据,用户体验差。我就想问:你是在做网站还是在做实时应用? 反面教材 // 反面教材:纯客户端渲染 // App.jsx import React, { useState, useEffect } from 'react'; function App() { const [posts, setPosts] = useState([]); const [loading, setLoading] = useState(true); useEffect(() => { async function fetchPosts() { setLoading(

pywebview:用Python+Web技术打造轻量级桌面应用!

pywebview:用Python+Web技术打造轻量级桌面应用!

✍️作者:唐叔在学习 💡专栏:唐叔学python ✨关键词:Python桌面开发、pywebview教程、WebView应用、前后端分离、JS与Python交互、桌面应用打包、Electron替代方案、Python GUI 大家好,我是唐叔。今天我们来聊聊一个非常轻量且强大的Python库——pywebview。如果你曾经为开发一个简单的桌面应用而纠结于Electron的笨重、PyQt的复杂,或是Tkinter的界面简陋,那pywebview或许正是你一直在找的解决方案。 文章目录 * 一、介绍 * 二、安装 * 安装全量版本 * 安装指定环境版本 * 三、使用入门 * 3.1 基本使用 * 3.2 应用程序架构 * 纯网络服务架构 * 无服务器架构 * 3.3 JS与Python交互 * 四、应用打包 * 五、常见使用场景 * 5.1 文件操作 * 文件下载

前端数据库 IndexedDB 详解:构建强大的离线Web应用

前端数据库 IndexedDB 详解:构建强大的离线Web应用 * 引言:为什么需要前端数据库? * IndexedDB核心概念解析 * 1. 数据库(Database) * 2. 对象存储(Object Store) * 3. 索引(Index) * 4. 事务(Transaction) * 5. 游标(Cursor) * 完整代码示例:实现一个联系人管理器 * 1. 初始化数据库 * 2. 添加联系人 * 3. 查询联系人 * 通过ID查询 * 通过索引查询 * 4. 更新联系人 * 5. 删除联系人 * 6. 高级查询:使用游标和范围 * IndexedDB最佳实践 * IndexedDB的浏览器支持情况 * 使用第三方库简化开发 * 常见应用场景 * 总结 引言:为什么需要前端数据库? 在现代Web开发中,我们经常需要处理大量结构化数据。传统的localStorage和sessionStorage虽然简单易用,

Web 可访问性最佳实践:构建人人可用的前端界面

Web 可访问性最佳实践:构建人人可用的前端界面 代码如诗,包容如画。让我们用可访问性的理念,构建出人人都能使用的前端界面。 什么是 Web 可访问性? Web 可访问性(Web Accessibility)是指网站、工具和技术能够被所有人使用,包括那些有 disabilities 的人。这意味着无论用户的能力如何,他们都应该能够感知、理解、导航和与 Web 内容交互。 为什么 Web 可访问性很重要? 1. 法律要求:许多国家和地区都有法律法规要求网站必须具有可访问性。 2. 扩大用户群体:约 15% 的世界人口生活有某种形式的 disability,可访问性可以让更多人使用你的网站。 3. SEO 优化:搜索引擎爬虫依赖于可访问性良好的网站结构。 4. 更好的用户体验:可访问性改进通常会使所有用户受益,而不仅仅是那些有 disabilities 的用户。 5. 社会责任: