69元!爆改百度小度音箱,适配小智AI,接入DeepSeek、豆包、Qwen、元宝大模型

文末联系小编,获取项目源码

小度蓝牙智能音箱基于小智AI 源码二次开发,使用ESP32S3R8控制板、外置16M NOR FLASH 双麦克风、 AXP173电源管理芯片,得益于小度的5W大腔体,音质非常的不错。

小度蓝牙音箱,3个实体按键,从左到右为电源和音量+键,唤醒键,音量-键5W音腔喇叭,500MA电池。为更好的发挥大音腔喇叭,采用了自带升压的功放芯片,大音量功耗较大平时建议音量在60%以内,电池供电在低电量大音量下,可能会触发电源芯片保护关机!

改造后,小度蓝牙音箱按键使用方式:

  • 左键:短按 开机键 开机,长按4s关机键关机。
  • 播放声音中:短按音量+,长按不要超过4S 最大音量
  • 中键:boot键 说话键 打断键
  • 右键:音量-键


小智AI 改造方案 

硬件相关基本参数

  • ESP32-S3R8
  • 16MB NOR FLASH
  • ES8311
  • ES7210
  • NS4830
  • ZTS6216 MEMS麦克风*2
  • 12pin 屏幕接口 ST7789 驱动
  • 1.25喇叭和电池插座
  • Typec 充电和烧录接口
  • 预留串口插针

重新烧录自编译固件:

1.下载附件中的代码,覆盖到完整项目代码中

2.编辑main/CMakeLists.txt文件在  # 根据 BOARD_TYPE 配置添加对应的板级文件  下添加如下代码

elseif(CONFIG_BOARD_TYPE_JIANGLIAN_S3)

    set(BOARD_TYPE "jianglian-s3")

3.编辑main/Kconfig.projbuild文件在  #Board type. 开发板类型  下添加如下代码

    config BOARD_TYPE_JIANGLIAN_S3

    bool "匠联未来·ESP32-S3"

在config USE_DEVICE_AEC 中添加 BOARD_TYPE_JIANGLIAN_S3

4.按照官方编译方式进行编译,版子进入menuconfi 选择 匠联未来·ESP32-S3

原理图

PCB板

开源小智AI聊天机器人项目 

图片


小智AI聊天机器人是一款基于乐鑫ESP32-S3核心板,搭载多种开源AI大模型( DeepSeek、OpenAI 、通义Qwen),通过对话角色自定义、海量知识库、长期记忆、语音声纹识别等功能。它不仅是智能工具,更是一个真正“懂你”的AI助理,致力于为每一天增添温暖和便利。无论是在解决问题还是分享快乐,小智AI聊天机器人都以独特的智慧和温柔的方式,使科技更加有温度,生活更美好。

  • 通信协议基于 xiaozhi-esp32 协议,通过 WebSocket 实现数据交互。
  • 对话交互支持唤醒对话、手动对话及实时打断。长时间无对话时自动休眠
  • 多语言识别支持国语、粤语、英语、日语、韩语(默认使用 FunASR)。
  • LLM 模块支持灵活切换 LLM 模块,可选阿里通义Qwen、DeepSeek、OpenAI 等
  • TTS 模块支持 EdgeTTS(默认)、火山引擎豆包 TTS 等多种 TTS 接口,满足语音合成需求。
图片

语音交互系统

  • • 支持中文、粤语、英语等多语言语音识别
  • • 高质量语音合成输出,支持多种音色
  • • 声纹识别功能,可识别不同说话者

智能对话能力

• 集成 Qwen2.5 大语言模型

• 支持上下文理解和对话记忆

• 可自定义对话风格和人设

硬件功能

  • •支持 Wi-Fi 和 4G 双网络接入
  • • OLED/LCD 屏幕显示交互内容
  • • 按键唤醒和打断功能
  • • 支持多款主流开发板

拓展性与定制

  • • 开放的插件系统,支持功能扩展
  • • 可自定义提示词和对话模板
  • • 支持脚本化任务处理

 小智AI聊天机器人服务端源码  

图片

服务端每个功能模块采用独立的目录,便于开发和维护,提高系统的可扩展性和可维护性。

  • asr-server+asr-worker:提供语音活动监测、语音转文本、说话人识别等服务;
  • tts-server:提供音色管理、音色克隆、语音合成等服务,对接本地部署的语音模型;
  • main-server:主服务,负责协调语音识别、大模型、语音合成等各种服务,并对接后端数据库。

小智AI 后台服务端功能清单

功能模块

描述

核心服务架构

基于WebSocket和HTTP服务器,提供完整的控制台管理和认证系统

语音交互系统

支持流式ASR(语音识别)、流式TTS(语音合成)、VAD(语音活动检测),支持多语言识别和语音处理

智能对话系统

支持多种LLM(大语言模型),实现智能对话

视觉感知系统

支持多种VLLM(视觉大模型),实现多模态交互

意图识别系统

支持LLM意图识别、Function Call函数调用,提供插件化意图处理机制

记忆系统

支持本地短期记忆、mem0ai接口记忆,具备记忆总结功能

工具调用

支持客户端IOT协议、客户MCP协议、服务端MCP协议、MCP接入点协议、自定义工具函数

管理后台

提供Web管理界面,支持用户管理、系统配置和设备管理

测试工具

提供性能测试工具、视觉模型测试工具和音频交互测试工具

部署支持

支持Docker部署和本地部署,提供完整的配置文件管理

插件系统

支持功能插件扩展、自定义插件开发和插件热加载

小智AI 服务端组件

LLM 语言模型:任何支持 openai 接口调用的 LLM 均可接入使用。

图片

VLLM 视觉模型:任何支持 openai 接口调用的 VLLM 均可接入使用。

图片

TTS 语音合成模块

图片

ASR 语音识别模块

图片

Memory 记忆存储模块

图片

Intent 意图识别模块

图片

如有IoT 源码采购和项目交付需求,请扫码联系小编,微信号: beacon0418

图片
图片

往期推荐

乐鑫ESP32+豆包智能AI聊天机器人

一周赚2万,搞定智慧农业项目交付

源码交付 IoT智慧水务、污水处理

这才是老板想要的IoT可视化大屏

上班摸鱼, 智能AI 监控老板行踪

图片
图片

免责声明:本公众号所发布的内容来源于互联网,我们会尊重并维护原作者的权益。由于信息来源众多,若文章内容出现版权问题,或文中使用的图片、资料、下载链接等,如涉及侵权,请告知我们,我们将尽快处理。

Read more

2026年03月16日全球AI前沿动态

摘要 本文献汇总2026年3月15日AI技术核心动态,聚焦AI Agent(智能代理)、大语言模型(LLM)优化、多模态技术、工具链生态四大核心领域。其中AI Agent相关项目与技能占比超30%,LLM模型迭代聚焦长上下文、多模态融合与效率优化,多模态技术以音视频生成与理解为突破点,工具链围绕开发效率、安全可控构建生态。整体呈现“技术闭环加速、场景落地深化、安全合规凸显”的发展态势,大公司与开源社区双轮驱动,Agent化、模块化、多模态成为技术演进的核心锚点。 总结与洞察 核心主线是什么? “工欲善其事,必先利其器”,本次技术汇总的核心主线是AI Agent的规模化落地与技术栈完善。从基础层的上下文数据库(如OpenViking)、高效模型(如Qwen3.5系列、NVIDIA Nemotron-3 Super),到工具层的浏览器自动化(Lightpanda)、后端开发平台(InsForge),再到应用层的群体智能预测(MiroFish)、代码生成(OmniCoder-9B),形成了“模型-工具-场景”

‌2026年测试工程师必备的10个免费开源AI工具

‌2026年测试工程师必备的10个免费开源AI工具

2026年,软件测试已进入“AI智能体驱动”的新纪元。传统脚本编写正被“感知-决策-执行-学习”闭环的开源AI工具取代。 ‌一、AI测试范式的根本性跃迁:为什么2026年必须重新定义工具链?‌ 2026年的测试工程师,不再只是“写脚本的人”。AI已从辅助工具进化为‌自主质量智能体‌,其核心能力包括: * ‌自愈测试‌:自动识别UI/接口变更,动态修复定位器,维护成本降低60%以上; * ‌语义级用例生成‌:基于需求文档、Figma设计稿、用户行为日志,生成带业务语义的测试场景; * ‌视觉AI验证‌:超越DOM,通过像素级比对检测布局偏移、字体错位、颜色失真; * ‌多智能体协同‌:多个AI代理分工协作——一个解析需求,一个生成用例,一个执行监控,一个分类缺陷; * ‌预测性质量分析‌:结合代码变更热区、历史缺陷模式、团队协作密度,智能推荐测试优先级。 ‌角色转变‌:从“脚本工人” → “AI训练师 + 质量策略设计师” ‌二、2026年十大免费开源AI测试工具深度清单‌

如何在 Ubuntu 上安装 OpenClaw (AI 龙虾)

如何在 Ubuntu 上安装 OpenClaw (AI 龙虾)

如何在 Ubuntu 上安装 OpenClaw (AI 龙虾) OpenClaw 近期备受关注,它是一个能够进行对话、浏览网页和管理文件的 AI 助手。以下是在 Ubuntu 系统上安装 OpenClaw 的步骤,帮助用户避免常见问题,快速完成安装。 1. 准备工作:设置环境 OpenClaw 基于 Node.js。建议 Ubuntu 用户安装最新的 Node.js v22 以确保稳定性。 # 更新系统 sudo apt update && sudo apt upgrade -y sudo apt install -y curl git # 安装

全球顶级AI大模型最新排名出炉!Gemini 3.1 Pro与GPT-5.4智能并列第一,中国 GLM-5强势杀入前 5,DeepSeek V3.2 成性价比之王!

全球顶级AI大模型最新排名出炉!Gemini 3.1 Pro与GPT-5.4智能并列第一,中国 GLM-5强势杀入前 5,DeepSeek V3.2 成性价比之王!

你好,我是杰哥 刚刚,权威 AI 评测平台Artificial Analysis 发布了全球最新大模型三维排名:智能指数(Intelligence)、**输出速度(Output Tokens per Second)**和 价格(USD per 1M Tokens)。 这次排名亮点满满: * 中美模型继续霸榜智能顶端,Gemini 3.1 Pro Preview 和 GPT-5.4(xhigh)并列57分第一! * 中国模型表现亮眼:GLM-5 智能第5(50分),DeepSeek V3.2虽然智能中等,但价格+速度综合性价比极高,继续展现“中国力量”! GLM-5 是由中国领先的 AI 公司智谱AI(Zhipu AI)