
具身智能 AI 小车图形化编程 Mixly MQTT MCP 控制
介绍基于 Small 小车和 AiTall Mini 开发板的具身智能 AI 小车项目。通过 Mixly 图形化编程,结合小智 AI 大模型,实现语音指令解析与物理执行。内容涵盖硬件组装、串口/MQTT/MCP 多协议通信配置、RGB 灯光控制及小车移动逻辑。拓展部分讨论了视觉感知、多车协同及算法优化方向,旨在构建具备自然语言理解能力的边缘智能体。
博客作者
BUG终结者
338
已发布文章
6.3K
博客获赞
372K
博客浏览
第 5 页

介绍基于 Small 小车和 AiTall Mini 开发板的具身智能 AI 小车项目。通过 Mixly 图形化编程,结合小智 AI 大模型,实现语音指令解析与物理执行。内容涵盖硬件组装、串口/MQTT/MCP 多协议通信配置、RGB 灯光控制及小车移动逻辑。拓展部分讨论了视觉感知、多车协同及算法优化方向,旨在构建具备自然语言理解能力的边缘智能体。

通义万相 2.1 多模态 AI 生成模型的技术特性,包括 Wan-VAE 和 DiT 架构、IC-LoRA 技术等。文章分析了其与高性能计算基础设施的深度协同优势,涵盖大规模训练提速、实时推理优化及智能资源分配。此外,还探讨了该组合在影视制作、广告设计、游戏开发等领域的具体应用场景,并提供了通用的部署使用指南。通义万相 2.1 凭借卓越性能,在 AIGC 领…

测试了使用 Claude Code 辅助进行 FPGA Verilog 开发的可行性。项目涵盖 UART 通信、协议解析状态机及 PWM 控制模块的设计与验证。结果显示,AI 能高效生成波特率发生器、三段式状态机及 Self-Checking Testbench,显著提升编码效率约 800%。但需注意位宽截断和锁存器隐患,人工 Review 仍不可或缺。

详细记录了 Llama-2-7b 模型在华为昇腾 Atlas 800T A2 NPU 上的部署与性能基准测试过程。内容包括环境激活、依赖安装及冲突解决,并通过六大核心场景评估了模型的首 Token 延迟、解码吞吐量及批量处理能力。测试表明,该配置在短输入下延迟约 68ms,解码速度稳定在 64 tokens/s,高并发下吞吐量显著提升。文章提供了针对实时交互…

通过 Python 和 Selenium 技术,演示如何从零搭建博客系统的 UI 自动化测试框架。内容包括环境配置、公共工具封装(驱动管理、截图)、核心模块用例开发(登录、列表、详情、编辑)、统一执行入口及测试报告生成。旨在帮助开发者减少手动测试成本,实现关键流程的自动化验证与回归测试。
介绍针对华为 Ascend NPU 优化的 GLM-4.7 vLLM 推理解决方案。通过 QKV RMSNorm 融合、FlashComm1 通信优化、MoE 大融合算子支持等 12 项核心措施,在 Atlas 800T 服务器上实现显著性能提升。内容涵盖环境准备、一键部署步骤、W8A8 量化配置及性能测试验证。优化后推理速度提升 30% 以上,内存占用减少…
IntelliJ IDEA 中四款主流 AI 辅助开发插件的功能特点与适用场景,涵盖代码自动补全、质量检查及 API 建议。同时提供了插件安装注意事项、版本兼容性说明及内存占用性能对比数据,帮助开发者根据实际需求选择合适的工具以提升编码效率。

系统介绍了卷积神经网络(CNN)的基础理论与实战应用。内容涵盖 CNN 核心组件(卷积层、池化层、全连接层、激活函数)、数学原理(前向传播、反向传播、损失函数)、以及基于 PyTorch 和 TensorFlow 的代码实现。此外,还探讨了模型优化策略,包括正则化、模型融合及压缩加速技术,适合希望深入理解深度学习视觉模型的开发者阅读。

介绍如何在本地服务器通过 Docker 部署开源 AI 项目 LocalAI,利用 CPU 即可运行大语言模型,保护数据隐私。教程涵盖容器启动、模型加载、Web 界面使用以及通过内网穿透工具实现远程访问的配置方法,帮助开发者在消费级硬件上低成本体验大模型能力。

对比了 Fooocus 的两种部署方式:本地手动配置与云平台一键部署。本地部署需安装 Conda、配置 Python 环境及处理依赖冲突,技术门槛高但利于学习;云平台利用预置镜像实现快速启动,效率高。文章提供了详细的本地操作步骤及常见问题解决方案,并推荐根据学习目标或产出需求选择合适的部署路径。

介绍 UniApp 中 WebView 与 H5 页面的双向通信方案。通过 URL 传递参数、postMessage 发送指令及 evalJS 回传结果实现交互。涵盖扫码、电话、打印、图片视频上传等功能调用。需区分 App 与 H5 端兼容逻辑,注意权限配置与调试细节,确保跨端通信稳定。

分享了使用 AIGC 工具制作 5 分钟微电影《编钟》的完整流程。主要工具包括 Gemini 用于剧本构思,Nano Banana Pro 生成人物三视图,Seedance2.0 生成视频片段,Suno 生成音乐,以及剪映进行后期剪辑。文章详细阐述了从剧本确定、角色一致性控制、视频分段生成、音乐版权规避到最终剪辑合成的技术细节,并总结了成本控制、积分使用策略…

介绍百度文心一言 4.5 开源模型中 ERNIE-4.5-0.3B 的轻量化部署方案。基于 FastDeploy 框架与 PaddlePaddle 环境,详细阐述了知识增强架构、推理优化及本地化部署步骤。通过工业场景诊断、中文古文献转写及工程数学计算等多维度测试验证了模型能力,并提供了量化调优、缓存策略及安全加固方法,展示了其在中小企业落地中的成本优势与效能…
介绍 AI 编程中的 Spec Coding(规格驱动编码)方法论,核心在于先定义结构化规格再生成代码。文章详细阐述了从需求拆解到归档沉淀的 6 个标准阶段,对比了其与 Vibe Coding 的优势,并提供了 SpecKit 与 OpenSpec 两款开源工具的介绍及适用场景。旨在帮助开发者实现可控、高效的 AI 辅助开发流程。
Whisper-WebUI 是基于 OpenAI Whisper 模型的语音转文字 Web 工具。文章介绍了环境准备(Git、Python、FFmpeg)、一键安装方法(Windows/Linux/Mac)、核心功能(语音转录、音乐分离、说话人识别、翻译)及应用场景(视频字幕、播客、会议)。支持多种模型选择及 REST API 集成,提供离线本地部署方案。

扩散模型的技术演进历程。从 2020 年 DDPM 奠定理论基础,到 2022 年 Stable Diffusion 通过潜在空间扩散实现实用化突破,再到 2023 年 DiT 引入 Transformer 架构提升可扩展性。文章对比了各阶段模型的架构差异、优缺点及应用场景,并梳理了当前业界主流模型及未来趋势,为理解生成式 AI 提供了清晰的技术脉络。

在 Windows 本地部署 OpenClaw 开源 AI Agent 网关框架及接入 QQ 机器人的完整流程。主要步骤包括:准备 Node.js v22+ 和 Git 环境,解决 npm 权限问题;通过 npm 全局安装 OpenClaw 并使用 onboard 命令初始化,配置 Qwen 等大模型 API;最后通过 QQ 开放平台创建机器人并安装官方通信…
ClawdBot 和 MoltBot 在树莓派 4 上的本地 AI 部署方案。通过整合 OCR、Whisper 语音转写及 vLLM 大模型推理,实现了 15 用户并发无卡顿的高性能体验。方案强调本地化处理以保障隐私,利用模型轻量化、异步 IO 设计及请求熔断机制优化资源占用。实测显示在 4GB 内存环境下,CPU 占用约 68%,平均响应延迟 0.92 秒…
对比了通义实验室推出的 Qwen-Image-Edit-2511 与 Stable Diffusion 在图像编辑领域的差异。文章分析了 Qwen-Image-Edit-2511 的指令驱动架构、角色一致性保持及工业设计优化能力,并通过功能特性、推理效率及实际案例展示了其在复杂语义理解上的优势。同时提供了基于 ComfyUI 和 Diffusers 的部署指…
机器人领域的旗舰顶会与细分方向顶会,包括 ICRA、IROS、CVPR 等,并提供了基于视觉算法基础的具身机器人学习路线。内容涵盖基础巩固、感知决策执行模块、实践项目及进阶方向,旨在帮助读者系统掌握从仿真到实物的全链路技术。