
AMD AI Max+ 395 CPU 本地大模型推理性能评测
对搭载 AMD AI Max+ 395 CPU 的迷你主机进行本地大模型推理测试。使用 Ollama 和 LM-Studio 框架,评估了 deepseek-r1、qwen3 及 gpt-oss 系列模型的性能。结果显示 LM-Studio 推理速度普遍优于 Ollama。gpt-oss:120b 等大参数模型在消费级硬件上仍具备可用性。CPU 的统一内存架…
博客作者
持续部署爱好者
326
已发布文章
12K
博客获赞
677K
博客浏览
第 5 页

对搭载 AMD AI Max+ 395 CPU 的迷你主机进行本地大模型推理测试。使用 Ollama 和 LM-Studio 框架,评估了 deepseek-r1、qwen3 及 gpt-oss 系列模型的性能。结果显示 LM-Studio 推理速度普遍优于 Ollama。gpt-oss:120b 等大参数模型在消费级硬件上仍具备可用性。CPU 的统一内存架…

介绍 Spring AI 中 ChatMemory 机制的实现方案,涵盖短期、长期及摘要三种记忆类型的设计逻辑。对比了 Redis 缓存与数据库持久化的选型策略,并提供了过期配置示例。针对 Token 限制问题,阐述了基于语义相似度的关键信息提取和基于大模型的对话摘要生成两种压缩技巧。最后通过混合压缩策略与双存储架构,展示了支持 100 轮超长对话的智能客服…
如何在 Windows、Linux 和 Mac 系统上安装和配置 node-llama-cpp。该工具基于 llama.cpp,提供 Node.js 绑定,支持本地运行 AI 模型并强制 JSON 输出。安装主要依赖 npm,部分场景需源码构建及特定编译工具(如 Visual Studio Build Tools、Xcode)。文章涵盖各平台依赖安装、源码构…

总结了医疗 AI 场景下的算法编程实践,以 ICU 败血症早期预警系统为例。内容涵盖数据模拟、预处理、特征工程、多模型训练(逻辑回归、随机森林、XGBoost)、模型融合(Stacking)、超参数调优及不平衡处理。同时包含模型评估指标(AUC、PR AUC)、可解释性分析(SHAP)、阈值选择与决策曲线,并提供模型保存与 API 示例代码。该程序可作为医疗…
Altera USB-Blaster 驱动的安装流程与故障排查方法。涵盖自动安装与手动安装两种路径,解析关键驱动文件,提供自动化检测脚本及常见问题解决方案。旨在帮助用户解决 Windows 平台下驱动识别失败、签名阻止等问题,构建稳定的 FPGA 下载环境。

JavaScript 中用于移动设备的核心触摸事件:touchstart、touchmove 和 touchend。详细阐述了各事件的触发时机、关键特性及常用场景,如滑动交互、实时绘制和状态恢复。提供了完整的 HTML 代码示例,演示了如何监听这些事件,并说明了在浏览器开发者工具中开启设备模拟模式以测试触摸效果的步骤。

介绍如何使用 ChromaDB、Ollama 和 Llama 3.1 搭建本地私有知识库系统。通过 LangChain 框架整合文档解析、向量化及 RAG 流程,实现离线问答。方案涵盖环境安装、Python 脚本编写、向量库构建及查询服务启动,并提供隐私保护、性能调优及中文增强建议。适用于需要数据安全和专业性的 AI 应用场景。

2023 年电赛 H 题信号分离装置的 FPGA 与 STM32 联合解决方案。系统通过高速 ADC 采集混合信号 C,利用 FPGA 进行 FIFO 缓存及串口通信,将数据发送至 STM32。STM32 端运行 FFT 算法识别输入信号的频率及波形类型(正弦波或三角波),并将结果回传至 FPGA。FPGA 端基于 DDS 技术重构波形,并结合锁相环(PLL…

提出 ZoomDet,一种针对无人机小目标检测的自适应图像变焦框架。通过轻量级偏移预测网络实现非均匀图像放大,并结合角点对齐的边界框变换解决训练推理中的坐标错位问题。在 VisDrone、UAVDT 和 SeaDronesSee 数据集上实验表明,该方法能显著提升检测精度(如 Faster R-CNN 在 SeaDronesSee 上 mAP 提升超 8%)…

PUSHI G1 AI+AR 眼镜的开源技术方案,基于瑞芯微 RockIVA RV1106B 芯片提供边缘 AI 算力。方案开放视频推流 SDK 与音频处理接口,支持多模态大模型对接。文章详细解析了硬件参数、核心优势,并列举了工业、医疗、教育等三大方向共 18 个应用场景,涵盖远程指导、智能巡检、AR 导览等,展示了 AI+AR 在专业工作流、个人体验及空间…
ZYNQ 是 Xilinx 推出的 SoC 产品,将 ARM 处理器与 FPGA 融合。文章详细解析了 PS(处理系统)和 PL(可编程逻辑)的架构、组成及优势。PS 端包含双核 ARM Cortex-A9、存储系统及外设接口;PL 端提供 LUT、BRAM、DSP 等逻辑资源。重点阐述了 PS-PL 互联技术,基于 AXI 总线协议,包括 GP、HP、AC…
将小米智能设备集成到 Home Assistant 平台的方案,涵盖准备工作、三种安装方式(HACS、Git、手动)、云端与本地控制模式解析、配置流程及常见问题处理。通过 OAuth 认证实现设备管理,支持多账号及多语言界面,强调本地控制的隐私与速度优势,并提供自动化场景创建建议与安全注意事项。

介绍基于 RuoYi-Vue-Plus 5.X 框架的 AI 智能编程助手配置方案。支持 Claude Code 和 OpenAI Codex 双引擎,内置 40+ 专业技能与 10 大快捷命令。通过智能钩子系统自动匹配技能,规范代码生成。涵盖 CRUD 开发、API 设计、数据库操作及安全权限等核心功能。提供完整的项目目录结构、技术规范及使用方法,旨在提升…

深入解析 AIGC 核心技术,涵盖 Transformer 架构原理、GPT 生成式模型及 BERT 双向编码器。详细介绍了自注意力机制、位置编码、多头注意力等关键组件,并通过代码示例展示 Transformer 实现。对比了三种模型的架构差异、训练目标及应用场景,指出 Transformer 适合序列任务,GPT 擅长文本生成,BERT 长于语义理解。最后…
雷达信号处理中的恒虚警率(CFAR)技术。CFAR 是一种自适应阈值目标检测技术,旨在背景噪声或杂波功率变化时保持虚警概率恒定。文章阐述了其基本原理,包括滑动窗口、单元划分(待检测单元、保护单元、参考单元)及门限计算流程。此外,对比了 CA-CFAR、GO-CFAR、SO-CFAR 和 OS-CFAR 四种常见算法类型及其适用场景。最后提供了基于 MATLA…

AI 绘画技术在广告、插画及游戏设计领域展现出巨大潜力,能显著提升创意生成效率并降低成本。文章介绍了利用 AI 工具快速生成概念图、个性化素材及游戏原型的实践方法,并提供了基于 Python 的 GAN、OpenCV 及 StyleGAN 代码示例。同时探讨了 AI 生成内容的版权归属争议及数据合规性挑战,指出未来需在技术发展与法律规范间寻求平衡。
对比了前端多种状态管理方案,包括 React Context+useReducer、Redux、MobX、Recoil、Zustand 和 Jotai。通过分析反面教材展示了缺乏状态管理的弊端,如状态分散、Props Drilling 和难以调试。文章详细提供了各方案的代码示例,并指出应根据应用复杂度选择:小型应用用 Context,中型用 Zustand/…
OpenClaw v2026.3.8 是一款开源可私有化部署的 AI 智能体,支持跨应用自动化任务。 Windows、macOS、Linux 及移动端的一键部署流程,涵盖 Docker 隔离部署方案。内容包含环境准备、端口配置、Ollama 本地模型离线对接步骤,以及常见报错排查与安全设置建议,帮助用户实现本地化运行并规避安全风险。

GitHub Copilot 学生认证的最新流程与注意事项。主要步骤包括开启双重验证(2FA)、完善个人资料与账单信息以确保姓名一致、使用手机摄像头拍摄学生证上传、处理地理位置报错及选择远程学习选项。若多次尝试失败,建议提交工单寻求人工审核。重点在于耐心尝试不同材料组合及确保信息填写准确。
介绍 AMD 显卡使用 ComfyUI-Zluda 进行 AI 绘画的配置方法。涵盖环境准备、安装步骤、核心功能解析及性能优化技巧。支持 RX 6000 系列及以上显卡,通过 ZLUDA 技术实现 GPU 加速。包含缓存管理、精度调节、条件缓存应用及常见问题解决方案。提供工作流模板示例,帮助用户快速上手 Stable Diffusion 图像生成任务。