博客列表·第 195 页

PythonAI算法

基于 LLaMA-Factory 微调与 vLLM 部署的大语言模型实战

在 AutoDL 环境中利用 LLaMA-Factory 对 Qwen1.5-4B-Chat 进行微调，并通过 vLLM 实现高效推理。流程涵盖环境配置、数据集准备、WebUI 参数调整及模型导出。针对 vLLM 启动时显存预分配导致的 OOM 问题，提供调整最大序列长度的解决方案。最后通过 Streamlit 搭建本地聊天界面，验证微调后模型的对话能力，并指出模型路径配置的关键点以避免 404 错误。

菩提发布于 2026/4/9更新于 2026/5/36 浏览0 点赞约 11 分钟阅读

编程语言AI大前端

VSCode Copilot 接入智谱 GLM-5.1 及其他大模型配置指南

通过安装 OAI Compatible Provider 插件，可将智谱 GLM-5.1 等支持 OpenAI 兼容接口的大模型无缝接入 VSCode Copilot。操作涵盖获取 API Key、配置对应 Base URL（区分包月与按量计费地址）以及在 Copilot Chat 中切换模型。该方法不仅降低订阅成本，还能利用国产模型优势提升代码辅助效率，适用于各类开发场景。

MongoKing发布于 2026/4/9更新于 2026/5/14 浏览0 点赞约 7 分钟阅读

PythonAI算法

Ollama Windows 安装与使用：本地运行 Llama、DeepSeek 等大模型

Ollama 是一款开源工具，支持在 Windows 系统上本地运行 Llama、DeepSeek 等大语言模型。安装过程包含官方安装包和命令行两种方式，需满足内存及显卡要求。基础操作涵盖模型拉取、列表管理及对话交互。进阶应用提供 API 接口调用及 Open WebUI 图形界面支持，便于集成开发。常见问题涉及下载速度、端口冲突及显存限制，可通过代理、环境变量调整及量化模型优化解决。该方案无需复杂配置，有效保障数据隐私。

随缘发布于 2026/4/9更新于 2026/5/36 浏览0 点赞约 10 分钟阅读

PythonAI算法

实时 Linux 部署 Whisper 实现工业语音指令识别与 VAD 延迟优化

实时 Linux 环境下利用 Whisper Tiny 和 VAD 技术实现工业语音指令控制。通过优化音频采集、推理及 PLC 通信流程，将端到端延迟控制在 300ms 以内。方案涵盖硬件选型、PREEMPT_RT 内核配置、C 语言实时线程编写及 Python 模型推理集成，解决传统云端 API 延迟高及误触问题，适用于急停、复位等安全场景。

孤勇者发布于 2026/4/9更新于 2026/5/58 浏览0 点赞约 17 分钟阅读

PythonAI算法

Ψ0 人形全身 VLA：基于人类视频预训练与 MM-DiT 后训练策略

综述由AI生成Ψ0 模型提出一种分阶段训练范式，利用大规模人类第一视角视频预训练视觉语言模型（VLM），再在真实机器人数据上后训练动作专家。该方案避免了异构数据混合训练的次优性，结合实时动作分块（RTC）技术解决推理延迟问题。实验表明，Ψ0 在人形机器人行走 - 操作任务中显著优于现有开源基线，实现了低成本、高泛化能力的全身控制。

BackendPro发布于 2026/4/9更新于 2026/5/34 浏览0 点赞约 8 分钟阅读

编程语言AI大前端

VR、AR 与 MR 区别详解：从概念到应用场景的通俗解读

VR、AR、MR 是三种不同的虚实交互技术。VR 通过隔绝现实实现完全沉浸，适合游戏和观影；AR 在现实中叠加虚拟信息，常用于导航和特效；MR 则实现虚实无缝融合与互动，适用于专业办公和工业场景。三者并非简单的升级关系，核心区别在于虚实融合度与交互能力。

山野诗人发布于 2026/4/9更新于 2026/4/304 浏览0 点赞约 6 分钟阅读

PythonAI算法

无人机视觉任务主流数据集汇总：检测与分割资源整理

涵盖地理、农业、智慧城市等领域的无人机视觉数据集，包含 VOC/YOLO 及 LabelMe 格式，支持目标检测与语义分割任务。数据涉及道路、建筑、电力、水利、灾害、军事等多种场景，适合算法研发与模型训练。

猫巷少女发布于 2026/4/9更新于 2026/5/44 浏览0 点赞约 25 分钟阅读

PythonAI算法

智能家居 AI 应用变革：从指令执行到主动理解

智能家居正经历从被动响应指令到主动理解需求的质变。基于 AI 应用架构视角，探讨设备如何进化为猜需求、破解多设备信息孤岛及平衡智能与隐私的核心逻辑。通过场景案例与架构设计，揭示 AI 重塑智能家居体验的关键路径。

链路追踪发布于 2026/4/9更新于 2026/5/59 浏览0 点赞约 2 分钟阅读

PythonAI算法

OpenDroneMap 无人机影像处理与地理数据生成指南

OpenDroneMap 是一款开源工具包，利用计算机视觉算法将无人机航拍影像转换为精确的地理空间数据。支持生成点云、三维模型、正射影像及数字高程模型。通过命令行或 Docker 部署，涵盖相机参数解析、特征提取、稀疏与稠密重建等流程。具备跨平台兼容性、GPU 加速及多光谱植被指数计算能力，适用于城市规划、农业监测及环境评估等领域。

FrontendX发布于 2026/4/9更新于 2026/4/297 浏览0 点赞约 5 分钟阅读

PythonAI算法

CS336 从零构建语言模型：Transformer 架构实现详解

综述由AI生成斯坦福 CS336 课程作业实战记录，完整实现了 Transformer 语言模型架构。涵盖线性层、嵌入层、RMSNorm、SwiGLU 前馈网络、RoPE 位置编码及因果多头自注意力等核心组件的 PyTorch 代码编写。重点解析了数值稳定性处理、张量形状变换及资源消耗核算方法，最终整合为完整的 Transformer LM 架构，并分析了 GPT-2 XL 规模的参数量与 FLOPs 分布。

安卓系统发布于 2026/4/9更新于 2026/5/25 浏览0 点赞约 29 分钟阅读

Kotlinjava

基于 AR 眼镜的喝水提醒应用开发实践

综述由AI生成基于 Rokid AR 眼镜和 CXR-M SDK 开发的喝水提醒应用。通过前台服务实现定时提醒，利用提词器场景在眼镜端显示文字及 TTS 语音播报。解决了蓝牙权限动态申请、中文乱码、TTS 播放不完整等常见问题。项目采用 Kotlin 编写，使用 SharedPreferences 存储数据，实现了饮水记录、目标追踪及历史统计功能。

ArchDesign发布于 2026/4/9更新于 2026/5/57 浏览0 点赞约 62 分钟阅读

TypeScriptNode.jsAI大前端

Cursor Chat Browser：管理 AI 聊天历史的 Web 应用

综述由AI生成Cursor Chat Browser 是一款基于 Next.js 和 TypeScript 开发的开源工具，旨在解决开发者在使用 Cursor 编辑器时难以管理和回顾 AI 对话历史的问题。它支持跨平台自动检测存储路径，提供全文搜索、按工作区分类以及 Markdown、HTML、PDF 等多种格式的导出功能。通过读取本地 SQLite 数据库，该工具实现了新旧版本 Cursor 存储格式的兼容，帮助用户高效整理技术问答与代码建议，适合…

虚拟内存发布于 2026/4/9更新于 2026/5/57 浏览0 点赞约 11 分钟阅读

PythonAI算法

Llama3-8B 本地部署实战：vLLM + Open-WebUI 免配置方案

Llama3-8B 本地部署采用 vLLM 推理引擎配合 Open-WebUI 界面，基于 Docker 镜像实现免配置快速启动。方案支持 RTX 3060 等消费级显卡，提供单卡量化运行能力。内容包含环境准备、镜像拉取、登录使用、API 调用及性能优化技巧，重点解决显存不足与中文效果问题，适合开发者构建本地 AI 工作流或内部知识问答系统。

狂少发布于 2026/4/9更新于 2026/5/56 浏览0 点赞约 15 分钟阅读

JavaScript大前端算法

前端面试核心考点整理：HTML、JS、框架及网络协议详解

综述由AI生成本文整理了前端面试中的高频考点，涵盖 HTML 结构、JavaScript 核心机制、CSS 布局、Vue 与 React 框架原理、HTTP 协议及常见算法。内容按优先级排序，旨在帮助开发者系统复习基础知识与实战问题，提升面试通过率。

锁机制发布于 2026/4/9更新于 2026/5/46 浏览0 点赞约 6 分钟阅读

编程语言AI

OpenClaw 漏洞预警：如何为 AI 代理构建日志审计防线

工信部近期发布风险提示，指出开源 AI 智能体框架 OpenClaw 因默认配置脆弱存在较高安全风险。当 AI 代理拥有系统级权限时，其操作失误或遭受攻击可能导致严重数据泄露。解决关键在于建立完善的日志审计机制，通过全量行为采集、智能关键词告警、低成本长期存储及全文检索分析，实现对 AI 操作的分钟级感知与溯源。这不仅能满足合规留存要求，更能有效降低自建运维成本，帮助企业在 AI 应用中构建可视化的安全防线。

moshang发布于 2026/4/9更新于 2026/4/305 浏览0 点赞约 5 分钟阅读

PythonAI算法

Stable Diffusion WebUI Windows 部署与常见报错解决方案

综述由AI生成Stable Diffusion WebUI Windows 部署常因 Python 版本、虚拟环境、Git 仓库及依赖包问题导致启动失败。整理标准安装流程，涵盖必备软件配置、源码克隆步骤，并汇总了 UnboundLocalError、ModuleNotFoundError 等 10+ 种常见报错的原因与具体修复命令。重点强调使用 Python 3.10、Git 加入 PATH、避免中文路径及正确安装 CLIP 源码版等关键注意事项，提…

时间旅人发布于 2026/4/9更新于 2026/5/28 浏览0 点赞约 11 分钟阅读

MATLAB / OctaveAI算法

公交网络辅助的无人机调度用于无线可充电传感器网络可持续充电

综述由AI生成无线可充电传感器网络面临能量供应瓶颈，提出利用公交网络辅助无人机进行调度充电的方案。针对能量受限场景设计逼近算法 DSA，最小化总时间成本；针对带截止时间场景设计 DDSA 算法，最大化充电传感器数量。仿真实验表明，DSA 相比贪婪算法降低总时间成本 84.83%，DDSA 提升传感器存活率 51.95%。提供了相关 Matlab 代码实现供参考。

魔尊发布于 2026/4/9更新于 2026/5/57 浏览0 点赞约 14 分钟阅读

Java大前端java

若依 (RuoYi) 低代码框架深度解析与选型建议

若依基于 Spring Boot，是国内 Java 低代码领域的代表性开源框架。其优势在于完备的 RBAC 权限体系、模块化设计及强大的代码生成器，适合企业内部管理系统及快速原型开发。然而，技术栈相对保守（如 Vue2）、代码生成灵活性不足及性能瓶颈也是不可忽视的短板。在微服务支持和高并发场景下需谨慎评估。开发者应权衡便利性与灵活性，根据实际项目需求选择是否采用。

板砖工程师发布于 2026/4/9更新于 2026/5/54 浏览0 点赞约 15 分钟阅读

PythonAI大前端java算法

Web 开发者构建多模态 Agent 图像识别技能：JS+Python 全栈实战

Web 开发者转型多模态 Agent 图像识别技能，需掌握 Canvas 操作与 API 设计模式。通过 Vue3+TensorFlow.js 实现前端预处理，Spring Boot+Python 构建后端推理服务。重点解决 GPU 资源调度、模型加载阻塞及高并发延迟问题，利用 LRU 淘汰、熔断降级策略保障系统稳定性。结合电商瑕疵检测实战，展示从像素操作到特征提取的工程化升级路径，帮助开发者构建视觉智能架构。

城市逃兵发布于 2026/4/9更新于 2026/5/37 浏览0 点赞约 106 分钟阅读

PHP大前端算法

攻防世界 Web 题解：SQL 注入与文件包含绕过实战

针对攻防世界两道 Web 题目进行解析。第一题 Supersqli 考察 SQL 注入，在 SELECT 关键字被过滤的情况下，利用 HANDLER 语句实现数据读取。第二题 Warmup 涉及文件包含漏洞，通过构造特定路径和 URL 解码绕过白名单检查获取 Flag。重点在于理解后端逻辑过滤机制及寻找替代语法或路径遍历技巧。

清酒独酌发布于 2026/4/9更新于 2026/5/26 浏览0 点赞约 8 分钟阅读