
llama.cpp 本地大模型部署教程
在 Windows WSL2 环境下使用 llama.cpp 部署本地大模型的完整流程。内容包括环境准备(硬件要求、编译工具安装)、源码克隆与编译、GGUF 模型下载、命令行交互及 API 服务启动。提供了 curl、Python 和 Node.js 的 API 调用示例,并列举了常用参数说明、常见问题排查及推荐模型列表。适用于希望本地运行 Qwen 或 M…
博客作者
逆风前行
379
已发布文章
8.5K
博客获赞
530K
博客浏览
第 6 页

在 Windows WSL2 环境下使用 llama.cpp 部署本地大模型的完整流程。内容包括环境准备(硬件要求、编译工具安装)、源码克隆与编译、GGUF 模型下载、命令行交互及 API 服务启动。提供了 curl、Python 和 Node.js 的 API 调用示例,并列举了常用参数说明、常见问题排查及推荐模型列表。适用于希望本地运行 Qwen 或 M…
前端 Vue 项目的完整打包与部署流程。内容包括安装依赖与环境配置,执行生产构建命令。提供了打包优化方案,如体积分析、代码分割及 CDN 引入。部署方式涵盖静态托管服务、Nginx 自有服务器及 Docker 容器化。此外还解决了静态资源路径、跨域及缓存等常见问题,并给出了 GitHub Actions 和 Jenkins 自动化部署示例。最后包含部署后验证…
ComfyUI Manager 的使用指南,涵盖环境兼容性检查、多场景部署方案(本地、便携版、服务器)、核心功能(插件与模型管理)、安全配置及常见问题解决。旨在帮助用户优化 AI 绘画工作流,确保系统稳定运行。
介绍 Node-RED 在智能家居中的配置与使用。首先通过 Home Assistant 集成安装插件,熟悉界面布局包括节点面板、画布区域及导航栏。接着演示创建灯光自动控制流程,涵盖触发节点配置、执行服务调用及节点连接。最后提供错误处理、性能优化建议及常见问题排查方法,帮助用户构建稳定的自动化系统。

机器人 DH 参数模型(Denavit-Hartenberg)的定义、坐标系建立方法及参数表,阐述了机器人正向运动学原理及雅可比矩阵的作用,并详细推导了速度在坐标系间及关节间的传递公式。内容涵盖连杆长度、扭角、关节距离、转角等核心概念,以及转动与移动关节的速度变换逻辑,为理解机器人运动学提供了理论基础。

一个基于 Spring Boot 和 Vue 的停车场管理系统。系统采用前后端分离架构,后端使用 Spring Boot、MyBatis、Redis 和 MySQL,前端使用 Vue 和 ElementUI。主要功能包括用户登录注册、车辆信息管理、停车位管理、入场出场登记、预约管理及收费规则设置等。文章涵盖了项目技术栈、功能模块详解及数据库设计思路,适合作为…

介绍 Diffusion Transformer (DiT),一种将扩散模型中的 U-Net 替换为 Vision Transformer (ViT) 的架构。DiT 结合了视觉 Transformer 和扩散模型的优点,广泛应用于图像和视频生成,以及机器人动作预测。文章详细阐述了 DiT 的条件策略(如 adaLN-Zero、交叉注意力)、在视频生成中的改…
通过七个关卡实例详解 XSS 跨站脚本攻击的绕过技巧。涵盖基础注入、URL 编码绕过、引号闭合、伪协议跳转、表单自动提交及 AngularJS 模板注入沙箱逃逸。同时介绍了反射型、存储型和 DOM 型 XSS 的基本概念与攻击原理。

如何使用 Docker 一键部署 AstrBot 与 NapCat,接入 DeepSeek AI 实现 QQ 智能对话。内容包括初始化配置、人设切换、插件安装(如点歌)、MCP 服务扩展(如 12306 查询),以及使用 cpolar 进行内网穿透以实现公网访问管理面板。

在 Ubuntu 24 系统下,基于 MS-S1 MAX 与 AI MAX 395 硬件,通过安装 AMD GPU 驱动、ROCm 及 Vulkan 环境,并配置内核参数以解锁大显存,最终利用 Vulkan 版 llama.cpp 成功运行 gpt-oss 120b 模型的完整流程。包含驱动安装、BIOS 设置、GRUB 参数调整、模型下载及服务器启动命令,…

OpenClaw 的爆火标志着 AI 从对话层向执行层跨越,验证了低门槛、高自动化、可落地的核心逻辑,倒逼低代码 AI 从工具叠加向生态重构升级。当前低代码 AI 面临技术融合度不足、落地门槛高、生态协同弱等痛点。未来三年,低代码 AI 将呈现五大趋势:AI 执行层深度集成实现全流程自动化、低门槛普惠化使业务人员成为核心开发者、开源生态一体化实现跨工具联动、…

VS Code 1.104 版本更新后,Ctrl+I 快捷键默认触发 Copilot AI 对话框,影响原有属性提示功能。可通过修改设置禁用该 AI 特性。全局配置需在 settings 中取消勾选 disableAIFeatures;已开通 Copilot 用户可在工作目录 .vscode/settings.json 中添加 chat.disableAIF…
探讨无人机红外照片的温度校准与精度优化。分析了传感器误差、环境干扰及算法转换误差三大来源,介绍了基于大疆 TSDK 提取 R_JPEG 温度数据的基本流程,旨在帮助中高级用户提升热成像数据的可靠性与亚摄氏度级精度。
介绍如何在低配置 Windows 电脑上通过云端 GPU 方案运行 Stable Diffusion 3.5。内容包括本地硬件限制分析、云端部署步骤、提示词工程技巧、核心参数调整及进阶功能如 LoRA 和 ComfyUI 的使用。旨在帮助用户摆脱硬件束缚,利用云服务实现 AI 图像生成。

GitHub Copilot 作为基于 GPT-4 的 AI 编程助手的原理与使用方法。内容涵盖安装前的准备、VS Code 插件安装步骤、行内代码补全及 Chat 对话功能的使用指南。同时提供了常见问题解答,强调 AI 生成代码需经过人工审查以确保安全。适合前端开发者提升编码效率。

解析 FPGA 在图像处理领域的优势及核心算法。涵盖底层预处理(色彩转换、几何变换)、增强滤波(卷积、中值滤波)、特征提取(边缘、角点)、分割识别及压缩编解码等模块。重点介绍流水线设计、并行计算、数据流架构及定点数优化等 FPGA 实现特点,并列举工业、医疗、汽车电子等应用场景。结论指出 FPGA 适合流程固定、高吞吐、低延迟的底层与中级任务。

介绍百度文心大模型 4.5 系列(特别是 0.3B 版本)的开源部署方案。内容涵盖单卡环境配置、依赖安装及 API 服务启动,展示了在医疗影像、交通流优化及考古文本等场景的应用能力。同时提供性能优化策略(量化、层融合)及与 LLaMA2、通义千问的对比分析,旨在帮助中小企业低成本落地 AI 技术。
wechat-need-web 是一款基于 Chrome/Edge/Firefox 的浏览器扩展,用于解决微信网页版访问受限问题。通过修改网络请求头部信息绕过官方安全检测。支持 Manifest V3 规范,需手动安装构建后的 dist 目录。使用时需注意账号安全风险,建议定期更新版本以适配微信策略变化。
在 Ubuntu 22.04 环境下安装 llama.cpp 及 llama-server 的完整流程。包括系统依赖安装、源码克隆与编译、GGUF 模型下载、服务启动配置以及通过 curl 命令进行健康检查和接口调用的验证方法。重点解决了编译报错问题,并提供了后台运行与日志查看方案。

RunningHub 是基于开源生态的图形音视频 AIGC 应用共创平台,通过模块化节点系统与云端算力整合,实现设计、视频制作等流程的搭积木式操作。核心价值在于设计平权化、成本重构及生态闭环。技术架构基于 ComfyUI 优化,支持零代码工作流与开发者生态,具备多模态生成能力。相比传统方案,其在硬件要求、视频时长及协作效率上优势明显,适用于电商、影视、游戏及…