昇腾设备部署llama.cpp

优质文章学习记录

09 Apr 2026 — 1 min read

硬件环境：

Atlas 800I A2

CPU：KunPeng920 * 192

NPU：Atlas 910B4-1 * 8

内存：1000G

软件环境

操作系统：OpenEuler22.03 LTS

内核：5.10.0-186.0.0.2.1.oe2203sp3.galaxy.aarch64

驱动：24.1.rc2

docker：26.1.3

为了不影响物理环境，安装是在docker容器环境中进行，

由于目前llama.cpp只支持openeuler22.03和ubuntu 22.04，可以下载一个对应操作系统的镜像

此处以vllm-ascend:0.9.1rc1-torch_npu2.5.1-cann8.1.rc1-python3.10-oe2203lts-linuxarm64镜像为例

拉取镜像：

docker pull swr.cn-north-4.myhuaweicloud.com/ddn-k8s/docker.io/openeuler/vllm-ascend:0.9.1rc1-torch_npu2.5.1-cann8.1.rc1-python3.10-oe2203lts-linuxarm64

支持Atlas 300I Duo Atlas 300T A2（Ascend 910B4）

起容器：

docker run -it -d --net=host --shm-size=500g \ --privileged \ --name vllm-ascend \ --device=/dev/davinci_manager \ --device=/dev/hisi_hdc \ --device=/dev/devmm_svm \ -v /usr/local/Ascend/driver:/usr/local/

Read more

【Coze-AI智能体平台】解锁 Coze 工作流：逻辑控制・数据处理・AIGC 多媒体全场景实战

【Coze-AI智能体平台】解锁 Coze 工作流：逻辑控制・数据处理・AIGC 多媒体全场景实战

🔥小龙报：个人主页 🎬作者简介：C++研发，嵌入式，机器人方向学习者 ❄️个人专栏：《coze智能体开发平台》 ✨ 永远相信美好的事情即将发生文章目录 * 前言 * 一、业务逻辑节点 * 1.1 选择器节点 * 1.2 意图识别节点 * 1.3 循环节点 * 1.4 批处理节点 * 1.5 变量聚合节点 * 1.6 代码节点 * 1.6.1 JSON？ * 1.6.2 python异步编程 * 1.7 数据库节点 * 1.7.1 新增数据节点 * 1.7.2

IDEA 中的 AI 编程插件怎么选？Copilot / 灵码 / TRAE 实际使用对比

IDEA 中的 AI 编程插件怎么选？Copilot / 灵码 / TRAE 实际使用对比

# 【不吹不黑】Java 开发者真实体验：IDEA 三大 AI 编程插件深度对比（Copilot / TRAE / 灵码） > 本文是一篇**技术交流与使用体验记录**，仅用于分享 Java 开发过程中使用 AI 插件的真实感受与效率提升方式，不涉及任何商业推广或广告行为。 *** ## 一、写在前面：为什么要写这篇文章过去一年，大模型能力的跃迁，直接改变了开发者的工作方式。**AI 已经不再是“写 Demo 的玩具”，而是逐渐演变为 IDE 中的“第二大脑”** 。本文的目的非常明确： * 记录一名 **Java 后端开发者** 在真实项目中使用 AI 插件的体验 * 对比不同插件在 **补全、对话、Agent 工作流** 等方面的差异 * 帮助开发者根据自身场景选择合适的工具，而不是盲目跟风本文所有结论，

【收藏】大模型训练加速秘籍：LLaMA Factory与Megatron-LM的无缝集成方案

序言 LLaMA Factory 是一个广受欢迎的开源大模型微调平台，以其简洁的 API、丰富的训练范式支持（如（增量）预训练、（多模态）指令监督微调、奖励模型训练、PPO 训练、DPO 训练、KTO 训练、ORPO 训练等）和活跃的中文社区，成为国内开发者进行LLM 微调的首选工具之一。其基于 Hugging Face Transformers生态构建，支持使用 Accelerate或 DeepSpeed 作为训练加速后端，在单机多卡场景下表现优异。然而，当面对百亿参数以上的大模型或大规模多节点分布式训练需求时，传统基于数据并行的训练方案（如 ZeRO 或 FSDP）往往面临通信瓶颈与显存效率不足的问题。此时，若能将 LLaMA Factory强大的数据处理与训练配置能力，与 NVIDIA Megatron-LM 这类专为超大规模模型设计的高性能分布式训练框架相结合，将显著提升训练吞吐与可扩展性。

Altera FPGA 的 Avalon MM总线接口规范介绍（精简版）

Altera FPGA 的 Avalon MM总线接口规范介绍（精简版）

本文参考Altera文档：1. Introduction to the Avalon® Interface Specifications Avalon总线是一种协议较为简单的片内总线，主要用于连接片内处理器与外设，以构成片上可编程系统（SOPC）。使用Avalon接口能够轻松连接Intel FPGA中的各个组件，从而简化了系统设计。Avalon接口常用于高速数据流传输、读写寄存器和存储器、控制片外器件等。此外，也可以使用Avalone接口自定义组件，以增强设计的互操作性。 Avalon共有以下七种接口： * Avalon Clock Interface, Avalon时钟接口 -- 驱动或接收时钟信号的接口。 * Avalon Reset Interface, Avalon复位接口 -- 驱动或接收复位信号的接口。 * Avalon Memory Mapped Interface (Avalon-MM), Avalon存储器映射接口 -- 基于地址的读/写接口，是主-从连接的典型接口。 * Avalon Streaming Interface (Avalon-ST),