昇腾设备部署llama.cpp

优质文章学习记录

07 Apr 2026 — 1 min read

硬件环境：

Atlas 800I A2

CPU：KunPeng920 * 192

NPU：Atlas 910B4-1 * 8

内存：1000G

软件环境

操作系统：OpenEuler22.03 LTS

内核：5.10.0-186.0.0.2.1.oe2203sp3.galaxy.aarch64

驱动：24.1.rc2

docker：26.1.3

为了不影响物理环境，安装是在docker容器环境中进行，

由于目前llama.cpp只支持openeuler22.03和ubuntu 22.04，可以下载一个对应操作系统的镜像

此处以vllm-ascend:0.9.1rc1-torch_npu2.5.1-cann8.1.rc1-python3.10-oe2203lts-linuxarm64镜像为例

拉取镜像：

docker pull swr.cn-north-4.myhuaweicloud.com/ddn-k8s/docker.io/openeuler/vllm-ascend:0.9.1rc1-torch_npu2.5.1-cann8.1.rc1-python3.10-oe2203lts-linuxarm64

支持Atlas 300I Duo Atlas 300T A2（Ascend 910B4）

起容器：

docker run -it -d --net=host --shm-size=500g \ --privileged \ --name vllm-ascend \ --device=/dev/davinci_manager \ --device=/dev/hisi_hdc \ --device=/dev/devmm_svm \ -v /usr/local/Ascend/driver:/usr/local/

Read more

openclaw飞书机器人权限管理

为了确保 OpenClaw 既能顺畅运行，又不至于因权限过大导致安全隐患，建议在飞书开发者后台 - 权限管理中，按照以下清单进行勾选。这份清单分为基础必备和进阶功能两部分： 1. 基础必备权限（无论个人还是团队，必须开启）这些权限保证机器人能“听到”指令并“开口”说话： * im:message:p2p_msg:readonly (接收单聊消息) —— 允许机器人和你 1 对 1 聊天。 * im:message:group_at_msg:readonly (接收群聊中@机器人的消息) —— 团队场景下，机器人只响应被 @ 的内容，保护群隐私。 * im:message.p2p_msg:send (发送单聊消息) —— 机器人回复你的基础。 * im:message.

MIPI DSI 4-Lane液晶屏驱动开发实战：从时序解析到FPGA对接

1. MIPI DSI 4-Lane液晶屏基础认知第一次接触MIPI DSI 4-Lane液晶屏时，我被它复杂的时序图吓到了——直到把它想象成高速公路的车道管理才豁然开朗。这种显示屏采用串行差分信号传输，4条数据通道就像双向四车道的高速公路，每条lane的传输速率可达480MHz（实测GOWIN开发板环境），比传统并行RGB接口节省了约60%的引脚资源。以常见的5寸720x1280分辨率屏幕为例，其核心参数如下表：参数项典型值技术要点接口类型MIPI DSI 4-Lane支持LP/HS双模式分辨率720(H)×1280(V)60Hz刷新率色彩深度24bit RGB实际传输采用RGB888压缩为RGB565功耗特性LP模式<10mAHS模式峰值电流约120mA同步模式SYNC EVENT需要精确控制消隐区时序在硬件连接时，我曾犯过把CLK和DATA线序接反的低级错误。正确的接线顺序应该是： 1. 先对接CLK+/CLK-差分对（相当于交通信号灯） 2. 再按D0+/D0-到D3+/D3-顺序连接数据线 3. 最后接电源和背光（VCC/VLED等） 2.

Whisper.cpp移植参考：如何在PyTorch镜像中部署语音识别模型

Whisper.cpp移植参考：如何在PyTorch镜像中部署语音识别模型 1. 为什么要在PyTorch镜像里跑Whisper.cpp？你可能已经注意到一个有趣的现象：Whisper.cpp是用C/C++写的，而PyTorch镜像默认装的是Python生态——这看起来有点“不搭”。但现实中的工程落地，从来不是非此即彼的选择。真实场景往往是这样的：你的团队刚用PyTorch训练完一个语音增强模型，现在需要把降噪后的音频送进ASR系统做转录；或者你在Jupyter里做语音数据探索分析，顺手想调用本地ASR快速验证一段录音内容；又或者你正开发一个端到端语音处理Pipeline，前端用PyTorch做特征提取，后端需要轻量级、低依赖的推理引擎。这时候，硬生生拉起一个纯C环境反而增加运维负担。而PyTorch-2.x-Universal-Dev-v1.0镜像恰恰提供了最理想的“中间地带”：它自带CUDA驱动、已配置好清华/阿里源、预装了tqdm和requests等实用工具，更重要的是——它没有预装任何与Whisper.cpp冲突的LLVM或OpenMP版本，编译兼容性极佳。

一步到位！VSCode Copilot 终极魔改：智谱 GLM-4.6 接入 + 任意大模型适配

VSCode Copilot 接入 GLM-4.6 方法安装 vscode-zhipuai 插件后，在 VSCode 设置中添加以下配置： { "zhipuai.apiKey": "你的API_KEY", "zhipuai.model": "GLM-4" } 通过 Ctrl+Shift+P 调出命令面板，执行 ZhipuAI: Toggle Chat 即可激活对话窗口。该插件支持代码补全、对话和文档生成功能。任意大模型适配方案修改 VSCode 的 settings.json 实现通用 API 对接： { "ai.