Linux OpenEuler 部署 Qwen3-32B 大模型华为昇腾 Arm 服务器 MindIE Docker Dify 方案 | 极客日志

PythonAI算法

Linux OpenEuler 部署 Qwen3-32B 大模型华为昇腾 Arm 服务器 MindIE Docker Dify 方案

在 OpenEuler 系统上配置 Anaconda 虚拟环境，通过 ModelScope 下载 Qwen3-32B 模型权重至指定硬盘。使用华为 MindIE 推理引擎构建 Docker 容器，映射 NPU 设备与模型路径。修改配置文件启动服务，并通过 Dify 平台搭建可视化交互前端，实现本地大模型的 API 调用与对话测试。

1951018925发布于 2026/4/8更新于 2026/7/535 浏览

1. 基础环境配置

1.1 Anaconda 安装

系统：openEuler 22.03 (CentOS) 架构：aarch64

Anaconda 对应安装资源包下载地址： https://repo.anaconda.com/archive/

下载好后 cd 到安装包路径，使用安装指令如下：

bash Anaconda3-2025.06-1-Linux-aarch64.sh

按照提示接受协议，并选择安装目录。安装完成后，更新环境变量：

source ~/.bashrc

1.2 Anaconda 中创建虚拟环境

这部分同 Windows 下的 Anaconda env 设置相同。

对于 Qwen3 模型的下载，配置 ModelScope 环境，代码如下：

# 创建新环境，环境名为 modelscope
conda create -n modelscope python=3.9
# 这里必须使用 python3.9 及以上版本，否则在后续下载编译 modelscope 或者 qwen3 模型时，会提示 no module named zoneinfo，因为只有 3.9 以上的该模型才被加入系统模型库
# 激活环境
conda activate modelscope

安装 ModelScope：

pip install modelscope -i https://mirrors.aliyun.com/pypi/simple/

2. 下载模型库和模型权重

2.1 下载模型权重

如需下载完整模型库：

modelscope download --model Qwen/Qwen3-32B

如果只需要下载部分文件（例如 README）：

modelscope download --model Qwen/Qwen3-32B README.md --local_dir ./dir

这种方法会把权重默认下载在路径 ~/.cache/modelscope/ 下，但是很有可能占用系统盘，影响系统使用，因此把权重下载到指定硬盘，步骤如下。

（1）搜索系统所有硬盘

lsblk -o NAME,SIZE,MOUNTPOINT

输出如下，分别代表了硬盘名字、内存和地址：

NAME SIZE MOUNTPOINT
sda 200G
├─sda1 50G /
├─sda2 150G /data
sdb 500G /mnt/disk1
sdc 1T /mnt/disk2

（2）把模型权重下载到指定的 sdc 盘中的 models 文件夹中

自己新建一个文件夹命名 models，需要定位到指定文件夹路径，不要直接下到盘的路径，否则可能还是无法下载到指定盘中！或者直接 cd 到需要下载位置的路径下在进行下载也可以！

modelscope download --model Qwen/Qwen3-32B --local_dir /mnt/disk2/models

下载完成后，模型权重会放在 /mnt/disk2/models/Qwen/Qwen3-32B/ 路径下。

删除之前默认下载地址的模型权重，以防占用系统内存：

全盘搜索 Qwen3-32B 的储存路径：

 find / - d -name  2>/dev/null

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

rm -rf /root/dir

docker pull --platform=arm64 swr.cn-south-1.myhuaweicloud.com/ascendhub/mindie:2.1.RC2-800I-A2-py311-openeuler24.03-lts

# 禁用 docker-ce 的 repo（通常是 docker-ce-stable）
sudo dnf config-manager --set-disabled docker-ce-stable || true
# 或者直接删除 repo 文件（如果你知道文件在哪里，例如 /etc/yum.repos.d/docker-ce.repo）
sudo rm -f /etc/yum.repos.d/docker-ce* || true

sudo dnf update -y

dnf search yum-utils

cat /etc/openEuler-release

yum remove -y docker docker-client docker-client-latest docker-common docker-latest docker-latest-logrotate docker-logrotate docker-engine

vi /etc/resolv.conf

nameserver 114.114.114.114
nameserver 8.8.8.8

ping www.baidu.com

vi /etc/yum.repos.d/docker-ce.repo

[docker-ce-stable]
name=Docker CE Stable - $basearch
baseurl=https://repo.huaweicloud.com/docker-ce/linux/centos/7/$basearch/stable
enabled=1
gpgcheck=1
gpgkey=https://repo.huaweicloud.com/docker-ce/linux/centos/gpg

yum makecache

yum install -y docker-ce docker-ce-cli containerd.io docker-buildx-plugin docker-compose-plugin

systemctl enable docker

systemctl start docker

docker --version

systemctl status docker

sudo echo '{}' > /etc/docker/daemon.json

sudo systemctl restart docker

vi /etc/docker/daemon.json

{
  "registry-mirrors": [
    "https://hub-mirror.c.163.com",
    "https://mirror.baidubce.com",
    "https://ccr.ccs.tencentyun.com",
    "https://docker.1panelproxy.com",
    "https://5e96702d4787418295070cded678a7b6.mirror.swr.myhuaweicloud.com",
    "https://docker.m.daocloud.io"
  ]
}

systemctl daemon-reload
systemctl restart docker

docker ps -a

docker stop qwen3-32b

# 方法一：先停止运行后删除
docker stop qwen3-32b
docker rm qwen3-32b
# 方法二：强制删除（无论是否运行）
docker rm -f qwen3-32b

docker start qwen3-32b

docker images

docker run -it -d --shm-size 200g --net=host --name qwen3-32b \
--privileged \
--device=/dev/davinci_manager \
--device=/dev/hisi_hdc \
--device=/dev/devmm_svm \
--device=/dev/davinci0 \
--device=/dev/davinci1 \
--device=/dev/davinci2 \
--device=/dev/davinci3 \
--device=/dev/davinci4 \
--device=/dev/davinci5 \
--device=/dev/davinci6 \
--device=/dev/davinci7 \
-v /usr/local/Ascend/driver:/usr/local/Ascend/driver \
-v /usr/local/sbin:/usr/local/sbin \
-v /path/to/model:/path/to/model/in/container \
a4708118cd12 /bin/bash

chown -R root:root /path-to-weights
chmod -R 750 /path-to-weights

docker exec -it qwen3-32b bash

vim /usr/local/Ascend/mindie/latest/mindie-service/conf/config.json

ip addr show

ss -tuln

{
  "Version": "1.0.0",
  "ServerConfig": {
    "ipAddress": "172.16.23.55",
    "managementIpAddress": "127.0.0.2",
    "port": 1025,
    "managementPort": 1026,
    "metricsPort": 1027,
    "allowAllZeroIpListening": false,
    "maxLinkNum": 1000,
    "httpsEnabled": false,
    "fullTextEnabled": false,
    "tlsCaPath": "security/ca/",
    "tlsCaFile": ["ca.pem"],
    "tlsCert": "security/certs/server.pem",
    "tlsPk": "security/keys/server.key.pem",
    "tlsPkPwd": "security/pass/key_pwd.txt",
    "tlsCrlPath": "security/certs/",
    "tlsCrlFiles": ["server_crl.pem"],
    "managementTlsCaFile": ["management_ca.pem"],
    "managementTlsCert": "security/certs/management/server.pem",
    "managementTlsPk": "security/keys/management/server.key.pem",
    "managementTlsPkPwd": "security/pass/management/key_pwd.txt",
    "managementTlsCrlPath": "security/management/certs/",
    "managementTlsCrlFiles": ["server_crl.pem"],
    "kmcKsfMaster": "tools/pmt/master/ksfa",
    "kmcKsfStandby": "tools/pmt/standby/ksfb",
    "inferMode": "standard",
    "interCommTLSEnabled": true,
    "interCommPort": 1121,
    "interCommTlsCaPath": "security/grpc/ca/",
    "interCommTlsCaFiles": ["ca.pem"],
    "interCommTlsCert": "security/grpc/certs/server.pem",
    "interCommPk": "security/grpc/keys/server.key.pem",
    "interCommPkPwd": "security/grpc/pass/key_pwd.txt",
    "interCommTlsCrlPath": "security/grpc/certs/",
    "interCommTlsCrlFiles": ["server_crl.pem"],
    "openAiSupport": "vllm",
    "tokenTimeout": 600,
    "e2eTimeout": 600,
    "distDPServerEnabled": false
  },
  "BackendConfig": {
    "backendName": "mindieservice_llm_engine",
    "modelInstanceNumber": 1,
    "npuDeviceIds": [[0,1,2,3]],
    "tokenizerProcessNumber": 8,
    "multiNodesInferEnabled": false,
    "multiNodesInferPort": 1120,
    "interNodeTLSEnabled": true,
    "interNodeTlsCaPath": "security/grpc/ca/",
    "interNodeTlsCaFiles": ["ca.pem"],
    "interNodeTlsCert": "security/grpc/certs/server.pem",
    "interNodeTlsPk": "security/grpc/keys/server.key.pem",
    "interNodeTlsPkPwd": "security/grpc/pass/mindie_server_key_pwd.txt",
    "interNodeTlsCrlPath": "security/grpc/certs/",
    "interNodeTlsCrlFiles": ["server_crl.pem"],
    "interNodeKmcKsfMaster": "tools/pmt/master/ksfa",
    "interNodeKmcKsfStandby": "tools/pmt/standby/ksfb",
    "ModelDeployConfig": {
      "maxSeqLen": 25600,
      "maxInputTokenLen": 20480,
      "truncation": false,
      "ModelConfig": [
        {
          "modelInstanceType": "Standard",
          "modelName": "qwen3_32b",
          "modelWeightPath": "/data/Qwen3",
          "worldSize": 4,
          "cpuMemSize": 5,
          "npuMemSize": -1,
          "backendType": "atb",
          "trustRemoteCode": false
        }
      ]
    },
    "ScheduleConfig": {
      "templateType": "Standard",
      "templateName": "Standard_LLM",
      "cacheBlockSize": 128,
      "maxPrefillBatchSize": 50,
      "maxPrefillTokens": 25600,
      "prefillTimeMsPerReq": 150,
      "prefillPolicyType": 0,
      "decodeTimeMsPerReq": 50,
      "decodePolicyType": 0,
      "maxBatchSize": 200,
      "maxIterTimes": 10240,
      "maxPreemptCount": 0,
      "supportSelectBatch": false,
      "maxQueueDelayMicroseconds": 5000
    }
  }
}

cd /usr/local/Ascend/mindie/latest/mindie-service/bin
./mindieservice_daemon

curl -X POST 172.16.23.55:1060/v1/chat/completions \
-d '{ "messages": [ {"role": "system", "content": "you are a helpful assistant."}, {"role": "user", "content": "帮我写一个上海富婆爱上我的故事"} ], "max_tokens": 256, "stream": false, "do_sample": true, "temperature": 0.6, "top_p": 0.95, "top_k": 20, "model": "qwen3-32b" }'

lscpu

free -h

git clone https://github.com/langgenius/dify.git --branch 0.15.3

cd dify/docker
cp .env.example .env
vim .env

Error response from daemon: Get "https://registry-1.docker.io/v2/": net/http: request canceled while waiting for connection (Client.Timeout exceeded while awaiting headers)

vim /etc/docker/daemon.json
more /etc/docker/daemon.json

{
  "default-runtime": "ascend",
  "registry-mirrors": [
    "https://2a6bf1988cb6428c877f723ec7530dbc.mirror.swr.myhuaweicloud.com",
    "https://docker.m.daocloud.io",
    "https://hub-mirror.c.163.com",
    "https://mirror.baidubce.com",
    "https://your_preferred_mirror",
    "https://dockerhub.icu",
    "https://docker.registry.cyou",
    "https://docker-cf.registry.cyou",
    "https://dockercf.jsdelivr.fyi",
    "https://docker.jsdelivr.fyi",
    "https://dockertest.jsdelivr.fyi",
    "https://mirror.aliyuncs.com",
    "https://dockerproxy.com",
    "https://mirror.baidubce.com",
    "https://docker.m.daocloud.io",
    "https://docker.nju.edu.cn",
    "https://docker.mirrors.sjtug.sjtu.edu.cn",
    "https://docker.mirrors.ustc.edu.cn",
    "https://mirror.iscas.ac.cn",
    "https://docker.rainbond.cc"
  ],
  "runtimes": {
    "ascend": {
      "path": "/usr/local/Ascend/Ascend-Docker-Runtime/ascend-docker-runtime",
      "runtimeArgs": []
    }
  }
}

systemctl daemon-reload

systemctl restart docker.service

docker compose up -d

docker compose ps

docker ps

CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES
123456789abc nginx:latest "/docker-entrypoint...." 2 days ago Up 2 days 0.0.0.0:3000->80/tcp web_container

cd /path/to/dify-main/docker

vim docker-compose.yml

web:
  image: langgenius/dify-web:0.14.1
  restart: always
  ports:
    - "3000:80"
  environment:
    CONSOLE_API_URL: ${CONSOLE_API_URL:-}
    APP_API_URL: ${APP_API_URL:-}
    SENTRY_DSN: ${WEB_SENTRY_DSN:-}
    NEXT_TELEMETRY_DISABLED: ${NEXT_TELEMETRY_DISABLED:-0}
    TEXT_GENERATION_TIMEOUT_MS: ${TEXT_GENERATION_TIMEOUT_MS:-60000}
    CSP_WHITELIST: ${CSP_WHITELIST:-}

docker compose down
docker compose up -d

Linux OpenEuler 部署 Qwen3-32B 大模型华为昇腾 Arm 服务器 MindIE Docker Dify 方案

1. 基础环境配置

1.1 Anaconda 安装

1.2 Anaconda 中创建虚拟环境

2. 下载模型库和模型权重

2.1 下载模型权重

（1）搜索系统所有硬盘

（2）把模型权重下载到指定的 sdc 盘中的 models 文件夹中

更多推荐文章

相关免费在线工具

2.2 下载华为适配的加速推理引擎 MindIE

3. Docker 镜像加载

3.1 配置 Docker 环境

（1）更新下相关的 dnf 下载包

（2）确认目前系统版本

（3）卸载旧版本 docker，避免版本冲突

（4）配置 DNS，保证网络和下载

（5）配置 docker 仓库 repo

（6）安装 docker 组件

（7）启动 docker 并验证状态

（8）docker 镜像加速优化

（9）docker 相关的启动/查询/删除等

3.2 启动容器

3.3 进入容器

3.4 检查资源可用性（可省略）

3.5 服务化推理 - 模型测试

3.6 可视化交互前端界面

（1）使用 Dify 工具包

（2）Dify 安装

（3）可视化 web 配置

更多推荐文章

相关免费在线工具

Linux OpenEuler 部署 Qwen3-32B 大模型华为昇腾 Arm 服务器 MindIE Docker Dify 方案

1. 基础环境配置

1.1 Anaconda 安装

1.2 Anaconda 中创建虚拟环境

2. 下载模型库和模型权重

2.1 下载模型权重

（1）搜索系统所有硬盘

（2）把模型权重下载到指定的 sdc 盘中的 models 文件夹中

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

2.2 下载华为适配的加速推理引擎 MindIE

3. Docker 镜像加载

3.1 配置 Docker 环境

（1）更新下相关的 dnf 下载包

（2）确认目前系统版本

（3）卸载旧版本 docker，避免版本冲突

（4）配置 DNS，保证网络和下载

（5）配置 docker 仓库 repo

（6）安装 docker 组件

（7）启动 docker 并验证状态

（8）docker 镜像加速优化

（9）docker 相关的启动/查询/删除等

3.2 启动容器

3.3 进入容器

3.4 检查资源可用性（可省略）

3.5 服务化推理 - 模型测试

3.6 可视化交互前端界面

（1）使用 Dify 工具包

（2）Dify 安装

（3）可视化 web 配置

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具