海光 DUC 环境（海光 DCU K100_AI）部署 ollama+deepseek

优质文章学习记录

07 Apr 2026 — 5 min read

看到 ZEEKLOG 上好多的这个部署流程不是要收费就是写的不清不楚，所以决定将我的部署流程写出来，明明所有的官方文档都是免费的。

“不太懂为什么吃了别人免费的饭，现在拉出来的屎要收费！”

声明：本人不是专业运维实施人员，所有的流程都是靠试或直觉，还有一点点的知识

正式开始：

系统：Kylin Linux Advanced Server V10（Lance）

CPU：海光 C86 7360（24 核）

内存：256GB

内核：Linux-4.19.90-52.48.v2207.ky10.x86_64

显卡：海光 DCU K100_AI（Co-processor）

1. 环境部署

1.1 驱动安装

光合开发者社区下载驱动

通过显卡型号选择驱动

驱动版本	支持硬件	推荐DTK版本
rock-4.0-23-5.6.25	Z100/Z100L	21.04/21.10/22.04
rock-4.5.2-5.11.40	Z100/Z100L	22.04/22.10/23.04
rock-5.2.0-5.16.18	Z100/Z100L	22.10/23.04
rock-5.2.0-5.16.29	Z100/Z100L/K100	23.04/23.10
rock-5.7.1-6.2.26+	Z100/Z100L/K100/K100-AI	24.04/25.04
rock-6.3.8+	BW1000/K100-AI/K100/Z100L/Z100	25.04

安装驱动环境

centos：yum install -y rpm-build gcc-c++ cmake automake elfutils-libelf-devel libdrm libdrm-devel pciutils ubuntu：apt install -y gcc g++ cmake automake libelf-dev libdrm_amdgpu1或libdrm-amdgpu1 libtinfo5 pciutils libdrm-dev Centos：yum install -y kernel-devel-`uname -r` kernel-modules-extra ubuntu：apt install -y linux-headers-`uname -r` linux-modules-extra

chmod +x rock*.run systemctl restart hymgr

我这里选择安装 6.2.x 以下的驱动，因为 6.2.x 以上的驱动标识为hycu，以下的标识为hydcu，ollama 检测驱动时会检测标识为hydcu的驱动，如果安装新的会出现找不到 GPU 的问题。

以上内容是通过 ollama 日志猜测。。。

光合官方备注：

1）新版本驱动依赖cmake版本要高于3.2，gcc版本要大于7.3

2）kernel 版本要与kernel-devel版本一致

3）6.2.以前的驱动显示的模块名称是hydcu，6.3.以后的驱动模块是hycu。

4）6.3.*驱动下，docker调用时，推荐挂载/sys/kernel/debug路径，不然，容器内无法获取到dcu进程信息

1.2 DCU 环境安装

https://sourcefind.cn/#/image/dcu/pytorch?activeName=overview

拉取镜像要注意dtk的版本要跟你自己驱动的版本相匹配，上面有对应版本的表格，尽量新一点

推荐容器化部署，如果手动安装坑太多了！

docker run \ --shm-size 64g \ --network=host \ --name=test \ --privileged \ --device=/dev/kfd \ --device=/dev/dri \ --group-add video \ --cap-add=SYS_PTRACE \ --security-opt seccomp=unconfined \ -v {宿主机工作目录}:/home/ \ -v /opt/hyhal:/opt/hyhal:ro \ --it {镜像 id} bash

--shm-size 64g
- 缓存区大小，默认好像是 64M

容器化部署就是这么简单，有兴趣可以了解下手动部署的流程

2. ollama 安装

进入容器内部 docker exec -it test bash

https://sourcefind.cn/#/model-zoo/1888167889015537665

下载模型和 ollma 用到的inference文件

cd inference pip install -r requirements.txt

这里有警告不要紧，因为有些环境在容器中已经包含，再次安装就是会有警告

2.1 编译 ollama

因为 ollama 默认适配的是英伟达的 CUDA 架构，并没有默认适配海光，所以还是得从光源下载

http://developer.sourcefind.cn/codes/OpenDAS

# 注意，这里的代码版本和 go 的版本是强绑定的，这里如果更换，下面的流程就会发生变化！！！ git clone -b 0.5.7 http://developer.sourcefind.cn/codes/OpenDAS/ollama.git --depth=1 cd ollama # 编译 wget https://go.dev/dl/go1.23.4.linux-amd64.tar.gz tar -C /usr/local -xzf go1.23.4.linux-amd64.tar.gz export PATH=$PATH:/usr/local/go/bin # 修改go下载源，提升速度（按需设置） go env -w GOPROXY=https://goproxy.cn,direct # 运行编译 export LIBRARY_PATH=/opt/dtk/lib:$LIBRARY_PATH make -j 16 go build .

这时 ollama 文件夹中会出现一个 ollama 可执行文件

2.2 运行

设备可以通过 rocminfo、rocm-smi查询

export HSA_OVERRIDE_GFX_VERSION=设备型号（如: Z100L gfx906对应9.0.6；K100 gfx926对应9.2.6；K100AI gfx928对应9.2.8） # 例如 export HSA_OVERRIDE_GFX_VERSION=9.2.8 export ROCR_VISIBLE_DEVICES=显卡序号（0,1,2,3,4,5,6,...） # 例如 export ROCR_VISIBLE_DEVICES=0,1,2,3 ./ollama serve # 另开一个窗口 ./ollama run deepseek-r1:14b

注意：ollama 启动后，要确认显卡启用，ollama 日志中会有

测试是否可以正常使用

curl http://localhost:11434/api/chat -d '{"model":"deepseek-r1:14b","messages":[{"role":"user","content":"为什么天空是蓝色的？"}]}' curl http://localhost:11434/api/generate -d '{"model":"deepseek-r1:14b","prompt":"为什么天空是蓝色的？"}' curl http://172.30.0.217:11434/api/chat -d '{"model":"deepseek-r1:14b","messages":[{"role":"user","content":"为什么天空是蓝色的？"}]}' curl http://172.30.0.217:11434/api/generate -d '{"model":"deepseek-r1:14b","prompt":"为什么天空是蓝色的？"}'

如果其它服务器无法访问，添加环境变量

OLLAMA_HOST=0.0.0.0:11434

# 监听所有 ip，默认监听 127.0.0.1:11434

3. 制作 docker 镜像

为了方便使用，这里将已经成功运行并已经部署好 ollama 和模型的容器只作为镜像

docker commit \ --change 'ENV PATH=$PATH:/usr/local/go/bin' \ --change 'ENV LIBRARY_PATH=/opt/dtk/lib:$LIBRARY_PATH' \ --change 'ENV HSA_OVERRIDE_GFX_VERSION=9.2.8' \ --change 'ENV ROCR_VISIBLE_DEVICES=0' \ --change 'CMD ["/workspace/ollama/ollama", "serve"]' \ test dcu-ollama-deepseek:0.0.1

运行：dcu-ollama-deepseek:0.0.1

docker run \ -d \ --restart=always \ --shm-size 64g \ --network=host \ --name=ollama \ --privileged \ --device=/dev/kfd \ --device=/dev/dri \ --group-add video \ --cap-add=SYS_PTRACE \ --security-opt seccomp=unconfined \ -e OLLAMA_HOST=0.0.0.0:11434 \ -v /usr/local/develop/data/ollama:/home/ \ -v /opt/hyhal:/opt/hyhal:ro \ dcu-ollama-deepseek:0.0.1

4. 参考

https://developer.sourcefind.cn/tool

https://developer.sourcefind.cn/gitbook//dcu_tutorial/#15

https://sourcefind.cn/#/image/dcu/pytorch?activeName=overview

https://download.sourcefind.cn:65024/6/main/

https://sourcefind.cn/#/model-zoo/1888167889015537665

国产化硬件任重道远，我们开发的关键是要保持好心态，耐心点，总能将问题解决🙂

FPGA读写DDR4 (一)MIG IP核控制信号

前言这几个星期在倒腾DDR4内存的读写控制，期间看了不少资料，这几天终于完工了于是想着把做过的内容总结一下，于是有了这篇文章，由于控制DDR4的内容很多，这一篇文章就只讲基础的，也就是DDR4的控制IP核 MIG的控制信号。主要参考内容：【正点原子】MPSoC-P4之FPGA开发指南_V2.0，[XILINX] pg150-ultrascale-memory-ip-en-us-1.4 MIG IP核控制信号 IP核创建界面 MIG IP核（memory interface generator）是用户与DDR4进行沟通的桥梁，因为如果我们自己去写直接DDR4代码的话，其内容将会非常复杂，而且即便写出来其性能可能也不会好，以XILINX提供的MIG IP核为例，在综合布线后查看utilization，能发现MIG IP核足足使用了约7500个LUT和9000个register资源，足以看出其编写的复杂，不过对于我们普通用户，能够操作MIG提供的用户接口就我觉得就算差不多了，既然要使用IP核，我们就从IP核的创建界面开始说起，

春晚不用抢红包，全在刷AI？豆包和机器人疯传，2026普通人逆袭就靠这“三字经”

节目里的机器人不仅会后空翻，还能听懂蔡明的相声包袱，那一夜，科技的温度第一次盖过了除夕的烟火。当王菲的天籁之音还在演播大厅回荡，当李健的《人间共鸣》刚刚唱罢，2026年的春晚留给观众的，除了熟悉的年味，还有一种“未来已来”的具象冲击。今年春晚的“隐藏主角”不再是某款饮料或电商平台，而是看不见摸不着却无处不在的AI。如果你错过了今年的春晚，你可能不仅仅错过了一台晚会，而是错过了理解接下来五年财富逻辑的关键信号。AI不再是极客手中的玩具，它正在以春晚为原点，迅速“飞入寻常百姓家”。 01、现象复盘：今年的春晚，不只是“看”，更是“用” 今年的春晚，科技感并非只是舞台上的炫酷特效，更是一次全民的AI应用启蒙。首先是无处不在的AI大模型。作为独家AI云合作伙伴，火山引擎的豆包大模型贯穿了晚会全流程-1。在小品《奶奶的最爱》中，蔡明与“数字双胞胎”的互动，以及那些声音稚嫩的机器人小朋友，其声音正是由豆包的语音合成模型生成的-1。节目能精准理解蔡明的“包袱”，靠的正是AI对复杂语义的精准识别。这不仅仅是提前录好的配音，而是现场实时生成的“

2026年，我整理了中国 200 多家机器人（具身智能）公司名单

近几年，机器人行业突然变得异常热闹。尤其是2022年9月特斯拉首次亮相具身智能人形机器人 Optimus 之后，国内外都掀起了一波浪潮。2023年之后，国内出现了一批新的人形机器人公司，为了更好地理解这个行业，我整理了一份中国机器人企业名单，包含200 多家企业，涵盖人形机器人、工业机器人、移动机器人、服务机器人、特种机器人等领域。注：名单中的企业排序没有特殊含义，仅表示本人收集信息的先后顺序。序号企业简称总部成立时间主营产品网址企业全称1优必选深圳2012年人形机器人、轮式机器人https://ubtrobot.com深圳市优必选科技股份有限公司2宇树科技杭州2016年四足机器狗、人形机器人https://unitree.com宇树科技股份有限公司3智元上海2023年四足、轮式、双足人形机器人、具身模型https://zhiyuan-robot.com智元创新（上海）科技股份有限公司4海康机器人杭州2016年机器视觉、移动机器人https://hikrobotics.com杭州海康机器人股份有限公司5傅利叶上海2015年康复机器人、双足人形机器人、灵巧手https://f

Neo4j 图数据库安装与操作指南(以mac为例)

目录一、安装前提条件 1.1 Java环境 1.2 Homebrew（可选）二、下载并安装Neo4j 2.1 从官方网站下载 2.1.1 访问Neo4j的官方网站 2.1.2 使用Homebrew安装三、配置Neo4j 3.1 设置环境变量(可选) 3.2 打开配置文件(bash_profile) 3.2.1 打开终端 3.2.2 使用open命令和默认文本编辑器(如TextEdit) 3.2.3 使用nano编辑器 3.2.4