昇腾设备部署llama.cpp

硬件环境:

Atlas 800I A2

CPU:KunPeng920 * 192

NPU:Atlas 910B4-1 * 8

内存:1000G

软件环境

操作系统:OpenEuler22.03 LTS

内核:5.10.0-186.0.0.2.1.oe2203sp3.galaxy.aarch64

驱动:24.1.rc2

docker:26.1.3

为了不影响物理环境,安装是在docker容器环境中进行,

由于目前llama.cpp只支持openeuler22.03和ubuntu 22.04,可以下载一个对应操作系统的镜像

此处以vllm-ascend:0.9.1rc1-torch_npu2.5.1-cann8.1.rc1-python3.10-oe2203lts-linuxarm64镜像为例

拉取镜像:

docker pull swr.cn-north-4.myhuaweicloud.com/ddn-k8s/docker.io/openeuler/vllm-ascend:0.9.1rc1-torch_npu2.5.1-cann8.1.rc1-python3.10-oe2203lts-linuxarm64

支持Atlas 300I Duo Atlas 300T A2(Ascend 910B4)

起容器:

docker run -it -d --net=host --shm-size=500g \ --privileged \ --name vllm-ascend \ --device=/dev/davinci_manager \ --device=/dev/hisi_hdc \ --device=/dev/devmm_svm \ -v /usr/local/Ascend/driver:/usr/local/

Read more

AI 应用层革命(一)——软件的终结与智能体的崛起

AI 应用层革命(一)——软件的终结与智能体的崛起

一、序章:当“软件”开始失效 过去半个世纪里,“软件”一直是人类塑造世界的逻辑核心。 从操作系统到应用程序,从 C 到 Python,从命令行到图形界面,我们不断将现实抽象成代码,并通过逻辑规则去控制机器。然而,2025 年的此刻,软件开始显露疲态。 想象一个开发者打开 VSCode,面对的是数十万行代码、层层嵌套的依赖、随版本崩溃的包管理系统。写一段业务逻辑,可能要理解五个框架、三个库、两个版本的差异。 软件越来越重,而智能却没有变得更聪明。 与此同时,AI 的力量在悄然重塑一切。 ChatGPT、Claude、Gemini、GPT-4、Grok、Mistral…… 这些名字已不仅仅代表模型,而是代表一种新型的“操作层”:人类开始通过自然语言与智能体对话,完成过去需要大量编码、配置、调试的任务。 于是,一个根本性的问题浮现: 当

Python 2026 年发展局势:AI 时代的 “通用基础设施语言”

2026 年的 Python 已从 “热门编程语言” 进化为全球数字生态的核心基础设施语言,其地位不仅稳固且进一步强化,同时也面临新的机遇与挑战,整体呈现 “一核多翼、优势固化、局部竞争” 的格局。 一、核心优势:AI + 全生态双轮驱动,地位无可替代 1. AI / 大模型领域的绝对霸主这是 Python 最核心的护城河。2026 年大模型落地、AI Agent 开发、多模态应用、低代码 AI 工具等场景中,Python 依然是95% 以上开发者的首选语言: * 生态垄断:PyTorch 3.0、TensorFlow 2.18、LangChain 2.0、Transformers 等核心框架均以 Python 为第一开发语言; * 效率优势:

AI生成图片R18提示词:新手入门指南与最佳实践

AI 生成图片 R18 提示词:新手入门指南与最佳实践 (2026 年视角,适用于本地 Stable Diffusion / Flux / Pony 等开源模型,或部分支持 NSFW 的在线平台) R18(成人限制级)内容在 AI 图像生成中属于高敏感领域,不同模型/平台对它的开放程度差异极大: * 完全封禁或强过滤:Midjourney、DALL·E 3/4、Flux.1 [dev/pro] 官方、Google Imagen、Adobe Firefly 等 * 部分支持但需技巧:NovelAI、Pony Diffusion、Flux Uncensored 变体、某些 SDXL LoRA 模型

Flutter 组件 tavily_dart 的适配 鸿蒙Harmony 实战 - 驾驭 AI 搜索引擎集成、实现鸿蒙端互联网知识精密获取与语义增强方案

Flutter 组件 tavily_dart 的适配 鸿蒙Harmony 实战 - 驾驭 AI 搜索引擎集成、实现鸿蒙端互联网知识精密获取与语义增强方案

欢迎加入开源鸿蒙跨平台社区:https://openharmonycrossplatform.ZEEKLOG.net Flutter 组件 tavily_dart 的适配 鸿蒙Harmony 实战 - 驾驭 AI 搜索引擎集成、实现鸿蒙端互联网知识精密获取与语义增强方案 前言 在鸿蒙(OpenHarmony)生态的智能个人助理、行业垂直类知识中枢以及需要实时获取互联网最新动态并进行 AI 语义加工的各种前沿应用开发中,“信息的有效检索与精准抽取”是决定 AI 应用是否具备“生命感”的关键泵口。面对浩如烟海且充满噪声的互联网网页。如果仅仅依靠传统的关键词匹配。那么不仅会导致应用返回大量无关紧要的垃圾信息。更会因为无法将网页内容转化为 AI 易于理解的结构化上下文(Context),引发严重的 LLM(大语言模型)幻觉风险。 我们需要一种“AI 驱动、语义过滤”的搜索艺术。 tavily_dart 是一套专为 AI