昇腾设备部署llama.cpp

硬件环境:

Atlas 800I A2

CPU:KunPeng920 * 192

NPU:Atlas 910B4-1 * 8

内存:1000G

软件环境

操作系统:OpenEuler22.03 LTS

内核:5.10.0-186.0.0.2.1.oe2203sp3.galaxy.aarch64

驱动:24.1.rc2

docker:26.1.3

为了不影响物理环境,安装是在docker容器环境中进行,

由于目前llama.cpp只支持openeuler22.03和ubuntu 22.04,可以下载一个对应操作系统的镜像

此处以vllm-ascend:0.9.1rc1-torch_npu2.5.1-cann8.1.rc1-python3.10-oe2203lts-linuxarm64镜像为例

拉取镜像:

docker pull swr.cn-north-4.myhuaweicloud.com/ddn-k8s/docker.io/openeuler/vllm-ascend:0.9.1rc1-torch_npu2.5.1-cann8.1.rc1-python3.10-oe2203lts-linuxarm64

支持Atlas 300I Duo Atlas 300T A2(Ascend 910B4)

起容器:

docker run -it -d --net=host --shm-size=500g \ --privileged \ --name vllm-ascend \ --device=/dev/davinci_manager \ --device=/dev/hisi_hdc \ --device=/dev/devmm_svm \ -v /usr/local/Ascend/driver:/usr/local/

Read more

什么是weblogic?一文带你了解

什么是weblogic?一文带你了解

Weblogic 简介 WebLogic 是 Oracle 公司开发的一款企业级 Java EE(Java Platform, Enterprise Edition)应用服务器,广泛用于构建、部署和管理分布式应用。它支持高可用性、可扩展性和安全性,适用于大型企业环境。WebLogic 提供了完整的 Java EE 标准实现,包括 Servlet、JSP、EJB、JMS 等技术,同时集成了多种管理工具和监控功能。 Weblogic 核心功能 * Java EE 支持:完全兼容 Java EE 标准,支持企业级应用开发。 * 集群与负载均衡:支持多服务器集群,提供高可用性和故障转移能力。 * 安全性:集成身份认证、授权和加密功能,保障企业数据安全。 * 管理控制台:提供基于 Web

前端国际化:别让你的应用只懂一种语言

前端国际化:别让你的应用只懂一种语言 毒舌时刻 这应用写得跟方言似的,出了本地就没人懂。 各位前端同行,咱们今天聊聊前端国际化。别告诉我你的应用还只有中文版本,那感觉就像在国际会议上只说方言——能说,但没人懂。 为什么你需要国际化 最近看到一个项目,想拓展海外市场,但所有文本都是硬编码在代码里的。我就想问:你是在做本地应用还是在做国际产品? 反面教材 // 反面教材:硬编码文本 function App() { return ( <div> <h1>欢迎来到我的网站</h1> <p>这是一个示例应用</p> <button>点击我</button> <div>

前端团队协作最佳实践:让团队效率飞起来

前端团队协作最佳实践:让团队效率飞起来 毒舌时刻 团队协作?听起来就像是前端工程师为了显得自己很专业而特意搞的一套复杂流程。你以为随便开几个会就能提高团队效率?别做梦了!到时候你会发现,会议时间比开发时间还多,团队效率反而下降了。 你以为使用Git就能解决所有协作问题?别天真了!Git的冲突解决能让你崩溃,分支管理能让你晕头转向。还有那些所谓的协作工具,看起来高大上,用起来却各种问题。 为什么你需要这个 1. 提高开发效率:良好的团队协作可以减少沟通成本,提高开发效率。 2. 减少错误:团队协作可以帮助你发现和修复代码中的错误,减少生产环境中的问题。 3. 知识共享:团队协作可以促进知识共享,提高团队整体水平。 4. 项目管理:良好的团队协作可以帮助你更好地管理项目,确保项目按时完成。 5. 团队凝聚力:良好的团队协作可以增强团队凝聚力,提高团队成员的工作积极性。 反面教材 // 1. 代码冲突 // 开发者A修改了文件 function getUser(id) { return fetch(`/api/users/${id}

C# WebAssembly血泪革命:从“页面卡成PPT”到“秒级响应”的10倍性能飞跃!

C# WebAssembly血泪革命:从“页面卡成PPT”到“秒级响应”的10倍性能飞跃!

🔥 一、为什么C# WebAssembly会“卡成PPT”?(别再当工具人!) 传统实现 = 人拉板车 “我只用,结果页面加载慢得像蜗牛!” * 痛点:未优化初始加载、未分页数据、未异步通信、未安全策略 * 灵魂拷问:你是在用WebAssembly,还是在给浏览器送“内存炸弹”? 革命后的C# WebAssembly = 赛车引擎 “像AI一样智能加载,首次加载时间从30秒→2.8秒!” * 核心价值:初始代码分割+流式数据处理+异步通信优化+状态管理+安全策略(不是瞎用Blazor!) * 真实数据:优化后,首次加载时间从30秒→2.8秒(前端团队主动要求加功能!) 💡 金句暴击: “C# WebAssembly不是写前端,是让代码自己‘流起来’—— 你只用默认Blazor,等于让老司机开拖拉机! 别再当‘WebAssembly小白’了!” 🧪 二、5层性能革命深度拆解(