
Llama-2-7b在昇腾NPU上的六大核心场景性能基准报告
基于 Atlas 800T A2 训练卡对 Llama-2-7b 大语言模型进行了昇腾 NPU 性能基准测试。涵盖六大核心场景,包括首 Token 延迟、解码吞吐量及批量并发处理。测试结果显示,短输入首 Token 延迟低至 68ms,解码速度稳定在 64 tokens/s,高并发下吞吐量提升显著。文章详细记录了环境搭建、依赖冲突解决及部署流程,为开发者提供…
博客作者
程序员问答达人
334
已发布文章
13K
博客获赞
444K
博客浏览
第 5 页

基于 Atlas 800T A2 训练卡对 Llama-2-7b 大语言模型进行了昇腾 NPU 性能基准测试。涵盖六大核心场景,包括首 Token 延迟、解码吞吐量及批量并发处理。测试结果显示,短输入首 Token 延迟低至 68ms,解码速度稳定在 64 tokens/s,高并发下吞吐量提升显著。文章详细记录了环境搭建、依赖冲突解决及部署流程,为开发者提供…
介绍 Playwright MCP 浏览器扩展,它作为连接 AI 大模型与真实浏览器的桥梁,支持 AI 接管现有浏览器会话、复用登录态并执行点击输入等操作。文章阐述了其核心功能如精准操作、智能感知及双模运行原理,并提供了在 Chrome/Edge 环境下安装插件及配置 MCP 客户端的通用步骤,适用于 AI 办公、自动化测试及数据采集场景。

在宝塔面板上部署 OpenClaw(Clawdbot)云端 AI 助手的完整流程。主要步骤包括:选择服务器并安装 Node.js v24,通过 npm 全局安装 OpenClaw 包,执行初始化向导生成 Token,启动后台服务。随后配置 Nginx 反向代理实现公网访问,启用 HTTPS 安全协议,并添加 Basic Auth 增强认证安全性。方案支持海外…
详细解析了 Llama Factory 框架支持的 Alpaca 和 ShareGPT 两种主流数据格式。内容涵盖格式结构特点、加载方法、格式转换工具及代码示例。同时提供了微调效果优化技巧、常见问题排查方案以及多格式混合训练等进阶应用配置。通过对比测试和最佳实践建议,帮助开发者选择合适的格式以提升大模型微调效果。

深入解析了通义万相 2.1 多模态 AI 生成模型的技术架构,包括 Wan-VAE 高效时空压缩、DiT 精准建模及 IC-LoRA 内容匹配技术。文章介绍了其在文生视频、文生图片及图生视频方面的功能优势,并指出其在权威评测中的领先地位。同时,探讨了高性能计算平台如何通过 GPU 集群、容器化技术及智能资源调度为 AI 模型提供算力支撑,实现大规模训练提速与…

对比了 IntelliJ IDEA 中三款主流 AI 编程插件:GitHub Copilot、TRAE AI 和灵码。重点分析了它们在模型能力、代码补全、Chat 对话及 Agent 工作流方面的表现。Copilot 在 Agent 模式和多文件修改上表现最成熟,适合高强度编码;TRAE AI 免费友好但体验割裂;灵码在国内环境下可用但智能程度一般。结论指出…
如何在 VS Code 中配置 GitHub Copilot 以实现高效的 Vibe Coding。内容包括环境准备、界面布局优化、快捷键设置、GitHub 集成以及 Copilot Chat 的 Ask、Edit、Agent 三种模式详解。此外还涵盖了斜杠命令、上下文引用及提示工程技巧,帮助开发者利用 AI 提升编程效率。
基于 Python Tkinter 开发的一个集成 AI 助手的本地代码编辑器。项目实现了代码编辑、文件管理、代码运行调试以及 GPT 智能问答功能。系统支持同时调用 OpenAI 官方 API 和本地部署的 DocsGPT API,通过 SQLite 数据库存储提问历史和代码片段。界面采用左右分栏设计,支持深浅色主题切换,具备完整的错误处理和连接测试机制,…

Prompt 提示词工程通过设计指令引导大模型生成高质量输出。文章详解核销流程(解析 - 拆解 - 理解 - 生成 - 验证),涵盖任务拆解、上下文理解及输出验证关键环节。提供清晰指令、巧用上下文、合理运用示例等编写策略,并针对幻觉问题与输出不匹配提出解决方案。结合实际案例展示在内容生成、数据分析及代码开发中的应用,展望自动化生成与多模态融合趋势。

将 AI 工具生成的高保真 HTML 原型导入 Axure 进行编辑的方法。主要流程是通过 Figma 安装 html to design 插件上传 HTML 文件,再使用 Axure 专用插件复制画板,最后粘贴至 Axure 中完成编辑。该方案适用于希望利用现有 AI 设计成果快速迭代原型的场景。

利用 AI 辅助开发工具构建在线图书借阅平台的流程。通过需求拆解、接口设计、表结构定义及核心逻辑输出,快速生成符合 SpringBoot 规范的项目代码。对比传统开发模式,AI 辅助显著缩短了前期准备时间,提高了代码规范性与可维护性,使开发者能更专注于业务逻辑优化。
介绍在 Ubuntu 20.04 环境下安装 QGroundControl 地面站的流程。包括配置系统依赖、下载并运行 AppImage 安装包,以及解决地图白屏问题的缓存清理方法。

评测了 Lynx、GitHub Copilot、Cursor、Claude 和 Codeium 五款 AI 编程工具。Lynx 擅长对话式全栈应用生成;Copilot 提供 IDE 内无感知代码补全;Cursor 基于 AI 重构编辑器,支持 Agent 模式;Claude 长文本处理能力突出,适合代码审查;Codeium 则是功能全面的免费替代方案。结论是…
介绍 Whisper.cpp 语音识别模型的量化技术及其 ggml 格式模型下载方法。涵盖 q4_0 至 q8_0 等量化级别对比,说明不同精度对模型尺寸和性能的影响。提供从官方 GitHub 仓库下载预编译量化模型的具体步骤及命令行使用示例,帮助用户在资源受限设备上部署高效语音识别方案。
基于 Qwen3-TTS-VoiceDesign 模型为 AR 导览眼镜生成空间音频定位语音提示的实战方案。文章分析了项目需求,阐述了模型在多语言支持、自然语言声音描述及高质量输出方面的优势。提供了系统架构设计、环境部署步骤、代码示例以及多语言导览实现方法。此外,还包含空间音频后期处理(HRTF)的技术细节、实际效果展示及性能优化建议,展示了该技术在沉浸式听…

2026 年 3 月科技圈迎来 AI 智能体元年。OpenAI 发布 GPT-5.4 支持原生电脑操作,小米、荣耀推出移动端 AI 智能体。硬件方面,苹果发布低价 AI Mac,阿里千问 AI 眼镜价格亲民,比亚迪将高压平台下放至 15 万级车型。数据显示中国模型 Token 消耗量首次超越美国。政府工作报告提出打造智能经济新形态。AI 正从对话者转变为执行…
介绍 Flutter 三方库 serial 在 OpenHarmony 系统上的适配方案。通过封装 window.navigator.serial API,实现 Web 组件对外部硬件(如扫码枪、打印机)的串口通信。文章分析了底层原理、权限配置(module.json5 及 Webview 拦截)、核心 API 用法及断链重连策略,并提供了完整的 Flutt…
对比了豆包、元宝、千问、Kimi、DeepSeek、MiniMax、GLM 七款国内主流 AI 工具。涵盖开发公司、核心功能及适用场景。豆包适合快速问答与写作;元宝专注腾讯会议集成;千问强于中文理解与多模态;Kimi 擅长超长上下文文档处理;DeepSeek 代码与推理能力突出;MiniMax 侧重创意与娱乐;GLM 学术背景深厚。综合对比显示各工具在对话、…
ComfyUI 与 Photoshop 插件的配置方法。通过安装 ComfyUI Manager 和 Auto-Photoshop-SD 插件,用户可在 Photoshop 中直接调用 ComfyUI 模型进行文生图、图生图及智能修复。文章涵盖了环境要求、安装步骤、工作流配置及常见问题排查,旨在实现高效的 AI 图像创作流程。
GGCNN 是一种基于深度学习的机器人抓取检测开源项目,采用全卷积网络架构预测抓取位置、角度和宽度。它具备轻量化设计和动态环境适应能力,适用于工业自动化和智能仓储场景。工作流程涵盖数据预处理(支持 Cornell/Jacquard 数据集)、模型训练优化及实时部署评估。通过微调策略和性能优化,可实现高精度抓取与实时推理,为机器人在复杂环境中的自主操作提供支持…