海光 DCU K100_AI 环境部署 Ollama 与 DeepSeek
在麒麟操作系统及海光 DCU K100_AI 环境下部署 Ollama 并运行 DeepSeek 模型的完整流程。内容包括驱动安装(注意 hydcu/hycu 版本差异)、DCU 容器环境配置、基于 OpenDAS 源码编译适配海光的 Ollama、设置环境变量启动服务以及制作 Docker 镜像。通过测试 API 接口验证模型可用性,解决了国产硬件上本地大…
博客作者
Python开发者
359
已发布文章
12K
博客获赞
624K
博客浏览
第 4 页
在麒麟操作系统及海光 DCU K100_AI 环境下部署 Ollama 并运行 DeepSeek 模型的完整流程。内容包括驱动安装(注意 hydcu/hycu 版本差异)、DCU 容器环境配置、基于 OpenDAS 源码编译适配海光的 Ollama、设置环境变量启动服务以及制作 Docker 镜像。通过测试 API 接口验证模型可用性,解决了国产硬件上本地大…

系统综述了 AI Agent 记忆技术,涵盖分类体系、五大技术路线(上下文窗口、RAG、文件系统、知识图谱、多 Agent 推理)及七大代表性系统(Mem0、Zep、Letta、Cognee、MemOS、OpenClaw、ASMR)。文章对比了不同方案的架构、优缺点及基准测试结果,分析了向量检索与 Agent 推理的路线分歧,探讨了隐私、自动化遗忘等关键设计…

对 AIGC 内容易被检测系统识别的问题,提供了 15 条实用提示词以降低 AI 生成内容的检测率。通过结构重塑、语气混合、风格模仿、引用干预、模糊修饰、句式杂糅及生活细节注入等方法,引导 AI 输出更具人类特征的文本。实测表明合理使用这些提示词可使 AIGC 率平均下降 30% 至 50%,建议结合人工润色而非完全依赖自动降重工具。

VR 雷霆双翼是一款双人协同的沉浸式航空航天体验设备。它包含八大行星漫游、月球登陆等丰富场景,支持 360°全景动态漫游。通过高清 VR 头显、智能操纵手柄及多自由度震动平台,还原真实飞行触感。技术层面采用实景模拟、实时跟踪同步、体感控制及双人协同交互技术。该体验旨在普及航天知识,提升公众科学素养,创新科普教育模式,让抽象知识转化为可感知体验。

通过表单提交、AJAX 登录及 JSON 数据交互三个案例,详解 Spring Boot 前后端联调技巧。涵盖参数绑定、Session 状态管理、@RequestBody 注解使用及 RESTful 接口设计,对比不同交互模式的优缺点,帮助开发者掌握核心交互机制。

介绍基于 MCP 协议的图片素描转换工具。该工具支持经典、详细、柔和三种风格,兼容多种图片格式及中文路径。用户需配置 Python 环境(>=3.13),通过 uvx 安装依赖,并在 Trae 编辑器中导入 MCP 配置。工具支持单张或批量处理,可调节高斯模糊核与对比度参数,并提供图片信息查询。适用于社交媒体配图、设计素材制作等场景,降低素描化处理门槛。
介绍如何利用 ClaudeCode 与 Figma-MCP 插件配合,将设计稿高效转换为高保真前端代码。流程涵盖工具安装、设计稿准备(BEM 命名、注释)、MCP 生成基础代码、通过自然语言指令在 Claude 中优化结构与样式、校准像素间距与颜色、实现复杂交互逻辑及响应式布局。最后提供性能优化建议与调试验证方法,旨在帮助开发者实现 UI 的 1:1 还原并…

介绍基于 RAG 架构搭建本地私有知识库的方案,采用 Chroma 作为向量数据库,Ollama 运行 Llama 3.1 模型,结合 LangChain 框架实现文档解析、向量化及问答检索。涵盖环境安装、依赖配置、脚本编写及安全优化建议,支持中文增强与多模态扩展,确保数据隐私与推理效率。

POINTWorld 是一个大规模预训练的三维世界模型,旨在解决机器人在非结构化环境中的操作预测问题。它通过统一表示状态与动作在同一三维空间中,以三维点流形式建模,预测场景点云在给定动作下的位移变化。该模型基于约 200 万条轨迹的大规模数据集训练,涵盖真实与仿真环境。实验表明,POINTWorld 具备零样本泛化能力,可结合 MPC 框架在真实机器人上完成…
HTML5 与 AI 技术融合的开发实践。内容涵盖核心概念解析(如前端 AI 推理)、技术原理(Canvas 绘图、AI 接口封装)、数据交互机制及性能优化策略。通过智能表单、天气应用等实际案例展示了 AI 在前端的具体落地方式,并提供了技术选型、实施步骤及最佳实践建议。文章还讨论了常见问题解答、未来发展趋势及职业发展路径,旨在帮助开发者掌握智能化前端开发能…

Claude Skills 的定义、核心构成及技术特性,包括渐进式披露、可组合性、高可移植性及代码执行支持。文章阐述了其在 AI 办公助手、企业知识工作流及自定义 Agent 架构中的应用场景,并通过实战演练展示了技能目录搭建、SKILL.md 编写、参数配置及测试优化流程。最后对比了其与 ChatGPT Plugins、MCP 及传统提示词工程的区别,展望…

2026 年高校 AIGC 检测政策趋严,多数 985/211 高校要求 AI 率低于 10%-20%。知网、维普、万方为主要检测平台。学生需提前确认学校政策,通过语义重构等方式降低 AI 率,并复检确认达标。
盘点了 2026 年十款主流 AI 大模型,包括 GPT-5.2、Gemini 3 Pro、Claude Opus 4.5 等。分析了各模型在推理、多模态、代码能力、生态集成等方面的优势与不足。GPT-5.2 擅长深度推理但成本高;Gemini 3 Pro 长上下文和多模态强;Qwen3 和 DeepSeek-V4 性价比高;Llama 4 适合开源部署。建…
在本地设备上使用 AMD 显卡部署 llama.cpp 大语言模型的性能优化方案。内容涵盖环境准备检查、一键部署脚本编写、内存配置优化及核心参数调校。针对 RX 6000 和 RX 7000 系列提供了差异化配置命令,并包含驱动兼容性、内存不足及性能异常的故障排查方法。通过 Vulkan 后端启用与显存管理策略调整,可显著提升推理速度。

Stable Diffusion 虽是主流开源图像模型,但微调复杂。三个替代方案:PixAI 专为动漫风格优化,支持 LoRA 训练;ChatGPT 多功能性强,适合快速创意;Gemini 集成于 Google 生态,支持多模态视频生成。选择建议取决于具体需求:严肃创作选 PixAI,休闲创意选 ChatGPT,Google 工具内使用选 Gemini。通用…
解决 Coze ChatSDK 在网页嵌入时不同用户共享会话记录的问题。通过 OAuth 应用为每个用户生成独立的 JWT 令牌,替代硬编码的公共令牌,从而在前端实现用户级会话隔离,无需部署后端服务。

分享了使用 OpenClaw 搭配 OpenAI Codex 5.3 构建个人 AI 编程助手的实战经验。主要解决了 OAuth 回调配置错误、模型选择混淆及工作目录设置问题。通过飞书作为消息入口,本地 Workspace 管理项目资产,实现了低成本、高可控的编码工作流。关键配置包括将默认模型设为 openai-codex/gpt-5.3-codex,清理重…
使用 CSS 实现毛玻璃模糊背景效果的主流方法。通过对比 backdrop-filter、filter、SVG 滤镜及 Canvas/WebGL 等方案,推荐使用 backdrop-filter 以获得最佳性能与效果平衡。文章提供了完整的 HTML 与 CSS 代码示例,涵盖浅色与深色模式适配,并总结了常见问题优化建议及进阶用法,如动态调节模糊度与滚动动画结…

介绍 AI Coding 的核心概念与工作流。强调模型边界感知、上下文工程及提示词协议。涵盖需求澄清、调试错误处理、版本控制及代码审查。提出长上下文管理策略如对话分片与记忆系统,以及 MCP 架构封装工作流。建议建立 AI 友好型 Wiki 结构,推动从辅助编码向代理编程转变。

gstack 是由 YC 创始人 Garry Tan 主导开发的开源 AI 编程工作流工具。它基于 Claude Code,结合 Bun 和 Playwright,将高水平工程师的规范固化为可复用的指令集。核心功能包括 CEO 评审、架构师模式、自动化 QA 测试及发布流程。该工具强调工作流工程而非单纯的提示词优化,通过强制思考和闭环自检提升代码质量与交付效…