博客列表·第 135 页

PythonAI算法

大模型全面解析：原理、训练流程与应用场景详解

深入解析大语言模型（LLM）的核心原理与构建流程。涵盖预训练、指令微调及对齐技术（RLHF/DPO），详解参数高效微调方法（如 LoRA）。同时介绍提示词工程技巧及在自然语言处理、推荐系统等领域的应用，为开发者提供系统的学习路径与技术实践参考。

FlinkHero发布于 2025/2/6更新于 2026/4/3010 浏览0 点赞约 8 分钟阅读

编程语言算法

综述由AI生成深入讲解了递归、搜索与回溯算法在二维矩阵中的应用，重点剖析了 FloodFill 算法及其变体。内容涵盖图像渲染、岛屿数量、岛屿最大面积、被围绕的区域、太平洋大西洋水流问题、扫雷游戏以及机器人的运动范围等经典 LeetCode 题目。文章详细阐述了深度优先搜索 (DFS) 的核心逻辑，包括连通区域标记、边界处理、逆向思维优化（如正难则反策略）、以及何时需要恢复现场等关键细节，并提供了完整的 Python 代码实现与注意事项总结。

忘忧发布于 2026/2/7更新于 2026/4/30778 浏览76 点赞约 15 分钟阅读

PythonAI算法

大模型提示工程技术分类详解：单一、多重及外部工具应用

综述由AI生成详细解析了大模型提示工程的技术分类体系。首先介绍了单一提示技术，包括零样本、少样本、思维链及程序辅助语言模型等基础方法。其次阐述了多重提示技术，涵盖投票排名、分而治之策略下的定向激励、知识生成、提示链及表链，以及自我评估中的思维树方法。接着探讨了结合外部工具的高级应用，重点分析了 RAG 检索增强生成架构与 Agent 智能体框架（如 Reflexion 和 ReAct）。最后提出了提示评估的基本原则与工程化小结，强调将提示设计视为数据…

极光发布于 2025/2/7更新于 2026/4/308 浏览0 点赞约 14 分钟阅读

PythonAI算法

Qwen3-Embedding-4B + llama.cpp 部署教程

介绍 Qwen3-Embedding-4B 模型的本地化部署实践。该模型支持 32k 长文本，输出 2560 维向量，适用于检索和知识管理。教程提供两种方案：一是基于 llama.cpp 的轻量级部署，利用 GGUF 量化在消费级显卡运行；二是结合 vLLM 与 Open WebUI 构建可视化知识库系统，支持 RAG 检索。内容涵盖环境准备、模型下载、服务启动及接口调试，适合个人及企业构建语义搜索应用。

晚风叙旧发布于 2026/4/6更新于 2026/4/3021 浏览3 点赞约 17 分钟阅读

编程语言AI算法

优雅训服大模型：深入理解与实战 Prompt 技巧

综述由AI生成探讨了如何高效利用大语言模型的核心技巧。首先强调了将大模型视为专业顾问的沟通本质，包括角色设定、要素清晰化和范围限定。其次介绍了上下文管理的重要性，涵盖长窗口利用、温度参数调整及 Few-Shot 示例引导。接着讲解了命令动词与特殊标记的使用规范，以及在代码生成和图像创作等专业领域的应用方法。最后提供了获取优质资源和工具的途径，并总结了持续迭代优化的重要性，旨在帮助用户建立系统的提示工程思维。

HadoopMan发布于 2025/2/6更新于 2026/4/306 浏览0 点赞约 7 分钟阅读

PythonAI算法

Ubuntu 22.04, Isaac Sim 5.1.0 + Isaac Lab 2.3.0 Conda 环境安装指南

综述由AI生成档详细说明了在 Ubuntu 22.04 系统下，利用 Conda 构建 Python 3.11 环境以部署 Isaac Sim 5.1.0 和 Isaac Lab 2.3.0 的流程。涵盖环境初始化、Isaac Sim pip 包及 PyTorch CUDA 版安装、Isaac Lab 源码克隆与依赖配置，并通过运行官方示例脚本验证安装结果。

LinuxPan发布于 2026/3/30更新于 2026/4/3021 浏览6 点赞约 8 分钟阅读

Python算法

Python 正则表达式语法与使用指南

Python 正则表达式用于文本模式匹配。涵盖字符类、量词、分组、断言及标志位等核心语法，详解 re 模块的 compile、search、match、findall、sub 及 split 方法。通过实际代码示例展示捕获组、反向引用及多行匹配技巧，帮助开发者高效处理字符串解析任务。

奶糖兔发布于 2025/2/7更新于 2026/4/307 浏览0 点赞约 11 分钟阅读

PythonAI算法

Stable Diffusion 多模态大模型 LoRA 微调实战指南

综述由AI生成基于 LoRA 技术对 Stable Diffusion 多模态大模型进行微调的完整流程。内容包括数据收集与爬虫实现、训练环境配置、模型训练脚本参数详解、推理阶段 LoRA 权重的加载与动态调整，以及多 LoRA 模型融合的方法。通过具体代码示例展示了如何从原始模型出发，利用少量样本训练出特定风格的生成模型，并提供了常见问题排查与最佳实践建议，旨在帮助开发者在有限资源下高效完成定制化微调任务。

樱花落尽发布于 2025/2/7更新于 2026/4/308 浏览0 点赞约 16 分钟阅读

C算法

二叉树顺序结构：堆的定义与实现

综述由AI生成堆（Heap）作为完全二叉树的定义，分为大根堆和小根堆。阐述了使用数组存储堆的顺序结构原理。详细讲解了堆的初始化、销毁、向上调整算法、入堆、向下调整算法及出堆操作，并提供了基于 C 语言的完整代码示例，帮助理解堆的数据结构与核心实现逻辑。

板砖工程师发布于 2026/3/26更新于 2026/4/3014 浏览2 点赞约 8 分钟阅读

编程语言AI算法

Meta Llama3 模型技术解析与在线体验指南

综述由AI生成Meta 发布了开源大语言模型 Llama3，包含 8B 和 70B 参数版本。模型基于 Transformer 架构，经过指令调优，在基准测试中表现优异，部分场景超越 GPT-4。 Llama3 的技术特点、三种在线体验方式（英伟达开发者网站、HuggingFace、官方演示）以及中文能力现状。同时分析了上下文窗口限制，并提供了本地部署的基本思路及代码示例，为开发者评估和使用该模型提供参考。

zhang发布于 2025/2/7更新于 2026/4/308 浏览0 点赞约 5 分钟阅读

C++AI算法

Darknet 预测分类：图像数据格式转换与 GPU 加速

综述由AI生成针对 Darknet 预测分类任务，探讨了从原始 OCT 数据采集到目标存储格式的转换流程。重点分析了内存布局调整、通道扩展及图像翻转逻辑，并提供了将双重循环合并的优化方案。此外，还展示了如何利用 CUDA 内核实现矩阵通道的 GPU 并行加速，以提升推理前的预处理效率。

魔尊发布于 2019/12/5更新于 2026/4/304 浏览0 点赞约 8 分钟阅读

PythonAI算法

深度优化 TorchRec：提升 PyTorch 推荐系统性能

综述由AI生成针对 PyTorch 推荐系统库 TorchRec 的深度优化方案。通过在 16 个 DGX H100 节点上针对 MLPerf DLRM 基准进行测试，实现了 2.25 倍的加速比，将单次迭代耗时从 7.6 毫秒降低至 3.4 毫秒。优化工作主要涵盖 CPU 启动延迟和 Input Dist 两个方向，具体包括利用 CUDA Graph 减少 Kernel 启动开销、采用多线程 Kernel 启动解决单线程阻塞问题、使用 Pinned…

星星泡饭发布于 2025/2/7更新于 2026/4/307 浏览0 点赞约 16 分钟阅读

PythonAI算法

Stable Diffusion v1.5 风格迁移实战：照片转油画/水彩/像素风

Stable Diffusion v1.5 模型支持通过提示词工程实现图像风格迁移。介绍利用文生图功能，结合主体描述、风格指令及负向提示词，配合采样步数与引导系数等参数微调，将普通照片转换为油画、水彩或像素艺术风格的具体操作方案与常见问题排查方法。

beaabea发布于 2026/4/8更新于 2026/4/305 浏览0 点赞约 8 分钟阅读

SQLAI算法

openGauss 向量数据库能力与 RAG 应用场景解析

综述由AI生成openGauss 作为开源企业级数据库，通过 datavec 扩展原生支持向量数据类型及索引，具备构建向量数据库的能力。深入解析了 openGauss 的技术演进、向量检索实战流程及在 RAG（检索增强生成）场景中的应用。内容包括环境搭建、IVFFlat 索引构建、相似度检索 SQL 示例以及基于 Python 的 RAG 集成代码。性能分析显示其在毫秒级召回和 QPS 方面表现优异，结合 HTAP 架构优势，适合企业级智能知识库建设…

数字游民发布于 2026/2/8更新于 2026/4/307577 浏览400 点赞约 24 分钟阅读

PythonAI算法

Llama-2-7B 在昇腾 NPU 上的性能测评与部署建议

Llama-2-7B 模型在昇腾 NPU 环境下完成全流程部署，实测单请求吞吐量稳定在 15.6-17.6 tokens/秒，batch=4 时总吞吐量达 63.33 tokens/秒。16GB 显存即可支撑高并发，长文本推理无明显性能衰减。通过算子融合与显存池优化，批量推理线性增长特性显著，适合国产化大模型落地场景。

HadoopMan发布于 2026/3/28更新于 2026/4/305 浏览0 点赞约 16 分钟阅读

PythonSaaSAI算法

AI 工程化实战：RAG 与 Agent 融合架构详解

RAG 与 Agent 融合架构，将检索作为外部记忆嵌入推理循环。核心组件包括动态知识检索器、状态化推理引擎（LangGraph）及安全工具执行器。通过 ReAct 循环实现边思考边检索，解决传统 RAG 无法执行操作及 Agent 参数幻觉问题。涵盖智能 HR、合规审查、IT 运维等场景，提供性能优化策略如检索缓存与批处理，以及安全审计机制。部署基于 Kubernetes 微服务，支持弹性伸缩。最终实现企业知识转化为生产力，让 AI…

山野来信发布于 2026/3/22更新于 2026/4/3017 浏览3 点赞约 19 分钟阅读

PythonAI算法

终身机器人学习数据集 LIBERO 详解

LIBERO 是基于 robosuite 框架构建的终身机器人学习基准测试平台，专注于多任务学习中的知识迁移。它包含 130 个操作任务，分为空间、物体、目标导向及综合测试套件。系统支持模仿学习，提供多种视觉运动策略网络（RNN、Transformer、ViLT）及五种终身学习算法（顺序微调、经验回放、EWC、PackNet、多任务）。LIBERO 通过受控分布偏移评估知识迁移能力，跟踪灾难性遗忘，并计算前向和后向迁移指标。项目提供详细…

游戏玩家发布于 2026/4/6更新于 2026/4/3020 浏览3 点赞约 16 分钟阅读

PythonAI算法

Mini Qwen 1B 大模型从头训练全流程经验总结

综述由AI生成总结了 Mini Qwen 1B 大模型的从头训练经验，涵盖预训练、SFT 微调和 DPO 偏好对齐三个阶段。实验基于 6 张 H800 显卡，使用 Accelerate、DeepSpeed 和 TRL 等工具。预训练阶段发现数据多样性不足会导致复读现象，Instruct 版本相对较好。SFT 阶段通过增加 System Prompt 提升了角色扮演泛化能力。DPO 阶段因数据规模和质量限制，性能提升不明显。文章提供了详细的超参数配置表…

乱七八糟发布于 2025/2/6更新于 2026/4/308 浏览0 点赞约 6 分钟阅读

Python算法

Python 容器性能优化：列表、集合与字典的高效用法

综述由AI生成详细分析了 Python 常用容器的性能差异与优化方案。内容涵盖列表插入操作的时间复杂度对比，推荐使用 deque 解决头部插入性能问题；集合查找相比列表遍历的效率优势及哈希原理；字典合并的多种写法及版本兼容性；有序去重的实现方式。此外，补充了 Counter 和 defaultdict 的高级用法，以及元组、生成器等内存优化技巧。通过理论分析与代码实测，帮助开发者建立正确的数据结构选型意识，写出高效简洁的 Python 代码。

佛系玩家发布于 2025/2/6更新于 2026/4/308 浏览0 点赞约 11 分钟阅读

大模型全面解析：原理、训练流程与应用场景详解

递归、搜索与回溯算法及 FloodFill 算法详解

大模型提示工程技术分类详解：单一、多重及外部工具应用

Qwen3-Embedding-4B + llama.cpp 部署教程

优雅训服大模型：深入理解与实战 Prompt 技巧

热门开源 AI 大模型项目精选与总结

Ubuntu 22.04, Isaac Sim 5.1.0 + Isaac Lab 2.3.0 Conda 环境安装指南

Python 正则表达式语法与使用指南

Stable Diffusion 多模态大模型 LoRA 微调实战指南

二叉树顺序结构：堆的定义与实现

Meta Llama3 模型技术解析与在线体验指南

Darknet 预测分类：图像数据格式转换与 GPU 加速

深度优化 TorchRec：提升 PyTorch 推荐系统性能

Stable Diffusion v1.5 风格迁移实战：照片转油画/水彩/像素风

openGauss 向量数据库能力与 RAG 应用场景解析

Llama-2-7B 在昇腾 NPU 上的性能测评与部署建议

AI 工程化实战：RAG 与 Agent 融合架构详解

终身机器人学习数据集 LIBERO 详解

Mini Qwen 1B 大模型从头训练全流程经验总结

Python 容器性能优化：列表、集合与字典的高效用法