追风少年的博客文章

PythonAI算法

LangChain 构建代理：工具调用与内存管理

如何使用 LangChain 构建智能代理。通过结合语言模型的工具调用能力，代理可以执行搜索、检索本地知识库及自定义函数等操作。教程涵盖了环境安装、工具定义（如 Tavily 搜索和 FAISS 向量检索）、LLM 绑定、代理创建、流式响应处理以及基于检查点的内存持久化。最终实现了一个能够自主决策并记忆上下文的多工具交互系统。

发布于 2025/2/741 浏览0 点赞

编程语言AI算法

RustAI算法

从零写 Agent 框架：Workflow 与 Runtime 模块设计

详细阐述了 AI Agent 框架中 Runtime 模块的核心设计与实现方案。内容涵盖 Workflow 与 Multi-agent 的典型场景分析，提出了基于 Service、Plan、Context 和 Scheduler 的四层架构模型。重点介绍了 Rust 语言下的 Trait 抽象、异步执行流程、JSON 序列化封装以及异常处理与性能优化策略。此…

发布于 2025/2/729 浏览0 点赞

PythonAI算法

从零训练大语言模型：环境与代码实战指南

详细讲解如何从零开始预训练一个大语言模型，涵盖环境配置、数据清洗、分词器训练、模型训练及推理测试全流程。通过基于《三国演义》文本的实战案例，演示如何使用 Python 生态中的 Transformers 和 Tokenizers 库构建自定义模型，帮助开发者深入理解大模型底层原理与训练细节。内容包括依赖安装、BPE 分词器构建、GPT2 架构模型训练循环编写…

发布于 2025/2/725 浏览0 点赞

PythonAI算法

AI产品经理学习路线与核心技能指南

详细解析了 AI 产品经理与通用型产品经理的异同，明确了两者在思考框架上的共性以及在技术思维上的差异。文章阐述了 AI 产品经理所需的核心技能，包括对 AI 应用场景、算法原理、数据质量及评价指标的理解。提供了从全局认知、Python 基础、机器学习理论到大模型应用开发的完整学习路径，并给出了新晋从业者在提问、实践、倾听及轮岗方面的具体建议。最后总结了大模型…

发布于 2025/2/739 浏览0 点赞

PythonAI算法

LLM 大文本分块技术详解与最佳实践

大文本分块是构建 LLM 应用的关键步骤，旨在将长文档分解为语义连贯的片段以优化向量检索效果。详细阐述了分块的核心原理，对比了固定大小、递归、语义等多种分块方法的优缺点及适用场景。通过介绍基于 LangChain 的代码实现示例，指导开发者根据内容性质、嵌入模型特性及查询复杂度选择合适的分块策略。此外，文章还探讨了如何评估不同块大小的性能，并提供了预处理数据…

发布于 2025/2/631 浏览0 点赞

编程语言AI算法

大模型训练流水线并行（PP）性能评价指标与分析方法

探讨了大模型训练中流水线并行（PP）的性能评价指标与分析方法。核心指标包括端到端耗时、正反向耗时及 Bubble Ratio（气泡率）。文章详细解析了 Native、GPipe、1F1B、PipeDream 及 Virtual Pipe 五种主流算法的优缺点，指出 1F1B 在显存与效率间的平衡优势。同时强调了张量并行（TP）与流水并行（PP）的配置原则，建…

发布于 2025/2/624 浏览0 点赞

PythonAI算法

Reflexion 框架下 ReflectionAgent 工作流详解

Reflexion 框架通过引入自我反思机制改进 LLM Agent 的推理能力。文章分析了 ReactReflectAgent 的工作流程，包括 Prompt 设计、迭代逻辑及反思策略实现。重点探讨了如何在 ReAct 基础上增加记忆层防止循环推理，并讨论了 is_correct() 判断在不同任务场景下的适用性。此外，还补充了工程化落地中的 Token…

发布于 2025/2/633 浏览0 点赞

PythonAI算法

魔搭社区：探索 LLM 大模型的应用与微调实践

大型语言模型（LLM）的基本概念及其在自然语言处理中的应用。详细阐述了基于魔搭社区平台的开发环境搭建方法，并通过情感分析案例演示了模型推理的具体代码实现。文章进一步探讨了预训练模型的局限性，提出了微调（Fine-tuning）的必要性及标准流程，包括数据准备、LoRA 适配及评估部署。最后分析了端侧模型、多模态融合等技术趋势，以及 LLM 对开发者工作模式和…

发布于 2025/2/629 浏览0 点赞

PythonAI算法

《GPT 图解大模型是怎样构建的》：从 NLP 演进到 GPT 实战

本书通过问答与图解形式，梳理自然语言处理技术发展脉络，涵盖从 N-Gram、Word2Vec 到 Transformer 及 GPT 的核心原理。作者黄佳结合实战项目，指导读者从零搭建语言模型，适合初学者及从业者深入理解大模型构建逻辑与技术细节。

发布于 2025/2/626 浏览0 点赞

Python算法

Python 基础：集合与字典核心用法详解

Python 集合与字典是两种重要的内置数据结构。集合用于存储无序且唯一的元素，支持去重及数学集合运算；字典用于存储键值对，通过键快速查找值，适用于配置管理或对象映射。详细讲解了它们的创建方式、常用操作方法（增删改查）、遍历技巧以及性能特点，帮助开发者高效利用这两种结构处理数据。

发布于 2025/2/633 浏览0 点赞

PythonAI算法

大模型技术入门：基础概念、训练与微调实战指南

系统介绍大模型技术的核心概念、学习路径及实战方法。涵盖 Transformer 架构原理、预训练与微调策略、分布式训练方案（如 DeepSpeed）、指令数据构建及行业应用开发。内容包含从数学基础到 LangChain 框架应用的全栈知识，旨在帮助读者掌握大模型全链路开发能力，提升在人工智能领域的竞争力。

发布于 2025/2/623 浏览0 点赞

编程语言AI算法

大模型基本概念详解：定义、发展、特点与分类

大模型是具有大规模参数和复杂计算结构的机器学习模型。文章阐述了其与小模型的区别，梳理了从 CNN 到 Transformer 再到预训练大模型的发展历程。介绍了语言、视觉及多模态大模型的分类，以及通用、行业、垂直大模型的层级。重点解析了泛化能力与微调技术，包括全量微调与参数高效微调（PEFT），为理解人工智能核心技术提供基础参考。

发布于 2025/2/631 浏览0 点赞

编程语言java

网络安全初学者环境搭建指南：Kali Linux、phpStudy、Pikachu 及 BurpSuite 安装配置

网络安全入门所需的核心工具安装流程，涵盖 Kali Linux 虚拟机部署、phpStudy 本地环境搭建、Pikachu 漏洞靶场配置以及 BurpSuite 抓包工具的 JDK 环境设置与激活步骤，旨在帮助初学者快速构建安全的渗透测试学习环境。内容包含具体的参数配置、常见问题排查及操作注意事项，适合零基础用户参考。

发布于 2025/2/627 浏览0 点赞

编程语言大前端java

渗透测试常见面试题与核心知识点解析

渗透测试是通过模拟攻击评估系统安全性的方法。涵盖渗透测试标准流程、常用工具（如 Nmap、Burp Suite）、接口与前后端测试方法，以及 SQL 注入、XSS、CSRF、SSRF 等常见漏洞的原理、实例与修复方案。内容包含代码示例、防御最佳实践及伦理规范，旨在帮助技术人员理解安全测试核心概念及应对面试常见问题。

发布于 2025/2/631 浏览0 点赞

PythonAI算法

大模型 NLP 开发：行业趋势、薪资前景与学习路径

大模型 NLP 开发行业的现状，指出人工智能领域人才紧缺，薪资水平高且对年龄包容度较好。文章详细阐述了该岗位所需的核心技能，包括 Transformer 架构、预训练模型、提示词工程及微调技术。同时提供了从系统设计到行业应用落地的七阶段学习路线，并给出了基于 HuggingFace 和 LangChain 的代码示例，旨在帮助开发者系统掌握大模型开发能力，应…

发布于 2025/2/630 浏览0 点赞

PythonAI算法

InternLM2 书生·浦语大模型本地化部署指南

InternLM2 是新一代开源大语言模型，支持 20 万字超长上下文和工具调用。介绍 InternLM2-Chat-7B 模型的本地化部署流程，涵盖环境准备、Gradio 与 Streamlit 页面交互部署方式，以及基于 Transformers、ModelScope 和 LMDeploy 的代码调用方法。内容包含显存需求分析、启动参数说明及常见错误排查…

发布于 2025/2/629 浏览0 点赞

PythonAI算法

大模型微调实战：基于 LLaMA-Factory 的 LoRA 微调指南

如何使用 LLaMA-Factory 框架对大语言模型进行 LoRA 微调。内容涵盖 Base、Chat、Instruct 模型的区别，环境配置步骤，模型下载方法，以及基于 identity.json 数据集的自定义微调流程。文章提供了完整的命令行操作示例，包括推理测试、训练参数详解及结果验证，并补充了显存优化与常见问题排查方案，适合希望掌握大模型微调技术的…

发布于 2025/2/627 浏览0 点赞

PythonAI算法

英文大语言模型中文指令微调实战指南

英文大语言模型进行中文指令微调的完整流程。首先阐述了数据构造规范，包括指令、输入和输出的拼接方式，以及 input_ids 和 labels 的构建逻辑，特别解释了 IGNORE_INDEX 的作用。接着分析了 Tokenization 的关键点，如特殊标记的处理和编码解码测试。在模型加载部分，说明了 AutoModel 的使用及 trust_remote_…

发布于 2025/2/640 浏览0 点赞

编程语言

Kerberos 认证协议详解与操作流程

Kerberos 协议是一种用于不可信网络上可信主机的身份验证协议，旨在解决开放网络中的安全通信问题。核心目标包括防止密码在网络传输、实现单点登录、支持双向认证及集中管理认证信息。主要组件包括领域、主体、票据、KDC（含 AS 和 TGS）、会话密钥及认证符。流程涉及 AS_REQ、AS_REP、TGS_REQ、TGS_REP 及 AP_REQ 等交互步骤。…

发布于 2025/2/419 浏览0 点赞

追风少年

发布的文章