松间照月的博客文章

PythonAI算法

AI 生成内容水印技术：原理、工具与实践

人工智能生成内容的水印技术，涵盖可见与不可见水印的原理及工作流。文章详细阐述了图像、文本和音频三种模态下的水印实现方法，对比了开放与封闭系统的优劣，并讨论了数据投毒与签名技术。针对当前面临的鲁棒性、容量及对抗攻击等挑战，提出了未来多模态联合水印与标准化协议的发展方向。

发布于 2025/2/722 浏览0 点赞

编程语言SaaSAI算法

百度智能云千帆大模型平台生态与产品方案解析

百度智能云千帆大模型平台展示了 ToB 市场应用的增长趋势。平台通过 MaaS 模式解决传统 AI 开发烟囱式架构问题，提供算力、模型及应用开发三层支持。生态方面，针对头部、价值、高潜三大市场提供资金、商机及技术支持。核心产品包括百舸算力平台、千帆 Model Builder 及 AppBuilder，支持私有化部署。典型开发流程涵盖需求分析、数据准备、模型…

发布于 2025/2/726 浏览0 点赞

PythonSaaSAI算法

大模型厂商入驻钉钉生态，争夺企业级应用入口

大模型行业进入白热化竞争阶段，真实场景的大规模应用成为价值验证关键。钉钉宣布向多家大模型厂商开放生态，提供 7 亿用户及企业级组织入口。厂商通过 ToB 项目、ToC 应用及开发者影响力争夺市场份额，价格战与技术迭代并行。行业共识指向拥抱高频刚需场景，实现模型能力与业务需求的闭环。钉钉引入多元模型能力，结合长文本、语音多模态等特性，助力企业降本增效。大模型落…

发布于 2025/2/726 浏览0 点赞

PythonAI算法

NLP 基础：BERT 模型原理、训练与压缩技术详解

详细解析了 BERT 模型的架构原理、知识表示能力及训练压缩技术。内容涵盖 Transformer 编码器结构、自注意力机制数学原理、预训练任务（MLM/NSP）的改进策略、微调优化方法以及模型压缩方案（蒸馏、量化、剪枝）。文章提供了 PyTorch 代码示例，并对比了不同压缩方法的优劣，旨在帮助开发者全面掌握 BERT 的核心技术与落地实践。

发布于 2025/2/727 浏览0 点赞

PythonAI算法

大型语言模型的 11 种高效微调策略详解

综述了大型语言模型的 11 种参数高效微调方法。涵盖前缀调优、提示调优、P-Tuning v2 等引入特定参数的技术，以及基于 LoRA 及其变体（DyLoRA、AdaLoRA、QLoRA、QA-LoRA、LongLoRA、VeRA、S-LoRA）的旁路适配方案。这些方法通过冻结主模型参数或增加低秩矩阵，显著降低训练显存和计算成本，同时保持模型性能。PEFT…

发布于 2025/2/734 浏览0 点赞

PythonAI算法

从数据集构建到 LoRA 微调：使用 LlamaFactory 实现高效文本分类

使用 LLaMA-Factory 框架基于 Qwen2.5-7B-Instruct 模型进行 LoRA 微调以实现文本分类的完整流程。内容包括按 Alpaca 格式构建数据集、配置 YAML 训练参数、执行命令行训练、加载 LoRA 权重进行推理以及使用 Python 脚本评估模型效果。文章详细解析了关键参数含义、提供了评估代码示例，并给出了显存优化、防过拟…

发布于 2025/2/739 浏览0 点赞

PythonAI算法

大模型 (LLMs) 面试准备指南：核心架构、训练微调与推理优化详解

涵盖大模型基础架构、训练目标、微调策略、推理加速及分布式训练等关键领域。内容涉及 Decoder-only 结构、PEFT 技术如 LoRA、RLHF 流程、LangChain 应用及向量知识库构建等实战要点，旨在帮助开发者全面掌握 LLM 面试考点与技术细节。文章详细解析了从 Tokenization、Position Encoding 到 Attenti…

发布于 2025/2/724 浏览0 点赞

PythonAI算法

科大讯飞、小米、百度等互联网大厂算法工程师面试题汇总

本合集整理了科大讯飞、小米、百度等互联网大厂算法工程师面试真题，涵盖自然语言处理、深度学习模型原理及工程实践。内容包括 jieba 分词、Word2Vec、ChatGPT 训练流程、BERT 架构、PyTorch 训练评估模式、Python 数据结构、Transformer 机制、P-Tuning V2、BiLSTM-CRF、LoRA 微调、GBDT 集成学…

发布于 2025/2/722 浏览0 点赞

PythonAI算法

科大讯飞、小米、百度等大厂算法工程师面试题汇总

汇总了科大讯飞、小米、百度等大厂算法工程师面试真题，涵盖 NLP 分词、Word2Vec、ChatGPT 训练、BERT 模型、PyTorch 框架、Python 字典原理、Top K 算法、Transformer 架构、P-tuning V2、BiLSTM-CRF、LoRA 微调、GBDT、Flash Attention 及混合精度训练等核心技术点。内容包…

发布于 2025/2/725 浏览0 点赞

编程语言AI算法

ChatOllama 本地部署与 RAG 知识库实战指南

ChatOllama 项目的本地部署流程及其 RAG 知识库功能。内容包括环境准备、Docker Compose 配置、Ollama 模型连接、知识库创建与文档处理策略。文章深入解析了 RAG 技术原理，提供了具体的配置文件示例和故障排查指南，并探讨了在企业文档、代码辅助及个人学习等场景下的实际应用价值。通过本地化部署，用户可实现数据隐私保护与低成本的大模型…

发布于 2025/2/724 浏览0 点赞

编程语言AI算法

RAG 进阶指南：15 种高级技术优化检索与生成

详细阐述了检索增强生成（RAG）系统中的 15 种高级优化技术，涵盖预检索、检索、检索后及生成四个阶段。预检索优化包括使用 LLM 提高信息密度、分层索引、假设性问答对生成及去重；检索优化涉及查询重写、HyDE 及查询路由；检索后优化包含重排模型、Prompt 压缩及 Corrective RAG；生成优化则利用思维链、Self-RAG 及微调提升鲁棒性。此…

发布于 2025/2/629 浏览0 点赞

PythonAI算法

检索增强生成（RAG）技术最佳实践与构建指南

检索增强生成（RAG）技术通过将大型语言模型与信息检索相结合，有效解决了模型幻觉和知识滞后问题。详细阐述了 RAG 的核心架构、数据准备、文档分块策略、嵌入模型选择及提示工程实践。内容涵盖从基础构建到高级优化（如混合检索、重排序、查询重写）的全流程指南，并强调了测试评估、安全防护及生产部署的关键要点。通过合理的架构设计和持续迭代，RAG 能够显著提升企业级智…

发布于 2025/2/624 浏览0 点赞

编程语言AI算法

强化学习与 DeepSeek-R1 训练原理详解

强化学习通过环境反馈优化策略，核心在于利用 Reward 信号指导模型行为。系统讲解了强化学习基础概念、Policy Gradient 及其变体、PPO 算法原理、Actor-Critic 架构及 GAE 优势估计方法。重点分析了 DeepSeek-R1 的训练机制，指出其摒弃了复杂的 PRM 和 MCTS，仅依靠规则奖励与 GRPO 算法实现高性能推理。文…

发布于 2025/2/624 浏览0 点赞

Python算法

Python 枚举类：定义、使用和最佳实践

详细讲解了 Python 枚举类（Enum）的定义、使用方法及最佳实践。内容涵盖基础枚举类创建、访问成员、比较与迭代，以及 IntEnum、Flag、StrEnum 等高级变体的应用。文章还介绍了函数式定义、auto() 自动赋值、自定义方法、序列化处理和唯一性约束等进阶技巧，并通过对比魔术数字与枚举的使用场景，强调了类型安全对代码可维护性的重要性。同时指出…

发布于 2025/2/626 浏览0 点赞

PythonAI算法

基于 LangChain 与 ChatGLM3 搭建个人知识库

基于 LangChain 框架结合 ChatGLM3 大模型，详细阐述了构建本地私有化知识库的技术方案。通过检索增强生成（RAG）技术，利用向量数据库存储文档片段，实现了对本地文档的精准检索与问答。教程涵盖环境配置、模型下载、参数调整及实战部署步骤，并提供了常见问题排查指南，旨在帮助开发者低成本实现企业级知识管理系统的私有化落地。

发布于 2025/2/626 浏览0 点赞

PythonAI

ScrapeGraphAI：利用大语言模型实现智能网页数据提取

ScrapeGraphAI 是一个基于大语言模型的 Python 网络爬虫库，旨在简化数据提取过程。该工具允许用户通过自然语言提示词定义抓取目标，自动解析网页结构并返回结构化数据，无需手动编写复杂的解析规则。 ScrapeGraphAI 的核心特性，包括 SmartScraper、SearchGraph 和 SpeechGraph 三种模式。内容涵盖环境安装…

发布于 2025/2/627 浏览0 点赞

PythonAI算法

大模型微调（Fine-tuning）原理与实战指南

大模型微调是通过在特定任务数据上调整预训练模型参数，使其适应下游应用场景的技术。微调的本质、主流方法如LoRA及Qlora、完整实施流程包括数据准备与训练评估，并提供基于Hugging Face的Python代码示例，帮助开发者高效完成模型适配。

发布于 2025/2/628 浏览0 点赞

PythonAI算法

Stable Diffusion 文生图保姆级入门指南

Stable Diffusion 是基于扩散模型的开源图像生成工具。文生图模式下的核心参数配置，包括模型选择、提示词权重、采样方法与迭代步数设置。内容涵盖界面功能解析、高分辨率修复策略、批处理优化及进阶的局部重绘与 ControlNet 应用。文章旨在帮助用户理解 SD 工作原理，规避常见显存与生成问题，建立规范的 AI 绘画工作流。

发布于 2025/2/624 浏览0 点赞

PythonAI算法

零基础 Python 入门学习指南：环境配置、核心路径与实战建议

详细阐述了零基础学习 Python 的系统路径。内容涵盖心态调整与目标设定、开发环境搭建（含 Python 安装与 IDE 选择）、核心知识体系（基础语法、数据结构、函数、OOP）、实战练习平台推荐以及系统化调试方法。文章旨在帮助初学者建立正确的学习框架，通过环境配置、代码实践和排错技巧，逐步掌握 Python 编程能力，并为 Web 开发、数据分析及人工智…

发布于 2025/2/623 浏览0 点赞

松间照月

发布的文章