
RAG 实操教程:使用 LangChain + Milvus 构建本地知识库
使用 LangChain 框架结合 Milvus 向量数据库构建本地知识库的完整流程。文章首先分析了大语言模型在知识滞后性和私有数据方面的痛点,阐述了 RAG 技术的原理及其相较于微调的优势。随后,通过代码示例演示了环境搭建、PDF 文档加载、文本分块策略、Embedding 模型配置以及 Milvus 向量存储的具体实现。最后,构建了基于 Prompt 的…
博客作者
开发环境搭建师
357
已发布文章
11K
博客获赞
780K
博客浏览
第 17 页

使用 LangChain 框架结合 Milvus 向量数据库构建本地知识库的完整流程。文章首先分析了大语言模型在知识滞后性和私有数据方面的痛点,阐述了 RAG 技术的原理及其相较于微调的优势。随后,通过代码示例演示了环境搭建、PDF 文档加载、文本分块策略、Embedding 模型配置以及 Milvus 向量存储的具体实现。最后,构建了基于 Prompt 的…

综述了大语言模型(LLM)增强强化学习(RL)的最新研究进展。文章定义了 LLM-enhanced RL 框架,指出其具有多模态理解、多任务泛化、样本效率提升、长期规划及奖励生成等特性。核心内容总结了 LLM 在 RL 中的四种主要角色:作为信息处理者提取表征,作为奖励设计者生成奖励信号,作为决策者直接决策或辅助决策,以及作为生成者构建世界模型或解释行为。文…

详细演示了如何在 Visual Studio 环境下利用 Tools for AI 扩展将 ONNX 模型封装为 C# 类库,并在 Windows Forms 应用中实现图像推理。内容涵盖环境配置、UI 设计、模型类库生成、代码集成及数据预处理细节。重点讲解了 x64 平台设置、输入输出节点映射、图像尺寸与通道顺序对推理结果的影响,以及常见错误的排查方法。通…

在本地环境中部署 Llama3 大模型的具体流程。首先通过 Ollama 工具安装并拉取模型,实现本地推理服务;随后配置 AnythingLLM 客户端,设置 LLM 提供商及向量数据库参数,完成图形化界面的搭建。内容涵盖环境准备、模型管理、服务连接及常见故障排查,旨在帮助用户低成本、安全地拥有私有化 AI 助手。

总结了 LangChain 框架的学习曲线,分析了 API Key 获取、文档阅读、版本更新快及缺乏系统教程等核心难点。同时阐述了 LangChain 相比直接调用接口的优势,探讨了其与国产大模型(如 Qwen)的集成方案,并提供了后续深入学习的路径建议。文章还包含了具体的代码示例和常见问题排查指南,帮助开发者更高效地构建基于大模型的应用。

AI 产品经理是连接技术与市场的关键角色。随着深度学习、自然语言处理等技术成熟,行业对具备技术理解与市场洞察能力的复合型人才需求激增。金融、医疗、教育等领域广泛应用 AI 技术,推动岗位增长。求职者需掌握基础算法知识、项目管理能力及创新思维,同时保持持续学习以适应快速变化的技术环境。虽然竞争激烈,但通过积累实战经验、构建人脉及提升综合素质,可在该领域获得广阔…

基于 LoRA 技术微调多模态大模型 BLIP-2 的完整流程。内容涵盖 BLIP-2 的架构原理,包括 Image Encoder、Q-Former 和 LLM 的协同工作机制,以及两阶段预训练策略。文章提供了从环境搭建、数据集准备、模型加载、LoRA 参数配置、训练循环编写到推理评估的代码示例。重点阐述了如何通过低秩适应减少可训练参数量,实现高效微调,并…

介绍如何利用 LangChain、Gradio、ChromaDB 及 FlagEmbedding 构建本地个人知识助手。通过检索增强生成(RAG)技术,结合讯飞星火大模型 API,实现基于私有数据的智能问答。文章涵盖环境配置、知识库建立、向量模型下载、API 密钥设置及完整代码实现,旨在帮助用户快速搭建安全可控的本地 AI 应用。主要流程包括文本分块、向量化…

PyCharm 的安装配置、项目创建、环境管理及核心功能使用方法。内容涵盖社区版与专业版的区别、虚拟环境配置、依赖管理、调试技巧、版本控制集成及常用快捷键。同时补充了远程开发、Docker 集成及代码质量分析等高级功能,旨在帮助开发者建立规范的 Python 开发工作流,提升编码效率与代码质量。

LLM 微调的六种主流高效方法,包括 Adapter Tuning、Prefix Tuning、Prompt Tuning、P-tuning、P-tuning v2 及 LoRA。针对全量微调成本高、资源消耗大的问题,这些方法通过冻结预训练参数并仅训练少量新增参数,实现了接近全参数微调的效果。文章详细解析了各方法的原理、结构优势与局限性,并提供了不同场景下的…

Python 列表(List)的基础用法与核心操作。内容涵盖列表的定义与创建、索引与切片访问、列表运算(拼接、重复)、元素遍历方法、常见的列表操作方法(如 append、sort、pop 等)、列表推导式的语法及应用,以及浅拷贝与深拷贝的区别。文章最后通过掷骰子统计的实战案例,展示了如何利用列表优化代码结构,提升数据处理效率。

AI 绘画中创意文字的四类主流玩法:光影文字、嵌入文字、隐藏文字及海报文字。核心流程包括制作高对比度文字底图、选择合适的 Stable Diffusion 大模型、编写精准的提示词以及配置 ControlNet 参数。文章针对每种类型提供了具体的模型推荐、提示词模板及参数调节范围,并补充了环境搭建、故障排查及进阶优化技巧,帮助用户系统掌握从底图处理到最终渲染…

大模型(LLM)的概念、定义及发展现状,涵盖 Transformer 架构、预训练与微调核心技术。重点梳理了从零开始的大模型学习路线,包括数学基础、Python 编程、深度学习框架(PyTorch/TensorFlow)、模型优化技术(剪枝、量化)、分布式训练及硬件加速。文章还分析了大模型在 NLP、CV、推荐系统及医疗金融等行业的应用场景,并探讨了未来向专…

梳理了 AI 大模型的核心概念与架构演变。涵盖大模型定义、分类及与大语言模型的区别。详解 Transformer 架构原理,包括 Self-attention、残差连接、Layer normalization 等关键技术。回顾 GPT 系列发展历程,从 GPT-1 到 GPT-4 的迭代,重点分析 ChatGPT 基于人类反馈强化学习(RLHF)的训练范式。…

详细阐述了提示工程(Prompt Engineering)的核心概念与多种关键技术。内容包括提示的基本公式(任务、指令、角色),以及指令提示、角色提示、零样本/少样本、思维链、自洽性、种子词、知识生成、受控生成、问答摘要、对话对抗、聚类强化学习、课程学习、情感分析、实体识别和文本分类等具体技术。文章还补充了综合应用策略与最佳实践,旨在帮助用户全面掌握引导大模…

Qwen 2.5-Max 在编程能力上表现优异,结合 Cline 编辑器可提升开发效率。介绍 Qwen 2.5-Max 特性及百炼平台 API 接入方法,通过 Vue 项目实战对比其代码生成质量与 DeepSeek V3 的差异。结果显示 Qwen 2.5-Max 具备较强潜力,配合免费 Token 额度适合开发者尝鲜。文章详细阐述了配置步骤、提示词设计及实…

Stable Diffusion WebUI 是一款基于扩散模型的开源图像生成工具,支持本地部署。整合包的安装步骤、界面功能解析、提示词编写技巧、ControlNet 控制网络的使用以及 LoRA 模型加载方法。内容涵盖环境要求、参数调节优化及常见问题排查,旨在帮助初学者快速上手并实现高质量的 AI 绘画创作。

AI 绘画摆摊通过提供个性化头像定制服务实现盈利。主要流程包括拍摄底图、美颜修图、使用 Midjourney 生成图像及现场打印装框。设备成本可控,毛利率较高。硬件配置、定价策略、MJ 提示词模板及打印注意事项,帮助从业者快速上手并优化出图效果。

Python 语言设计中的 27 个核心问题解答,涵盖缩进机制、浮点运算精度、字符串不可变性、self 参数语义、赋值表达式限制、内置函数与方法区别、join 归属、异常性能、switch 替代、线程实现、lambda 限制、内存管理与垃圾回收、元组与列表差异、字典哈希实现、接口规范、goto 缺失、原始字符串规则、with 语句设计、语法符号必要性及尾随逗…

复盘了 2022 年护网行动中的攻防实战经验。从攻击方角度分析了分布式扫描、Webshell 管理、钓鱼攻击、内网渗透及 0day 漏洞的使用策略;从防守方角度探讨了事前排查、事中监控、事后溯源的全流程防御体系,指出了防御过度、重边界轻内网等常见问题。文章重点介绍了 RASP、EDR、蜜罐等技术手段在应对 0day 攻击中的应用,并强调了零信任架构与常态化安…