基于 LangChain 的 RAG 与对话记忆实现
介绍如何使用 LangChain 构建支持本地文档检索(RAG)及多轮对话记忆的问答系统。通过加载 TXT/PDF 文档、向量化存储并结合历史消息上下文,实现了连贯的智能交互。示例代码展示了环境配置、模型调用及会话状态管理,适用于企业知识库或私有文档答疑场景。
博客作者
逆风前行
379
已发布文章
8.5K
博客获赞
530K
博客浏览
第 5 页
介绍如何使用 LangChain 构建支持本地文档检索(RAG)及多轮对话记忆的问答系统。通过加载 TXT/PDF 文档、向量化存储并结合历史消息上下文,实现了连贯的智能交互。示例代码展示了环境配置、模型调用及会话状态管理,适用于企业知识库或私有文档答疑场景。

VSCode 搭配 GitHub Copilot 进行 AI 编程的完整流程。涵盖安装配置、基础对话与代码补全功能,以及核心的 Agent 编程实战(Plan 模式制定方案,Agent 模式执行)。详细解析了 Tools 工具箱、MCP 外部连接、Agent Skills 技能包、多种运行方式、Hooks 脚本、Custom Instructions 自定义…

探讨了医疗 AI 基础设施的构建方案,针对数据孤岛和标准化问题,提出基于向量数据库的矩阵化架构。通过多模态数据统一向量空间、优化 HNSW 索引及动态矩阵更新机制,实现了跨模态高效检索。临床验证显示,该架构提升影像检索效率 47%,缩短模型迭代周期 60%,并符合 GDPR 和 HIPAA 合规要求,为医疗 AI 标准化建设提供技术框架。
在 OpenClaw 中配置本地 llama.cpp 作为后端的方法。主要涉及添加自定义 Provider 以及检查 models.json 与 provider 配置的一致性。遇到模型状态不正确或对话返回异常时,需确认配置文件路径无误且不存在重复的 provider 名称。通过修正配置可解决连接与响应问题。

开源低代码平台 Microi 吾码的核心特性。该平台基于.NET8 构建,支持 gRPC 跨语言通信及 MySQL、SQL Server、Oracle 等多种数据库连接。具备无限制用户与表单创建能力,支持分布式架构 Docker 部署。此外,提供界面自定义、SaaS 引擎、表单接口协同、工作流权限控制及单点登录集成等功能,适用于快速实现多样化业务需求。

详细解析了基于 rsl_rl 库的 PPO 强化学习算法在 Python 中的实现细节。内容包括仓库结构概览、核心类初始化、经验回放缓存管理、动作采样与环境反馈处理,以及训练循环中的损失计算与梯度更新。重点阐述了概率比率裁剪、GAE 优势估计、价值函数裁剪及 KL 散度控制等关键机制,适用于四足机器人控制策略的训练与部署。

记录了基于 Web 的远程文件管理系统毕业设计开题答辩过程。系统采用 B/S 架构,后端 Spring Boot + MySQL,实现文件上传下载、操作及搜索功能。答辩重点涉及安全性措施(权限隔离、白名单)、与公有云盘的差异化(私有化部署)、技术选型理由(Spring Boot 简化配置)、存储策略(目录分类+DB 元数据)、内网穿透方案及大文件分片上传处理…

记录了 Clawdbot(Moltbot)的源码部署全过程。主要涵盖在 Windows 环境下使用 WSL2 进行环境准备,安装 Node.js 及依赖,解决 node-llama-cpp 构建报错问题,通过自定义脚本完成项目构建。随后配置智谱 AI 模型及 WebChat 通道,处理 API 限额导致的无响应问题,并验证了工具调用及文件操作能力。提供了常用…

如何在 Visual Studio 中关闭 GitHub Copilot 的 AI 代码提示功能。尽管该工具能提升开发效率,但在刷题或练习场景下可能产生干扰。通过点击右上角 Copilot 按钮进入设置,取消启用选项即可禁用该功能。

如何在 Linux 云服务器上通过命令行脚本部署 Clawdbot 智能体,并配置其与 Telegram 机器人对接。主要步骤包括创建服务器环境、运行安装脚本、选择 AI 模型(如 Qwen)、获取 Telegram Bot Token 以及完成配对授权。最终实现 Telegram 消息的自动回复功能。

介绍 Ollama 本地大模型的管理方法,包括命令行运行、单模型删除、批量清理及彻底卸载步骤。同时涵盖 Open WebUI 的 pip 安装与服务启动流程,指导用户通过浏览器访问界面进行大模型交互。内容涉及基础命令操作、缓存清理及服务状态检查,适合希望搭建本地 AI 环境的开发者参考。
介绍如何在 Flutter 鸿蒙应用中集成 vertex_ai 三方库以接入 Google Vertex AI 服务。内容涵盖环境配置、核心 API 调用(生成式对话、文本嵌入、向量匹配引擎)、鉴权安全方案及典型应用场景如语义搜索和端云联动 RAG。旨在帮助开发者利用云端算力增强鸿蒙应用的智能化能力,同时注意网络延迟与凭证存储的安全实践。
介绍利用 Llama Factory 微调显存计算器预估云资源成本的方法。涵盖模型参数量、微调方法(LoRA/QLoRA)、精度选择对显存的影响公式。提供 7B 至 72B 模型的基础显存参考值及实战计算案例(如 Qwen-32B)。此外,还包含序列长度调整、梯度检查点、ZeRO 优化等实际部署中的显存节省技巧,帮助合理规划 GPU 预算,避免 OOM 错误…
Clawdbot 结合 Qwen3-32B 模型在企业内部部署的实战案例。通过私有化部署确保数据安全,解决了 HR 政策咨询重复高、IT 故障响应慢的痛点。方案包含架构设计、HR 规则引擎注入、IT 日志意图识别等核心功能,实现了秒级响应和自助解决率提升。文章详细展示了部署步骤、交互效果对比及性能数据,强调大模型应回归'助手'本质,注重业务语义对齐而非单纯参…
MiniMax 公布港交所上市首份年报,2025 年营收同比增长 158.9%,毛利同比飙升 437%。公司采用 C 端产品与 B 端开放平台双轮驱动模式,用户超 2.36 亿。技术层面完成 M2、M2.1、M2.5 三代模型迭代,强化代码与智能体能力。展望 2026,MiniMax 聚焦编程、办公及多模态创作三大超级 PMF,致力于转型为 AI 平台型公司…

主流大模型的技术演进与架构。涵盖 GPT 系列从 GPT-1 到 ChatGPT 的发展,重点解析 RLHF 机制。对比了 GPT 与 BERT 的区别。详细分析了开源模型如 LLaMA、ChatGLM、Qwen 和 DeepSeek 的核心特性,包括 SwiGLU、RoPE、Prefix-Decoder 及 MoE 混合专家架构。提供了硬件配置参考与开源协…
解读了 MiniOneRec 开源框架,这是一个基于 LLM 的生成式推荐系统。核心流程包括使用 RQVAE 构建 SID 进行商品分词,结合 LLM 世界知识进行文本对齐,并通过 SFT 和 RL(GRPO)进行训练。实验表明模型具有 Scaling 特性,且 SID 与文本对齐至关重要。文章详细分析了 Tokenization、Alignment、RL…
介绍 M25P16 SPI-FLASH 芯片的基础特性,包括其 2MB 容量、三级寻址结构及 SPI 接口模式。详细解析了读取、写入、擦除等关键指令集及时序要求,如 WREN 写使能和 PP 页编程流程。同时提供了 Verilog 宏定义示例及状态机设计思路,帮助开发者理解嵌入式存储操作的底层实现与注意事项。

flux-kontext-pro 是一款基于 Flux 架构的前端状态管理库,结合 React Context 实现全局状态集中管理和跨组件通信。其核心功能包括单向数据流、异步操作支持及中间件机制。通过 Store 和 Action 模式简化复杂应用的数据流,提升开发效率与可维护性。其原理、核心功能及基础搭建流程。

一款基于 AI 视觉分析的网页生成工具,旨在解决前端开发中 CSS 编写耗时的问题。该工具通过输入网页 URL,利用 AI 理解布局结构,输出干净的 HTML 及 Tailwind CSS 代码。支持响应式布局,可直接集成至 React/Vue 项目。适用于独立开发者快速搭建 MVP、外包项目切图及前端学习参考。虽然复杂交互需人工微调,但作为起步模板能显著节…