
LangChain-Chatchat 本地知识库部署与避坑指南
LangChain-Chatchat 是基于 ChatGLM 和 Langchain 的开源 RAG 本地知识库项目。介绍其实现原理,涵盖开发环境准备(Ubuntu、Python、CUDA)、硬件要求、仓库拉取、虚拟环境创建、依赖安装及配置文件初始化。详细说明了模型下载策略、知识库初始化命令、服务启动方式(一键或单独)以及 Web UI 和 API 访问方法…
博客作者
开源社区贡献者
354
已发布文章
11K
博客获赞
887K
博客浏览
第 17 页

LangChain-Chatchat 是基于 ChatGLM 和 Langchain 的开源 RAG 本地知识库项目。介绍其实现原理,涵盖开发环境准备(Ubuntu、Python、CUDA)、硬件要求、仓库拉取、虚拟环境创建、依赖安装及配置文件初始化。详细说明了模型下载策略、知识库初始化命令、服务启动方式(一键或单独)以及 Web UI 和 API 访问方法…

Ollama 在本地环境下的部署流程、配置方法及核心功能。内容涵盖 Linux 与 Docker 安装步骤、系统服务配置、模型拉取与运行、自定义 Modelfile 开发以及 REST API 集成方案。同时补充了 One-API 与 Open WebUI 的生态整合实践,并提供了常见问题的排查指南与 Python 客户端示例,旨在帮助开发者快速搭建私有化大…

五个基于 Python 的办公自动化实用脚本,涵盖从 Word 提取图片、制作国旗头像、汉字转拼音、发票 OCR 识别到自动整理文件夹的场景。内容详细说明了各功能的安装依赖、代码实现、技术原理及安全注意事项,特别强调了 API 密钥的安全管理和虚拟环境的最佳实践。通过掌握这些自动化技巧,可有效减少重复劳动,提升工作效率。

30 个实用的 Python 编程技巧,涵盖列表推导、枚举、多值返回、链式比较、字符串转换、For-Else 结构、堆操作、字典合并、集合运算及常用内置函数等核心知识点。内容经过清洗去除了无关推广信息,修正了原有代码逻辑错误与拼写错误,并补充了必要的上下文说明与最佳实践建议,旨在帮助开发者提升编码效率与代码质量。

详细讲解了在 Python 中执行 Windows CMD 命令的四种主要方法。首先介绍了标准库 subprocess 模块的最佳实践,包括参数配置、错误处理和超时控制;其次分析了 os 模块的简单用法及其局限性;接着探讨了 pyautogui 在 GUI 自动化中的应用及依赖条件;最后说明了 ctypes 库在 Windows 底层调用中的使用场景。文章重…

大语言模型在处理 13.11 与 13.8 等数值比较时出现常识性错误。研究表明,这源于 LLM 基于 Token 预测而非数值逻辑的本质。Token 分词机制导致数字被拆解为文本片段,训练数据中的版本号或日期习惯干扰了数值判断。此外,上下文提示方式显著影响结果,明确指定数据类型或调整提问顺序可改善表现。此现象揭示了当前 AI 缺乏真正的数学推理能力,依赖统…

北京交通大学 ADaM 团队开源 o1-Coder 框架,旨在复现类 o1 的推理能力。该框架通过测试用例生成器(TCG)构建结果奖励,利用蒙特卡洛树搜索(MCTS)合成推理数据,并支持在无推理过程数据情况下进行强化微调(RFT)。文章详细阐述了六步框架流程、伪代码生成策略,并讨论了系统 2 对齐、世界模型构建等挑战与未来方向。

Safetensors 是一种用于安全存储张量的新格式,旨在替代不安全的 pickle 格式。它通过零拷贝技术提升加载速度,支持惰性加载以优化内存使用,并天然防止反序列化攻击。深入解析其内部结构、安全性优势及在 PyTorch 中的实践应用,涵盖文件头定义、数据偏移量机制以及与 HuggingFace 生态的集成方式,为开发者提供完整的模型权重存储解决方案。

介绍如何使用 LangChain4J 框架结合智谱 GLM-4 大模型,通过 Function Calling 功能开发支持工具调用的智能体(Agent)。示例基于 Kotlin 和 Quarkus 构建,模拟本地商店发现与下单场景,展示了 ChatMemory、SystemMessage、UserMessage 及 Tool 的定义与调用流程。文章还分析了…

深入解析了检索增强生成(RAG)技术的核心原理及其在大模型应用中的关键作用。文章对比了 RAG 与大模型微调的差异,详细阐述了检索与生成的工作流程,并分析了当前面临的检索精度、幻觉及维护成本等局限性。针对这些问题,提出了包括混合检索、重排序、查询重写及自动化维护在内的多种性能提升策略。最后总结了 RAG 的技术趋势,为企业落地提供实践参考。

在本地环境中使用 Ollama 部署大语言模型的完整流程。涵盖 Windows/Linux 系统下的安装步骤、环境变量配置、模型下载与运行方法,以及通过 Node.js 构建聊天界面的操作指南。此外还包括如何在 VS Code 中集成 Ollama 插件进行开发辅助,并提供了常用命令参考及性能优化建议,帮助用户快速实现本地 AI 能力落地。

大模型算法岗位的常见面试题,涵盖基础架构、进阶训练、LangChain 应用、分布式训练及推理优化等核心领域。内容包括 Transformer 体系、Tokenization 原理、LoRA 微调技术、RAG 检索增强生成、分布式并行策略(数据/张量/流水线)、显存优化方案(ZeRO、量化)以及 LangChain 框架详解。文章详细解析了 Self-att…

检索增强生成(RAG)技术通过结合外部知识库与大语言模型,有效解决了幻觉、知识过时及隐私问题。文章系统阐述了 RAG 的定义、从朴素到模块化范式的演进历程,对比了其与微调技术的适用场景,并介绍了评估指标与未来在多模态及垂直领域的优化方向。同时提供了基于 Python 的基础实现代码示例,帮助开发者理解 RAG 的核心工作流与落地实践。

Android 开发中深入理解框架源码是提升技术深度的关键途径。系统梳理了包括 Retrofit、OkHttp、Glide、ButterKnife 在内的多个主流 Android 框架的架构设计与核心原理。通过分析这些开源库的源码,开发者可以掌握动态代理、拦截器链、内存缓存策略、注解处理等设计模式与实现机制。文章详细解读了网络请求、图片加载、事件总线及内存泄…

Android Jetpack 是 Google 官方推出的 Android 开发工具包集合,旨在帮助开发者遵循最佳实践、减少样板代码并简化复杂任务。系统讲解了 Jetpack 核心组件,涵盖 Navigation 导航、DataBinding 数据绑定、ViewModel 与 LiveData 状态管理、Room 本地数据库、Paging 分页加载、Wor…

探讨了 35 岁以上快消从业者面临的职业危机现状,结合拼多多高管及普通业务员案例,分析了行业年轻化趋势、数字化转型冲击及年龄歧视等核心成因。文章指出困境源于缺乏对抗优势而非单纯年龄问题,并提出技能升级、跨界融合、心态调整等应对策略,强调终身学习与核心竞争力构建的重要性。

探讨了 Python 在金融风险管理领域的核心应用与实战方法。文章分析了 Python 作为金融首选语言的优势,包括开放性、数据处理能力及简洁性。详细介绍了 NumPy、Pandas、Matplotlib 及 Scikit-learn 等技术栈在市场风险、信用风险及合规监控中的具体应用场景。同时提供了明确的学习路径与最佳实践建议,强调理论与实践结合的重要性,…

推荐了六本经典的 Python 学习书籍,涵盖从入门到进阶的不同阶段,包括《Python 编程:从入门到实践》、《流畅的 Python》等。同时梳理了系统学习路线,包含计算机基础、爬虫技术、数据分析、数据库与 ETL、机器学习及高级进阶等内容,并提供相关代码示例,帮助读者从零开始掌握 Python 开发技能。

C++ 被视为最难学编程语言的原因,包括复杂的语法规则、庞大的标准库、手动内存管理的风险、高度灵活的模板特性以及代码缺乏简洁性。文章对比了指针与引用、栈与堆的区别,介绍了智能指针和 RAII 机制以解决内存问题,并探讨了模板元编程和并发编程带来的挑战。尽管学习曲线陡峭,掌握 C++ 能提供对底层资源的极致控制力。

中国科学院软件研究所联合多所高校分析了 102 篇关于大模型在软件测试领域应用的论文。研究发现大模型主要应用于测试生命周期后段,如用例生成和调试。常用模型包括 ChatGPT、Codex 和 CodeT5。技术路径涵盖微调与提示工程。当前面临覆盖率低、测试预言难、评估基准泄露及现实项目适配等挑战。未来机遇在于扩展测试阶段、结合传统技术及高级提示工程。