
FastGPT:基于 LLM 的开源 AI 知识库问答系统
FastGPT 是一款基于 LLM 的开源 AI 知识库问答系统,支持 RAG 检索与可视化工作流编排。它解决了传统 AI 对话在多轮交互、实时数据获取及任务效率上的不足。 FastGPT 的在线使用流程及 Docker 本地私有化部署方法,涵盖应用创建、知识库管理及环境配置,帮助用户构建安全可控的 AI 应用。
博客作者
极光照耀
312
已发布文章
7.1K
博客获赞
482K
博客浏览
第 15 页

FastGPT 是一款基于 LLM 的开源 AI 知识库问答系统,支持 RAG 检索与可视化工作流编排。它解决了传统 AI 对话在多轮交互、实时数据获取及任务效率上的不足。 FastGPT 的在线使用流程及 Docker 本地私有化部署方法,涵盖应用创建、知识库管理及环境配置,帮助用户构建安全可控的 AI 应用。

探讨了职场人在 AI 时代保持竞争力的九种方法,包括拥抱变化、培养成长型思维、识别自动化任务及探索领域专用 AI 工具等。文章详细阐述了从初阶应用到高阶实战的学习路径,涵盖提示工程、RAG 技术、模型微调及商业部署等内容,旨在帮助读者系统性地掌握 AI 技能,实现工作效率与创新能力的双重提升。

系统介绍了 AI 大模型的核心原理、训练流程及应用实战。内容涵盖从人工智能演进历史、Transformer 架构解析、数据预处理与分布式训练策略,到有监督微调(SFT)、LoRA 技术及强化学习(RLHF)的详细讲解。文章还提供了完整的章节大纲,包括模型评估、多模态应用及推理优化等关键知识点,旨在帮助读者从零开始构建大模型知识体系,掌握从理论到落地的全流程技…

FLOAT 是基于流匹配的音频驱动说话者头像生成模型,通过引入学习的运动隐空间和基于 Transformer 的流向量场预测器,解决了传统扩散模型采样慢和时间不一致的问题。该模型支持语音驱动的情感控制,在视觉质量、运动保真度及生成效率上均达到 SOTA。实验验证了其在多数据集上的优越性,并提供了情感重定向等扩展功能。

详细阐述了 AI 产品经理所需的十大核心能力,涵盖人工智能与机器学习基础、数据管理与分析、编程技能、产品管理、沟通领导力、用户体验设计及伦理合规等方面。内容还探讨了在大模型时代如何系统学习 AI 技术,包括提示词工程、知识库应用及微调开发等实践路径,旨在为从业者提供从入门到进阶的全面指导。

大语言模型评测对应用和发展至关重要,涵盖经典与新型两种范式。经典范式包括自然语言理解与生成任务,常用基准有 GLUE、CLUE 等,指标含 BLEU、ROUGE。新型范式关注道德准则、知识运用、幻觉检测等多维属性。现有评测存在基准缺乏、区分度不足、不公平、不全面、数据污染及缺乏可解释性等不足。全面评测体系如 HELM 引入了准确率、校准度、泛化能力、适配能力…

Ollama 是一个快速运行大语言模型的本地化工具,采用 Client-Server 架构,默认监听 11434 端口。其核心由 ollama-http-server 和 llama.cpp 推理引擎组成,通过 HTTP 协议通信。存储结构遵循 OCI 规范,包含 blobs 原始数据和 manifests 元数据。对话流程涵盖模型拉取、初始化会话及 API…

对比了三种智能体开发方案:纯代码构建、LangGraph 框架以及 LlamaIndex Workflows。纯代码方案灵活但维护成本高,适合学习原理;LangGraph 提供清晰的图结构和状态管理,适合团队协作但调试复杂;Workflows 采用事件驱动和异步架构,平衡了约束与自由度,适合复杂异步场景。选型时需考虑项目集成度、开发者熟悉度及参考资源。生产环…

大型推理模型通过结合训练时扩展与测试时计算提升推理能力。文章综述了数据构建从人工标注转向 LLM 自动化的趋势,分析了监督微调与强化学习在优化多步推理中的应用,特别是过程奖励模型的作用。探讨了测试时间缩放技术如 PRM 引导搜索及 OpenAI o1 系列进展。总结数学、逻辑、编码等评估基准,并讨论慢思考机制与未来开放问题。

涵盖 Python 基础语法与核心概念,包括变量数据类型、控制流程、函数定义、模块管理、数据结构、面向对象编程及异常处理。内容修正了原有代码语法错误,补充了控制流与异常处理章节,清理了外部链接与广告信息,旨在提供一份完整且规范的 Python 入门指南。

Python 变量是数据的载体,用于保存内存空间中的数据。 Python 中常用的数据类型包括整型 int、浮点型 float、字符串 str 和布尔型 bool。详细说明了变量命名的规则与惯例,如字母数字下划线组成、大小写敏感、避开关键字等。通过代码示例演示了变量的定义、运算及类型转换方法,展示了如何使用 type 函数检查类型以及 int、float、s…

Python 初学者常用的编程代码示例,涵盖循环控制、数据结构操作、基础算法实现及常用库使用等内容。通过具体代码片段演示了列表遍历、素数判断、顺序表逆置、九九乘法表打印等典型场景,并补充了文件读写、异常处理及面向对象基础等实用技巧,帮助新手快速掌握核心语法与逻辑构建方法。

深入解析了大模型量化技术中的 AWQ(Activation-aware Weight Quantization)原理及其工具 AutoAWQ。文章首先阐述了模型压缩的背景,对比了剪枝、蒸馏和量化三种方案,重点指出训练后量化在低比特场景下的挑战。AWQ 方法通过观察发现仅少数显著权重对模型性能至关重要,提出通过激活感知缩放来保护这些权重,而非简单混合精度。文中…

Python 在人工智能和机器学习领域的核心库,包括 NumPy、Pandas、Matplotlib、Scikit-learn、TensorFlow 和 PyTorch。内容涵盖各库的功能简介、安装环境准备、核心代码示例以及选型建议。通过详细解析数据处理、模型训练及可视化的关键步骤,帮助开发者快速上手 Python AI 生态,避免常见配置陷阱,实现从理论到…

基于斯坦福李飞飞团队发布的论文《AI Agent: Multimodal Interaction Frontier Survey》,系统梳理了 AI Agent 在多模态交互领域的研究全景。文章涵盖了代理 AI 的集成方式、智能范式、学习策略、分类体系及应用任务,重点探讨了跨模态理解、模拟到现实转移及伦理安全等关键挑战。报告指出 AI 正从被动模型向动态代理…

详细解析了低秩适应(LoRA)在大模型高效微调中的核心原理,包括其通过低秩分解近似增量参数的机制、显存优化策略及梯度计算过程。文章阐述了为何 LoRA 能减少训练参数量而不影响推理性能,分析了秩 r 和系数 alpha 的选择对微调效果的影响,并对比了不同微调方法的硬件需求。最后总结了 LoRA 在实际应用中的参数配置建议,为开发者提供从理论到实践的完整指导…

探讨了大模型 RAG 应用中两种高级检索模式:融合检索与递归检索。融合检索通过多路检索(如问题重写、多索引类型)结合重排序算法提升召回精度,适用于对准确性要求高的场景。递归检索则通过层级链接(Chunk 到 Chunk、检索器、RAG 引擎或 Agent)实现深度探索,适合处理长文档或复杂结构化数据。文章分析了各模式的实现原理、关键技术及在 LangChai…

Ollama 是一个开源项目,旨在简化本地大语言模型的运行。它支持多种硬件配置,提供命令行交互及模型管理功能,并能与 LangChain 等框架集成。 Ollama 的核心特性、安装方法、常用命令、API 调用方式以及通过 Open WebUI 构建本地对话界面的步骤,帮助开发者快速在本地环境部署和测试 AI 模型。

使用 Python 的 PIL 库为图片批量添加水印的方法。通过 ImageDraw 模块实现文字水印,支持自定义字体、大小和位置;通过 Image.paste 方法实现图片水印,可调整尺寸和位置。提供完整的目录结构建议和批量处理代码示例,涵盖横竖版图片自适应逻辑,帮助开发者快速实现自动化图片处理任务。

Stable Diffusion 是一款开源的 AI 绘画工具,支持文生图与图生图。详细讲解了硬件配置要求、整合包安装步骤、界面功能说明及核心参数设置。涵盖模型管理、提示词编写技巧、采样方法选择及常见问题排查,帮助用户快速掌握本地部署与绘图流程,实现个性化图像生成。