
LLM 大模型基础知识与开发实践指南
大模型技术涵盖生成式预训练变换模型核心概念,包括提示词工程、检索增强生成(RAG)、微调及智能体架构。详细解析了知识问答的三种实现方式及其优劣对比,阐述了从面向过程到面向目标的软件架构范式迁移。同时探讨了程序员在 AI 时代的角色转变,从代码编写转向系统设计与流程编排,并提供了从基础理解到私有化部署的系统化学习路径与技术栈建议。
博客作者
虚拟世界
368
已发布文章
14K
博客获赞
907K
博客浏览
第 17 页

大模型技术涵盖生成式预训练变换模型核心概念,包括提示词工程、检索增强生成(RAG)、微调及智能体架构。详细解析了知识问答的三种实现方式及其优劣对比,阐述了从面向过程到面向目标的软件架构范式迁移。同时探讨了程序员在 AI 时代的角色转变,从代码编写转向系统设计与流程编排,并提供了从基础理解到私有化部署的系统化学习路径与技术栈建议。

Open-Sora 1.0 由 Colossal-AI 团队全面开源,作为全球首个类 Sora 架构视频生成模型,涵盖数据处理、训练细节及模型权重。其采用 Diffusion Transformer (DiT) 架构,引入时间注意力层扩展至视频数据,包含预训练 VAE、文本编码器及 STDiT 模型。训练分为大规模图像预训练、大规模视频预训练及高质量视频微调…

涵盖 30 道大语言模型面试问题,包括基础概念、架构原理、伦理道德、应用场景及编程实践。内容涉及 Transformer、提示工程、偏差处理、微调策略等核心技术点,并提供了 Python 回文检测示例。旨在帮助求职者全面理解 LLM 技术细节与行业应用,提升面试准备效率。

介绍如何利用 Meilisearch 搜索引擎结合 Ollama 本地大模型实现文本向量搜索。通过 Docker 部署 Meilisearch,配置 Ollama 作为嵌入模型源,设置混合搜索策略,并演示了文档索引与查询的具体步骤。该方案支持语义理解,适用于需要实时、高性能搜索的应用场景,如电商或知识库检索。

LangChain Callbacks 模块允许开发者在 LLM 应用程序的各个阶段挂接逻辑,适用于日志记录、监控和流式传输。核心接口包括 BaseCallbackHandler 及其子类,如用于终端输出的 StdOutCallbackHandler、用于文件记录的 FileCallbackHandler 以及异步处理的 AsyncCallbackHandl…

30 余道大语言模型(LLM)面试问题及参考答案,涵盖基础概念、训练方法、架构原理、伦理道德、应用场景及代码实现。内容涉及 Transformer、提示工程、偏差处理、微调策略及行业部署挑战,旨在帮助求职者系统掌握 LLM 核心知识,提升面试表现。

详细阐述了 AI 产品经理的定义、职责及其与传统互联网产品经理的区别,分析了 AI 软件与硬件产品经理的分类及特点。文章重点介绍了 AI 产品经理所需的核心技能,包括算法理解、系统架构认知、数据驱动分析及业务转化能力,并补充了软技能与合规意识的重要性。最后提供了在校生及传统 PM 转型的具体路径建议,强调持续学习与垂直领域深耕是职业发展的关键。

AI 大模型微调产品经理面试涉及对模型理解、关键因素把控、项目经验复盘及数据质量管理等核心能力。高频面试题,涵盖微调原理、数据集构建、超参数调整、评估指标选择及落地迭代流程。同时补充了成本控制、伦理安全及利益相关者管理等进阶问题,旨在帮助候选人系统梳理技术边界与产品思维,提升在垂直领域模型应用中的综合竞争力。

汇总了大模型算法岗位的高频面试题,涵盖基础理论、进阶微调、应用框架及分布式训练推理。内容包括主流开源模型体系、Transformer 架构细节、Prefix/Causal LM 区别、幻觉解决方案、Tokenizer 原理、Layer Normalization 差异等。进阶篇涉及 LLaMA 输入长度限制、复读机问题缓解、SFT 指令数据构建、领域模型微调…

DeepSeek-R1 通过纯强化学习激发大模型推理能力,提出 R1-Zero 冷启动策略及多阶段训练方案。实验显示其在数学、编程及知识任务上超越前代模型,并通过蒸馏技术实现小模型性能跃升。该研究验证了自主进化的可能性,为 AGI 发展提供新范式,同时开源生态推动技术普惠。

文档解析技术是大模型训练与应用的关键环节。随着数据爆炸,高质量语料成为瓶颈,面临 Token 耗尽、语料质量要求高及文档解析不精准等挑战。基于 TextIn 的文档解析技术方案,涵盖文档预处理(去噪、矫正)、版面分析(物理与逻辑)及文档构建流程。该技术通过多模态识别与结构化输出,提升大模型问答精度。未来趋势包括更准确的文本识别、端到端理解及多模态解析,推动人…

如何使用 Python 的 Gradio 库为 RAG(检索增强生成)系统搭建 Web 用户界面。通过集成文件上传功能,用户可以本地加载文档,系统自动构建向量数据库并进行内容索引。随后,用户可通过聊天窗口输入问题,系统基于检索到的上下文调用大模型生成回答。教程涵盖了环境配置、Gradio 基础组件使用、RAG 后端逻辑对接以及完整的代码示例,旨在帮助开发者快…

ChatGLM3 是智谱 AI 推出的开源对话模型。介绍如何在本地环境部署 ChatGLM3-6B,涵盖 Python 环境配置、依赖安装及 Streamlit 演示启动。重点解决 CPU 运算警告、CUDA 版本不匹配及 PyTorch 无法调用显卡等常见问题,提供详细的版本检查命令与代码修改方案,帮助用户顺利完成本地化部署并优化推理性能。

LangChain 中的 Model I/O 包含输入提示、调用模型、输出解析三部分。详细讲解了 PromptTemplate、ChatPromptTemplate、FewShotPromptTemplate、PipelinePromptTemplate 及 Partial 提示模板的使用方法。通过代码示例展示了如何创建、调用及复用这些模板,并介绍了基于向量…

多模态对比预训练模型如 CLIP 易受数据中毒后门攻击影响,少量中毒样本即可导致模型行为被操纵。CleanCLIP 提出一种微调框架,通过独立对齐各模态表示并结合自监督学习目标,在干净数据上微调以消除虚假关联。实验显示该方法能显著降低攻击成功率,同时保持模型在 ImageNet-1K 上的零样本性能,为多模态模型安全部署提供了解决方案。

介绍在 macOS 环境下部署 Stable Diffusion WebUI 的完整流程。涵盖环境依赖安装、WebUI 克隆与启动、模型下载与管理、基础参数配置及常见报错处理。通过本教程,用户可快速掌握本地生成 AI 图像的核心操作,解决内存不足、代理冲突等常见问题,实现从文本到图像的自动化创作。重点包含 Apple Silicon 芯片的 MPS 加速配置…

GraphRAG 结合知识图谱与向量检索提升大模型问答准确性。基于 PolarDB、通义千问和 LangChain 搭建系统,利用 PolarDB 同时支持 AGE 图引擎和 pgvector 插件的特性,实现图数据与向量数据的统一存储。通过对比单独使用向量检索、图检索及联合搜索的效果,验证了图 + 向量联合搜索在复杂查询中的优势,能有效减少幻觉并增强上下文…

总结了 2023 年国内大模型公司的面试经验,涵盖智元机器人、面壁科技、Minimax、阿里、百度等 24 家企业的面试流程与结果。文章详细分析了基座算法岗的技术考点,包括多头注意力机制、Transformer 架构、分布式训练、数据预处理及评估方法。同时提供了从基础夯实到行业落地的七阶段学习路径,强调了工程与研究的结合以及 RLHF 方向的前景,旨在为求职…

系统介绍了 Transformer 模型的核心架构与技术细节。内容涵盖编码器与解码器结构、自注意力机制、位置编码、残差连接等基础组件;深入解析了 BERT 模型的双向上下文与预训练策略;探讨了多语言处理、ViT 等变体架构以及预训练微调的工程实践。此外,文章还涉及模型可解释性技术与未来演进方向,为开发者提供从理论到应用的完整技术视角。

全面综述了知识图谱增强大模型 GraphRAG 技术。GraphRAG 通过整合外部结构化知识图谱,解决了传统检索增强生成(RAG)在处理实体间复杂关系时的局限性。文章详细阐述了 GraphRAG 的三大核心阶段:基于图的索引、图引导检索和图增强生成,分析了图数据选择、索引方法、检索模型及生成策略。同时探讨了其在问答、推荐、医疗等领域的下游任务应用,对比了无…