
大模型微调(Fine Tuning)通俗解读
深入解析了大模型微调(Fine Tuning)的核心概念、应用场景及技术路线。文章首先阐述了微调的定义及其相对于 Prompt Engineering 的优势,包括降低成本、提升领域适应性及保障数据安全。随后详细介绍了全量微调(FFT)与参数高效微调(PEFT)的区别,重点讲解了 Prompt Tuning、Prefix Tuning、LoRA 及 QLoR…
博客作者
大数据开发工程师
318
已发布文章
6.8K
博客获赞
336K
博客浏览
第 15 页

深入解析了大模型微调(Fine Tuning)的核心概念、应用场景及技术路线。文章首先阐述了微调的定义及其相对于 Prompt Engineering 的优势,包括降低成本、提升领域适应性及保障数据安全。随后详细介绍了全量微调(FFT)与参数高效微调(PEFT)的区别,重点讲解了 Prompt Tuning、Prefix Tuning、LoRA 及 QLoR…

大语言模型的四种主流微调技术:SFT 监督微调、LoRA、P-tuning v2 以及 Freeze。SFT 通过复制源模型参数并微调输出层,适合数据充足场景但成本高。LoRA 通过低秩分解矩阵注入,仅训练少量参数,显著降低显存消耗且无推理延迟。P-tuning v2 改进了 P-tuning v1,通过多层 prefix 和多任务学习解决序列标注任务问题。…

深入分析了 Android EventBus 框架的源码实现。文章首先介绍了 EventBus 的基本用法及与广播的区别,阐述了其基于观察者模式的原理。随后详细剖析了 register、post、unregister 三大核心方法的源码流程,包括单例模式、订阅方法查找、线程模式分发机制以及粘性事件处理。重点解释了 CopyOnWriteArrayList 在…

大模型幻觉指生成虚假、误导或无关答案的现象,可能源于训练数据缺失或误解。常见类型包括无意义输出、无关输出、提示矛盾、句子矛盾及事实矛盾。检索增强生成(RAG)是一种无需重新训练模型即可减轻幻觉的有效策略。RAG 通过检索、增强、生成三步流程,利用外部知识库增强模型上下文。设计有效 RAG 需关注提示词、知识库、嵌入模型及向量存储四大组件。优化方向包括改进提示…

AI 大模型学习涵盖提示工程、检索增强生成、模型微调及部署。梳理了从零基础到商业闭环的系统化路径,包括 Prompt 优化技巧、RAG 架构搭建、LoRA 微调方法及 vLLM 部署实践,旨在帮助开发者构建垂直领域应用并理解底层原理。

基于 Mistral 7B 和 Llama2 7B 开源模型构建本地 AI 聊天机器人的完整流程。内容涵盖环境配置、使用 ctransformers 加载 GGUF 量化模型、实现流式输出以提升交互体验、利用 Panel 库构建 Web 聊天界面,以及通过 LangChain 框架进行高级集成。文章还提供了多模型对比方法和性能优化建议,旨在帮助开发者在本地资…

详细演示了如何在本地环境部署谷歌开源大模型 Gemma,涵盖 Ollama 安装、模型拉取及 JAN AI 界面配置流程。同时分析了不同参数量模型对显存的要求,并结合 CUDA 生态提供显卡选购建议,帮助用户实现低成本、高隐私的本地 AI 推理体验。

LoRA(Low-Rank Adaptation)是一种用于大语言模型微调的高效技术,通过更新低秩矩阵减少计算量。基于 Sebastian Raschka 的研究,详细讲解了从零构建 LoRA 层的 PyTorch 实现方法。实验使用 DistilBERT 模型在 IMDb 数据集上进行文本分类,结果显示 LoRA 测试准确率达 92.39%,优于仅微调最后…

Agent 是能够自主规划并执行任务的系统,区别于预定义的工作流。构建 Agent 需权衡延迟与成本,仅在必要时引入复杂性。核心模式包括增强型 LLM、提示链、路由、并行化、协调器 - 工作器及评估器 - 优化器。Agent 适用于开放式问题,需配合沙盒测试与安全护栏。最佳实践包括保持设计简洁、优先透明度及精心设计工具接口。客户支持与编码是典型应用场景。

讲解 LangChain 中 OutputParser 的用法及 LCEL 链的构建。OutputParser 负责将 LLM 非结构化输出转为格式化数据,支持内置列表解析和自定义 Pydantic 模型。LCEL 通过管道符组合 Runnable 组件,简化代码逻辑。相比传统 invoke 方式,LCEL 提供更简洁高效的链式调用体验,适用于复杂应用开发。

精选了五本关于 AIGC、AGI 及 ChatGPT 的核心书籍,涵盖软件开发、算法原理、深度学习基础、教育应用及通用人工智能未来展望。同时提供了从系统设计、提示词工程、RAG 应用到微调开发的七阶段学习路径,旨在帮助读者系统掌握大模型技术,构建全栈工程能力,应对行业变革。

梳理了大模型(LLM)学习的完整路径,涵盖机器学习数学基础、Python 编程、神经网络与自然语言处理。重点介绍了大型语言模型的架构原理、指令数据集构建、预训练与微调技术(SFT、LoRA、RLHF)、评估与量化方法。此外还包含工程师视角的部署方案、向量存储、RAG 高级应用及推理优化策略,为开发者提供从理论到实践的系统性指导。

详细解析了 Python 爬虫技术的核心难点,包括数据规模、动态内容反爬、稳定性维护及法律合规问题。文章提供了从基础语法、网络协议、解析技术到 Scrapy 框架的学习路径,并给出了 HTTP 请求、HTML 解析及项目部署的代码示例。重点强调了遵守 Robots 协议、控制请求频率及数据脱敏的最佳实践,旨在帮助开发者构建稳定、高效且合法的爬虫系统。

在 Windows 操作系统上安装和配置 Python 环境的完整流程。内容涵盖系统架构确认、Python 版本选择、官方安装包下载、安装过程中的环境变量设置关键点、安装后的验证步骤、Pip 镜像源配置、虚拟环境的使用以及常见报错的排查方法。文章旨在帮助用户建立规范的 Python 开发基础环境,确保后续编程工作的顺利进行。

对普通程序员如何系统掌握大模型技术提供了详细的学习路线与知识体系。文章首先分析了 AI 浪潮下的职业焦虑与机遇,提出了工程优先、场景驱动的学习策略。核心内容包含七个阶段的学习路径:从 Transformer 基础与系统设计,到提示词工程,再到基于 LangChain 的知识库应用开发、模型微调(LoRA/QLoRA)、多模态处理及行业商业化落地。此外,还梳理…

详细阐述了AI产品经理的角色定位、核心能力模型及系统化学习路径。内容涵盖Python编程基础、机器学习与深度学习原理、AI产品设计与项目管理流程,以及实战项目经验与职业发展建议。旨在帮助从业者构建完整的技术与产品知识体系,适应AIGC时代的职业需求。

Leap AI 是一款基于 Stable Diffusion 模型的图像生成工具,提供网页端和 API 接口。它支持多种模型版本如 Realistic Vision,具备步长、批量生成等参数调节功能。相比 Midjourney,Leap 在免费试用和价格策略上更具优势,但在全身照一致性上仍有提升空间。文章详细介绍了其使用方法、API 集成方式及定价模式。

详细梳理了大模型工程师的核心知识体系,涵盖 NLP 基础、预训练、微调、推理优化、主流架构及应用开发六大板块。内容涉及分词算法、Transformer 架构原理、LoRA 高效微调、FlashAttention 加速及 RAG 检索增强生成等关键技术点,旨在为学习者提供系统化的进阶路径与工程实践参考。

介绍大语言模型(LLM)的基本概念、发展历程及应用能力,并详细解答了关于 LLM 架构、训练目标、涌现能力及优化策略等 10 道核心面试题。内容涵盖 Prefix LM 与 Causal LM 的区别、Decoder-only 结构优势、长文本处理方案以及不同模型选型依据,旨在帮助开发者深入理解 LLM 技术原理与面试考点。

探讨大型语言模型(LLM)性能优化的核心方法。重点介绍提示工程(Prompt Engineering)的实用技巧与框架(如 ICIO、BROKE、CRISPIE),分析如何通过本地知识库构建结合检索增强生成(RAG)技术解决幻觉问题。同时阐述利用 LangChain 落地 RAG 及工作流(Workflow)与智能体(Agent)的应用实践,为开发者提供从理…