
大模型微调与 RAG 的区别是什么?
对比了大模型微调与 RAG 技术的核心差异。微调是通过预训练模型在特定任务数据上继续训练以优化参数,适用于小数据集、领域特定及复杂任务,但成本高且更新困难。RAG 结合检索与生成,通过外部知识库更新知识,具备成本低、易维护、多任务支持好的优势,适合知识频繁变动场景。两者选择需根据任务需求、数据规模及资源预算权衡。
博客作者
撸猫日常
310
已发布文章
12K
博客获赞
1.1M
博客浏览
第 15 页

对比了大模型微调与 RAG 技术的核心差异。微调是通过预训练模型在特定任务数据上继续训练以优化参数,适用于小数据集、领域特定及复杂任务,但成本高且更新困难。RAG 结合检索与生成,通过外部知识库更新知识,具备成本低、易维护、多任务支持好的优势,适合知识频繁变动场景。两者选择需根据任务需求、数据规模及资源预算权衡。

Python 爬虫技术涵盖网站开发、数据分析、人工智能等多个应用方向。文章介绍了 Python 基础安装配置、常用框架如 Scrapy、Django 及 Flask 的应用场景。就业方面涉及开发工程师、爬虫工程师及数据分析师岗位,北京地区薪资范围大致在 15K 至 26K 之间。此外还探讨了通过爬虫和数据分析进行外包兼职的可行性、收费模式及接单平台推荐。学习…

Windows 环境下 Python 开发环境搭建指南,涵盖 Python 解释器安装、VS Code 与 PyCharm 集成开发环境配置、中文语言包及插件安装步骤。包含环境变量设置、软件重启验证及两款工具的功能差异对比,帮助初学者快速完成开发工具准备。

AI 产品经理与通用产品经理在思考框架上相似,但在思维模式、技能要求及业务载体上存在差异。成为 AI 产品经理需理解 AI 应用场景、数据重要性及评价指标。学习路径涵盖初阶应用、高阶应用(如 RAG)、模型训练及商业闭环四个阶段,重点在于掌握 AI 技术体系、数据运营能力及大模型部署方案,以适应行业对 AI 解决方案的需求。

Webmin 1.997 版本之前存在任意命令执行漏洞(CVE-2022-36446)。该漏洞需要身份验证且账户需拥有软件包更新模块权限。攻击者可通过构造特定请求在 update.cgi 接口注入系统命令,以 root 权限执行。修复方法为升级至 1.997 及以上版本或应用官方补丁。详细阐述了漏洞原理、复现步骤及 POC 规则编写。

AI 大模型如 Sora 的发布对多个行业产生深远影响,同时也带来就业结构变化。普通人应深耕垂直领域,提升深度思考能力以构建竞争力护城河。算力付费将成为常态,单人独角兽模式可能兴起。投资建议上,全球股市中 AI 上游硬科技公司表现确定,推荐关注费城半导体 ETF。个人发展方面,掌握大模型技术至关重要,相关岗位薪资持续走高,建议系统学习以提升职业竞争力。

基于大型语言模型(LLM)进行产品开发的完整流程,涵盖规划、构建、部署与监测四个阶段。通过自营电商商品描述生成器的案例,详细阐述了如何识别业务场景、选择模型、设计结构化提示词以及集成 API 部署。文章强调了品牌指南在提示词中的重要性,并探讨了针对多商户 SaaS 平台的个性化提示词设计策略,旨在帮助产品经理有效利用 LLM 技术优化产品体验与效率。

LangChain 是构建 LLM 应用的开源框架,通过模块化组件(模型、提示词、索引、记忆、链、代理)简化开发。 LangChain 核心概念,展示基于人脸识别场景的智能排查助手实战案例,涵盖工具定义、向量检索及 Agent 执行流程。此外,探讨了智能体发展趋势,包括 Gorilla、ToolLLaMa 等增强工具调用能力的模型,以及 MetaGPT、Ch…

详细解析了 Android 开发中 CoordinatorLayout 的使用方法与核心机制。文章介绍了 CoordinatorLayout 配合 AppBarLayout、CollapsingToolbarLayout、NestedScrollView 等组件实现的各种滚动与折叠效果,包括浮动按钮、Toolbar 扩展收缩、视差效果及 ViewPager…

精选了六本 Python 学习经典书籍,涵盖从零基础入门到高级进阶的不同阶段。《Python 编程:从入门到实践》适合初学者建立兴趣与基础;《Python 基础教程》提供扎实的语法讲解;《流畅的 Python》帮助中高级开发者掌握语言特性写出地道代码;《Python 编程快速上手》侧重自动化任务实践;《Python 核心编程》深入剖析网络、数据库等核心模块;…

探讨了 Python 在兼职接单与日常办公自动化中的实际应用。内容涵盖网络爬虫获取数据、Excel 报表自动化处理以及数据分析可视化等核心场景。通过具体代码示例,展示了如何利用 Python 提升工作效率并实现技能变现,同时提供了系统化的学习路径建议,帮助开发者掌握通用编程技能以应对职业挑战。

AI 产品经理是在通用产品经理基础上增加运用 AI 技术解决客户问题能力的角色。主要涵盖视觉、机器学习、应用及语义四大类别。转型需掌握机器学习原理、特征学习及算法逻辑,具备全局思维与跨团队协作能力。市场分析显示大厂要求具备 AI 技术背景或沟通无障碍能力。建议通过大模型系统设计、提示词工程、平台开发、知识库应用、微调开发及多模态应用等七个阶段进行系统性学习,…

探讨了体制内工作人员如何利用大语言模型提升工作效率。重点介绍了使用大模型处理会议纪要和数据分析的具体方法,包括语音转文字、文档摘要生成及数据可视化。同时强调了数据安全与隐私保护的重要性,并提供了从入门到进阶的学习路径建议,帮助读者掌握 AI 工具以优化日常工作流程。

OpenAI COO Brad Lightcap 在访谈中指出,广泛允许员工使用 AI 工具是企业落地的最大催化剂,而非仅由高层推动。他认为全球经济具有弹性,AI 应用不会导致大规模失业,反而能创造新机会,当前重点在于加速技术应用。模型发展速度将加快,未来多模态模型将成为用户的得力队友。企业案例显示,Klarna 利用 AI 提升客服效率,Moderna 则…

针对汽车保养场景下复杂表格文档碎片化及非结构化数据导致的智能问答效果不佳问题,提出基于多 Agent 系统的解决方案。通过梳理大模型架构与'变与不变'的思考,确立以模型、平台为核心,Agent、Prompt 为要素的实施原则。方案采用文档解析(大模型版)+ 百炼组合 RAG 进行可行性验证,发现准确率不足后,引入多智能体架构,利用车型改写、意图识别、Serv…

深入剖析了 RWKV(Receptance Weighted Key Value)模型架构,探讨了其如何结合 RNN 的线性复杂度与 Transformer 的并行计算优势。文章回顾了从 RNN、LSTM、GRU 到 Transformer 的演进历程,详细解析了 RWKV 的 Time-Mix 和 Channel-Mix 模块原理,并通过代码示例展示了推理…

从城乡规划转行至大模型公司担任提示词工程师,经历了从传统设计院高压环境到科技公司相对灵活氛围的转变。文章详细描述了 Prompter 岗位的核心职责,包括设计高效提示词、利用低代码平台构建应用以及应对模型幻觉、逻辑推理弱等技术挑战。对比了薪资变化与工作压力,指出大模型赛道虽充满不确定性且需持续学习,但作为生产力工具已显著提升工作效率。作者认为大模型是第四次科…

DeepSeek-V3 是一款性能卓越的混合专家(MoE)语言模型,总参数量 671B,激活参数 37B。文章详细解读了其基于 MLA 的高效推理架构和 DeepSeekMoE 的经济高效训练方案。重点介绍了无辅助损失负载均衡策略和多 token 预测(MTP)训练目标。通过 FP8 混合精度训练和 DualPipe 流水线并行优化,实现了低成本高效率的训练…

如何利用 CrewAI 框架结合 Google Gemini 1.5 大模型构建多智能体系统。通过定义主题研究员、博客作者和 LinkedIn 帖子创作者三个智能体,实现从网络搜索到内容生成的自动化流程。文章涵盖了环境配置、智能体与任务定义、流程运行及优化建议,展示了 AI Agent 在内容创作领域的应用潜力。

Meta 发布的新一代开源大语言模型 Llama 3。文章涵盖了 Llama 3 的两个主要版本(8B 和 70B)及其指令调优版,重点分析了其架构改进,包括扩展至 128k 的词汇表、分组查询注意力(GQA)机制以及 8000 Token 的上下文窗口。文中提供了基于 Transformers 库的代码示例,展示了如何进行基础推理、量化部署(4-bit)以…