
LLM 驱动的智能体(Agent)应用与实践指南
探讨了大型语言模型(LLM)在智能体(Agent)中的应用与实践。内容涵盖智能体的定义、基本结构及工作原理,详细解析了感知、决策、执行与反馈的闭环流程。文章介绍了客服助手、代码生成、智能 NPC 等典型应用场景,并提供了构建 Agent 的具体步骤,包括模型选择、行为逻辑设计及外部工具集成。重点阐述了 ReAct、规划与反思等 Agentic Workflo…
博客作者
系统架构设计师
325
已发布文章
10K
博客获赞
486K
博客浏览
第 15 页

探讨了大型语言模型(LLM)在智能体(Agent)中的应用与实践。内容涵盖智能体的定义、基本结构及工作原理,详细解析了感知、决策、执行与反馈的闭环流程。文章介绍了客服助手、代码生成、智能 NPC 等典型应用场景,并提供了构建 Agent 的具体步骤,包括模型选择、行为逻辑设计及外部工具集成。重点阐述了 ReAct、规划与反思等 Agentic Workflo…

探讨大学生参与 CTF 竞赛的必要性及其对技术成长的帮助。内容涵盖 CTF 六大方向的选择建议,重点介绍 Web 安全的学习路径,包括基础理论、渗透工具使用、OWASP Top 10 漏洞原理、Google Hacking 技巧及信息收集方法。同时分析 CTF 在提升实战能力、就业竞争力及获取学分方面的价值,并指出竞赛环境与真实攻防的差异,为初学者提供客观的…

10 个有趣且实用的 Linux 命令行工具,包括字符串反转、ASCII 艺术显示、终端动画及管道进度监控等功能。详细说明了各命令的安装方法、基本用法及适用场景,帮助开发者丰富终端体验并提升操作效率。内容涵盖 Ubuntu 与 CentOS 安装差异、常见参数详解及故障排查指南,适合系统管理员与技术人员参考。

梳理了大语言模型(LLM)的入门基础,涵盖必要的数学知识、开发框架及核心模型架构。重点解析了 Transformer 原理、注意力机制、Prompt 工程、检索增强生成(RAG)、微调技术及部署优化方案,为开发者提供系统化的技术成长路线与实践指导。文章详细阐述了从线性代数、微积分到 PyTorch 框架的前置要求,并深入探讨了自注意力机制的数学推导与代码实现…

AI 大模型微调产品经理面试指南涵盖了从技术理解到项目落地的核心考察点。内容包含微调概念辨析、关键影响因素分析、数据质量管理策略以及实际项目经验分享。重点探讨了在资源受限情况下如何平衡模型性能与成本,如何选择微调与检索增强生成(RAG)方案,以及如何建立有效的业务评估指标体系。此外,还补充了关于模型部署监控、伦理风险管控及行业趋势判断等进阶问题,旨在为候选人…

RAG 系统的评估方法。首先分析了 RAG 在数据处理、分块、Embedding 模型选择、Prompt 设计及检索策略等方面的痛点与优化方案。接着深入讲解了 TRIAD 评估框架,涵盖上下文相关性、忠实度及答案相关性三大维度,并详细阐述了精确度、召回率、MRR、MAP 等检索指标的计算方法与适用场景。最后,通过 LangSmith 平台提供了完整的评估实施…

详细解析了 Flutter 与 Dart 开发中的核心面试题,涵盖 Dart 语言基础如扩展方法与 Mixin 机制、事件循环与并发模型 Isolate、Future 与 Stream 的区别;深入阐述了 Flutter 渲染流程、Widget/Element/RenderObject 三者关系及生命周期管理;同时介绍了 Platform Channel 原…

提示工程是通过不更新模型权重来引导大语言模型行为的方法。文章解析了 Prompt 的定义、分类(硬/软提示、在线/离线)、六大要素(任务、上下文等)、工作原理(采样策略如贪婪、Beam、温度参数等)及基本方式(Zero-shot、Few-shot、指令提示)。此外还探讨了思维链、递归提示、自动提示设计及常见实践,并分析了面临的挑战与未来方向,旨在帮助用户掌握…

综述了大规模语言模型在分布式基础设施上的高效训练技术。内容涵盖 LLM 架构特点及 SER 挑战,详细分析了 AI 加速器、高性能网络与存储系统的创新。重点讨论了数据并行、张量并行及流水线并行等策略,以及混合精度、ZeRO 优化器和激活重计算等内存与计算优化手段。此外,文章还介绍了梯度压缩、通信重叠等通信优化技术,以及检查点机制和弹性调度等可靠性保障方案。最…

大语言模型在生产环境中面临成本高和延迟大的挑战,核心原因在于输入输出 Tokens 的数量。优化策略包括将提示词拆分为决策与执行分层架构以减少冗余;优先使用 Python 等传统编程工具处理语言检测、数学计算等简单任务;利用 SQL 或 Python 代替 LLM 进行数据处理;监控最终提示词规模并使用 LangSmith 等工具分析;在 Agent 设计中…

深入解析了嵌入(Embeddings)在机器学习中的核心作用,详细阐述了 Word2Vec 模型的两种架构(CBOW 与 Skip-gram),并逐步演示了从数据准备、词向量初始化到损失函数优化的完整训练流程。内容涵盖向量相似度计算方法及实际代码实现,旨在帮助开发者理解文本向量化原理及其在自然语言处理中的应用。文章补充了负采样优化技术及 Python 实战案…

大模型私有化部署旨在解决数据隐私与合规问题,通过将模型部署于企业内部环境实现数据自主控制。精调则是利用特定领域数据对通用模型进行再训练,以提升其在垂直场景下的表现。文章详细阐述了从通用到行业再到企业定制的分层模型体系,介绍了 Post-pretrain、SFT、RLHF 及 LoRA 等主流微调技术,并梳理了从需求分析、数据准备到部署监控的全流程实施步骤。同…

详细讲解了在微信小程序中集成 AI 聊天功能的完整流程。内容包括安装 mp-html 组件以支持 Markdown 渲染,配置 Bmob 后端云密钥并初始化 SDK,建立 WebSocket 长连接以接收流式文本响应,以及构建包含滚动视图和输入框的前端界面。通过补充缺失的消息处理辅助函数,实现了用户消息发送、AI 流式输出显示及会话管理的闭环,帮助开发者快速…

探讨了利用大语言模型进行代码阅读与理解的实践方案。通过分析封闭域场景下的信息获取需求,提出了基于 Agent 图编排的架构设计,结合流式输出技术实现高效交互。重点阐述了系统提示词构建、上下文管理策略及前后端技术选型,旨在解决传统代码阅读中效率低、理解成本高的问题,为开发者提供自动化辅助工具的设计思路与优化方向。

深入对比了传统 AI 与大模型在算法结构、灵活性、数据规模、任务能力及计算成本等方面的核心差异。文章分析了当前行业现状,引用了斯坦福及国内权威报告,探讨了主流模型的技术特点与产业挑战。同时梳理了大模型时代的人才需求与技能树,涵盖 Python、PyTorch、LangChain 及微调部署等关键技术点,为读者提供全面的技术认知与发展指引。

大型视觉模型(LVM)是专为处理图像或视频数据设计的先进 AI 模型,拥有数百万至数十亿参数。解析了 CLIP、LandingLens 和 Vision Transformer 等主流模型的结构与训练机制,并探讨了其在医疗、自动驾驶、安防等七大领域的商业应用。同时分析了计算资源、数据需求、偏见及隐私等核心挑战,为行业落地提供参考。

基于调研报告分析了 2024 年中国企业 AI 大模型应用现状。文章指出知识密集型场景如营销、客服和知识库是优先落地方向。技术路径涵盖提示词工程、RAG、模型精调和预训练四种方式,企业需根据资源选择合适路径。当前面临模型幻觉、数据安全、算力成本及人才短缺等挑战。企业投入意愿积极但预算谨慎,多集中在 IT 预算的 10% 以内。建议采取小步快跑、数据治理先行及…

利用极简未来平台、腾讯云轻量应用服务器及 Docker 容器技术,低成本搭建基于大模型的 AI 微信聊天机器人的完整流程。内容涵盖平台账号配置、服务器环境初始化、COW 组件 Docker 编排部署及微信号绑定等关键步骤,并详细解析了环境变量配置与安全注意事项,同时解答了关于成本、运维及常见故障的疑问,适合希望快速落地 AI 应用的技术人员参考。

总结了作者历经淘天、字节、蚂蚁、商汤等 20 家国内互联网大厂的大模型岗位面试经历。涵盖 OCR、多模态大模型、指令微调、Transformer 架构等核心技术点的考察细节。文章整理了各公司的具体面试题、Offer 情况及面试体验,并提供了 HR 面试注意事项及核心考点梳理,包括 Self-Attention 实现、OCR 方案对比、推理加速技术等,旨在帮助…

Python 元组是不可变序列类型,用于存储有序数据。相比列表,元组一旦创建无法修改元素,适合多线程环境且创建效率更高。元组的定义语法、索引切片、拼接成员运算、打包解包操作及变量交换技巧,探讨了元组作为字典键和函数返回值的应用场景,并通过 timeit 模块对比了元组与列表的创建性能差异,最后总结了两者在可变性及适用场景上的区别。