第一本给程序员看的AI Agent图书上市了!

第一本给程序员看的AI Agent图书上市了!

AI Agent火爆到什么程度?

OpenAI创始人奥特曼预测,未来各行各业,每一个人都可以拥有一个AI Agent;比尔·盖茨在2023年层预言:AI Agent将彻底改变人机交互方式,并颠覆整个软件行业;吴恩达教授在AI Ascent 2024演讲中高赞:AI Agent是一个令人兴奋的趋势,所有从事AI开发的人都应该关注。而国内的各科技巨头也纷纷布局AI Agent平台,如:钉钉的AI PaaS、百度智能云千帆大模型平台等等。

Agent 是未来最重要的智能化工具。对于程序员来说,是时候将目光转向大模型的应用开发了,率先抢占AI的下一个风口AI Agent

小异带来一本新书《大模型应用开发 动手做 AI Agent》,这本书由《GPT图解》的作者黄佳老师创作,从0到1手把手教你做AI Agent。现在下单享受5折特惠!

www.zeeklog.com  - 第一本给程序员看的AI Agent图书上市了!

点击下方,即可5折起购书

有这样一本秘籍在手,程序员们这下放心了吧,让我们先来揭开 Agent 的神秘面纱。

AI Agent 面面观

先对 Agent 下一个定义:Agent 是一个具有一定程度自主性的人工智能系统。更进一步说,Agent 是一个能够感知环境、做出决策并采取行动的系统。

Agent 具有四大特性:

· 自主性:Agent 能够根据自身的知识和经验,独立做出决策和采取行动。

· 适应性:Agent 能够学习和适应环境,不断提高自己的能力。

· 交互性:Agent 能够与人类进行交互,提供信息和服务。

· 功能性:Agent 可以在特定领域内执行特定的任务。

要从技术上实现上述特性,Agent 通常需要包含四大核心组件。感知器用来收集环境信息;知识库存储和管理有关环境和自身状态的信息;决策引擎分析感知的信息,做出决策;执行器在环境中采取行动。

www.zeeklog.com  - 第一本给程序员看的AI Agent图书上市了!

那么,我们在开发 Agent 时要遵循哪些原则才能收效最佳呢?本书作者引据儒家经典的“博学之,审问之,慎思之,明辨之,笃行之”。 在经过引申之后,为我们阐述了 Agent 方法论。

博学:海纳百川,基于海量数据的训练。

审问:接受清晰明确的指令,即有效的提示工程。

慎思:在精巧设计的模式下认知,配置 CoT、ToT、ReAct 等思维框架。

明辨:明确地遵循人类道德规范,通过指令微调和价值对齐来确保AI安全无害。

笃行:借助 ToolCalls 和 Function Calling 等技术工具与外界交互。

www.zeeklog.com  - 第一本给程序员看的AI Agent图书上市了!

将传统文化中的哲理与现代科技前沿结合,碰撞出智慧的火花,这对处于萌芽阶段的 Agent 技术来说,是十分珍贵的思考。Agent 市场潜力巨大,但目前相关技术资料分散,本书将多项 AI 技术和工具整合到一起,为 Agent 开发提供系统性指导。

作者黄佳,笔名咖哥,现任新加坡科技研究局人工智能研究员,他在 NLP、大模型、AI in MedTech、AI in FinTech 等领域积累了丰富的项目经验。他还著有《GPT图解:大模型是怎样构建的》《零基础学机器学习》《数据分析咖哥十话:从思维到实践促进运营增长》等图书。

www.zeeklog.com  - 第一本给程序员看的AI Agent图书上市了!

在黄佳的书中,他总是以“咖哥”这个角色引出讨论,再以妙趣横生的方式讲解复杂的技术。这是因为他乐于保持好奇心、拥抱变化、持续学习,希望借助AI的“慧眼”和“注意力”来观察世界,并以轻松幽默的方式分享知识,收获本真的快乐。

现在,让咖哥带着我们动手玩转 Agent 开发吧。

动手玩转 AI Agent

对于构建 Agent 来说,目前业界已经具备技术基础,包括大模型和 AIGC 模型、人工智能应用开发框架和工具、软件平台、丰富的数据等。只要结合具体的业务场景,将现有技术进行整合,就能开发出满足需求的 Agent。

本书按照“基础知识——技术工具——项目实战”三部分来组织内容,帮助读者从理论学习推进到动手实际操作。

基础知识

这部分先是定义了 Agent 的概念,然后说明大模型对于 Agent 的重要程度如同大脑,这是 Agent 进行理解和决策的基础。还对 Agent 的四大特性与四大核心组件进行介绍。

书中提到 Agent 可用于自动化办公、客户服务、个性化推荐、医疗保健等领域,将会带来新的商业模式和变革。

www.zeeklog.com  - 第一本给程序员看的AI Agent图书上市了!

技术工具

书中介绍了 Agent 架构的四大要素,分别是规划、记忆、工具、执行。重点介绍了当前流行的 ReAct 框架。详细说明了以下技术工具的使用方法。

· OpenAI API 以及 OpenAI Assistants:用于调用包含 GPT-4 模型 和 DALL·E 3 模型在内的众多人工智能模型。

· LangChain:开源框架,专门用于构建和开发由大型语言模型驱动的应用程序,其中包含对 ReAct 框架的封装和实现。

· LlamaIndex:开源框架,用于帮助管理和检索非结构化数据,利用大模型的能力和 Agent 框架来提高文本检索的准确性、效率和智能程度。

www.zeeklog.com  - 第一本给程序员看的AI Agent图书上市了!

Agent 通过接口连接大模型,获得生成内容、语言理解、决策支持能力,再通过外部工具执行复杂任务,或者与环境交互。

项目实战

工具都会用之后,这部分要讲的就是怎样做出成功的应用,书中详细解析了 7 个项目的实战。

· Agent 1:自动化办公项目,通过 Assistants API 和 DALL·E 3 模型创作 PPT。

· Agent 2:多功能选择的引擎,通过 Function Calling 调用函数。

· Agent 3:推理与行动的协同,通过 LangChain 中的 ReAct 框架实现自动定价。

· Agent 4:计划和执行的解耦,通过 LangChain 中的 Play-and-Execute 实现智能调度库存。

· Agent 5:知识的提取与整合,通过 LlamaIndex 实现检索增强生成 Agent。

· Agent 6:GitHub 的网红聚落,AutoGPT、BabyAGI 和 CAMEL。

· Agent 7:多 Agent 框架,AutoGen 和 MetaGPT。

本书兼具理论与实践,读者可以轻松入门,快速掌握 AI Agent 的开发方法。

结语

自从 ChatGPT 诞生以来,大模型技术在业界可谓炙手可热,人们从最初的惊叹到现在广泛应用,而人工智能的下一个引爆点很有可能就是 AI Agent。

《大模型应用开发:动手做 AI Agent》从零基础出发,介绍了 Agent 的定义、特性与技术架构,还对构建 Agent 的 AI 技术工具进行了详细讲解,最后以 7 个实战项目展示了 Agent 开发的方法。

本书的一大特点是站在技术前沿,结合当下实际需要,提出了一套 Agent 开发的系统性方法论。这在业界具有开创性意义,作者也希望读者通过这本书开启对人工智能应用开发的探索。

实战性强是本书另一大特点,7 个实战项目覆盖了 Agent 开发的多个方面。读者如果在实际工作中遇到困难,都可以在案例中得到启发,或者直接找到解决方案。

在这本书里,我们又见到咖哥和搭档小雪,在轻松幽默的对话中,将各种原理和概念娓娓道来,生动形象地解释了复杂的技术实现过程。即使是讲前沿的 AI 技术,读者也会觉得非常有趣。

www.zeeklog.com  - 第一本给程序员看的AI Agent图书上市了!

本书适合想要转型的程序员、意欲投身 AI 领域的专业研究人员阅读。对 Agent 技术感兴趣的技术爱好者、企业负责人、高等院校师生也都可以从本书中有所收获。

《大模型应用开发:动手做 AI Agent》为我们提供了一个千载难逢的良机,抓住这个机会,成为时代的领航者吧!

www.zeeklog.com  - 第一本给程序员看的AI Agent图书上市了!

点击下方,即可5折起购书

www.zeeklog.com  - 第一本给程序员看的AI Agent图书上市了!

点击文末二维码,限时特惠

5折

www.zeeklog.com  - 第一本给程序员看的AI Agent图书上市了!

Read more

使用本地大模型调用代码,根本就是一场骗局!

使用本地大模型调用代码,根本就是一场骗局!

通过大模型调用其他工具到底可不可行?ChatGPT 或许能轻松搞定一切,但同样的需求落在本地大模型上,恐怕就要打个问号了。 法国开发工程师 Emilien Lancelot 尝试了多款号称具备工具调用功能的 agent 框架,来看看本地大模型到底能不能完成任务,但结果就像他总结的“一无所获”。是什么让这位工程师失望了? 用 AutoGPT,得会点“糊弄学” AutoGPT 是款貌似强大的框架,提供很酷的 CLI 外加 Flutter UI,能够通过浏览器创建 agent。其主要功能是处理用户的文档、音频、视频等本地内容。 但是……它主要依靠 ChatGPT 或其他专有大模型服务来完成繁重工作,至少给我们的感觉是如此。 我们必须“唬弄”AutoGPT 才能使用 Ollama 端点,让其误认为是 ChatGPT。 ## OPENAI_API_KEY - OpenAI API

By Ne0inhk
详细说明Encoder-only架构的特点以及他和encoder decoder的区别和联系

详细说明Encoder-only架构的特点以及他和encoder decoder的区别和联系

Poe Encoder-only 架构的特点 Encoder-only 模型只使用 Transformer 的编码器部分,专注于对输入序列的理解和表征学习。这类模型通常被用在需要对输入文本进行深度理解的任务上,如文本分类、问答和语义匹配。以下是 Encoder-only 架构的核心特点: 1. 双向上下文建模 * 特点:Encoder-only 模型通过自注意力机制(Self-Attention)同时关注输入序列的前后文。 * 优势:相比单向模型(如 Decoder-only),它可以更全面地捕捉输入序列的全局语义,适合需要理解复杂上下文的任务。 * 实现方式:在训练过程中,不对输入序列进行因果掩码(Causal Masking),允许模型在任何位置访问序列的所有位置。 * 例子:BERT 的 Masked Language Model(MLM)训练任务通过随机遮盖部分单词,依赖左侧和右侧的信息来预测被遮盖的词,即双向建模的典型体现。 2. 适用于理解任务 * 特点:Encoder-only 模型专注于理解输入序列,而不生成输出序列,因此适合处理分类、

By Ne0inhk
手把手教学,DeepSeek-R1微调全流程拆解

手把手教学,DeepSeek-R1微调全流程拆解

手把手教学,DeepSeek-R1微调全流程拆解 原创 极客见识  2025年02月09日 09:02 广东 DeepSeek 通过发布其开源推理模型 DeepSeek-R1 颠覆了 AI 格局,该模型使用创新的强化学习技术,以极低的成本提供与 OpenAI 的 o1 相当的性能。 更令人印象深刻的是,DeepSeek 已将其推理能力提炼成几个较小的模型。这篇文章,我们将使用其蒸馏版本之一引导大家完成 DeepSeek-R1 的整个微调过程。 本文章将演示了如何微调其中一个模型(使用我们自己的自定义思维链数据集),然后保存和部署微调后的模型。 高级推理模型微调 DeepSeek 简介 DeepSeek-R1 是由深度求索(DeepSeek)公司开发的突破性推理模型。DeepSeek-R1 基于 DeepSeek-V3-Base(总共 671B 个参数,每次推理 37B 处于活动状态)构建,使用强化学习 (RL) 在提供最终答案之前生成思路链

By Ne0inhk