
LangChain 实战:工具调用与结构化输出
文章目录 工具调用(Tool Calling) Tool 创建的三种方式 1.1. 直接用 @tool 装饰函数 1.2. 用 @tool + 自定义参数结构(Pydantic) 1.3. 继承 BaseTool 写类 本地自定义工具 2.1 定义工具 2.2 绑定工具到模型 2.3 工具调用流程 2.4 AI 响应结构解析 第三方工具集成(Tavily 搜索) 3.1 集成第三方工具 3.2 多…

文章目录 工具调用(Tool Calling) Tool 创建的三种方式 1.1. 直接用 @tool 装饰函数 1.2. 用 @tool + 自定义参数结构(Pydantic) 1.3. 继承 BaseTool 写类 本地自定义工具 2.1 定义工具 2.2 绑定工具到模型 2.3 工具调用流程 2.4 AI 响应结构解析 第三方工具集成(Tavily 搜索) 3.1 集成第三方工具 3.2 多…

一、项目概述 OpenViking 是字节跳动开源的 AI 代理上下文数据库,专门解决复杂 AI 代理系统中的上下文管理难题。传统 RAG 方案在长期、多步骤任务中面临成本高、效率低的问题,OpenViking 通过文件系统范式和三层加载策略,显著提升性能并降低成本。将详细讲解 OpenViking 的部署、配置和实战应用。 二、环境准备 2.1 系统要求 操作系统:Linux/Windows…

综述由AI生成什么是多模态 AI 多模态 AI 是指能够同时处理**文本、图像、音频、视频**等多种不同类型数据的人工智能系统,它打破了单模态 AI 的信息壁垒,能更贴近人类理解世界的方式。比如我们日常使用的 AI 聊天机器人识图功能、视频自动字幕生成工具,都是多模态 AI 的典型应用。 开发前的核心准备 **模型选型建议** | 模型类型 | 推荐模型 | 适用场景 | | --- | --- | --- |…

Llama-2-7b 昇腾 NPU 测评总结:核心性能数据、场景适配建议与硬件选型参考  背景与测评目标 以 Llama-2-7b 为对象,在昇腾 NPU 环境中完成从依赖安装到模型部署的全流程落地,并通过六大维度测…
综述由AI生成Stable Diffusion 2024:技术突破与商业落地的开源实践 导语 Stable Diffusion 4.0 于 2024 年 11 月正式开源,通过三段式生成流程与移动端部署突破,重新定义了 AI 图像生成的技术边界与商业价值。 行业现状:开源与闭源的双轨竞争 2024 年全球 AI 内容生成市场规模突破 150 亿美元,年复合增长率保持 30% 以上。在这一赛道中,Stable D…
ClawdBot 效果展示:语音输入→Whisper 转写→多语言翻译端到端演示 这不是'又一个 AI 助手',而是一套可落地的本地化多模态工作流 你有没有遇到过这样的场景: 听国际会议录音,想边听边看中文实时字幕; 收到一段外语语音消息,需要快速理解内容并回复; 群里有人发来一张带外文的说明书图片,你得立刻识别 + 翻译 + 查术语。 这些需求,过去要么依赖云端服务(隐私没保障、网络不稳就卡住)…
Pixel Fashion Atelier 部署教程:Stable Diffusion 像素时装生成 项目介绍 Pixel Fashion Atelier 是一款基于 Stable Diffusion 与 Anything-v5 模型的像素风格时装生成工具。它将 AI 图像生成与复古日系 RPG 界面设计完美结合,为用户带来独特的创作体验。 **核心特点**: 专为像素艺术优化的生成模型 直观的…

综述由AI生成前言 世界模型 (World Model) 展示了如何通过在生成的想象环境中进行实验来训练模型 (而不是在真实环境中进行训练),从而学习如何执行特定任务。世界模型很好的说明了如何将生成模型与其他机器学习技术 (如强化学习) 相结合使用解决实际问题。 该架构的关键组成部分是生成模型,它可以根据当前状态和动作构建下一个可能状态的概率分布。该模型通过随机运动建立对基本物理环境的了解之后,该模型能够完全依…
鹏城实验室盘古大模型轻量化训练:Llama-Factory 辅助方案 在大模型落地应用的浪潮中,一个现实问题始终困扰着科研机构与企业团队:如何在有限算力条件下,高效完成百亿参数级模型的领域适配?鹏城实验室推进'盘古大模型'项目时就面临这一挑战——全参数微调动辄需要数十 GB 显存和多卡并行,普通研发环境难以支撑。正是在这种背景下,基于 **Llama-Factory** 框架的轻量化训练路径脱颖而…
AIGC 率:一个开发者必须面对的质量指标 最近在项目里用 ChatGPT 这类大模型生成内容时,总被一个词困扰——AIGC 率。简单来说,它衡量的是生成内容与模型训练数据中已有内容的相似度,或者说'机器味儿'有多浓。对于开发者而言,高 AIGC 率不仅意味着内容可能缺乏新意、流于模板化,在严肃的应用场景(如知识输出、创意写作、代码生成)中,更可能引发原创性不足、甚至潜在的合规风险。因此,学会通过…
开发背景 档记录基于 Python 和 Tkinter 构建集成 DocsGPT 与 OpenAI API 的本地 AI 代码助手开发过程。主要目标是通过本地 API 调用实现代码编辑、运行及智能问答功能。 功能需求 **界面布局**: 左侧:Python 代码编辑区(支持多行输入、语法高亮、Run 按钮)。 右侧:GPT 调用区(提问输入、答案显示、历史记录)。 **核心功能**: 支持本地…

模型特性 Qwen3-VL 是由阿里云 Qwen 团队开发的多模态大语言模型系列,具备以下核心能力: **空间感知能力大幅提升**:2D grounding 从绝对坐标变为相对坐标,支持判断物体方位、视角变化、遮挡关系,能实现 3D grounding,为复杂场景下的空间推理和具身场景打下基础。 **OCR 支持更多语言及复杂场景**:支持的中英外的语言从 10 种扩展到 32 种,覆盖更多国家和…
先说如何解决,我个人采用源码安装,安装时禁用构建隔离: git clone https://github.com/openai/whisper.git cd whisper git checkout v20231117 pip install -e . --no-build-isolation 再说该问题产生的原因,下面是详细分析。 🔍 问题根源分析 问题的关键在于 **PEP 517/518…
SeargeSDXL AI 绘画工作流使用指南 你面临的 AI 绘画难题 当你开始接触 AI 绘画时,是否经常遇到这些问题:生成效果不稳定,参数调节复杂,高分辨率图片质量下降,多模型切换困难?这正是 SeargeSDXL 要为你解决的核心痛点。 作为 ComfyUI 平台上的专业级 AI 绘画工具,SeargeSDXL 通过精心设计的工作流系统,将复杂的 AI 绘画过程转化为直观的可视化操作。无论…
OpenDroneMap 实战教程:从无人机照片生成专业地图 OpenDroneMap 是一款革命性的开源无人机数据处理工具,能够将普通的航拍照片自动转换为专业级的地理空间产品。无论您是测绘新手、农业从业者,还是城市规划师,都能通过这个强大的工具包实现从图像到地图的完整工作流。 快速入门:10 分钟启动项目 **最简单部署方案** 使用 Docker 容器是最推荐的安装方式,只需几个简单命令: 将…
Unitree 机器人强化学习部署全流程:从仿真训练到实体控制 项目架构深度解析 Unitree RL GYM 采用模块化设计,核心代码组织清晰。在 legged_gym 目录下,您可以看到完整的训练和部署架构: **环境配置模块**:envs/base/ 包含基础配置和任务定义 **机器人专用模块**:envs/g1/、envs/h1/等分别对应不同型号 **训练执行脚本**:scripts/t…

综述由AI生成> **论文原文 (Paper)**:https://arxiv.org/abs/2411.00485 目录 核心思想 背景与动机 主要贡献点 方法细节 即插即用模块的作用 核心思想 对无人机航拍图像中**目标尺寸多变、遮挡严重、光照复杂**等挑战,提出了一种名为 **LAM-YOLO** 的新型目标检测模型。该模型以 YOLOv8 为基础,引入了 **光照 - 遮挡注意力机制 (LAM)*…
综述由AI生成摘要 原文翻译 推荐系统在我们的日常生活中变得越来越重要,有助于缓解各类面向用户的在线服务中的信息过载问题。大语言模型(LLMs)的出现取得了显著成就,展现出其推动下一代推荐系统发展的潜力。尽管取得了这些进展,基于大语言模型的推荐系统仍面临源于其模型架构的固有局限性,尤其是幻觉问题(生成虚假信息)以及缺乏最新知识和领域特定知识的问题。近年来,检索增强生成(RAG)技术受到了广泛关注,它通过利用外部…
综述由AI生成OpenClaw 飞书机器人权限配置与安全指南 为了确保 OpenClaw 既能顺畅运行,又不至于因权限过大导致安全隐患,建议在飞书开发者后台 - 权限管理中,按照以下清单进行勾选。 这份清单分为基础必备和进阶功能两部分: 基础必备权限 无论个人还是团队,必须开启。这些权限保证机器人能'听到'指令并'开口'说话: im:message:p2p_msg:readonly (接收单聊消息) —— 允许…

前端加密 encrypt-labs 靶场实战涵盖环境搭建、插件配置及多类加密算法破解。通过 Docker 部署靶场,利用 Galaxy 和 autoDecoder 插件实现请求加解密自动化。解析 AES 固定 Key、服务端获取 Key、RSA 加密、混合加密、DES 规律 Key、明文加签及防重放等关卡原理。结合浏览器栈跟踪定位混淆代码,使用 Python 脚本模拟客户端逻辑完成爆破,理解前端防护核心机制与绕过方法。