
Spring AI 接入 Agent Skill 实战教程
介绍如何在 Spring AI 框架下接入 Agent Skill。内容包括环境依赖配置(Maven)、Skill 文件结构定义(SKILL.md)、Controller 中注册 SkillsTool 的代码实现,以及源码层面的加载与调用机制分析。通过解析 SKILL.md 元数据并生成工具回调,实现大模型对自定义技能的动态发现与执行。
博客作者
战无不胜
350
已发布文章
11K
博客获赞
741K
博客浏览
第 5 页

介绍如何在 Spring AI 框架下接入 Agent Skill。内容包括环境依赖配置(Maven)、Skill 文件结构定义(SKILL.md)、Controller 中注册 SkillsTool 的代码实现,以及源码层面的加载与调用机制分析。通过解析 SKILL.md 元数据并生成工具回调,实现大模型对自定义技能的动态发现与执行。
whisper.cpp 项目中 ggml-large-v3.bin 模型参数文件的第四部分。该文件为压缩分卷的一部分,需与其他三个部分结合使用以加载完整模型。内容包含文件描述、注意事项及合法使用建议,适用于具备一定技术背景的自然语言处理用户。

Llama-Swap,一个轻量级开源代理服务,用于在本地运行多个大语言模型(LLM)时实现动态切换。通过监听 OpenAI 风格 API 请求,它可根据模型名称自动启动或停止对应的 llama-server 进程,支持资源分组管理。文章提供了环境准备、安装步骤、配置文件编写及 API 调用测试的完整指南,帮助用户在本地低成本、高隐私环境下灵活部署多模型服务。

LazyLLM 是一款由商汤大装置推出的开源低代码框架,旨在简化多 Agent 应用的开发与优化。 LazyLLM 的环境搭建、依赖安装及核心原理,并详细演示了如何基于该框架构建代码专家智能体。内容包括初始化配置、功能模块定义、数据流管道串联以及 Web 服务部署。测评结果显示,使用 LazyLLM 可显著降低开发成本,提升代码生成与修复效率,支持本地与在线…

探讨了 AI 绘画技术在商业领域的应用,涵盖广告设计、插画创作及游戏设计三大场景。在广告中,AI 可快速生成创意概念并实现个性化素材;插画领域能显著提效降本,并与传统手绘结合;游戏设计则用于场景、角色及道具的快速原型制作。此外,文章分析了 AI 绘画面临的版权归属争议及数据使用合规性问题,指出需完善法律法规以保障行业健康发展。最后提供了基于 Python 的…
众趣科技、大疆创新、瞰景科技、大势智慧、飞燕遥感及埃洛克航空六家主流无人机倾斜摄影三维建模服务商。涵盖其核心技术特点如空地一体化、软硬件协同、集群处理能力及底层算法优化,并通过表格对比了各家的产品定位、应用场景与突出优势。文章总结了行业从空中建模到空地融合、桌面软件到云原生平台、几何重建到语义理解的发展趋势,为技术决策者提供选型参考。
解决了 VSCode 通过 SSH 远程连接服务器时,GitHub Copilot 无法显示或调用 Claude 系列模型的问题。虽然开启代理后本地使用正常,但远程环境下模型选项会消失。解决方案是在远程服务器的 settings.json 配置文件中添加 http.useLocalProxyConfiguration 为 true 的配置项,并区分于用户设置…
对比分析了六款主流 AI 代理工具:Claude Code、Cowork、OpenCode、OpenWork、OpenClaw 和 Codex。文章从出身背景、核心定位及开源情况入手,详细阐述了各工具在终端操作、桌面自动化、系统级控制及多智能体协作方面的差异。总结指出,AI 正从对话转向执行,用户需掌握指挥 AI 团队的能力,而非单纯比拼编码速度。

宇树 G1 机器人的两种开发连接方式:有线直连与无线 SSH。有线连接通过网线配置固定 IP(192.168.123.X),适合底层调试;无线连接需将机器人接入同一 WiFi,通过 SSH 远程登录(默认账号 unitree/密码 123)。文章包含网络配置步骤、IP 验证方法及常见问题排查建议,旨在帮助开发者快速建立稳定的开发环境。
对非科班转码背景的学习者,梳理了从零开始掌握人工智能技术的四阶段路径。涵盖基础准备(Python、数学)、AI 基础(机器学习、深度学习框架)、进阶学习(高级模型、领域应用)及实战应用(项目部署、优化)。推荐了 Coursera、书籍及开源社区等资源,并强调项目驱动、持续学习与心态管理的重要性,旨在帮助学习者克服基础薄弱挑战,系统性地构建 AI 能力。
介绍如何为 PP-DocLayoutV3 WebUI 注入自定义 CSS 样式,以适配企业内网 UI 规范和品牌色。内容包括 WebUI 结构解析、样式文件定位、多种注入方法、深色模式适配、品牌色系一体化方案及响应式布局优化。通过定制 CSS 变量和选择器,实现界面风格统一,解决视觉割裂感,并提供维护策略与常见问题排查步骤。

本项目介绍了一种基于改进YOLO深度学习模型与DeepSeek大语言模型的河道环境智能检测与分析系统。系统采用Vue3前端、SpringBoot后端及Flask中台架构,结合PyTorch深度学习框架,支持单图、批量图片、视频及实时摄像头等多种输入方式。功能涵盖漂浮物、污染物、生物目标等高精度检测,并集成AI智能分析模块生成治理建议与报告。技术实现包括骨干网…
国内常用的 Stable Diffusion 和 LLaMA 模型镜像站点,如清华 TUNA、阿里云 ModelScope 等,解决了直连下载慢的问题。文章提供了镜像站链接替换方法及脚本示例。同时详细讲解了基于 LoRA 的微调工作流,包括数据准备、参数配置、训练启动和部署步骤。此外还总结了显存溢出、训练效果差等常见问题的解决方案,帮助开发者利用消费级硬件完…

介绍如何使用 LlamaIndex 集成 Llama API。涵盖环境配置、依赖安装及密钥设置。通过代码示例演示了文本补全、对话交互、函数调用及结构化数据提取功能。利用 Pydantic 模型定义数据结构,结合 OpenAIPydanticProgram 实现非结构化文本解析。方案支持 OpenAI 兼容接口,无需本地部署,便于快速构建 Llama 2 应用…
QClaw 是基于 OpenClaw 框架的 macOS 桌面 AI 助理应用,核心理念是将 AI 融入工作流。它支持本地 Gateway 服务、技能系统、多渠道接入和工作区记忆。安装简单,通过 dmg 文件拖拽完成。功能包括直接执行系统命令、集成日历邮件网页浏览等扩展能力、浏览器自动化操作。记忆系统维护长期记忆文件,记住用户偏好。支持微信 Telegram…

全面解析了 Coze 开源 AI Agent 开发平台,介绍了其核心价值、智能体构建、工作流自动化、知识库管理及部署功能。通过实例演示了如何搭建一个成语视频生成的 AI Agent 工作流,涵盖提示词编写、图像生成、视频合成等步骤。文章对比了在线版与开源版 Coze 的优缺点,包括功能完整性、数据安全、定制化能力及适用人群,为开发者选择合适的部署方案提供参考…

介绍开源 AI 助手 OpenClaw 的安装流程及飞书机器人接入方法。涵盖 Node.js 环境配置、PowerShell 权限设置、一键安装命令执行、AI 模型 API Key 配置以及飞书应用创建与插件部署。包含常见问题解答如 npm 报错处理,帮助用户实现通过即时通讯软件控制本地任务的自动化功能。

ToClaw 作为数字助理的价值,对比了其与仅能聊天的 AI 的区别。文章指出 ToClaw 具备技能系统、定时任务和记忆功能,能结合 ToDesk 远程办公场景执行具体任务。结论认为 ToClaw 代表了 AI 从咨询顾问向长期待命助手的转变,更适合普通用户日常使用。

实测了谷歌 Gemini Pro 模型的核心能力。在功能上,它支持原生多模态处理(文本、图像、音频、视频协同),具备复杂的逻辑推理与纠错能力,并能辅助多种编程语言的代码生成与调试。应用场景涵盖科研数据处理、自媒体内容创作及办公效率提升。对比主流 AI,Gemini Pro 在多模态协同与响应速度上表现突出,适合日常综合使用;而 ChatGPT-4 在长文档深…

自动写作助手的背景需求与技术选型,涵盖功能全面性、数据准确性及架构设计流程。详细阐述了模型训练优化策略,包括强化训练、数据迭代、人机交互及多领域知识支持。最后通过 Python 和 C 语言的基础代码案例展示了编程在相关项目中的应用,并展望了教育、商业及科研领域的未来发展趋势。