跳到主要内容
极客日志极客日志
首页博客AI提示词GitHub精选代理工具
搜索
|注册
极客日志

极客日志

面向效率的开发者社区

站内导航

  • 首页
  • 工具箱
  • 博客

快速链接

  • 全球AI模型中转站:Crex
  • 大模型:Hugging Face
  • Stack Overflow
  • MDN

联系我们

  • 技术支持:[email protected]
  • 商务合作:[email protected]
  • 投诉举报:[email protected]

© 2026 极客日志 · zeeklog.com

隐私政策|用户服务条款|关于我们
重置
编程语言 / Python

标签

全部标签AIGPT-image-2javaNode.jsNuctPayPPT制作React NativeRNSaaSVScodeWeChat大前端算法

分类

全部分类
编程语言
PythonJavaScriptTypeScriptJavaKotlinGo / GolangRustC++CC#F#PHPRubySwiftObjective-CScalaClojureElixirErlangHaskellDartLuaPerlRJuliaMATLAB / OctaveSQLShell / BashPowerShellHTML / CSSZigNimCrystalGroovyVisual Basic .NETSolidity汇编

排序

最新更新最新发布最多浏览最多点赞
LangChain 实战:工具调用与结构化输出
PythonAI算法

LangChain 实战:工具调用与结构化输出

文章目录 工具调用(Tool Calling) Tool 创建的三种方式 1.1. 直接用 @tool 装饰函数 1.2. 用 @tool + 自定义参数结构(Pydantic) 1.3. 继承 BaseTool 写类 本地自定义工具 2.1 定义工具 2.2 绑定工具到模型 2.3 工具调用流程 2.4 AI 响应结构解析 第三方工具集成(Tavily 搜索) 3.1 集成第三方工具 3.2 多…

魔法巫师发布于 2026/4/6更新于 2026/5/940590 浏览311 点赞约 53 分钟阅读
OpenViking 部署与应用:字节跳动开源 AI 代理上下文数据库
PythonAI算法

OpenViking 部署与应用:字节跳动开源 AI 代理上下文数据库

一、项目概述 OpenViking 是字节跳动开源的 AI 代理上下文数据库,专门解决复杂 AI 代理系统中的上下文管理难题。传统 RAG 方案在长期、多步骤任务中面临成本高、效率低的问题,OpenViking 通过文件系统范式和三层加载策略,显著提升性能并降低成本。将详细讲解 OpenViking 的部署、配置和实战应用。 二、环境准备 2.1 系统要求 操作系统:Linux/Windows…

涅槃凤凰发布于 2026/4/6更新于 2026/5/878804 浏览222 点赞约 44 分钟阅读
多模态 AI 应用:图文音视频一体化开发实战
PythonAI算法

多模态 AI 应用:图文音视频一体化开发实战

综述由AI生成什么是多模态 AI 多模态 AI 是指能够同时处理**文本、图像、音频、视频**等多种不同类型数据的人工智能系统,它打破了单模态 AI 的信息壁垒,能更贴近人类理解世界的方式。比如我们日常使用的 AI 聊天机器人识图功能、视频自动字幕生成工具,都是多模态 AI 的典型应用。 开发前的核心准备 **模型选型建议** | 模型类型 | 推荐模型 | 适用场景 | | --- | --- | --- |…

灵魂伴侣发布于 2026/4/6更新于 2026/5/654022 浏览160 点赞约 21 分钟阅读
Llama-2-7b 昇腾 NPU 测评:性能数据、场景适配与硬件选型
PythonNuctAI算法

Llama-2-7b 昇腾 NPU 测评:性能数据、场景适配与硬件选型

Llama-2-7b 昇腾 NPU 测评总结:核心性能数据、场景适配建议与硬件选型参考 ![](https://qiniu.meowparty.cn/coder.2023/2026-04-06/769903e579ae66441d7d077c230d6750.png) 背景与测评目标 以 Llama-2-7b 为对象,在昇腾 NPU 环境中完成从依赖安装到模型部署的全流程落地,并通过六大维度测…

FlinkHero发布于 2026/4/6更新于 2026/5/862132 浏览557 点赞约 91 分钟阅读
PythonAI算法

Stable Diffusion 2024:技术突破与商业落地的开源实践

综述由AI生成Stable Diffusion 2024:技术突破与商业落地的开源实践 导语 Stable Diffusion 4.0 于 2024 年 11 月正式开源,通过三段式生成流程与移动端部署突破,重新定义了 AI 图像生成的技术边界与商业价值。 行业现状:开源与闭源的双轨竞争 2024 年全球 AI 内容生成市场规模突破 150 亿美元,年复合增长率保持 30% 以上。在这一赛道中,Stable D…

信号故障发布于 2026/4/6更新于 2026/5/954788 浏览883 点赞约 11 分钟阅读
PythonAI算法

ClawdBot 本地化语音翻译工作流:Whisper 转写与多语言支持

ClawdBot 效果展示:语音输入→Whisper 转写→多语言翻译端到端演示 这不是'又一个 AI 助手',而是一套可落地的本地化多模态工作流 你有没有遇到过这样的场景: 听国际会议录音,想边听边看中文实时字幕; 收到一段外语语音消息,需要快速理解内容并回复; 群里有人发来一张带外文的说明书图片,你得立刻识别 + 翻译 + 查术语。 这些需求,过去要么依赖云端服务(隐私没保障、网络不稳就卡住)…

利刃发布于 2026/4/6更新于 2026/5/763115 浏览178 点赞约 17 分钟阅读
PythonAI算法

Pixel Fashion Atelier 部署教程:Stable Diffusion 像素时装生成

Pixel Fashion Atelier 部署教程:Stable Diffusion 像素时装生成 项目介绍 Pixel Fashion Atelier 是一款基于 Stable Diffusion 与 Anything-v5 模型的像素风格时装生成工具。它将 AI 图像生成与复古日系 RPG 界面设计完美结合,为用户带来独特的创作体验。 **核心特点**: 专为像素艺术优化的生成模型 直观的…

RedisGeek发布于 2026/4/6更新于 2026/5/846620 浏览639 点赞约 9 分钟阅读
AIGC 世界模型 (World Model) 技术解析
PythonAI算法

AIGC 世界模型 (World Model) 技术解析

综述由AI生成前言 世界模型 (World Model) 展示了如何通过在生成的想象环境中进行实验来训练模型 (而不是在真实环境中进行训练),从而学习如何执行特定任务。世界模型很好的说明了如何将生成模型与其他机器学习技术 (如强化学习) 相结合使用解决实际问题。 该架构的关键组成部分是生成模型,它可以根据当前状态和动作构建下一个可能状态的概率分布。该模型通过随机运动建立对基本物理环境的了解之后,该模型能够完全依…

RedisGeek发布于 2026/4/6更新于 2026/5/877860 浏览936 点赞约 2 分钟阅读
PythonAI算法

基于 Llama-Factory 的盘古大模型轻量化训练方案

鹏城实验室盘古大模型轻量化训练:Llama-Factory 辅助方案 在大模型落地应用的浪潮中,一个现实问题始终困扰着科研机构与企业团队:如何在有限算力条件下,高效完成百亿参数级模型的领域适配?鹏城实验室推进'盘古大模型'项目时就面临这一挑战——全参数微调动辄需要数十 GB 显存和多卡并行,普通研发环境难以支撑。正是在这种背景下,基于 **Llama-Factory** 框架的轻量化训练路径脱颖而…

鲜活发布于 2026/4/6更新于 2026/5/896846 浏览903 点赞约 16 分钟阅读
PythonAI算法

大模型降低 AIGC 率指令策略与实战指南

AIGC 率:一个开发者必须面对的质量指标 最近在项目里用 ChatGPT 这类大模型生成内容时,总被一个词困扰——AIGC 率。简单来说,它衡量的是生成内容与模型训练数据中已有内容的相似度,或者说'机器味儿'有多浓。对于开发者而言,高 AIGC 率不仅意味着内容可能缺乏新意、流于模板化,在严肃的应用场景(如知识输出、创意写作、代码生成)中,更可能引发原创性不足、甚至潜在的合规风险。因此,学会通过…

CryptoLab发布于 2026/4/6更新于 2026/5/584812 浏览916 点赞约 19 分钟阅读
PythonAI算法

Python Tkinter 集成 DocsGPT 开发 AI 代码助手

开发背景 档记录基于 Python 和 Tkinter 构建集成 DocsGPT 与 OpenAI API 的本地 AI 代码助手开发过程。主要目标是通过本地 API 调用实现代码编辑、运行及智能问答功能。 功能需求 **界面布局**: 左侧:Python 代码编辑区(支持多行输入、语法高亮、Run 按钮)。 右侧:GPT 调用区(提问输入、答案显示、历史记录)。 **核心功能**: 支持本地…

魔法巫师发布于 2026/4/6更新于 2026/5/910970 浏览208 点赞约 25 分钟阅读
Qwen3-VL 结合 LLaMA-Factory 进行 Grounding 任务 LoRA 微调
PythonAI算法

Qwen3-VL 结合 LLaMA-Factory 进行 Grounding 任务 LoRA 微调

模型特性 Qwen3-VL 是由阿里云 Qwen 团队开发的多模态大语言模型系列,具备以下核心能力: **空间感知能力大幅提升**:2D grounding 从绝对坐标变为相对坐标,支持判断物体方位、视角变化、遮挡关系,能实现 3D grounding,为复杂场景下的空间推理和具身场景打下基础。 **OCR 支持更多语言及复杂场景**:支持的中英外的语言从 10 种扩展到 32 种,覆盖更多国家和…

橘子海发布于 2026/4/6更新于 2026/5/755086 浏览561 点赞约 22 分钟阅读
PythonAI算法

CosyVoice 安装 openai-whisper 报错 ModuleNotFoundError 原因及解决方案

先说如何解决,我个人采用源码安装,安装时禁用构建隔离: git clone https://github.com/openai/whisper.git cd whisper git checkout v20231117 pip install -e . --no-build-isolation 再说该问题产生的原因,下面是详细分析。 🔍 问题根源分析 问题的关键在于 **PEP 517/518…

极光发布于 2026/4/6更新于 2026/5/824031 浏览675 点赞约 11 分钟阅读
PythonAI算法

SeargeSDXL AI 绘画工作流使用指南

SeargeSDXL AI 绘画工作流使用指南 你面临的 AI 绘画难题 当你开始接触 AI 绘画时,是否经常遇到这些问题:生成效果不稳定,参数调节复杂,高分辨率图片质量下降,多模型切换困难?这正是 SeargeSDXL 要为你解决的核心痛点。 作为 ComfyUI 平台上的专业级 AI 绘画工具,SeargeSDXL 通过精心设计的工作流系统,将复杂的 AI 绘画过程转化为直观的可视化操作。无论…

城市逃兵发布于 2026/4/6更新于 2026/5/887824 浏览596 点赞约 5 分钟阅读
PythonAI算法

OpenDroneMap 实战教程:从无人机照片生成专业地图

OpenDroneMap 实战教程:从无人机照片生成专业地图 OpenDroneMap 是一款革命性的开源无人机数据处理工具,能够将普通的航拍照片自动转换为专业级的地理空间产品。无论您是测绘新手、农业从业者,还是城市规划师,都能通过这个强大的工具包实现从图像到地图的完整工作流。 快速入门:10 分钟启动项目 **最简单部署方案** 使用 Docker 容器是最推荐的安装方式,只需几个简单命令: 将…

二进制发布于 2026/4/6更新于 2026/5/9140 浏览117 点赞约 7 分钟阅读
PythonAI算法

Unitree 机器人强化学习部署全流程:从仿真训练到实体控制

Unitree 机器人强化学习部署全流程:从仿真训练到实体控制 项目架构深度解析 Unitree RL GYM 采用模块化设计,核心代码组织清晰。在 legged_gym 目录下,您可以看到完整的训练和部署架构: **环境配置模块**:envs/base/ 包含基础配置和任务定义 **机器人专用模块**:envs/g1/、envs/h1/等分别对应不同型号 **训练执行脚本**:scripts/t…

晚风告白发布于 2026/4/6更新于 2026/5/885969 浏览137 点赞约 6 分钟阅读
LAM-YOLO: 无人机小目标检测模型的光照遮挡注意力机制
PythonAI算法

LAM-YOLO: 无人机小目标检测模型的光照遮挡注意力机制

综述由AI生成> **论文原文 (Paper)**:https://arxiv.org/abs/2411.00485 目录 核心思想 背景与动机 主要贡献点 方法细节 即插即用模块的作用 核心思想 对无人机航拍图像中**目标尺寸多变、遮挡严重、光照复杂**等挑战,提出了一种名为 **LAM-YOLO** 的新型目标检测模型。该模型以 YOLOv8 为基础,引入了 **光照 - 遮挡注意力机制 (LAM)*…

女王发布于 2026/4/6更新于 2026/5/866616 浏览176 点赞约 14 分钟阅读
PythonAI算法

K-RagRec:知识图谱检索增强生成在 LLM 推荐中的应用

综述由AI生成摘要 原文翻译 推荐系统在我们的日常生活中变得越来越重要,有助于缓解各类面向用户的在线服务中的信息过载问题。大语言模型(LLMs)的出现取得了显著成就,展现出其推动下一代推荐系统发展的潜力。尽管取得了这些进展,基于大语言模型的推荐系统仍面临源于其模型架构的固有局限性,尤其是幻觉问题(生成虚假信息)以及缺乏最新知识和领域特定知识的问题。近年来,检索增强生成(RAG)技术受到了广泛关注,它通过利用外部…

ApiHolic发布于 2026/4/6更新于 2026/5/916196 浏览77 点赞约 73 分钟阅读
PythonSaaSAI

OpenClaw 飞书机器人权限配置与安全指南

综述由AI生成OpenClaw 飞书机器人权限配置与安全指南 为了确保 OpenClaw 既能顺畅运行,又不至于因权限过大导致安全隐患,建议在飞书开发者后台 - 权限管理中,按照以下清单进行勾选。 这份清单分为基础必备和进阶功能两部分: 基础必备权限 无论个人还是团队,必须开启。这些权限保证机器人能'听到'指令并'开口'说话: im:message:p2p_msg:readonly (接收单聊消息) —— 允许…

Elasticer发布于 2026/4/6更新于 2026/5/851838 浏览451 点赞约 7 分钟阅读
前端加密 encrypt-labs 靶场实战:环境搭建与全关卡解析
Python大前端算法

前端加密 encrypt-labs 靶场实战:环境搭建与全关卡解析

前端加密 encrypt-labs 靶场实战涵盖环境搭建、插件配置及多类加密算法破解。通过 Docker 部署靶场,利用 Galaxy 和 autoDecoder 插件实现请求加解密自动化。解析 AES 固定 Key、服务端获取 Key、RSA 加密、混合加密、DES 规律 Key、明文加签及防重放等关卡原理。结合浏览器栈跟踪定位混淆代码,使用 Python 脚本模拟客户端逻辑完成爆破,理解前端防护核心机制与绕过方法。

虚拟内存发布于 2026/4/6更新于 2026/5/88 浏览0 点赞约 100 分钟阅读
上一页下一页