跳到主要内容
极客日志极客日志
首页博客AI提示词GitHub精选代理工具
搜索
|注册
极客日志

极客日志

面向效率的开发者社区

站内导航

  • 首页
  • 工具箱
  • 博客

快速链接

  • 全球AI模型中转站:Crex
  • 大模型:Hugging Face
  • Stack Overflow
  • MDN

联系我们

  • 技术支持:[email protected]
  • 商务合作:[email protected]
  • 投诉举报:[email protected]

© 2026 极客日志 · zeeklog.com

隐私政策|用户服务条款|关于我们
重置
编程语言 / Python

标签

全部标签AIGPT-image-2javaNode.jsNuctPayPPT制作React NativeRNSaaSVScodeWeChat大前端算法

分类

全部分类
编程语言
PythonJavaScriptTypeScriptJavaKotlinGo / GolangRustC++CC#F#PHPRubySwiftObjective-CScalaClojureElixirErlangHaskellDartLuaPerlRJuliaMATLAB / OctaveSQLShell / BashPowerShellHTML / CSSZigNimCrystalGroovyVisual Basic .NETSolidity汇编

排序

最新更新最新发布最多浏览最多点赞
PythonAI算法

Stable Diffusion v1.5 模型介绍及 Python 代码实现

Stable Diffusion v1.5 是由 Stability AI 与 RunwayML 合作开发的文生图模型,支持文本生成图像、图像修复及风格迁移等功能。该模型基于扩散架构,默认分辨率 512x512,可通过 Python 的 diffusers 库调用。适用于插画生成、产品设计草图及二次元风格创作,需配合显卡运行以获得较好性能。

DevOpsTeam发布于 2026/4/8更新于 2026/4/266 浏览0 点赞约 10 分钟阅读
Metric3D v2: 零样本单目度量深度与表面法线估计基础模型
PythonAI算法

Metric3D v2: 零样本单目度量深度与表面法线估计基础模型

综述由AI生成Metric3D v2 是一款面向单目图像的零样本度量深度与表面法向量联合估计的几何基础模型。其核心突破在于针对度量深度的相机内参歧义和表面法向量的标注稀缺两大痛点,提出了规范相机空间变换模块(CSTM)和联合深度 - 法向量优化模块。模型基于 16 个数据集的超 1600 万张图像完成训练,不仅在 16+ 深度与法向量基准上斩获 SOTA,还可直接赋能 3D 场景重建、单目 SLAM 及野外场景计量等下游任务,实现了从单张野生图像到真…

并发大师发布于 2026/4/8更新于 2026/4/276 浏览0 点赞约 12 分钟阅读
VLA 机器人模型解析:10 篇关键视觉 - 语言 - 动作论文
PythonAI算法

VLA 机器人模型解析:10 篇关键视觉 - 语言 - 动作论文

VLA 模型整合视觉感知、语言理解与动作执行,推动机器人向通用智能演进。分析 10 篇核心论文,涵盖 RT-2、OpenVLA 等基础架构及 GR00T、WorldVLA 等前沿方向。重点探讨利用互联网数据增强泛化、开源生态构建、3D 空间推理及开放世界适应能力。技术路径从单一硬件控制发展为双系统架构与物理世界建模,解决数据稀缺、仿真到现实迁移及实时性难题,为具身智能落地提供理论支撑与实践参考。

292440837发布于 2026/4/8更新于 2026/4/265 浏览0 点赞约 41 分钟阅读
PythonAI算法

Lychee-Rerank 在统信 UOS 与申威 CPU 环境下的部署适配

综述由AI生成Lychee-Rerank 是一款基于 Qwen2.5-1.5B 模型的本地检索相关性评分工具。档详细记录了在统信 UOS 操作系统配合申威 SW64 架构 CPU 的国产化信创环境中完成该工具部署的全过程。内容涵盖系统依赖安装、虚拟环境配置、模型文件准备及 Streamlit 服务启动指南,并针对内存不足、端口占用等常见问题提供了排查方案。通过离线运行模式,该方案确保了数据隐私安全,适用于企业知识库检索及文档排序场景。

ServerBase发布于 2026/4/8更新于 2026/4/263 浏览0 点赞约 10 分钟阅读
Python大前端

F12 网络调试实战:前后端交互原理与 Flask 路由定位

F12 网络面板是前后端交互调试的核心工具。通过理解客户端与服务端的通信角色,以及前端运行环境与后端逻辑的分层,开发者能更精准地定位问题。重点掌握 XHR 与 Fetch 请求的筛选与分析,查看 Payload、Response 及 Header 细节,可快速验证接口数据。在 Flask 项目中,利用路径段搜索后端路由,结合类视图定义方式,能有效追踪请求来源,提升排查效率。

KernelLab发布于 2026/4/8更新于 2026/4/263 浏览0 点赞约 6 分钟阅读
PythonAI

Stable Diffusion 模型下载工具实战指南

Stable Diffusion 模型下载常受网络限制影响。介绍一款 WebUI 扩展工具,支持智能路径识别、双重下载引擎及模型预览功能。通过安装 aria2c 可提升速度,自动管理 Checkpoint、LoRA 等文件存储结构。解决连接异常与空间不足问题,简化创作流程。

Kubernet发布于 2026/4/8更新于 2026/4/262 浏览0 点赞约 3 分钟阅读
OpenClaw 接入飞书机器人与 Kimi2.5 配置指南
PythonAI

OpenClaw 接入飞书机器人与 Kimi2.5 配置指南

记录在 Ubuntu 环境下将 OpenClaw 接入飞书机器人及 Kimi2.5 模型的完整流程。涵盖飞书应用创建、权限配置、事件订阅,以及 Kimi Code API Key 获取步骤。重点说明 OpenClaw 命令行初始化过程中的关键配置项,并解决插件安装失败的常见排查方法,实现本地 Agent 与即时通讯工具的联动。

嘘发布于 2026/4/8更新于 2026/4/253 浏览0 点赞约 11 分钟阅读
大模型时代人形机器人感知:视觉 - 语言模型应用
PythonAI算法

大模型时代人形机器人感知:视觉 - 语言模型应用

综述由AI生成视觉 - 语言模型通过统一建模视觉与自然语言,使人形机器人具备理解指令与场景的能力。文章介绍了 CLIP、BLIP 及 Flamingo 等核心模型的演进与分工,阐述了文本与视觉的语义对齐机制,包括嵌入空间构建、对比学习与跨模态注意力。此外还探讨了基于语言的视觉任务控制流程,从指令解析到行动意图映射,展示了大模型如何支撑机器人在复杂环境中的闭环感知与决策。

片刻发布于 2026/4/8更新于 2026/4/262 浏览0 点赞约 16 分钟阅读
PythonAI算法

PyCharm 中提升 GitHub Copilot 代码建议准确性的实战技巧

PyCharm 集成 GitHub Copilot 时,常因上下文理解不足导致建议偏差。本文通过完善类型注解、优化文档字符串及调整项目结构,帮助模型更精准捕捉业务逻辑。同时针对延迟问题提供网络与配置调优方案,并强调反馈机制对提升编码效率的重要性。实际应用中,结合详细注释与合理的文件组织,可显著减少无效建议,让 AI 助手真正融入开发流程。

KernelLab发布于 2026/4/8更新于 2026/4/262 浏览0 点赞约 4 分钟阅读
基于 NVIDIA DGX Spark 部署 Stable Diffusion 3.5 与 ComfyUI
PythonAI算法

基于 NVIDIA DGX Spark 部署 Stable Diffusion 3.5 与 ComfyUI

NVIDIA DGX Spark 搭载 Blackwell 架构 GPU 与 Grace CPU,运行 CUDA 13。介绍在该 ARM64 环境下构建兼容 PyTorch 基础环境,下载 Stable Diffusion 3.5 Large 模型,安装并修复 ComfyUI 依赖。通过软链接挂载模型,配置高显存模式实现秒级出图,并提供适配 TripleCLIPLoader 的标准工作流 JSON,支持原生 4K 生成及高并发任务。

疯疯癫癫发布于 2026/4/8更新于 2026/4/264 浏览0 点赞约 25 分钟阅读
AI 驱动的自动化运维机器人:从数字劳动力到智能协作者
PythonAI算法

AI 驱动的自动化运维机器人:从数字劳动力到智能协作者

综述由AI生成AI 驱动的自动化运维机器人通过融合 UI 自动化、人工智能与智能编排,模拟人类操作执行全链路任务。它解决了传统运维中重复劳动、操作风险高、信息孤岛及被动响应等痛点,具备灵巧的手、明亮的眼和智慧的大脑三大核心能力。核心价值在于解放人力、实现 7x24 小时无人值守、保障操作合规及知识固化,典型场景涵盖智能巡检、安全事件闭环处置及跨系统业务流程自动化,推动运维向人机协同智能化转变。

CodeArtist发布于 2026/4/8更新于 2026/4/255 浏览0 点赞约 9 分钟阅读
ComfyUI:AI 绘画与图像生成的高效工作流
PythonAI算法

ComfyUI:AI 绘画与图像生成的高效工作流

ComfyUI 基于节点式流程的 Stable Diffusion 操作界面,通过可视化编程实现生成过程显式化。核心优势在于数据与代码分离,支持跨平台运行与工作流版本管理。实战技巧涵盖基础文生图到高级风格迁移,结合 ControlNet 及批量处理优化效率。插件开发允许自定义节点扩展功能,如 ESRGAN 超分辨率。应用场景包括电商视觉自动化、艺术创作风格迁移及游戏资产生成。集成 Blender 与 Photoshop 可实现 3D 资…

编程诗人发布于 2026/4/8更新于 2026/4/265 浏览0 点赞约 11 分钟阅读
Stable Diffusion v4.10 与 ComfyUI 整合包配置指南
PythonAI算法

Stable Diffusion v4.10 与 ComfyUI 整合包配置指南

Stable Diffusion v4.10 整合包提供一键启动环境,支持 Intel 核显驱动升级及 AMD 显卡 ZLUDA/DirectML 方案。ComfyUI 版本包含 Python 3.11 与 PyTorch 2.5.1 环境,节点精简优化。常见问题可通过启动器疑难解答修复,适合快速上手 AI 绘图与流程生成。

性能调优发布于 2026/4/8更新于 2026/4/266 浏览0 点赞约 2 分钟阅读
PythonAI算法

Whisper-large-v3 多任务并行:转录、翻译与摘要一体化服务

Whisper-large-v3 模型支持 99 种语言自动检测,本方案构建 Web 服务实现转录、翻译、摘要三模式并行处理。通过单服务集成减少数据传输开销,利用 GPU 资源优化提升效率。支持文件上传及麦克风录音,提供 Web 界面与 API 接口。实测在 RTX 4090 环境下,全模式处理速度较传统串行提升约 45%,适用于会议记录、多媒体内容处理及教育场景。

宁静发布于 2026/4/8更新于 2026/4/275 浏览0 点赞约 11 分钟阅读
OpenClaw Skills 详解:机器人行为控制框架与实战
PythonAI算法

OpenClaw Skills 详解:机器人行为控制框架与实战

综述由AI生成OpenClaw Skills 是面向开源机械爪和小型机器人的控制框架核心模块,将单一可执行行为封装为独立代码单元。文章解析了 Skills 的核心架构,包括核心层、抽象层、技能层及交互层。通过 Python 示例展示了如何继承 BaseSkill 类实现初始化、执行与停止逻辑,并演示了注册技能与组合原子 Skill 的方法。文中列举了抓取、移动、释放等原子技能及搬运、分拣等复合技能场景,强调模块化设计与硬件抽象层的重要性,帮助开发者降…

DebugKing发布于 2026/4/8更新于 2026/4/266 浏览0 点赞约 15 分钟阅读
LTX-2.3 开源音视频生成模型技术解析
PythonAI算法

LTX-2.3 开源音视频生成模型技术解析

LTX-2.3 是 Lightricks 发布的开源音视频生成基础模型,基于 Diffusion Transformer 架构。支持文生视频、图生视频及音频驱动视频三种模式,原生支持竖屏与本地运行。模型采用 Apache 2.0 协议,提供量化版本与 LoRA 微调能力,兼容 ComfyUI 工作流。相比前代在细节保留、提示词理解及音频质量上有显著提升,适用于短视频创作、营销素材生成等生产场景。

Elasticer发布于 2026/4/8更新于 2026/4/263 浏览0 点赞约 12 分钟阅读
PythonAI算法

IQuest-Coder-V1 与 Meta-Llama-Code 开源模型部署实测对比

IQuest-Coder-V1 与 Meta-Llama-Code 在 A100 环境下部署实测。IQuest 原生支持 128K 上下文,工程鲁棒性更强,适合 IDE 插件及长文本处理;Llama-Code 轻量但需补丁扩展上下文,适合单文件脚本。实测显示 IQuest 在复杂任务可运行性及健壮性上得分更高,推荐混合部署策略以平衡性能与成本。

beaabea发布于 2026/4/8更新于 2026/4/263 浏览0 点赞约 21 分钟阅读
PythonAI算法

CosyVoice 安装 openai-whisper 报错 ModuleNotFoundError: No module named'pkg_resources'

CosyVoice 安装 openai-whisper 时报错 ModuleNotFoundError: No module named'pkg_resources'。原因是 PEP 517 构建隔离环境中缺少 setuptools 导致 setup.py 无法导入 pkg_resources。解决方法包括使用--no-build-isolation 参数跳过隔离环境,或修改 setup.py 延迟导入依赖。推荐临时方案为禁用构建隔离,…

imJackJia发布于 2026/4/8更新于 2026/4/267 浏览0 点赞约 11 分钟阅读
Llama 3-8B-Instruct 在昇腾 NPU 上的 SGLang 性能实测
PythonAI算法

Llama 3-8B-Instruct 在昇腾 NPU 上的 SGLang 性能实测

综述由AI生成Llama 3-8B-Instruct 模型在昇腾 NPU 配合 SGLang 框架下的推理性能表现优异。实测涵盖吞吐量、延迟及显存占用等关键指标,并通过批量与压力测试验证了高并发场景下的稳定性。结果显示,Ascend NPU 在矩阵运算与张量处理上优势明显,能有效支持低延迟、高吞吐的在线推理任务,适合大规模部署。

灰度发布发布于 2026/4/8更新于 2026/4/264 浏览0 点赞约 33 分钟阅读
Python算法

Webots R2023b 安装配置及 Python 环境搭建指南

Webots R2023b 安装配置涉及 Python3、Micromamba 环境管理、OpenCV 依赖安装及 MATLAB 路径关联。教程涵盖 Windows 与 macOS 双系统下的详细步骤,包括 Python 版本选择、Micromamba 初始化、虚拟环境创建、Webots 偏好设置中 Python 解释器指定以及 MATLAB 根目录配置。通过验证脚本确保 OpenCV 可用性及环境隔离,解决常见命令未识别或模块缺失问题…

Stephaine Walsh发布于 2026/4/8更新于 2026/4/274 浏览0 点赞约 22 分钟阅读
上一页下一页