跳到主要内容
极客日志极客日志
首页博客AI提示词GitHub精选代理工具
搜索
|注册
极客日志

极客日志

面向效率的开发者社区

站内导航

  • 首页
  • 工具箱
  • 博客

快速链接

  • 全球AI模型中转站:Crex
  • 大模型:Hugging Face
  • Stack Overflow
  • MDN

联系我们

  • 技术支持:[email protected]
  • 商务合作:[email protected]
  • 投诉举报:[email protected]

© 2026 极客日志 · zeeklog.com

隐私政策|用户服务条款|关于我们
重置
编程语言 / Python

标签

全部标签AIGPT-image-2javaNode.jsNuctPayPPT制作React NativeRNSaaSVScodeWeChat大前端算法

分类

全部分类
编程语言
PythonJavaScriptTypeScriptJavaKotlinGo / GolangRustC++CC#F#PHPRubySwiftObjective-CScalaClojureElixirErlangHaskellDartLuaPerlRJuliaMATLAB / OctaveSQLShell / BashPowerShellHTML / CSSZigNimCrystalGroovyVisual Basic .NETSolidity汇编

排序

最新更新最新发布最多浏览最多点赞
PythonAI算法

Windows 本地大模型工具链安装:Ollama + llama.cpp + LLaMA Factory

介绍在 Windows 11 环境下安装 Ollama、llama.cpp 和 LLaMA Factory 的完整流程。包括统一文件夹规划、Ollama 安装及模型路径配置、llama.cpp 编译启用 CUDA 加速、基于 Miniconda 创建 Python 虚拟环境并部署 LLaMA Factory、数据集配置方法以及一键启动脚本编写。同时涵盖常见问题排查与 GPU 监控验证,帮助用户构建本地大模型开发与推理环境。

虚拟内存发布于 2026/4/6更新于 2026/5/1423 浏览4 点赞约 18 分钟阅读
异构算力部署通义万相 2.1 文生图技术解析
PythonAI算法

异构算力部署通义万相 2.1 文生图技术解析

综述由AI生成AIGC 领域算力需求的增长趋势及异构算力的作用,重点解析了通义万相 2.1 文生图模型的技术特性。该模型具备卓越的语义理解能力、丰富的细节表现力、高效的生成速度、灵活的输出分辨率以及智能改写功能,能够根据文本描述生成高质量图像,满足多样化的创作需求。

JavaCoder发布于 2026/4/6更新于 2026/5/1226 浏览4 点赞约 2 分钟阅读
多模态大模型垂直微调实战:Qwen3-VL-4B-Thinking 与 Llama Factory
PythonAI算法

多模态大模型垂直微调实战:Qwen3-VL-4B-Thinking 与 Llama Factory

基于 Qwen3-VL-4B-Thinking 模型进行多模态垂直微调的完整流程。内容包括数据集制作(XFUND)、环境配置(Llama Factory)、训练参数设置及模型导出。通过 LoRA 技术实现高效微调,适用于文档结构化提取等场景,旨在提升模型在特定领域的语义对齐与输出标准化能力。

接口猎人发布于 2026/4/6更新于 2026/5/1020 浏览2 点赞约 48 分钟阅读
ComfyUI Mixlab 插件 Whisper.available False 报错修复方案
PythonAI算法

ComfyUI Mixlab 插件 Whisper.available False 报错修复方案

对 ComfyUI Mixlab 插件中 Whisper.available False 报错提供解决方案。问题根源在于代码未处理模型目录缺失导致的异常,以及模型文件结构不符合要求。通过修改 __init__.py 增强日志输出定位问题,在 Whisper.py 中添加目录自动创建逻辑,并手动创建 models/whisper 目录及放置包含 config.json 的 Faster-Whisper 格式模型文件,即可恢复正常加载。

SparkGeek发布于 2026/4/6更新于 2026/5/1323 浏览2 点赞约 8 分钟阅读
PythonAI算法

N46Whisper:基于 Whisper 的日语视频字幕生成工具

N46Whisper 是一款基于 Whisper 技术的日语视频字幕生成工具。它利用云端 AI 能力实现语音转文字及中日双语翻译,支持 ASS 和 SRT 格式。用户可通过 Google Colab 环境快速运行,无需本地安装。相比传统手动制作,该工具能显著缩短字幕制作时间,提升识别准确率与工作效率,适用于综艺、访谈及学习视频等多种场景。

DebugKing发布于 2026/4/6更新于 2026/5/1523 浏览2 点赞约 4 分钟阅读
PythonAI算法

AIGC 大模型系统化学习路径:从理论到工业级实战指南

综述由AI生成探讨了 AIGC 大模型系统化学习路径,涵盖理论到工业级实战。首先分析了模型选择、算力门槛及 Prompt 设计的痛点。接着对比了 Full Fine-tuning、LoRA 和 Prompt Tuning 的技术选型策略。核心实现部分介绍了 HuggingFace Pipeline 优化及 LangChain 多模型编排,提供了具体的 Python 代码示例。生产环境考量包括基于 Locust 的负载测试方案与敏感词过滤的安全防护。最…

监控大屏发布于 2026/4/6更新于 2026/5/1522 浏览3 点赞约 9 分钟阅读
PPO-VLA:强化学习如何提升机器人泛化能力
PythonAI算法

PPO-VLA:强化学习如何提升机器人泛化能力

综述由AI生成清华大学研究对比了监督微调(SFT)与强化学习(PPO)在视觉语言动作(VLA)模型上的表现。研究发现,PPO 能显著提升模型在语义理解和执行鲁棒性方面的分布外泛化能力,最高提升达 42.6%。相比 SFT 的模仿瓶颈,RL 通过试错学习更本质的技能。研究还提出了高效的 PPO-VLA 训练方案,包括共享骨干架构、预热策略及最小更新轮次,在单卡上即可高效微调。实验表明 RL 在执行干扰和未见物体场景下优势明显。

念念不忘发布于 2026/4/6更新于 2026/5/1217 浏览6 点赞约 17 分钟阅读
PythonAI算法

ComfyUI Photoshop 插件安装与使用指南

介绍 ComfyUI Photoshop 插件的安装流程与核心功能。该插件将 ComfyUI 的 AI 能力集成至 Photoshop,解决传统 AI 绘画工作流中软件切换繁琐、效率低下的问题。主要步骤包括环境准备(Photoshop CC 2022+、ComfyUI 运行环境)、通过 ComfyUI Manager 安装 Auto-Photoshop-SD 及 ControlNet 组件。支持文本生成图像、图像转换、精准修复及外绘扩展…

Elasticer发布于 2026/4/6更新于 2026/5/1339 浏览4 点赞约 5 分钟阅读
PythonAI

Gemini 全能 QQ 机器人部署指南

基于 OneBot V11 (NapCat)、NoneBot2 及 Gemini Flash 模型的全能 QQ 机器人部署流程。涵盖 Ubuntu 服务器环境准备、Docker 容器化部署 NapCat 协议端、Python 虚拟环境配置与核心代码编写、Systemd 服务管理及 WebUI 连接配置。包含打卡、排行榜、管理员指令等功能实现,适合有 Linux 基础的用户快速搭建群聊 AI 助手。

极光发布于 2026/4/6更新于 2026/5/824 浏览2 点赞约 56 分钟阅读
PythonAI算法

LeRobot 机器人学习数据集实战指南:从数据采集到行业落地

综述由AI生成基于 LeRobot 框架的机器人学习数据集构建流程。涵盖多传感器时间同步、数据清洗与标准化方法,以及视觉与力觉等多模态数据融合方案。详细对比了 HDF5、Zarr 等存储格式特性,并提供了医疗、农业、智能家居三个行业的落地案例及数据集质量评估标准。内容包含代码示例、配置清单及合规性自查要点,旨在帮助开发者高效构建高质量机器人训练数据集。

人间过客发布于 2026/4/6更新于 2026/5/1225 浏览3 点赞约 12 分钟阅读
OpenClaw Skills 原理与实战:构建机器人专属技能模块
PythonAI算法

OpenClaw Skills 原理与实战:构建机器人专属技能模块

OpenClaw Skills 是机器人控制框架中的可复用行为单元,支持原子与组合技能。介绍其核心架构、基于 Python 的编写步骤(继承 BaseSkill、注册、测试)、常见技能分类及注意事项。通过模块化设计降低开发门槛,适配不同硬件,支持自定义参数与紧急终止,助力开发者快速构建机器人应用。

追风少年发布于 2026/4/6更新于 2026/5/1433 浏览8 点赞约 14 分钟阅读
OpenClaw:面向具身智能与机器人操作的多模态大模型框架
PythonAI算法

OpenClaw:面向具身智能与机器人操作的多模态大模型框架

综述由AI生成OpenClaw 是由上海人工智能实验室发布的开源多模态大模型框架,专注于具身智能(Embodied AI)与机器人操作的视觉 - 语言 - 动作(VLA)联合建模。文章介绍了其核心特点如多模态对齐与动作生成范式,并详细阐述了在真实机械臂(如 UR5e)部署时的工程实践,包括延迟缓解策略、安全约束保障机制及闭环控制实现方式。此外,还涵盖了坐标系统一、TCP 标定误差补偿及协同校准工作流等关键技术细节,确保动作在安全区内精准可达。

孤勇者发布于 2026/4/6更新于 2026/5/1420 浏览2 点赞约 18 分钟阅读
Trae 集成图片素描 MCP 实现多风格图像转换
PythonAI算法

Trae 集成图片素描 MCP 实现多风格图像转换

综述由AI生成如何使用 Trae 编辑器集成图片素描 MCP 工具,将普通图片转换为多风格素描效果。该工具基于 MCP 协议,支持经典、详细、柔和三种风格切换,兼容多种图片格式及中文路径,具备单张/批量处理能力。教程涵盖了环境准备(Python 3.13+)、依赖安装(uvx)、Trae 智能体配置及 MCP 连接步骤,并提供了系统提示词示例。通过调节高斯模糊和对比度参数,用户可针对不同分辨率图片优化素描质量,适用于社交媒体配图、设计素材制作及批量图…

怪力乱神发布于 2026/4/6更新于 2026/5/1418 浏览2 点赞约 7 分钟阅读
PythonAI算法

基于 YOLOv 的 Web 目标检测系统开发与部署实战

综述由AI生成基于 YOLOv 系列模型构建 Web 目标检测系统的全流程。针对模型加载慢、前后端联调难、环境依赖冲突等常见问题,提出了使用 FastAPI 作为后端框架、ONNX Runtime 进行模型推理、Vue.js 构建前端的解决方案。文章详细阐述了项目结构规划、模型导出与封装、API 接口实现及前端交互代码,并强调了 Docker 容器化部署的重要性以确保环境一致性和性能优化。通过模块化设计和工程化实践,帮助开发者构建稳定、易维护的 AI…

星河入梦发布于 2026/4/6更新于 2026/5/1424 浏览2 点赞约 15 分钟阅读
Python大前端

Python 与前端集成:构建全栈应用

综述由AI生成使用 Python(FastAPI/Flask)作为后端与前端框架(React/Vue)集成的全栈开发方案。内容涵盖 RESTful API 设计、前后端数据交互(JSON)、跨域处理(CORS)、JWT 认证机制以及基于 Docker 的部署流程。此外还对比了 Python 与 Rust 在开发效率与性能上的差异,并提供了实践项目建议与学习方法。

月亮邮递员发布于 2026/4/6更新于 2026/5/1226 浏览4 点赞约 29 分钟阅读
OpenClaw 实战:WSL2 环境下使用 Python 调用摄像头
PythonAI算法

OpenClaw 实战:WSL2 环境下使用 Python 调用摄像头

在 WSL2 环境下让 OpenClaw AI 助手访问摄像头的三种方案。第一阶段尝试通过 Node.js 配对,因 WSL2 网络隔离和端口占用失败;第二阶段使用浏览器方案,虽可预览但无法自动化;第三阶段采用 Python + OpenCV 本地程序,成功实现摄像头调用及拍照功能。结论是 WSL2 无法直接访问摄像头硬件,需借助 Windows 原生程序或特定桥接方案。

CloudNative发布于 2026/4/6更新于 2026/5/1220 浏览3 点赞约 12 分钟阅读
PythonAI

Browser Use 使用指南:AI 自动控制浏览器

介绍开源 Python 库 Browser Use,用于让 AI 模型自动控制浏览器。支持多模型(GPT-4、Claude 等)、视觉感知及智能交互。内容包括安装配置、Agent 核心组件详解、实际案例(数据收集、表单填写、内容分析)及高级配置。通过自然语言描述任务,AI 可自动完成网页操作,适用于数据采集与测试自动化场景。

人间过客发布于 2026/4/6更新于 2026/5/1226 浏览5 点赞约 8 分钟阅读
开源AI桌宠AIRI完整部署指南
PythonAI

开源AI桌宠AIRI完整部署指南

综述由AI生成AIRI 是一款开源 AI 桌宠项目,支持多平台部署。从下载安装、界面语言设置、大模型接入(如阿里百炼 API 或本地 Ollama)到 TTS 语音服务配置(使用 openai-edge-tts)的完整流程。此外还涵盖了角色卡片编辑及 Discord 等外部平台联动配置。项目维护活跃,适合希望低成本体验多模态 AI 桌宠的用户。

奶糖兔发布于 2026/4/6更新于 2026/5/1533 浏览7 点赞约 7 分钟阅读
AI 农业创业:基于 ViT 的轻量化病虫害检测系统
PythonAI算法

AI 农业创业:基于 ViT 的轻量化病虫害检测系统

一名大学生利用 AI 技术解决农业病虫害检测问题的创业实践。针对传统人工巡检效率低的问题,项目采用 Vision Transformer(ViT)架构进行轻量化改造,结合知识蒸馏与剪枝技术,将模型压缩至 50MB 以内。在 PlantVillage 数据集上训练准确率达 99.44%,支持 ONNX 格式导出及边缘设备部署。未来计划构建多模态融合预测框架,推动技术落地田间地头。

剑仙发布于 2026/4/6更新于 2026/5/1325 浏览2 点赞约 6 分钟阅读
医疗 AI 编程与培训技能树分析报告(2025 版)
PythonAI算法

医疗 AI 编程与培训技能树分析报告(2025 版)

综述由AI生成2025 年全球医疗 AI 市场的增长数据及临床应用案例,涵盖肺结节检测、智能诊断系统及病理诊断效率提升等方面,并初步构建了医疗 AI 编程的技能体系框架。

技术博主发布于 2026/4/6更新于 2026/5/1419 浏览3 点赞约 1 分钟阅读
上一页下一页