跳到主要内容
极客日志极客日志
首页博客AI提示词GitHub精选代理工具
搜索
|注册
极客日志

极客日志

面向效率的开发者社区

站内导航

  • 首页
  • 工具箱
  • 博客

快速链接

  • 全球AI模型中转站:Crex
  • 大模型:Hugging Face
  • Stack Overflow
  • MDN

联系我们

  • 技术支持:[email protected]
  • 商务合作:[email protected]
  • 投诉举报:[email protected]

© 2026 极客日志 · zeeklog.com

隐私政策|用户服务条款|关于我们
重置
编程语言 / Python

标签

全部标签AIGPT-image-2javaNode.jsNuctPayPPT制作React NativeRNSaaSVScodeWeChat大前端算法

分类

全部分类
编程语言
PythonJavaScriptTypeScriptJavaKotlinGo / GolangRustC++CC#F#PHPRubySwiftObjective-CScalaClojureElixirErlangHaskellDartLuaPerlRJuliaMATLAB / OctaveSQLShell / BashPowerShellHTML / CSSZigNimCrystalGroovyVisual Basic .NETSolidity汇编

排序

最新更新最新发布最多浏览最多点赞
AirSim 无人机仿真入门:实现起飞与降落控制
PythonAI算法

AirSim 无人机仿真入门:实现起飞与降落控制

AirSim 基于虚幻引擎构建,支持无人机与自动驾驶仿真。从环境搭建到 Python 控制的完整流程,涵盖 Unreal Engine 插件配置、Visual Studio 编译设置以及通过 API 实现无人机自动起飞与降落的代码示例。同时提供摄像头视图配置等常见问题解决方案,帮助开发者快速上手仿真测试。

路由之心发布于 2026/4/7更新于 2026/4/273 浏览0 点赞约 6 分钟阅读
OpenClaw 接入飞书机器人配置指南
PythonAI

OpenClaw 接入飞书机器人配置指南

综述由AI生成OpenClaw 接入飞书机器人涉及应用创建、凭证获取、权限配置及渠道绑定。本文详述了从企业自建应用到事件订阅的完整流程,并提供了命令行工具的配置步骤与测试方法,帮助开发者快速实现飞书渠道的消息收发功能。

监控大屏发布于 2026/4/7更新于 2026/4/283 浏览0 点赞约 12 分钟阅读
OmniSteward:基于 LLM Agent 的智能家居与电脑控制方案
PythonAI算法

OmniSteward:基于 LLM Agent 的智能家居与电脑控制方案

OmniSteward 是一款基于大语言模型的智能管家系统,支持语音和文字交互,能够控制智能家居设备及管理电脑程序。项目采用 Python 开发,集成 Qwen2.5、Silero VAD 等模型,通过 Flask 构建 Web 服务。支持命令行与 Web 两种模式,具备多模态交互、工具调用及自定义拓展能力,适用于家庭办公场景,旨在提升人机交互效率与智能化水平。

暖阳发布于 2026/4/7更新于 2026/4/263 浏览0 点赞约 10 分钟阅读
PythonAI

AI 辅助开发实战:Python 自动化处理 Excel 数据指南

利用 AI 工具辅助编写 Python 脚本处理 Excel 数据,涵盖读取、清洗及可视化全流程。通过自然语言描述需求,AI 可自动生成带注释的代码框架,支持 pandas 与 matplotlib 库的自动引入。实践中发现 AI 具备实时错误定位、业务逻辑纠错及文档自动生成能力。针对复杂需求建议分步引导,明确样式参数以提升输出质量。AI 并非替代开发者,而是作为结对编程伙伴处理机械化实现,让人类专注于核心逻辑与规则制定,显著提升开发效…

赛博朋克发布于 2026/4/7更新于 2026/4/262 浏览0 点赞约 3 分钟阅读
大模型 Token 机制与上下文窗口管理实战
PythonAI算法

大模型 Token 机制与上下文窗口管理实战

深入解析大语言模型中的 Token 概念及其在上下文窗口管理中的关键作用。涵盖分词器原理、多语言 Token 差异、计费优化策略,以及压缩上下文和提示词缓存等工程实践。通过代码示例展示如何精确计算 Token 消耗,帮助开发者有效控制成本并提升模型响应效率。

霸天发布于 2026/4/7更新于 2026/4/272 浏览0 点赞约 9 分钟阅读
PythonAI算法

Stable Diffusion 模型版本演进与核心差异解析

综述由AI生成Stable Diffusion V1 至 V2 系列升级涉及文本编码器从 CLIP 切换至 OpenCLIP,参数量显著增加,提升了对复杂抽象指令的理解力,但要求提示词更精准。此外,基础分辨率由 512 提升至 768,生成图像细节更丰富。选择版本需权衡风格控制与提示词适配度。

DevStack发布于 2026/4/7更新于 2026/4/274 浏览0 点赞约 4 分钟阅读
基于 YOLO 的深度学习纺织品缺陷检测系统设计与实现
PythonAI算法

基于 YOLO 的深度学习纺织品缺陷检测系统设计与实现

综述由AI生成纺织品缺陷检测系统采用 YOLOv5/v8/v11/v12 系列模型结合 Django 框架开发。系统支持图片、视频及摄像头实时流分析,具备缺陷类别过滤、结果导出 Excel、识别历史追溯及多模型切换功能。提供自动化训练脚本,可动态修正数据集路径并批量训练不同版本模型。实验对比显示 YOLO12n 精度最高(mAP 40.6%),YOLO11n 推理速度最优(56.1ms)。数据集包含 13000 余张图片,涵盖 4 种缺陷类别,混淆矩…

古灵精怪发布于 2026/4/7更新于 2026/4/273 浏览0 点赞约 16 分钟阅读
PythonAI算法

基于 GLM-4.6V-Flash-WEB 的电力设施周边活动监测方案

综述由AI生成针对传统电力安防监控效率低、语义理解弱的问题,利用智谱开源轻量级视觉语言模型 GLM-4.6V-Flash-WEB 构建边缘侧智能巡防系统。该方案通过单卡部署实现从像素到语义的跃迁,支持自然语言交互与合规性判断。实测数据显示,误报率降低超 80%,响应时间提速近 7 倍。文章详细阐述了部署脚本编写、电力专属提示词工程设计及本地化微调方法,展示了模型在识别违规施工、设备状态及人员行为方面的实际效果,为电力设施安全提供了可落地的智能化路径。

ServerBase发布于 2026/4/7更新于 2026/4/273 浏览0 点赞约 21 分钟阅读
OpenClaw 接入摄像头实战:WSL2 环境下的 OpenCV 方案
PythonAI算法

OpenClaw 接入摄像头实战:WSL2 环境下的 OpenCV 方案

综述由AI生成针对 OpenClaw 在 WSL2 环境下调用摄像头的难题,记录了从 Node.js 配对失败到 Python+OpenCV 成功的完整排查过程。由于 WSL2 网络隔离及 Hyper-V 限制,Windows 端 Node.js 方案无法稳定连接硬件。最终采用本地 Python 脚本调用 OpenCV 库实现摄像头访问,解决了自动化控制问题。文章提供了详细的依赖安装、代码示例及调试经验,帮助开发者在受限环境中实现 AI 视觉接入。

星河入梦发布于 2026/4/7更新于 2026/4/273 浏览0 点赞约 13 分钟阅读
PythonAI算法

LLaMa-Factory 开源大模型微调与部署实战

基于 LLaMA-Factory 进行开源大模型微调的全流程详解。涵盖环境安装、数据集格式配置(Alpaca/ShareGPT)、训练参数调优、LoRA 适配器合并与量化、以及本地推理与 Ollama 部署方案。旨在降低技术门槛,帮助开发者高效完成模型定制与落地应用。

静心发布于 2026/4/7更新于 2026/4/263 浏览0 点赞约 8 分钟阅读
Stable Diffusion 版本演进与技术脉络梳理
PythonAI算法

Stable Diffusion 版本演进与技术脉络梳理

综述由AI生成Stable Diffusion 自 2022 年发布以来经历了从 1.x 到 3.5 的快速迭代。架构上由 U-Net 转向 MMDiT,分辨率从 512 提升至 1024 以上。核心变化包括文本编码器升级、采样速度优化及多模态能力增强。尽管存在算力门槛与偏见问题,其开源生态仍推动了 AIGC 普及。

FlinkHero发布于 2026/4/7更新于 2026/4/263 浏览0 点赞约 8 分钟阅读
从人类视频到机器人跳舞:BeyondMimic 全流程解析与 rl_sar 部署实践
PythonAI算法

从人类视频到机器人跳舞:BeyondMimic 全流程解析与 rl_sar 部署实践

基于 BeyondMimic 框架实现从人类 RGB 视频到真实人形机器人跳舞的全流程。通过 GVHMR 提取人体运动轨迹,利用 GMR 重定向至机器人关节空间,在 Isaac Lab 中完成强化学习训练,最终通过 rl_sar 框架部署至 Unitree G1 真机。涵盖环境配置、数据转换、PPO 算法训练细节及 sim2real 迁移关键问题。

kaikai发布于 2026/4/7更新于 2026/4/275 浏览0 点赞约 59 分钟阅读
LTX-2.3:开源音视频生成新标杆,单模型同步输出视频与音频
PythonAI算法

LTX-2.3:开源音视频生成新标杆,单模型同步输出视频与音频

综述由AI生成LTX-2.3 是 Lightricks 推出的开源音视频生成基础模型,基于 DiT 架构,拥有约 190 亿参数,支持文生视频、图生视频及音频驱动视频三种模式。该模型重建了 VAE 潜在空间并升级了 HiFi-GAN 声码器,显著提升了画面清晰度与音频质量。模型权重在 HuggingFace 开放,采用 Apache 2.0 协议,支持本地运行及 ComfyUI 集成。提供 fast 与 pro 两种变体,适配不同生产需求,支持 72…

墨染流年发布于 2026/4/7更新于 2026/4/284 浏览0 点赞约 12 分钟阅读
PythonAI算法

ComfyUI-BrushNet 图像修复与编辑教程

ComfyUI-BrushNet 是基于扩散模型的图像编辑扩展节点,集成 BrushNet、PowerPaint 和 HiDiffusion 技术。教程涵盖安装配置、核心工作流搭建及参数调优,支持图像修复、对象移除、批量处理及高分辨率生成。通过调整 RAUNet 和下采样参数可优化生成质量,结合提示词策略解决显存限制,适用于专业图像创作场景。

Eee_123发布于 2026/4/7更新于 2026/4/288 浏览0 点赞约 8 分钟阅读
PythonAI算法

DeepSeek-R1-Distill-Llama-8B 部署教程:Docker Compose 多模型推理服务

DeepSeek-R1-Distill-Llama-8B 基于 Docker Compose 和 Ollama 实现本地化部署,无需配置复杂环境。文章涵盖模型选择理由、零配置搭建步骤、命令行与 Python 脚本调用方式,以及提示词优化和模型持久化技巧。通过容器化方案屏蔽底层差异,支持快速切换模型并集成至现有工作流。

laoliangsh发布于 2026/4/7更新于 2026/4/278 浏览0 点赞约 24 分钟阅读
基于 OpenAgents 构建多智能体旅游助手
PythonAI算法

基于 OpenAgents 构建多智能体旅游助手

综述由AI生成OpenAgents 框架支持本地部署多智能体系统。通过 network start 启动核心服务,利用 von.yaml 配置文件加载基于 GLM-4.7 模型的智能体实例。Web Studio 提供可视化控制台进行交互测试。采用多智能体协作架构,将行程规划、景点推荐、天气查询等任务拆解给不同 Agent,由主控 Agent 整合结果。针对 YAML 模式无法直接调用 HTTP 接口的限制,可通过 Python 自定义 BaseAge…

时间旅人发布于 2026/4/7更新于 2026/4/274 浏览0 点赞约 13 分钟阅读
三款主流云电脑 AIGC 性能实测:ToDesk、顺网云与青椒云对比
PythonAI算法

三款主流云电脑 AIGC 性能实测:ToDesk、顺网云与青椒云对比

针对 ToDesk、顺网云、青椒云三款云电脑进行 AIGC 场景实测。硬件层面,ToDesk 与青椒云配备 RTX 4090 显卡,推理速度显著优于顺网云的 RTX 4060。软件部署上,ToDesk 提供内置镜像简化流程,网络带宽方面顺网云表现最佳。综合性价比与体验,ToDesk 在文件传输与易用性上优势明显,适合高频 AIGC 创作需求。

人间过客发布于 2026/4/7更新于 2026/4/273 浏览0 点赞约 15 分钟阅读
PythonAI算法

Z-Image-Turbo WebUI 本地部署与实战指南

Z-Image-Turbo WebUI 镜像支持一行命令快速启动,实现本地离线 AI 绘画。内置中文提示词理解与多尺寸预设,覆盖电商、自媒体等常用场景。提供 CFG 引导强度、推理步数及随机种子的参数调优建议,并包含端口占用、显存不足等常见问题的排查方案。无需复杂环境配置,适合追求高效工作流的开发者直接部署使用。

孤勇者发布于 2026/4/7更新于 2026/4/293 浏览0 点赞约 20 分钟阅读
PythonPPT制作AI

5 款开源 PPT 生成大模型实测对比:技术原理与工具评测

综述由AI生成开源 PPT 生成大模型通过内容理解、设计适配和文档生成三大模块实现自动化演示文稿制作。文章对比了 ChatGPT-PPT 等工具的技术架构与实战效果,分析其在内容深度、设计美观度及生成速度上的表现,为职场人士和技术创作者提供选型建议。

氛围发布于 2026/4/7更新于 2026/4/264 浏览0 点赞约 3 分钟阅读
PythonAI

GitHub Copilot 实战:Python 开发中的 AI 辅助技巧

GitHub Copilot 作为基于 GPT 模型的编程助手,能根据上下文自动生成代码并提供智能建议。在 Python 开发中,它可加速函数与类的编写、优化循环逻辑及导入语句,并遵循 PEP 8 规范。尽管存在生成错误代码或版权风险等局限,通过明确注释和验证步骤,开发者仍能显著提升效率。结合 Rust 等多语言场景,Copilot 亦能辅助跨语言集成与性能优化,是提升编码质量与学习速度的有效工具。

DevStack发布于 2026/4/7更新于 2026/4/263 浏览0 点赞约 5 分钟阅读
上一页下一页