跳到主要内容
极客日志极客日志
首页博客AI提示词GitHub精选代理工具
搜索
|注册
极客日志

极客日志

面向效率的开发者社区

站内导航

  • 首页
  • 工具箱
  • 博客

快速链接

  • 全球AI模型中转站:Crex
  • 大模型:Hugging Face
  • Stack Overflow
  • MDN

联系我们

  • 技术支持:[email protected]
  • 商务合作:[email protected]
  • 投诉举报:[email protected]

© 2026 极客日志 · zeeklog.com

隐私政策|用户服务条款|关于我们
重置
编程语言 / Python

标签

全部标签AIGPT-image-2javaNode.jsNuctPayPPT制作React NativeRNSaaSVScodeWeChat大前端算法

分类

全部分类
编程语言
PythonJavaScriptTypeScriptJavaKotlinGo / GolangRustC++CC#F#PHPRubySwiftObjective-CScalaClojureElixirErlangHaskellDartLuaPerlRJuliaMATLAB / OctaveSQLShell / BashPowerShellHTML / CSSZigNimCrystalGroovyVisual Basic .NETSolidity汇编

排序

最新更新最新发布最多浏览最多点赞
PythonAI

Stable Diffusion 3.5 提示词语法校验与错误拦截部署指南

Stable Diffusion 3.5 提示词语法校验与错误拦截部署指南。针对 SD 3.5 模型对提示词精度要求高的问题,通过自定义节点实现本地语法校验。方案基于 ComfyUI 环境,利用 Python 脚本检测冲突词、无效标签及权重语法错误。集成后工作流自动拦截异常输入并给出修改建议,有效减少废图生成,提升出图效率与稳定性。支持扩展冲突规则库及风格最佳实践,适用于团队协作或批量生成场景,是优化 AI 绘图工作流的实用工程化手段。

imJackJia发布于 2026/4/7更新于 2026/4/275 浏览0 点赞约 26 分钟阅读
MCP 协议传输层详解:四种通信方式实现与对比
PythonAI

MCP 协议传输层详解:四种通信方式实现与对比

综述由AI生成MCP 协议传输层负责承载 JSON-RPC 消息在不同进程或网络间的传递。详细解析了 Stdio、HTTP+SSE、StreamableHTTP 及 WebSocket 四种传输方式的实现原理与适用场景。通过对比分析,阐述了各方案在本地通信、浏览器交互、会话管理及断点续传等方面的特性,并补充了错误处理机制与标准错误码定义,帮助开发者根据实际部署需求选择合适的传输通道。

RustyLab发布于 2026/4/7更新于 2026/4/263 浏览0 点赞约 31 分钟阅读
DeepSeek 优化提示词配合通义万相 2.1 生成高质量视频
PythonAI算法

DeepSeek 优化提示词配合通义万相 2.1 生成高质量视频

综述由AI生成利用通义万相 2.1 文生视频模型结合 DeepSeek 提示词优化的实战方案。通过 GPU 云服务器部署 1.3B 轻量版模型,仅需 8.2GB 显存即可生成 480P 视频。实验表明,使用 DeepSeek 将模糊指令扩展为包含光影、镜头语言的具体描述后,视频文件大小增加 2 倍且细节显著丰富。该方案实现了从算力到算法的全流程国产化,有效降低了 AI 视频创作门槛,适用于广告及影视制作场景。

漫步发布于 2026/4/7更新于 2026/4/263 浏览0 点赞约 5 分钟阅读
Diffusion Transformer (DiT):用 ViT 替代 U-Net,赋能视频生成与机器人动作预测
PythonAI算法

Diffusion Transformer (DiT):用 ViT 替代 U-Net,赋能视频生成与机器人动作预测

综述由AI生成Diffusion Transformer (DiT) 通过将扩散模型中的 U-Net 骨干替换为 Transformer,实现了更好的可扩展性。文章详细解析了 DiT 的条件策略、视频生成改造方案,并与 U-ViT、Simple Diffusion 及 U-DiT 等竞品架构进行了对比。重点介绍了清华 PAD 框架如何利用 DiT 实现图像预测与机器人动作的联合去噪,展示了其在具身智能领域的最新应用进展与实验效果。

云朵棉花糖发布于 2026/4/7更新于 2026/4/274 浏览0 点赞约 9 分钟阅读
AI Agent 架构详解:感知 - 决策 - 执行的三位一体
PythonAI算法

AI Agent 架构详解:感知 - 决策 - 执行的三位一体

AI Agent 架构围绕感知、决策、执行与记忆四大模块构建。核心决策模式包括 ReAct、Plan-and-Execute 及 Pre-Act,分别适用于不同复杂度场景。实现需注重工具设计、记忆管理及错误处理。没有最优架构,只有最适合场景的架构。

菩提发布于 2026/4/7更新于 2026/4/276 浏览0 点赞约 30 分钟阅读
PythonAI

Z-Image-Turbo_UI 本地 AI 绘图界面实测与使用心得

Z-Image-Turbo_UI 是一款基于 Gradio 的轻量级本地 AI 绘图工具,无需复杂环境配置即可运行。实测显示其在 RTX 3060 上启动迅速,生成速度快于主流 WebUI,且显存占用低。界面简洁直观,参数调节方便,适合显存有限用户及注重隐私的离线场景。通过命令行管理历史图片,操作透明高效。整体体验稳定可靠,专注于快速出图而非功能堆砌。

GopherDev发布于 2026/4/7更新于 2026/4/274 浏览0 点赞约 16 分钟阅读
深度生成模型对比:VAE、GAN、AR、Flow 与 Diffusion 原理及代码实战
PythonAI算法

深度生成模型对比:VAE、GAN、AR、Flow 与 Diffusion 原理及代码实战

深度生成模型涵盖 VAE、GAN、AR、Flow 及 Diffusion 五大类。VAE 基于变分推断,适合数据填充;GAN 通过对抗训练提升图像细节;AR 擅长序列建模;Flow 支持精确密度估计;Diffusion 凭借去噪过程实现高质量生成。对比各模型原理、损失函数及优缺点,并提供 PyTorch 核心代码实现,帮助理解不同架构的适用场景与权衡。

信号故障发布于 2026/4/7更新于 2026/4/264 浏览0 点赞约 28 分钟阅读
PythonAI算法

深度学习本地环境搭建指南:硬件、Anaconda 与 PyTorch 配置

综述由AI生成对希望在个人电脑上部署深度学习环境的开发者,提供了从硬件评估到软件配置的完整流程。重点涵盖 NVIDIA 显卡驱动安装、Anaconda 虚拟环境管理及 PyTorch 框架的部署方法。内容排除了无关的背景介绍与品牌营销信息,专注于实操步骤,帮助用户快速搭建稳定可用的神经网络训练环境。

念念不忘发布于 2026/4/7更新于 2026/4/263 浏览0 点赞约 6 分钟阅读
PythonAI算法

Stable Diffusion 与 AI 智能体联动云端设计工作流教程

Stable Diffusion 结合 AI 智能体实现云端设计工作流。通过云端 GPU 环境部署绘图工具,利用智能体自动分析客户需求并生成提示词。流程涵盖实例创建、智能体部署、需求解析及图像生成优化。支持批量生成与成本控制,有效提升设计效率。

黑客发布于 2026/4/7更新于 2026/4/287 浏览0 点赞约 9 分钟阅读
PythonAI算法

ChatGPT 降低低质内容生成指令实战:精准控制输出质量

综述由AI生成针对 AIGC 生成内容质量波动问题,分享了基于 Prompt 工程与 API 参数调优的实战方案。通过设计严谨的系统角色定义、结构化用户指令以及优化 Temperature、Top-p 等关键参数,可有效降低无关内容与事实错误率。文章还对比了 Prompt 优化、后处理过滤与模型微调三种技术路径,指出对于多数项目,Prompt 结合轻量后处理是性价比最高的起点。此外,提供了动态温度控制、正面引导替代负面约束等避坑指南,并建议在生产环境…

指针猎手发布于 2026/4/7更新于 2026/4/264 浏览0 点赞约 20 分钟阅读
YOLOv11 交通违规检测数据集训练方案:头盔佩戴与闯红灯识别
PythonAI算法

YOLOv11 交通违规检测数据集训练方案:头盔佩戴与闯红灯识别

YOLOv11 交通违规检测数据集包含 5132 张标注图像,涵盖 7 类交通违规行为,如闯红灯、未戴头盔、横穿马路等。提供完整的训练方案,包括数据划分统计、YOLO 配置文件、Python 训练脚本及推理代码。支持导出 ONNX 模型部署,适用于智能交通监控、城市安防及自动驾驶辅助系统。

LinuxPan发布于 2026/4/7更新于 2026/4/285 浏览0 点赞约 16 分钟阅读
PythonAI算法

MiniOneRec 开源推荐框架技术解析

MiniOneRec 是一个基于大语言模型的开源生成式推荐框架,包含 SID 构建、SFT 训练及强化学习优化。框架利用 RQVAE 对商品进行分词,通过序列推荐任务和对齐 SID 文本描述来结合世界知识与推荐信号。实验表明模型规模扩大能提升性能,且引入强化学习与混合奖励机制能有效改善推荐效果及迁移能力。

内存管理发布于 2026/4/7更新于 2026/4/276 浏览0 点赞约 11 分钟阅读
PythonAI算法

基于 LLaMA-Factory 的 LLM DPO 训练实战

基于 LLaMA-Factory 框架演示大语言模型 DPO 对齐训练全流程。涵盖从 HuggingFace 数据集加载、格式转换至 JSON、配置自定义数据集信息,到启动 WebUI 进行多卡分布式训练及最终模型合并的关键步骤。重点解决数据预处理规范与显存优化策略,适用于具备基础 Python 环境的开发者快速上手 RLHF 环节中的偏好优化任务。

猫巷少女发布于 2026/4/7更新于 2026/4/295 浏览0 点赞约 8 分钟阅读
DeepSeek 中冷启动数据与多阶段训练的作用
PythonAI算法

DeepSeek 中冷启动数据与多阶段训练的作用

DeepSeek 模型通过冷启动数据和多阶段训练提升推理能力。冷启动数据利用少量高质量样本指导初期微调,解决推理混乱问题。多阶段训练包含冷启动微调、推理导向强化学习、拒绝采样与监督微调及多场景强化学习四个步骤,逐步优化模型表现和稳定性。

信号故障发布于 2026/4/7更新于 2026/4/275 浏览0 点赞约 10 分钟阅读
Stable Diffusion 视觉提示词注入攻击原理与实现
PythonAI算法

Stable Diffusion 视觉提示词注入攻击原理与实现

综述由AI生成探讨针对 Stable Diffusion 模型的视觉提示词注入攻击。通过 PGD 对抗攻击算法对输入图像进行像素级微调,结合扩散模型推理过程重写与 CLIP 特征空间分析,绕过内置的 NSFW 安全检测机制(Safety Checker)。文章详细阐述了威胁模型定义、环境配置、核心攻击流程及代码实现,包括固定随机种子、数据预处理、损失函数构建及扰动优化等关键步骤,旨在揭示生成式 AI 的安全边界并辅助防御研究。

星星泡饭发布于 2026/4/7更新于 2026/4/296 浏览0 点赞约 38 分钟阅读
宇树 G1 机器人 VR 遥操与模仿学习开发:xr_teleoperate 集成 unitree_IL_lerobot
PythonAI算法

宇树 G1 机器人 VR 遥操与模仿学习开发:xr_teleoperate 集成 unitree_IL_lerobot

宇树 G1 人形机器人 VR 遥操作与模仿学习开发流程。涵盖 avp_teleoperate 及升级版 xr_teleoperate 环境配置、硬件连接(Vision Pro/Quest)、图像推流服务启动。支持手势与手柄控制,实现数据采集并转换为 LeRobot 格式。集成 pi0、Diffusion Policy 等策略进行训练与真机测试,提供从遥操到模型部署的完整技术路径。

奇形怪状发布于 2026/4/7更新于 2026/4/264 浏览0 点赞约 72 分钟阅读
开源机器人 AI 框架 LeRobot 入门与实践
PythonAI算法

开源机器人 AI 框架 LeRobot 入门与实践

LeRobot 是由 Hugging Face 团队开发的基于 PyTorch 的开源机器人学习框架,聚焦真实世界机器人的 AI 能力落地,主打模仿学习和强化学习。文章涵盖框架核心特性、SO101 机械臂硬件介绍与校准、带相机遥操作数据采集、模型训练策略及推理部署流程。同时包含 LeIsaac 仿真环境配置、键盘遥操作体验以及 LeIsaac 与 LeRobot EnvHub 集成的实操步骤,为具身智能 VLA 入门提供完整技术路径。

星星泡饭发布于 2026/4/7更新于 2026/4/264 浏览0 点赞约 59 分钟阅读
通义万相 2.1 文生图技术特性与部署实践
PythonAI算法

通义万相 2.1 文生图技术特性与部署实践

通义万相 2.1 文生图模型凭借卓越的语义理解与细节表现力,支持最高 200 万像素输出及智能改写功能。面对 AIGC 时代算力需求爆发,异构算力成为关键支撑。梳理模型核心优势,涵盖生成速度、分辨率设置及文本优化能力,为开发者评估大模型落地提供参考。

1qazxsw2发布于 2026/4/7更新于 2026/4/293 浏览0 点赞约 5 分钟阅读
PythonAI算法

faster-whisper 快速部署与性能优化指南

faster-whisper 是基于 OpenAI Whisper 模型的优化版本,利用 CTranslate2 引擎实现更快的推理速度。内容涵盖安装方法、GPU 与 CPU 环境配置、基础转录代码示例以及模型尺寸和计算类型的优化策略。通过量化技术和合理选型,可在保证准确率的同时显著降低显存占用并提升处理效率,适用于会议记录、视频字幕等多种语音识别场景。

abccba发布于 2026/4/7更新于 2026/4/263 浏览0 点赞约 5 分钟阅读
PythonAI算法

2026 RAG 技术演进:DeepSeek 结合 Neo4j 构建企业智能体系

综述由AI生成GraphRAG 凭借多跳推理与可解释性优势,正逐步替代传统向量 RAG 成为企业级应用主流。DeepSeek 在大模型理解与实体抽取上的能力,结合 Neo4j 的结构化存储,有效解决了上下文窗口限制与中间信息丢失痛点。文章分析了这一技术路线的核心价值与实施要点,探讨了如何利用动态 Schema 构建适应业务变化的智能体系。

时间旅人发布于 2026/4/7更新于 2026/4/294 浏览0 点赞约 5 分钟阅读
上一页下一页