跳到主要内容
极客日志极客日志
首页博客AI提示词GitHub精选代理工具
搜索
|注册
极客日志

极客日志

面向效率的开发者社区

站内导航

  • 首页
  • 工具箱
  • 博客

快速链接

  • 全球AI模型中转站:Crex
  • 大模型:Hugging Face
  • Stack Overflow
  • MDN

联系我们

  • 技术支持:[email protected]
  • 商务合作:[email protected]
  • 投诉举报:[email protected]

© 2026 极客日志 · zeeklog.com

隐私政策|用户服务条款|关于我们
重置
编程语言 / Python

标签

全部标签AIGPT-image-2javaNode.jsNuctPayPPT制作React NativeRNSaaSVScodeWeChat大前端算法

分类

全部分类
编程语言
PythonJavaScriptTypeScriptJavaKotlinGo / GolangRustC++CC#F#PHPRubySwiftObjective-CScalaClojureElixirErlangHaskellDartLuaPerlRJuliaMATLAB / OctaveSQLShell / BashPowerShellHTML / CSSZigNimCrystalGroovyVisual Basic .NETSolidity汇编

排序

最新更新最新发布最多浏览最多点赞
PythonAI算法

Stable Diffusion 3.5 本地部署与使用指南

Stable Diffusion 3.5 FP8 版本通过量化技术显著降低显存占用并提升推理速度,使消费级显卡也能流畅运行。部署核心在于配置 ComfyUI 环境及正确放置模型文件,包括主模型、CLIP 编码器及 T5 XXL 文本编码器。硬件建议 NVIDIA RTX 3060 及以上,显存至少 12GB。常见问题如显存不足可通过降低分辨率或开启分块渲染解决,提示词解析错误多因缺少 T5 模型导致。FP8 在保持画质的同时大幅优化性能…

ApiHolic发布于 2026/4/7更新于 2026/4/283 浏览0 点赞约 17 分钟阅读
PythonAI算法

基于 Cosmos-Reason1-7B 的机器人抓取物理推理分析

综述由AI生成Cosmos-Reason1-7B 模型通过思维链推理技术赋予机器人物理常识。文章展示了该模型在机器人抓取任务中的应用,包括对重力、摩擦力及稳定性的分析。通过厨房碗碟、仓储搬运、医疗辅助及户外作业等场景案例,演示了如何评估动态负载、重心变化及环境风险。内容涵盖模型原理、推理过程解读、WebUI 操作指南及提问技巧,旨在帮助开发者利用视觉感知与物理逻辑结合,提升机器人在非结构化环境中的交互安全性与适应性。

清心发布于 2026/4/7更新于 2026/4/255 浏览0 点赞约 13 分钟阅读
Diffusion Transformer (DiT) 详解:用 ViT 替代 U-Net 实现扩散模型,应用于视频生成与机器人控制
PythonAI算法

Diffusion Transformer (DiT) 详解:用 ViT 替代 U-Net 实现扩散模型,应用于视频生成与机器人控制

综述由AI生成详细解析了 Diffusion Transformer (DiT) 架构,探讨了如何用 ViT 替代传统扩散模型中的 U-Net。文章首先介绍了 DiT 的核心原理及三种条件策略,对比了 U-ViT、Simple Diffusion 等相关工作。随后阐述了 DiT 在视频生成领域的改造方法,包括时空 Token 化和因果时间注意力机制。重点分析了 DiT 在机器人动作预测中的应用,特别是清华提出的 PAD 框架,该框架通过联合去噪同时预…

游戏玩家发布于 2026/4/7更新于 2026/4/285 浏览0 点赞约 9 分钟阅读
RTX4090 在 AI 与深度学习中的实践应用
PythonAI算法

RTX4090 在 AI 与深度学习中的实践应用

综述由AI生成RTX4090 凭借 Ada Lovelace 架构、24GB 显存及第四代 Tensor Core,显著提升了深度学习训练与推理效率。本文结合 PyTorch 实战,详解了混合精度训练、梯度检查点、TensorRT 加速及多卡分布式策略。通过显存优化与量化技术,解决了大模型部署瓶颈,为开发者提供了从硬件选型到工程落地的完整参考。

GRACE Grace发布于 2026/4/7更新于 2026/4/286 浏览0 点赞约 52 分钟阅读
PythonAI算法

通义千问 2.5-7B-Instruct 模型部署与 AI 写作实战演示

通义千问 2.5-7B-Instruct 模型部署方案及 AI 写作能力实战分析。基于 vLLM 与 Open WebUI 搭建环境,覆盖创意文案、技术文档、多语言翻译及结构化输出等场景。内容包含模型特性解析、性能优化建议与安全使用提醒,为开发者提供可复现的本地化大模型应用路径。

SqlMaster发布于 2026/4/7更新于 2026/4/273 浏览0 点赞约 14 分钟阅读
OpenVLA 模型解析:基于 Prismatic VLM 与下一个 Token 预测的动作生成
PythonAI算法

OpenVLA 模型解析:基于 Prismatic VLM 与下一个 Token 预测的动作生成

OpenVLA 是基于 Prismatic VLM 构建的开源视觉 - 语言 - 动作模型。它利用 SigLIP 和 DinoV2 作为视觉编码器,Llama 2 作为语言骨干,通过离散化机器人动作并映射到 LLM 词表,采用下一个 Token 预测技术进行训练。该模型在 Open-X Embodiment 数据集上微调,支持多机器人控制及高效 LoRA 微调。实验表明其在泛化能力和任务成功率上优于部分闭源模型如 RT-2-X,且推理速…

怪力乱神发布于 2026/4/7更新于 2026/4/288 浏览0 点赞约 57 分钟阅读
PythonAI算法

本地离线部署 Whisper 模型进行语音转写

本地离线部署 Whisper 模型实现语音转写功能。需安装 Python 3.8+ 及 FFmpeg 环境,通过 pip 安装 openai-whisper 库。支持命令行直接转写音频文件,也可编写 Python 脚本调用模型接口。关键参数包括模型大小选择、语言指定及输出格式设置。常见问题涉及内存不足、音频格式错误及模型下载慢,可通过调整模型规格或手动下载解决。该方法无需依赖 Ollama,适合本地稳定运行。

DevStack发布于 2026/4/7更新于 2026/4/275 浏览0 点赞约 11 分钟阅读
AIGC 插画创作技术解析与代码实战
PythonAI算法

AIGC 插画创作技术解析与代码实战

AIGC 插画生成基于扩散模型原理,利用 Stable Diffusion 和 Diffusers 库构建生成系统。内容涵盖环境搭建、模型加载、提示词构建、参数调优及风格迁移。支持游戏角色设计与广告海报生成的代码示例,分析版权与算力挑战,探讨实时交互与跨模态融合趋势,推动人机协同创作。

t ag发布于 2026/4/7更新于 2026/4/265 浏览0 点赞约 11 分钟阅读
前端加密攻防实战:encrypt-labs 靶场环境搭建与通关解析
Python大前端算法

前端加密攻防实战:encrypt-labs 靶场环境搭建与通关解析

综述由AI生成详细讲解了 encrypt-labs 靶场的搭建与全关卡解析。涵盖环境部署、BurpSuite 插件配置(Galaxy 与 autoDecoder),以及 AES 固定 Key、AES 服务端获取 Key、RSA 加密、AES+RSA 组合加密、DES 规律 Key、明文加签、服务端加签和禁止重放等常见前端加密场景的逆向分析与绕过方案。通过实际代码示例,演示了如何利用 Python 脚本拦截请求、解密参数并构造合法请求,帮助读者深入理解…

全栈工匠发布于 2026/4/7更新于 2026/4/263 浏览0 点赞约 64 分钟阅读
基于魔搭与 LLaMA Factory 的大模型微调全流程实战
PythonAI算法

基于魔搭与 LLaMA Factory 的大模型微调全流程实战

使用魔搭平台与 LLaMA Factory 工具进行大模型微调的完整流程。涵盖环境搭建、轻量模型下载、数据集准备与转换、WebUI 训练配置、效果测试及 GGUF 格式导出等关键步骤。通过 Qwen2.5-0.5B-Instruct 模型实例,演示从零开始训练并本地部署私有化模型的方法,适合希望掌握大模型落地技术的开发者参考。

微码行者发布于 2026/4/7更新于 2026/4/274 浏览0 点赞约 8 分钟阅读
基于 ROS 的黑线循迹与激光跟随双模态视觉导航系统实战
PythonAI算法

基于 ROS 的黑线循迹与激光跟随双模态视觉导航系统实战

综述由AI生成视觉导航系统在室内机器人中应用广泛。本方案基于 ROS 构建,实现了黑线循迹与红外激光笔跟随的双模态切换。针对低算力硬件优化了图像处理流水线,支持路口自适应减速与多模式自动转换。内容涵盖硬件改造、环境配置、核心代码解析及调试技巧,适合入门开发者学习与二次拓展。

板砖工程师发布于 2026/4/7更新于 2026/4/284 浏览0 点赞约 37 分钟阅读
近半年无人机与大模型结合的 8 项前沿研究盘点
PythonAI算法

近半年无人机与大模型结合的 8 项前沿研究盘点

综述由AI生成无人机与大模型结合成为近期热点。盘点了近半年八项代表性研究,涵盖机载视觉语言动作框架 VLA-AN、语义导航 AirHunt、开放环境扫描 FlyCo、低空场景评测 MM-UAVBENCH 及 UAVBench、人机交互 Chat with UAV、提示词适配 AdaptFly 以及端边云协同 CoDrone。这些工作解决了算力受限、推理频率不匹配、开放世界理解及伦理决策等关键问题,展示了从感知到规划再到交互的系统化落地路径,为低空智能…

监控大屏发布于 2026/4/7更新于 2026/4/273 浏览0 点赞约 20 分钟阅读
PythonAI算法

Code Llama 7B 快速上手指南

Code Llama 7B 是 Meta 开发的代码生成模型,支持多种编程语言理解与生成。主要功能包括代码补全、函数填充及多语言支持。环境要求 Python 3.8+ 及至少 16GB 内存。安装依赖 transformers 和 accelerate 库,通过 Hugging Face 加载模型。参数调优涉及 temperature、top_k 和 max_length。适用场景涵盖快速原型开发、代码重构及学习辅助。使用前需遵守相关许…

moshang发布于 2026/4/7更新于 2026/4/276 浏览0 点赞约 5 分钟阅读
Llama 3.1 模型部署实践与体验
PythonAI算法

Llama 3.1 模型部署实践与体验

Llama 3.1 8B 模型部署需约 16GB 显存,建议选用 RTX 4090 等 GPU 环境。通过预装 PyTorch 镜像简化配置,安装 LangChain、Streamlit 及 Transformers 依赖后,利用 Hugging Face 接口加载模型并构建 Web 聊天界面。云端算力结合开源大模型可降低开发门槛,支持快速进行对话生成测试与应用验证。

松间照月发布于 2026/4/7更新于 2026/4/264 浏览0 点赞约 9 分钟阅读
AI 写作实战项目:自动写作助手设计与实现
PythonAI算法

AI 写作实战项目:自动写作助手设计与实现

自动写作助手基于自然语言处理技术,旨在解决多样化写作需求下的效率问题。项目涵盖背景分析、技术选型及架构设计,涉及语料库准备、数据预处理、模型构建与评估优化。训练阶段强调数据规模扩充、质量清洗及多领域知识支持,结合人机交互提升生成质量。应用场景覆盖教育、商业及科研领域,未来趋势指向更高智能化、多模态融合及个性化服务完善。通过用户反馈持续迭代,实现高效便捷的自动化内容创作。

DevStack发布于 2026/4/7更新于 2026/4/275 浏览0 点赞约 18 分钟阅读
PythonAI算法

多旋翼物流无人机节能轨迹规划及 Python 实现

综述由AI生成多旋翼物流无人机在配送场景中面临续航与效率的双重挑战。探讨基于动力学模型的节能轨迹规划方法,通过优化飞行高度、速度及航向来降低能耗。结合 Python 仿真环境,演示了如何在三维空间中构建障碍物走廊并调用求解器生成最优路径。方案涵盖静态环境下的可行性分析、能耗计算模型及动态调整策略,为智能物流系统的绿色运行提供技术参考。

灵魂摆渡发布于 2026/4/7更新于 2026/4/253 浏览0 点赞约 10 分钟阅读
PythonAI算法

Qwen3Guard-Gen-WEB 实战测评:真实业务场景下的安全审核表现

Qwen3Guard-Gen-WEB 是一款开源的安全审核工具,通过三级风险判定机制有效解决传统审核机制在真实场景下的误判问题。实测显示其在多语言支持、中英混杂内容处理及复杂意图识别上表现优异,尤其适合需要精细化风控的业务场景。部署过程简单,配合规则引擎构建双通道架构可平衡性能与准确率。生产环境建议通过正则解析自然语言输出以实现自动化集成,避免直接硬编码规则导致的维护困难。

PhpPioneer发布于 2026/4/7更新于 2026/4/263 浏览0 点赞约 19 分钟阅读
TrendRadar 本地部署指南:构建个人 AI 热点情报系统
PythonAI算法

TrendRadar 本地部署指南:构建个人 AI 热点情报系统

综述由AI生成TrendRadar 本地部署指南详细拆解了从环境准备、Docker 镜像拉取、局域网访问配置、飞书推送修复到 Cherry Studio MCP 服务对接的全流程。通过 Nvidia 免费模型 API 实现零成本的深度热点分析与趋势追踪,解决信息茧房问题。重点修正了飞书 Markdown 渲染错误,并展示了如何通过 MCP 协议实现 AI 对新闻数据的深度对话分析,打造个人专属情报局。

CoderByte发布于 2026/4/7更新于 2026/4/263 浏览0 点赞约 10 分钟阅读
PythonWeChatAI

OpenClaw 手机端部署指南:打造移动 AI 智能终端

OpenClaw 是一款开源自托管 AI 执行网关,能将指令转化为实际行动。将其部署于手机可实现随身自动化,利用旧设备作为边缘节点保障隐私安全。主要功能涵盖社交软件自动回复、语音交互、边缘 AI 任务及跨设备联动等场景,支持断网本地运行。

1qazxsw2发布于 2026/4/7更新于 2026/4/266 浏览0 点赞约 2 分钟阅读
PythonAI算法

FLUX.1-dev FP8 量化模型部署与优化指南

FLUX.1-dev FP8 量化版本将显存需求降低至 6GB,支持 RTX 3060、4060 等中端显卡流畅运行。通过创建虚拟环境、安装依赖及配置参数,可实现低资源下的图像生成。优化建议包括调整分辨率、采样步数及 CFG 值。文本编码保持 FP16,图像核心应用 FP8 量化,平衡性能与画质。适用于数字艺术、概念设计及内容营销场景。

灵魂伴侣发布于 2026/4/7更新于 2026/4/274 浏览0 点赞约 4 分钟阅读
上一页下一页