跳到主要内容
极客日志极客日志
首页博客AI提示词GitHub精选代理工具
搜索
|注册
极客日志

极客日志

面向效率的开发者社区

站内导航

  • 首页
  • 工具箱
  • 博客

快速链接

  • 全球AI模型中转站:Crex
  • 大模型:Hugging Face
  • Stack Overflow
  • MDN

联系我们

  • 技术支持:[email protected]
  • 商务合作:[email protected]
  • 投诉举报:[email protected]

© 2026 极客日志 · zeeklog.com

隐私政策|用户服务条款|关于我们
重置
编程语言 / Python

标签

全部标签AIGPT-image-2javaNode.jsNuctPayPPT制作React NativeRNSaaSVScodeWeChat大前端算法

分类

全部分类
编程语言
PythonJavaScriptTypeScriptJavaKotlinGo / GolangRustC++CC#F#PHPRubySwiftObjective-CScalaClojureElixirErlangHaskellDartLuaPerlRJuliaMATLAB / OctaveSQLShell / BashPowerShellHTML / CSSZigNimCrystalGroovyVisual Basic .NETSolidity汇编

排序

最新更新最新发布最多浏览最多点赞
通义万相 2.1 图生视频技术简介与开源资源获取
PythonAI算法

通义万相 2.1 图生视频技术简介与开源资源获取

综述由AI生成图生视频技术的概念,即通过图像和文本生成动态视频。重点介绍了阿里巴巴通义万相 2.1 模型及其独立网站 wan.video 的使用方式。同时提供了开源代码的获取途径,包括 GitHub 和 HuggingFace 平台,方便开发者进行本地体验测试。

雾岛听风发布于 2026/4/6更新于 2026/5/1325 浏览5 点赞约 1 分钟阅读
Diffusion Transformer(DiT):将 U-Net 换成 ViT,应用于视频生成与机器人动作预测
PythonAI算法

Diffusion Transformer(DiT):将 U-Net 换成 ViT,应用于视频生成与机器人动作预测

综述由AI生成Diffusion Transformer (DiT) 架构,该架构将扩散模型中的 U-Net 替换为 ViT,结合了 Transformer 与扩散模型的优势。文章阐述了 DiT 在视频生成领域的改造方法,包括引入时间维度和注意力掩码机制。重点分析了 DiT 在机器人动作预测中的应用,特别是清华提出的 PAD(预测与动作扩散器)框架。PAD 利用 DiT 骨干网络,通过联合去噪过程同时预测未来图像和机器人动作,支持多模态输入(RGB、…

技术博主发布于 2026/4/6更新于 2026/5/1427 浏览4 点赞约 61 分钟阅读
PythonAI算法

树莓派 4 部署 ClawdBot 与 MoltBot:本地 OCR/Whisper/vLLM 高并发实践

综述由AI生成在树莓派 4(4GB 内存)上部署 ClawdBot 和 MoltBot 的案例,实现了 OCR、Whisper 语音转写及 vLLM 大模型推理的本地化运行。通过优化模型选型(如 Whisper tiny、PP-OCRv4)和资源调度,系统支持 15 人并发使用且无卡顿。方案强调数据隐私可控、响应确定及低资源占用,提供了从配置到性能测试的完整实操指南,展示了本地 AI 助手在边缘设备上的可行性。

链路追踪发布于 2026/4/6更新于 2026/5/1224 浏览4 点赞约 20 分钟阅读
OpenAI 与 LangChain 集成实战使用详解
PythonAI

OpenAI 与 LangChain 集成实战使用详解

OpenAI 与 LangChain 的集成方法。内容涵盖开发环境准备(Python 环境、API Key)及 LangChain 核心组件概览。通过讲解 Chat Models、提示词模板、Memory 及向量数据库等组件的使用,帮助开发者在实际项目中有效利用 LangChain 构建智能应用,实现 RAG 等场景的落地实践。

HadoopMan发布于 2026/4/6更新于 2026/5/1326 浏览5 点赞约 1 分钟阅读
AIGC 赋能插画创作:技术解析与代码实战
PythonAI算法

AIGC 赋能插画创作:技术解析与代码实战

深入解析 AIGC 插画生成的技术架构,基于扩散模型原理,利用 Stable Diffusion 和 Diffusers 库实现从环境配置到图像生成的全流程。内容涵盖文本提示词构建、参数调优(迭代次数、引导尺度)、风格迁移及多模型融合技巧。通过游戏角色设计和广告海报生成示例展示应用场景,并探讨版权伦理、语义理解及计算资源等技术挑战与解决方案,展望实时交互与跨模态融合的未来趋势。

黑客帝国发布于 2026/4/6更新于 2026/5/1220 浏览3 点赞约 11 分钟阅读
PythonAI算法

Phi-3-vision-128k-instruct 开源镜像:支持国产昇腾/寒武纪平台适配指南

介绍 Phi-3-Vision-128K-Instruct 多模态模型在国产昇腾和寒武纪平台的部署指南。内容涵盖环境准备、服务启动验证、通过 Chainlit 前端及 REST API 调用方法,并提供图片识别与多轮对话示例。同时包含常见问题排查建议,如端口冲突、内存不足及响应速度优化方案,旨在帮助开发者在资源受限环境下实现高效推理。

疯疯癫癫发布于 2026/4/6更新于 2026/5/1320 浏览2 点赞约 5 分钟阅读
小米 MiLoco 大模型智能家居解决方案部署指南
PythonAI算法

小米 MiLoco 大模型智能家居解决方案部署指南

综述由AI生成介绍小米首个大模型加智能家居解决方案 Miloco 的部署流程。Miloco 基于自研端侧视觉语言大模型 MiMo-VL-Miloco-7B,支持自然语言交互控制 IoT 设备。文章涵盖系统硬件软件要求、WSL 环境配置、Docker 安装、CUDA 驱动验证及一键安装脚本执行步骤,并简述了前端访问与服务使用注意事项。

ArchDesign发布于 2026/4/6更新于 2026/5/1327 浏览3 点赞约 17 分钟阅读
AI 绘画在商业设计中的应用与版权探讨
PythonAI算法

AI 绘画在商业设计中的应用与版权探讨

综述由AI生成AI 绘画技术在广告、插画及游戏设计领域展现出巨大商业价值,能提升效率、降低成本并增强创意。然而,版权归属和数据合规性仍是行业面临的挑战。探讨了具体应用场景及相关法律风险,指出未来需完善法规与技术监管以促进健康发展。

CoderByte发布于 2026/4/6更新于 2026/5/1120 浏览3 点赞约 28 分钟阅读
终身机器人学习基准测试平台 LIBERO 介绍
PythonAI算法

终身机器人学习基准测试平台 LIBERO 介绍

LIBERO 是基于 robosuite 构建的终身机器人学习综合基准测试平台,专注于研究多任务场景下的知识迁移。它包含 130 个操作任务,分为 Spatial、Object、Goal 和 100 个任务的套件,支持程序化生成。系统提供多种视觉运动策略网络(RNN、Transformer、ViLT)及五种终身学习算法(如经验回放、弹性权重巩固等),旨在解决灾难性遗忘和知识迁移评估问题。用户可通过 pip 安装并使用 HuggingFa…

日志猎手发布于 2026/4/6更新于 2026/5/1328 浏览3 点赞约 15 分钟阅读
StreamVLN 具身导航复现与模型推理指南
PythonAI算法

StreamVLN 具身导航复现与模型推理指南

综述由AI生成介绍 StreamVLN 流式视觉语言导航模型的复现流程。内容包括创建 Conda 环境、安装 Habitat 仿真环境、准备 Matterport3D 及 VLN-CE 数据集、下载预训练模型权重。详细说明了多 GPU 和单 GPU 下的评估推理命令,展示了可视化效果代码修改,并提供了分布式训练指令。适用于具身智能导航任务的研究与部署。

锁机制发布于 2026/4/6更新于 2026/5/1229 浏览4 点赞约 89 分钟阅读
PythonAI算法

YOLO12 WebUI 目标检测快速上手指南

介绍 YOLO12 WebUI 目标检测工具的快速部署与使用方法。通过 Docker 镜像可直接启动服务,无需本地安装 Python 或 CUDA。支持点击或拖拽上传图片进行检测,结果包含边界框、类别及置信度。用户可切换不同精度模型(nano 至 x),查看运行日志排查问题,并通过 FastAPI 接口实现自动化集成。常见问题涵盖图片上传失败、检测结果异常及移动端访问限制等场景。

孤勇者发布于 2026/4/6更新于 2026/5/1228 浏览3 点赞约 17 分钟阅读
PythonAI算法

vLLM+Open-WebUI 部署通义千问 2.5-7B 完整教程

基于 vLLM 和 Open-WebUI 部署通义千问 2.5-7B-Instruct 模型的完整流程。涵盖环境准备(Docker、GPU)、模型获取、服务启动及 Web 界面配置。包含性能优化建议、Function Calling 支持及常见问题排查,实现本地高性能大模型推理与交互。

内存管理发布于 2026/4/6更新于 2026/5/1329 浏览2 点赞约 17 分钟阅读
PythonAI算法

通义千问 1.5-1.8B Chat GPTQ Int4 体验:vLLM 部署与 Chainlit 前端

综述由AI生成详细记录了通义千问 1.5-1.8B-Chat-GPTQ-Int4 模型的部署与实测过程。采用 vLLM 推理引擎结合 Chainlit 前端,实现了低资源消耗下的流畅对话体验。内容涵盖环境配置、服务验证、功能测试及性能分析。量化技术有效降低内存占用,适用于个人学习、原型开发及轻度生产场景。

开源信徒发布于 2026/4/6更新于 2026/5/1021 浏览1 点赞约 7 分钟阅读
PCTF2025 Web 赛题解析:整数溢出、JWT 伪造及 SSTI
Python算法

PCTF2025 Web 赛题解析:整数溢出、JWT 伪造及 SSTI

PCTF2025 Web 赛题涉及多种漏洞类型。神秘商店利用全角字符绕过注册及 Rust 整数溢出获取余额;We_will_rockyou 通过 JWT 密钥泄露与密码覆盖机制结合字典爆破获取权限;Jwt_password_manager 存在硬编码密钥导致 Token 伪造读取 Flag;ez_upload 利用 SSTI 模板注入绕过文件上传限制;Do_you_know_session? 通过搜索框 SSTI 获取密钥并伪造 Ses…

PentesterX发布于 2026/4/6更新于 2026/5/1425 浏览3 点赞约 54 分钟阅读
Google A2UI 前端可操作性技术入门
PythonAI大前端

Google A2UI 前端可操作性技术入门

综述由AI生成Google A2UI 是 Google 推出的前端可操作性协议,允许 AI 智能体通过结构化 UI 与用户交互。 A2UI 的快速入门方法,包括克隆仓库、配置 Gemini API Key 并运行餐厅查找器示例。支持 Flutter GenUI SDK 和 CopilotKit 组件构建器等集成方案。开发流程包含理解用户意图、生成 A2UI JSON、验证流式传输及处理用户动作。提供了基于 Python ADK 的简单代理开发代码示例…

古灵精怪发布于 2026/4/6更新于 2026/5/1333 浏览4 点赞约 9 分钟阅读
PythonAI算法

AI 股票分析师 daily_stock_analysis 实测:3 步完成私有化金融分析

综述由AI生成实测了基于 Ollama 和 gemma:2b 模型的私有化股票分析工具 daily_stock_analysis。该工具无需联网,数据完全本地处理,保障隐私安全。通过三步操作即可生成包含近期表现、潜在风险及未来展望的结构化分析报告。相比在线 AI 工具,它在稳定性、响应速度和风险控制上更具优势,适合内部投研初筛及教学案例拆解。支持通过 REST API 批量生成报告,并可结合真实数据管道进行深度分析,是个人投资者及企业分析师的高效辅助…

雪落无声发布于 2026/4/6更新于 2026/5/1226 浏览4 点赞约 20 分钟阅读
AI 调参技巧:网格搜索优化
PythonAI算法

AI 调参技巧:网格搜索优化

基于 Python 的 AI 模型调优方法,重点讲解网格搜索优化技术。内容涵盖核心概念解析、技术原理(含 TensorFlow 与 PyTorch 实现)、数据处理流程及模型评估方法。通过房价预测案例展示完整实施步骤,包括环境准备、项目结构搭建及代码规范。同时提供常见问题解答与最佳实践建议,帮助开发者提升模型性能与泛化能力。

念念不忘发布于 2026/4/6更新于 2026/5/1218 浏览2 点赞约 38 分钟阅读
AI 时代产品经理的能力边界:AI 能做什么与不能做什么
PythonAI

AI 时代产品经理的能力边界:AI 能做什么与不能做什么

综述由AI生成探讨 AI 时代产品经理如何掌握技术能力边界。文章指出 AI 是核心工具而非竞争对手,列举了 AI 在结构化信息处理、创意辅助、数据洞察等六方面的应用能力,以及战略决策、情感共情等四方面无法替代的核心能力。通过建立'AI 辅助 + 人类决策'流程、利用边界设计差异化产品及持续学习,产品经理可提升效率并明确自身价值,成为 AI 能力的熟练使用者和边界界定者。

小熊软糖发布于 2026/4/6更新于 2026/5/1118 浏览3 点赞约 8 分钟阅读
AI Agent 开发入门:零基础学习指南
PythonAI算法

AI Agent 开发入门:零基础学习指南

介绍 AI Agent 开发的基础概念、技术原理及实践应用。涵盖从底层架构到核心算法(如 ReAct),提供实施步骤、最佳实践及案例分析,帮助读者理解如何从零开始构建和执行智能体任务。内容包括 Python 代码示例、场景分析、成本与安全考量以及未来趋势展望。

追风少年发布于 2026/4/6更新于 2026/5/1228 浏览3 点赞约 34 分钟阅读
AI 数据标注平台的选型与实践:效率提升背后的技术逻辑
PythonSaaSAI算法

AI 数据标注平台的选型与实践:效率提升背后的技术逻辑

综述由AI生成探讨了 AI 数据标注平台的选型标准与技术架构。核心观点包括区分 SaaS 与私有化部署的适用场景,利用 WebSocket 保障实时并发,以及设计无损的标注格式中间态。效率提升依赖于 AI 预标注(如 SAM、LLM)减少人工操作,结合合理的任务调度与质控流程(如双盲审、Kappa 系数)。此外,强调数据安全(Canvas 绘制、水印)与版本控制的重要性。通过 Python 代码示例展示了预标注控制器的实现逻辑,旨在帮助团队构建高效、…

星河入梦发布于 2026/4/6更新于 2026/5/1224 浏览4 点赞约 18 分钟阅读
上一页下一页