跳到主要内容
极客日志极客日志
首页博客AI提示词GitHub精选代理工具
搜索
|注册
极客日志

极客日志

面向效率的开发者社区

站内导航

  • 首页
  • 工具箱
  • 博客

快速链接

  • 全球AI模型中转站:Crex
  • 大模型:Hugging Face
  • Stack Overflow
  • MDN

联系我们

  • 技术支持:[email protected]
  • 商务合作:[email protected]
  • 投诉举报:[email protected]

© 2026 极客日志 · zeeklog.com

隐私政策|用户服务条款|关于我们
重置
编程语言 / Python

标签

全部标签AIGPT-image-2javaNode.jsNuctPayPPT制作React NativeRNSaaSVScodeWeChat大前端算法

分类

全部分类
编程语言
PythonJavaScriptTypeScriptJavaKotlinGo / GolangRustC++CC#F#PHPRubySwiftObjective-CScalaClojureElixirErlangHaskellDartLuaPerlRJuliaMATLAB / OctaveSQLShell / BashPowerShellHTML / CSSZigNimCrystalGroovyVisual Basic .NETSolidity汇编

排序

最新更新最新发布最多浏览最多点赞
PythonSaaSAI算法

2026 年 3 月 18 日人工智能前沿动态与产业观察

2026 年 3 月中旬 AI 领域呈现多维格局。英伟达 GTC 大会开启太空计算时代,发布 Vera Rubin 空间模块及 Feynman 光通信芯片,展望万亿美元营收目标。国内'人工智能 +'行动深化,科大讯飞展示'超级团队'效能,格力 AI 节能技术落地。阿里巴巴推出企业级 Agent 平台'悟空',券商自研智能体兴起。资本市场方面,OpenAI 发布轻量模型拓展政府合同,三星工会罢工威胁加剧芯片供应不确定性,村田启动 MLCC…

性能调优发布于 2026/4/8更新于 2026/4/264 浏览0 点赞约 2 分钟阅读
PythonAI算法

AI 绘画 R18 提示词实战:基础原理与安全实践

AI 绘画 R18 内容创作面临伦理风险与合规挑战,主流模型如 Stable Diffusion 和 NovelAI 采用不同安全机制。通过安全提示词权重调节、负面提示词库构建及 TensorFlow NSFW 检测代码实现,可有效控制生成内容。结合多模态审核设计与合规实践建议,能在保障内容安全的同时兼顾艺术表达多样性,为开发者提供技术落地参考。

灵魂伴侣发布于 2026/4/8更新于 2026/4/274 浏览0 点赞约 7 分钟阅读
PythonAI算法

基于 vLLM 和 Open-WebUI 快速部署 Meta-Llama-3-8B-Instruct

基于 vLLM 推理引擎与 Open-WebUI 界面,利用预构建 Docker 镜像可快速在本地部署 Meta-Llama-3-8B-Instruct 模型。该方案支持 GPTQ-INT4 量化以降低显存占用,适配 RTX 3060 等消费级显卡。通过 OpenAI 兼容接口实现程序调用,具备高吞吐低延迟特性。需注意模型中文能力有限及商业许可条款,适合英文场景验证或轻量级助手开发。

CodeArtist发布于 2026/4/8更新于 2026/4/263 浏览0 点赞约 9 分钟阅读
PythonAI算法

ComfyUI 实战:串联 Stable Diffusion 与超分模型实现高清生成

本文探讨如何在 ComfyUI 中构建 Stable Diffusion 与超分辨率模型的串联工作流。通过节点式架构,解决传统 WebUI 流程割裂、控制力不足的问题。重点分析潜在空间扩散机制对超分效果的影响,对比 Real-ESRGAN 等模型特性,并提供包含显存优化、人脸修复的实战配置方案。旨在帮助开发者建立模块化 AI 工程思维,实现从创意草图到生产级高清图像的自动化产出。

kaikai发布于 2026/4/8更新于 2026/4/284 浏览0 点赞约 13 分钟阅读
PythonAI算法

DeepSeek-R1-Distill-Llama-8B 在 Ollama 中的 HTTP API 鉴权与访问控制配置

DeepSeek-R1-Distill-Llama-8B 是轻量级强推理模型,但 Ollama 默认 API 无鉴权。介绍三种安全方案:Nginx Basic Auth、Caddy JWT 及 FastAPI 自建网关,涵盖配置步骤与代码示例。同时提供按调用方划分权限、速率限制、日志审计等访问控制最佳实践,并排查连接拒绝、显存不足等常见问题,助力构建可信可控的 AI 服务。

LinuxPan发布于 2026/4/8更新于 2026/4/264 浏览0 点赞约 30 分钟阅读
PythonAI算法

基于 LeRobot 的手机 AR 机器人远程控制实践

利用 LeRobot 项目结合智能手机 AR 功能实现机器人远程控制的方案。通过手机陀螺仪与加速度计采集数据,经坐标系映射与逆运动学求解,实现对机械臂的六自由度精准控制。方案支持 iOS 与 Android 平台,具备零硬件成本、直观操作及多重安全保护机制,适用于教育、科研及小型工业场景。

292440837发布于 2026/4/8更新于 2026/4/262 浏览0 点赞约 7 分钟阅读
AirSim 无人机仿真入门:起飞与降落控制
PythonAI算法

AirSim 无人机仿真入门:起飞与降落控制

综述由AI生成AirSim 是基于 Unreal Engine 的开源飞行模拟器,支持无人机与自动驾驶汽车仿真。本文详细记录环境搭建过程,包括 UE 4.27.2 版本选择、插件导入配置及 Python API 连接方式。通过 msgpack-rpc 协议实现仿真器与控制端通信,演示了起飞、降落及摄像头窗口配置的具体操作,为后续算法迁移提供基础环境。

猫巷少女发布于 2026/4/8更新于 2026/4/265 浏览0 点赞约 10 分钟阅读
PythonAI算法

基于 GFPGAN 的低质量人脸图像超分辨率恢复实战

GFPGAN 是腾讯 ARC 实验室推出的深度学习人脸修复工具,专注于解决真实场景下的盲人脸恢复问题。其核心架构、跨平台环境配置、命令行及 Python API 使用方法,以及常见问题的排查与性能优化策略。通过融合生成对抗网络与面部先验知识,该工具能在保留面部特征的同时将低清图像恢复至高清状态,适用于老照片修复、监控增强等场景。

时间旅人发布于 2026/4/8更新于 2026/4/264 浏览0 点赞约 13 分钟阅读
PythonAI算法

Hunyuan-MT-7B WebUI 本地部署流程

Hunyuan-MT-7B WebUI 本地化部署方案基于 Docker 容器化环境,无需手动配置 CUDA 或单独下载模型权重。流程涵盖硬件检查、镜像拉取、容器启动及服务验证,适用于 Ubuntu 系统及 NVIDIA GPU 环境。通过端口映射访问 Web 界面,支持多语言翻译功能。内容包含常见问题排查及 RESTful API 调用示例,满足离线场景下的多语种处理与集成需求。

神经兮兮发布于 2026/4/8更新于 2026/4/263 浏览0 点赞约 18 分钟阅读
自然语言处理在金融领域的实战应用
PythonAI算法

自然语言处理在金融领域的实战应用

综述由AI生成自然语言处理技术在金融风控、情感分析及客户反馈中扮演关键角色。深入探讨了文本分类、情感分析与风险评估三大核心场景,结合 BERT 与 GPT-3 等前沿模型进行实战解析。通过构建金融风险评估应用,展示了从数据预处理、特征工程到模型部署的全流程。针对金融术语复杂、数据噪声大及实时性要求高等挑战,提供了具体的代码解决方案与优化建议,帮助开发者快速掌握金融 NLP 落地技能。

MongoKing发布于 2026/4/8更新于 2026/4/262 浏览0 点赞约 20 分钟阅读
PythonAI算法

本地部署 GLM-4.7-Flash 打造私有编程 Copilot

通过 Docker 部署 GLM-4.7-Flash 模型,构建本地私有编程助手。利用其强大的中文理解与代码生成能力,结合 Web 界面与 API 接口,实现代码补全、调试及问答功能。方案确保数据隐私,支持自定义系统提示词优化角色设定,并可集成至开发环境提升效率。无需云端依赖,适合对数据安全有要求的开发者团队。

数字游民发布于 2026/4/8更新于 2026/4/273 浏览0 点赞约 20 分钟阅读
YOLO11 无人机航拍小目标检测系统实战与优化
PythonAI算法

YOLO11 无人机航拍小目标检测系统实战与优化

综述由AI生成针对无人机航拍图像中小目标密集且尺度变化大的问题,本项目采用 YOLO11 模型结合 VisDrone 数据集进行训练优化。通过 PyQt6 构建桌面应用,支持图片、视频及摄像头的实时检测与可视化分析。文中详细阐述了数据配置、训练参数调优策略及系统架构,提供了从环境搭建到模型部署的完整流程,旨在提升复杂场景下的交通目标检测精度与效率。

城市逃兵发布于 2026/4/8更新于 2026/4/273 浏览0 点赞约 11 分钟阅读
VLA 机器人革命:10 篇关键视觉 - 语言 - 动作模型论文解析
PythonAI算法

VLA 机器人革命:10 篇关键视觉 - 语言 - 动作模型论文解析

综述由AI生成2024 至 2026 年间,机器人技术正从传统编程转向视觉 - 语言 - 动作(VLA)模型。本文精选 10 篇关键论文,涵盖 Google DeepMind、NVIDIA、斯坦福等机构的最新突破。内容分为基础理论与前沿探索两部分,深入解析 RT-2、OpenVLA、GR00T N1 等模型的核心架构、训练策略及泛化能力。文章探讨了数据孤岛、Sim-to-Real 差距、实时性控制等挑战,并展望了物理世界建模与开放世界泛化的未来方向,…

墨染流年发布于 2026/4/8更新于 2026/4/262 浏览0 点赞约 28 分钟阅读
渐进式 AIGC 系统:Nano-Banana 2 绘画与 VEO/Sora 视频生成私有化部署
PythonSaaSWeChatPayAI算法

渐进式 AIGC 系统:Nano-Banana 2 绘画与 VEO/Sora 视频生成私有化部署

综述由AI生成渐进式 AIGC 系统集成了多种主流大模型与生成式 AI 能力,支持私有化部署。涵盖文本对话、专业绘图、视频生成及 Agent 智能体开发,兼容 Claude、GPT、Gemini 及 Nano-Banana 2 等模型。系统提供工作流编排、知识库管理及多端访问功能,适配个人与企业使用需求。

beaabea发布于 2026/4/8更新于 2026/4/264 浏览0 点赞约 7 分钟阅读
AIGC 检测模型训练:基于 Python 爬虫构建高质量文本数据集
PythonAI算法

AIGC 检测模型训练:基于 Python 爬虫构建高质量文本数据集

AIGC 文本泛滥引发内容审核与学术诚信问题,高精度检测模型依赖高质量标注数据集。本方案提供 Python 爬虫结合数据清洗与人工标注辅助的完整路径,从多源平台获取人工创作及 AIGC 生成双端文本,经标准化处理后输出结构化数据集,直接支撑模型训练需求。

蓝绿部署发布于 2026/4/8更新于 2026/4/274 浏览0 点赞约 1 分钟阅读
PythonAI算法

Qwen3-TTS VoiceDesign 实战:AR 导览眼镜空间音频定位方案

Qwen3-TTS-VoiceDesign 结合 AR 眼镜实现空间音频定位。通过自然语言描述控制声音方向、距离与情感,利用 HRTF 技术模拟 3D 声场。项目涵盖环境部署、模型加载、多语言生成及后期音频处理流程。实测显示方向识别准确率高,支持实时推理,适用于博物馆导览等沉浸式场景。

月亮邮递员发布于 2026/4/8更新于 2026/4/263 浏览0 点赞约 13 分钟阅读
Stable Diffusion WebUI 本地部署完整教程
PythonAI算法

Stable Diffusion WebUI 本地部署完整教程

Stable Diffusion WebUI 本地部署涉及环境配置、项目克隆及网络问题解决。主要步骤包括安装 Python 和 Git,克隆 AUTOMATIC1111 仓库,运行 webui-user.bat 脚本。针对国内网络下载失败,可修改 pip 源或设置代理加速 GitHub 与 HuggingFace 资源。首次加载需等待模型下载,支持手动替换模型文件。最后通过浏览器访问本地地址生成图像,调整采样器、步数等参数优化效果。常见…

心动瞬间发布于 2026/4/8更新于 2026/4/277 浏览0 点赞约 14 分钟阅读
PythonNode.jsAI大前端

Clawdbot 整合 Qwen3-32B 本地部署与 18789 端口调试指南

通过构建轻量级 Python 代理层,实现 Clawdbot 前端与本地 Ollama 服务及 Qwen3-32B 模型的无缝对接。方案涵盖环境检查、API 协议转换、端口映射配置及链路调试全流程。重点解决跨域报错、模型连接失败及响应格式不兼容问题,提供 systemd 自启与安全加固建议,确保私有化大模型聊天平台的稳定运行。

WenxuanMa发布于 2026/4/8更新于 2026/4/265 浏览0 点赞约 24 分钟阅读
OpenClaw 接入摄像头实战:WSL2 下的视觉方案探索
PythonNode.jsAI算法

OpenClaw 接入摄像头实战:WSL2 下的视觉方案探索

综述由AI生成OpenClaw 集成摄像头功能时,WSL2 环境存在网络隔离导致 Node.js 配对失败。通过浏览器插件方案虽可预览但无法自动化。最终采用 Python + OpenCV 本地脚本方案,成功实现摄像头调用与图像分析。该方案规避了虚拟机网络限制,适合需要自动化视觉交互的场景。

独立开发者发布于 2026/4/8更新于 2026/4/265 浏览0 点赞约 12 分钟阅读
MiniMax 海螺 AI 视频:图文生视频功能与 API 接入指南
PythonAI算法

MiniMax 海螺 AI 视频:图文生视频功能与 API 接入指南

MiniMax 海螺 AI 视频基于 abab-video-1 模型与 DiT 架构,支持文生视频及图生视频。通过输入关键词或上传参考图,可生成高物理规律模拟的短视频。本文介绍其 Web 端操作流程及异步 API 调用逻辑,涵盖任务创建、状态查询与文件获取,适合开发者快速集成视频生成能力。

岁月神偷发布于 2026/4/8更新于 2026/4/272 浏览0 点赞约 6 分钟阅读
上一页下一页