跳到主要内容
极客日志极客日志
首页博客AI提示词GitHub精选代理工具
搜索
|注册
极客日志

极客日志

面向效率的开发者社区

站内导航

  • 首页
  • 工具箱
  • 博客

快速链接

  • 全球AI模型中转站:Crex
  • 大模型:Hugging Face
  • Stack Overflow
  • MDN

联系我们

  • 技术支持:[email protected]
  • 商务合作:[email protected]
  • 投诉举报:[email protected]

© 2026 极客日志 · zeeklog.com

隐私政策|用户服务条款|关于我们
重置
编程语言 / Python

标签

全部标签AIGPT-image-2javaNode.jsNuctPayPPT制作React NativeRNSaaSVScodeWeChat大前端算法

分类

全部分类
编程语言
PythonJavaScriptTypeScriptJavaKotlinGo / GolangRustC++CC#F#PHPRubySwiftObjective-CScalaClojureElixirErlangHaskellDartLuaPerlRJuliaMATLAB / OctaveSQLShell / BashPowerShellHTML / CSSZigNimCrystalGroovyVisual Basic .NETSolidity汇编

排序

最新更新最新发布最多浏览最多点赞
PythonAI算法

基于 Whisper-large-v3 的短视频配音识别与字幕生成

介绍基于 Whisper-large-v3 模型的语音识别 Web 服务,支持 99 种语言自动检测与转录。提供转录和翻译双模式,支持文件上传、麦克风录音及 URL 输入。部署需 GPU 加速环境,通过 Python 脚本启动服务。适用于短视频字幕生成、会议记录整理及教育内容制作。具备高性能处理、API 接口调用及批量处理能力,可显著提升多语言内容创作效率。

ApiHolic发布于 2026/4/6更新于 2026/5/1220 浏览3 点赞约 15 分钟阅读
无人机如何革新光伏电站巡检
PythonAI算法

无人机如何革新光伏电站巡检

综述由AI生成探讨了无人机技术在光伏电站巡检中的应用。针对传统人工巡检效率低、风险高、漏检率高的问题,介绍了无人机智能巡检系统的硬件配置与软件架构。通过多光谱检测与 AI 深度学习算法,实现了缺陷的自动识别与诊断。实际应用案例显示,该技术显著提升了巡检效率与缺陷检出率,降低了运维成本。未来随着低空经济发展,全自主化与数字孪生将是主要趋势。

忘忧发布于 2026/4/6更新于 2026/5/1221 浏览3 点赞约 12 分钟阅读
无人机路径规划技术:A*算法与 GPS 定位实现
PythonAI算法

无人机路径规划技术:A*算法与 GPS 定位实现

综述由AI生成无人机路径规划技术,重点分析了 A*算法原理及 GPS 定位集成。通过代码示例展示了网格地图构建、路径搜索及避障逻辑,并对比了不同算法的优劣,探讨了工程实践中的风险与未来趋势。内容涵盖系统架构、实时路径调整及环境配置建议,适用于无人机开发参考。

萤火微光发布于 2026/4/6更新于 2026/5/1321 浏览2 点赞约 27 分钟阅读
宇树 G1 机器人强化学习训练实战:环境配置与奖励函数
PythonAI算法

宇树 G1 机器人强化学习训练实战:环境配置与奖励函数

基于宇树 G1 人形机器人,介绍强化学习训练实战。涵盖 Isaac Gym 物理仿真环境与 RSL-RL 框架的基础搭建,解析 12 自由度与 23 自由度模型的配置差异,包括观测空间、动作空间及 PD 控制参数调整。重点剖析模块化奖励函数架构,详解轨迹跟踪、稳定性约束及动作平滑性惩罚的设计逻辑与代码实现,为高自由度机器人运动控制提供配置参考。

moshang发布于 2026/4/6更新于 2026/5/1425 浏览2 点赞约 30 分钟阅读
PythonAI算法

Stable Diffusion 云端 GPU 部署与 AI 绘画实战指南

利用云端 GPU 资源部署 Stable Diffusion 进行 AI 绘画的方法。通过预置镜像快速搭建 WebUI 环境,无需本地高性能硬件。内容涵盖实例选择、界面操作、提示词技巧及成本优化策略,帮助新手低成本体验 AI 创作全流程。

星落发布于 2026/4/6更新于 2026/5/928 浏览1 点赞约 23 分钟阅读
AI Agent 架构:基础组成模块解析
PythonAI算法

AI Agent 架构:基础组成模块解析

综述由AI生成深入解析 AI Agent 的基础架构与核心模块。涵盖从定义到技术原理,包括底层架构分层(应用层、Agent 层、工具层、模型层)及核心算法(如 ReAct 循环)。提供了企业自动化与个人效率的应用场景分析,实施步骤及最佳实践。通过文档处理 Agent 等案例展示实际效果,并探讨多模态、端侧部署等技术趋势,为开发者提供从理论到落地的完整参考。

晚风叙旧发布于 2026/4/6更新于 2026/5/1425 浏览3 点赞约 29 分钟阅读
Langchain 与纯手搓实现 RAG 系统的对比与实践
PythonAI算法

Langchain 与纯手搓实现 RAG 系统的对比与实践

综述由AI生成检索增强生成(RAG)技术的核心思想与工作流程,旨在解决大模型幻觉及私有知识问答问题。通过对比 Langchain 框架与纯手搓两种实现方式,分析了开发效率、代码复杂度及适用场景。文章提供了基于 Langchain 和原生 Python 库(如 sentence-transformers、faiss)的详细代码示例,涵盖文档加载、文本切分、向量化、索引构建及 Prompt 拼接等关键步骤。此外,还包含环境配置建议、常见问题解决方案及最佳…

清心发布于 2026/4/6更新于 2026/5/1120 浏览1 点赞约 27 分钟阅读
PythonAI算法

llama-cpp-python 常见问题解决指南

llama-cpp-python 在使用过程中的常见问题及解决方案。涵盖安装阶段的编译错误处理、CUDA 环境配置及内存不足优化;运行时模型加载失败排查与性能调优技巧;多模态支持及聊天格式配置方法;日志开启与环境检查脚本使用;以及版本管理与依赖更新的最佳实践。旨在帮助开发者快速定位并解决部署与推理中的技术障碍。

狂少发布于 2026/4/6更新于 2026/5/1324 浏览3 点赞约 3 分钟阅读
PythonAI算法

开源 ASR 新选择:Fun-ASR 与 Whisper 对比评测

综述由AI生成对比了开源语音识别工具 Fun-ASR 与 Whisper。Fun-ASR 由钉钉联合通义实验室推出,针对中文场景优化,支持本地私有化部署。文章分析了其模型架构(轻量级 Transformer)、VAD 语音活动检测、伪流式识别及批量处理能力。相比 Whisper,Fun-ASR 在中文识别精度、ITN 文本规整及企业级任务调度上更具优势,适合对数据隐私和中文环境有要求的开发者使用。

道系青年发布于 2026/4/6更新于 2026/5/1428 浏览2 点赞约 15 分钟阅读
PythonAI算法

Whisper-large-v3 语音识别模型部署与会议转录实测

综述由AI生成Whisper-large-v3 语音识别模型的本地化部署流程与实测结果。通过 Docker 镜像快速搭建服务,利用 GPU 进行推理,支持 Web 界面与 API 调用。测试显示该模型在中文及多语言混合场景下转录准确率高,能自动识别语种并处理专业术语。文章还分析了显存占用、推理速度等性能指标,并提供了参数优化建议,适用于企业会议记录、字幕生成等自动化场景。

活在当下发布于 2026/4/6更新于 2026/5/1225 浏览5 点赞约 12 分钟阅读
基于 DMXAPI 与豆包模型的头像生成实践
PythonAI大前端算法

基于 DMXAPI 与豆包模型的头像生成实践

介绍利用 DMXAPI 调用字节跳动豆包模型生成 AI 头像的技术方案。内容涵盖扩散模型原理、API 认证与参数设计、异步响应处理及代码实现(HTML/Python)。通过优化提示词与参数调优,可实现高质量、风格可控的头像批量生成,适用于社交、游戏等场景的数字身份构建。

不知所云发布于 2026/4/6更新于 2026/5/1327 浏览1 点赞约 56 分钟阅读
PythonAI算法

Python 爬虫结合 AI 模型实现艺术素材自动化采集与风格转换

一种基于 Python 爬虫与 AI 模型的自动化艺术素材采集与处理方案。通过 Requests 和 BeautifulSoup 构建爬虫模块,实施反爬策略,利用感知哈希算法清洗数据,并调用 AI API 进行风格转换。该方案能显著降低素材准备时间,提升创作效率,适用于内容创作、设计及教育领域。

云间运维发布于 2026/4/6更新于 2026/5/1028 浏览2 点赞约 19 分钟阅读
PythonAI算法

whisperX 入门指南:从安装到实现语音识别功能

whisperX 是基于 OpenAI Whisper 的语音识别工具,提供单词级时间戳和说话人区分功能。介绍环境搭建(Python 3.10, PyTorch, CUDA)、命令行使用及 Python API 集成方法。支持批处理推理、VAD 预处理及多语言识别。常见问题包括 GPU 内存不足、Speaker 区分效果不佳及时间戳不准确,可通过调整模型大小、批处理大小及计算类型解决。适用于语音转写、字幕生成等场景。

监控大屏发布于 2026/4/6更新于 2026/5/1121 浏览2 点赞约 13 分钟阅读
PythonAI算法

国内 Stable Diffusion 与 LLaMA 模型镜像站推荐及下载加速指南

综述由AI生成对国内用户下载 Stable Diffusion 和 LLaMA 模型速度慢的问题,推荐了清华大学 TUNA 镜像站、阿里云 ModelScope 和华为云昇思 Hub 等国内可用资源。文章详细说明了如何替换 Hugging Face 原始链接,并结合 LoRA 微调技术,提供了从基础模型下载、数据准备、参数配置到训练部署的完整工作流。同时列举了显存不足、效果不佳等常见问题的解决方案,旨在帮助开发者在消费级显卡上高效完成 AIGC 项目…

性能调优发布于 2026/4/6更新于 2026/5/1325 浏览3 点赞约 18 分钟阅读
PythonAI算法

Z-Image-Turbo_UI 本地 AI 绘图工具界面实测与使用

Z-Image-Turbo_UI 是基于 Gradio 的本地 AI 绘图工具,无需安装 Python 环境或配置依赖,直接运行脚本即可启动服务。支持离线生成,所有过程在本地完成,保障数据安全。界面布局清晰,含提示词输入、参数控制及预览区。实测在 RTX 3060 上单张出图耗时约 2 秒,显存占用稳定在 3.2–3.8GB。提供命令行方式管理历史图片,适合显存有限用户、快速验证需求者及重视隐私的人群。

人间过客发布于 2026/4/6更新于 2026/5/1011 浏览0 点赞约 16 分钟阅读
COT 思维链:引导 AI 拆解复杂问题,模拟人类思考
PythonAI算法

COT 思维链:引导 AI 拆解复杂问题,模拟人类思考

综述由AI生成COT(思维链)技术,旨在解决 AI 缺乏常识和逻辑推理能力的问题。通过将复杂问题分解为子步骤逐步推理,模拟人类思考过程。文中提供了基于 LangChain 和 DeepSeek 模型的 Python 代码示例,演示了如何通过提示词工程实现思维链功能,并探讨了其优势与未来展望。

邪神洛基发布于 2026/4/6更新于 2026/5/1328 浏览2 点赞约 3 分钟阅读
LLaMA-Factory 大模型 LoRA 微调实战指南
PythonAI算法

LLaMA-Factory 大模型 LoRA 微调实战指南

综述由AI生成介绍使用 LLaMA-Factory 进行大模型微调的全流程,涵盖安装部署、数据集准备、LoRA 微调训练、效果评估及模型合并导出。通过 WebUI 和命令行操作,演示了基于 Qwen3-1.7B 模型的指令微调方法,并包含批量推理测试与 Ollama 部署方案,适合开发者快速上手大模型定制。

DebugKing发布于 2026/4/6更新于 2026/5/1124 浏览4 点赞约 31 分钟阅读
大模型 API 注册与调用实战
PythonAI

大模型 API 注册与调用实战

介绍三大主流大模型(OpenAI GPT、百度文心一言、阿里通义千问)的 API 注册与密钥获取流程,提供 Python 调用代码示例及常见错误解决方案,帮助开发者快速上手 AI 应用开发。

魔法巫师发布于 2026/4/6更新于 2026/5/1029 浏览1 点赞约 1 分钟阅读
PythonAI算法

Whisper-large-v3 常见问题解析与语音识别避坑指南

Whisper-large-v3 部署与使用中的常见故障及优化方案。涵盖启动依赖检查(FFmpeg、CUDA 版本、端口占用)、语言检测准确性提升(手动指定语言、Prompt 优化)、性能调优(fp16 半精度、禁用流式模式)、音频预处理规范(单声道 16kHz WAV)以及 API 集成技巧。通过实际案例与配置调整,帮助用户实现稳定、高效的语音识别部署。

奇形怪状发布于 2026/4/6更新于 2026/5/1223 浏览1 点赞约 21 分钟阅读
PythonAI

PyCharm 中 GitHub Copilot 插件安装与配置指南

介绍在 PyCharm 中安装和配置 GitHub Copilot 插件的步骤。主要涵盖环境准备、账号订阅激活以及 IDE 版本兼容性要求。推荐使用 PyCharm 2021.2 及以上版本以确保功能完整,并提醒用户注意订阅费用及试用期管理。

刀狂发布于 2026/4/6更新于 2026/5/1123 浏览2 点赞约 2 分钟阅读
上一页下一页