跳到主要内容
极客日志极客日志
首页博客AI提示词GitHub精选代理工具
搜索
|注册
重置
编程语言 / Python

标签

全部标签AIGPT-image-2javaNode.jsNuctPayPPT制作React NativeRNSaaSVScodeWeChat大前端算法

分类

全部分类
编程语言
PythonJavaScriptTypeScriptJavaKotlinGo / GolangRustC++CC#F#PHPRubySwiftObjective-CScalaClojureElixirErlangHaskellDartLuaPerlRJuliaMATLAB / OctaveSQLShell / BashPowerShellHTML / CSSZigNimCrystalGroovyVisual Basic .NETSolidity汇编

排序

最新更新最新发布最多浏览最多点赞
PythonAI算法

Stable Diffusion 3.5 工业设计实战:产品草图生成系统

Stable Diffusion 3.5 结合 FP8 量化技术,通过 ComfyUI 构建工业设计草图生成系统。利用其语义理解与图像质感优势,设计师可快速探索形态、验证想法。实战涵盖环境部署、工作流配置及提示词编写,并通过智能音箱、滑板车等案例展示应用价值。进阶技巧包括潜空间微调与 ControlNet 精确控制,实现从概念发散到方案深化的全流程辅助,提升设计效率与沟通效果。

Elasticer发布于 2026/4/8更新于 2026/4/253 浏览0 点赞约 15 分钟阅读
C++ 后端配套 Web 自动化测试入门:Selenium 实战
Python大前端

C++ 后端配套 Web 自动化测试入门:Selenium 实战

Web 自动化测试通过脚本模拟用户操作,提升回归测试效率。核心在于理解测试金字塔,合理分配单元测试、接口测试与 UI 测试资源。环境搭建需配置 Python、Selenium 框架及浏览器驱动管理工具 webdriver-manager。实战中利用 Selenium API 实现百度搜索流程,包括元素定位、输入点击等操作。该方案适用于验证 Web 界面功能一致性,需配合人工测试覆盖异常场景。

并发大师发布于 2026/4/8更新于 2026/4/255 浏览0 点赞约 13 分钟阅读
自然语言处理在金融领域的应用与实战
PythonAI算法

自然语言处理在金融领域的应用与实战

NLP 技术在金融行业落地广泛,涵盖新闻情感分析、风险管理与欺诈检测等核心场景。通过引入 FinBERT 等专用模型及文本预处理技术,有效解决专业术语识别与实时性挑战。实战部分展示基于 Python 和 Tkinter 构建的金融新闻情感分析应用架构,提供从理论到工程落地的完整参考路径,助力金融机构提升市场分析与风控效率。

DevOpsTeam发布于 2026/4/8更新于 2026/4/263 浏览0 点赞约 11 分钟阅读
PythonAI算法

Whisper Large v3 模型解析:语音特征提取与处理机制

Whisper Large v3 基于 Transformer 架构,通过编码器解码器实现多语言语音识别。核心在于将 16kHz 单声道音频转换为对数梅尔频谱图,利用 FFT 和梅尔滤波器组提取声学特征。模型支持自动语言检测与翻译,需配合 FFmpeg 预处理及 GPU 加速推理。实际部署中可通过批处理、缓存及半精度计算优化性能,适用于会议记录、视频本地化等场景,但对方言及噪声环境仍有限制。

zhang发布于 2026/4/8更新于 2026/4/263 浏览0 点赞约 10 分钟阅读
PythonAI算法

中小团队 AIGC 工作流:Anything to RealCharacters 2.5D 转真人引擎实战

综述由AI生成针对中小团队将 2.5D 角色转换为写实真人的需求,分享了基于 Anything to RealCharacters 引擎的本地化部署与集成方案。通过优化显存占用适配 RTX 4090,结合动态权重注入与 Streamlit 可视化界面,实现低成本、高效率的生产管线。实测表明该方案在处理二次元立绘及 3D 渲染图时效果显著,配合提示词工程与批处理流程,能平衡画质与成本,为 AIGC 内容生产提供务实的技术选型参考。

MongoKing发布于 2026/4/8更新于 2026/4/263 浏览0 点赞约 18 分钟阅读
PythonAI算法

基于 LLaMA-Factory 的 LLM DPO 训练实战

基于 LLaMA-Factory 框架实现 LLM 模型的 DPO 训练全流程。包含从 Hugging Face 获取医疗 DPO 数据集、编写脚本将 Arrow 格式转换为 LLaMA-Factory 标准 JSON 格式、修改 dataset_info.json 注册自定义数据集、通过 WebUI 配置 DeepSpeed 多卡训练参数,最后导出并合并模型。适用于具备 Linux 环境及 GPU 资源的开发者进行偏好优化微调。

灭霸发布于 2026/4/8更新于 2026/4/264 浏览0 点赞约 7 分钟阅读
PythonAI算法

DeepSeek-R1-Distill-Llama-8B 详解:LoRA 微调、长上下文与 KV Cache 优化

DeepSeek-R1-Distill-Llama-8B 模型通过知识蒸馏继承 R1 推理能力。文章详解 LoRA 微调策略,推荐仅对最后 4 层注入低秩矩阵以节省显存。针对长文本场景,采用 NTK-aware 缩放将上下文从 4K 扩展至 128K。KV Cache 优化方面,FlashInfer 结合 StreamingLLM 可提升生成吞吐。配合 Ollama 部署可实现本地快速推理,实测在 RTX 4090 上表现优于同类竞品,…

云间漫步发布于 2026/4/8更新于 2026/4/265 浏览0 点赞约 21 分钟阅读
利用 AI 大模型辅助少儿编程学习与实践
PythonAI算法

利用 AI 大模型辅助少儿编程学习与实践

人工智能生成内容技术推动教育变革,大语言模型为编程学习提供个性化路径。通过游戏化入门激发兴趣,结合 Python 项目实战巩固知识。AI 助手能即时解答语法错误,推荐跨学科任务平衡技术与人文素养。家长陪伴鼓励同样关键,科学利用工具资源有助于培养未来编程能力。

霸天发布于 2026/4/8更新于 2026/4/264 浏览0 点赞约 6 分钟阅读
基于 YOLOv12 的无人机航拍视角目标检测系统
PythonAI算法

基于 YOLOv12 的无人机航拍视角目标检测系统

综述由AI生成基于 YOLOv12 的无人机航拍视角目标检测系统整合了环境配置、模型训练、测试评估及图形化界面封装全流程。项目采用 VisDrone 数据集,覆盖行人、车辆等常见目标类别。深入解析了 YOLOv12 的区域注意力机制与 YOLOv11 网络架构,提供 GhostConv 和 CBAM 等轻量化改进方案,旨在解决航拍场景中小目标检测难题,实现高精度实时推理。

abccba发布于 2026/4/8更新于 2026/4/262 浏览0 点赞约 29 分钟阅读
PythonAI算法

Stable Diffusion WebUI Docker 部署实战指南

基于 Docker 与 Miniconda 构建 Stable Diffusion WebUI 本地环境,解决依赖冲突与 CUDA 兼容问题。通过容器化隔离系统资源,支持 GPU 加速、Jupyter 调试及远程 SSH 管理。涵盖镜像选择、PyTorch 安装、模型目录规范、启动参数优化及性能调优方案,实现一键迁移与稳定复现。

baireiraku发布于 2026/4/8更新于 2026/4/262 浏览0 点赞约 23 分钟阅读
变分自编码器(VAE)原理与 PyTorch 实战实现
PythonAI算法

变分自编码器(VAE)原理与 PyTorch 实战实现

综述由AI生成变分自编码器(VAE)结合概率图模型与深度神经网络,通过学习数据分布生成新样本。文章阐述了 VAE 的核心特点及数学原理,包括隐空间表示、变分下界(ELBO)和 KL 散度。提供了基于 PyTorch 的完整代码实现,涵盖编码器、解码器、损失函数及训练流程。对比了 VAE 与 GAN、扩散模型的差异,并列举了图像生成、数据压缩等应用场景。适合希望掌握生成式模型底层逻辑与实战开发的开发者参考。

t ag发布于 2026/4/8更新于 2026/4/252 浏览0 点赞约 14 分钟阅读
PythonAI算法

DeepSeek-R1-Distill-Llama-8B 部署教程:Docker Compose 多模型推理服务

DeepSeek-R1-Distill-Llama-8B 部署基于 Docker Compose 和 Ollama 实现本地推理服务搭建。教程涵盖环境准备、配置文件编写、模型拉取验证、命令行与 Python 脚本调用、批量处理及提示词优化等步骤。通过容器化方案屏蔽底层差异,支持 GPU 加速与持久化存储,帮助开发者快速集成大模型至工作流。

蓝绿部署发布于 2026/4/8更新于 2026/4/254 浏览0 点赞约 9 分钟阅读
Llama-2-7B 昇腾 NPU 性能测评与部署优化指南
PythonAI算法

Llama-2-7B 昇腾 NPU 性能测评与部署优化指南

综述由AI生成详细记录了 Llama-2-7B 模型在昇腾 NPU 环境下的部署全流程与性能测评。通过实测发现,单请求吞吐量稳定在 15.6-17.6 tokens/秒,batch=4 时总吞吐量达 63.33 tokens/秒,显存占用控制在 16GB 以内。文章涵盖了环境初始化、模型加载、基准测试脚本编写、高并发极限测试及性能优化方案,解决了镜像源安装、版本冲突等常见问题。结论显示昇腾 NPU 对 Llama-2-7B 适配成熟,适合高并发场景部…

晚风叙旧发布于 2026/4/8更新于 2026/4/263 浏览0 点赞约 13 分钟阅读
PythonAI算法

Stable Diffusion v1.5 跨文化风格生成实战:浮世绘、拜占庭与非洲图腾

综述由AI生成Stable Diffusion v1.5 模型在固定种子与基础提示词下,通过追加风格关键词实现了浮世绘、拜占庭及非洲图腾三种艺术风格的迁移。测试表明,模型能准确捕捉不同文化的视觉特征,如浮世绘的平面装饰感、拜占庭的金色神圣感及非洲图腾的几何抽象性。实践发现风格关键词作为'开关'效果显著,且模型倾向于将风格特征与基础描述进行创意融合而非完全替换。该实验验证了 SD1.5 在风格化创作与概念探索中的稳定性与可控性,适合用于快速视觉构思与艺…

ApiHolic发布于 2026/4/8更新于 2026/4/264 浏览0 点赞约 14 分钟阅读
PythonAI

OpenClaw 飞书机器人权限配置与安全指南

OpenClaw 飞书机器人需配置特定权限以确保功能可用且安全。基础权限包括单聊群聊消息收发,进阶权限涉及文档读取及成员信息获取。严禁开启接收所有消息等高危权限。配置密钥时推荐环境变量法,避免硬编码,配合 IP 白名单与定期轮换策略保障安全。

奇形怪状发布于 2026/4/8更新于 2026/4/265 浏览0 点赞约 7 分钟阅读
视觉 - 骨架双模态框架:帕金森病步态泛化评估新方案
PythonAI算法

视觉 - 骨架双模态框架:帕金森病步态泛化评估新方案

综述由AI生成视觉 - 骨架双模态框架针对帕金森病步态评估提出新方案。传统方法依赖主观评分或接触式传感器,存在局限。该框架结合关键点视觉 Transformer 与时空图卷积网络,融合局部视觉细节与全局骨架运动特征。实验表明,双模态融合显著提升了评估准确性,并在跨视角数据中展现出优异的泛化能力,为无约束环境下的远程监测提供了可行路径。

追风少年发布于 2026/4/8更新于 2026/4/252 浏览0 点赞约 11 分钟阅读
无人机目标检测:自适应图像变焦与边界框变换方法
PythonAI算法

无人机目标检测:自适应图像变焦与边界框变换方法

无人机目标检测面临小物体识别难题。提出 ZoomDet 框架,采用自适应非均匀图像变焦放大物体细节,配合角点对齐的边界框变换解决标注错位问题。通过轻量级偏移预测网络和基于框的损失函数,模型在 VisDrone 等数据集上显著提升检测精度,尤其对小物体增益明显,且推理延迟增加极小。该方法兼容主流检测架构,并可扩展至视觉问答等高级任务。

ServerBase发布于 2026/4/8更新于 2026/4/263 浏览0 点赞约 6 分钟阅读
PythonAI算法

video-analyzer:基于 AI 的视频内容分析与摘要工具

video-analyzer 是一款结合计算机视觉、音频转录和自然语言处理的开源视频分析工具。它通过提取关键帧、转录音频并生成自然语言描述,帮助用户快速理解视频内容。支持本地运行以保护隐私,安装需 Python 环境。输出包含元数据、转录文本及结构化摘要,适用于课程整理、会议记录及素材管理场景。

星落发布于 2026/4/8更新于 2026/4/265 浏览0 点赞约 4 分钟阅读
字节跳动 DeerFlow 2.0 技术解析:多智能体协作框架与实战部署
PythonNode.jsAI算法

字节跳动 DeerFlow 2.0 技术解析:多智能体协作框架与实战部署

DeerFlow 2.0 是字节跳动开源的多智能体协作框架,旨在解决 AI 从'回答问题'到'动手做事'的跨越。项目采用主智能体加中间件链架构,内置沙盒执行环境与技能系统,兼容多种大模型与搜索引擎。通过 Python 后端与 Next.js 前端构建,提供本地、Docker 及 K8s 部署方案,适用于学术研究、商业分析及自动化内容创作场景。

苹果系统发布于 2026/4/8更新于 2026/4/263 浏览0 点赞约 17 分钟阅读
AI 应用开发的技术深度:超越 API 调用的工程实践
PythonAI算法

AI 应用开发的技术深度:超越 API 调用的工程实践

AI 应用开发常被误认为仅是 API 调用,实则涉及算法理解、系统架构与工程实践的深度融合。剖析提示词工程的方法论、生产级性能优化策略、智能体幻觉治理及 RAG 系统调优等核心技术点,探讨开发者如何构建系统化能力矩阵,应对高并发、成本控制及可观测性挑战,为 AI 原生应用落地提供实战参考。

t ag发布于 2026/4/8更新于 2026/4/263 浏览0 点赞约 41 分钟阅读
上一页下一页