dehua dong 的博客文章

PythonAI算法

Transformer 注意力机制详解：自注意力、交叉与因果自注意力 PyTorch 实现

Transformer 架构中的三种核心注意力机制：自注意力、交叉注意力和因果自注意力。文章从理论基础出发，结合 PyTorch 从零实现了缩放点积注意力、多头注意力及掩码自注意力，并通过代码示例展示了查询、键、值的投影与计算过程。重点阐述了自注意力如何通过上下文加权增强输入表示，多头注意力如何提升模型对不同特征的捕捉能力，交叉注意力如何实现跨序列信息交互，…

发布于 2025/2/728 浏览0 点赞

PythonAI算法

10 个大型语言模型 (LLM) 核心面试题与解析

文章列举了 10 个大型语言模型（LLM）面试高频问题，涵盖提示学习偏见减轻、矢量存储必要性、人类价值观对齐技术（RLHF/DPO）、奖励黑客行为、微调关键因素、Transformer 自注意力机制、子词算法优势、Adaptive Softmax 优化原理、推理随机性参数调整以及跨 GPU 扩展训练技术（FSDP）。内容旨在帮助开发者理解 LLM 核心概念及…

发布于 2025/2/620 浏览0 点赞

编程语言AI算法

视觉大模型深度解析：架构、训练与应用全景指南

深入解析视觉基础模型（Foundational Models），涵盖基于文本提示、视觉提示及异构模态的三大类架构。详细介绍了 CLIP、SAM、LLaVA 等主流模型的原理与变体，对比了对比式学习与生成式学习的训练目标。内容涉及预训练数据集选择、微调策略、提示工程方法，以及模型在医疗、遥感、机器人导航等场景的应用。旨在帮助读者系统理解大规模视觉系统的最新进展…

发布于 2025/2/626 浏览0 点赞

编程语言AI

利用 DeepSeek 提升 Excel 数据处理效率指南

利用 DeepSeek 大模型提升 Excel 数据处理效率的方法。主要涵盖四大核心场景：图片转表格、复杂公式编写、公式错误排查以及自动化脚本生成。文章详细说明了操作步骤、提供了具体的提示词建议和代码示例，并强调了数据安全、结果验证及提示词工程的最佳实践。通过合理使用 AI 工具，用户可以显著减少重复性工作，提高办公自动化水平，同时需注意保护敏感数据并对 A…

发布于 2025/2/630 浏览0 点赞

PythonAI算法

AI 大模型训练与微调实操经验总结

总结了 AI 大模型训练与微调的四大核心经验。数据预处理方面强调上下文截断、语句顺滑及敏感词过滤；训练参数上推荐 1024 上下文长度、大 Batch Size 及 bfloat16 混合精度；模型结构优选 Pre-RMSNorm、GeGLU 激活函数及 RoPE 位置编码；针对 OOM 问题提供数据分片与 DeepSpeed 优化方案；同时给出梯度裁剪、断…

发布于 2025/2/620 浏览0 点赞

PythonAI算法

大模型压缩技术详解：量化、剪枝与蒸馏原理

大模型部署面临算力与存储限制，模型压缩技术成为关键解决方案。量化通过降低参数精度减少显存占用，剪枝移除冗余权重提升推理速度，蒸馏利用大模型知识指导小模型训练。这三种技术常结合使用，并配合微调以平衡性能与效率，实现在移动端等资源受限设备上的高效运行。

发布于 2025/2/631 浏览0 点赞

PythonAI算法

Python 核心应用场景与开发环境配置指南

Python 作为一种通用高级编程语言，广泛应用于网络开发、数据科学、自动化脚本、人工智能及游戏开发等领域。详细阐述了 Python 的主要用途，对比了官方安装、Anaconda 及 Miniconda 等环境搭建方案，解析了 pip 与 conda 包管理机制及虚拟环境的重要性。同时介绍了 PyCharm、VS Code 等主流集成开发环境（IDE）的特点…

发布于 2025/2/631 浏览0 点赞

PythonAI算法

QVQ-72B 视觉推理大模型开源评测与代码实现

QVQ-72B 是通义千问团队发布的视觉推理大模型，基于 Qwen2-VL-72B 训练，参数量达 72B。该模型在 MMMU 榜单突破 70 分，具备较强的多模态逻辑推理能力，但存在中英文混杂、循环推理及幻觉风险。文章详细介绍了模型背景、性能评估及基于 Transformers 库的代码实现流程，涵盖环境配置、Prompt 构造、推理参数设置等关键技术点，…

发布于 2025/2/642 浏览0 点赞

PythonAI算法

云服务器部署 ComfyUI+SVD 生成 AI 视频实战指南

介绍在云服务器上部署 ComfyUI 并结合 SVD 模型实现图像转视频的完整流程。涵盖环境配置、插件安装、工作流搭建及常见问题处理，帮助开发者利用 GPU 算力高效生成 AI 动态内容。重点讲解了如何配置模型路径、安装自定义节点、调整生成参数以及视频格式转换，适用于希望低成本体验 AI 视频生成的技术用户。

发布于 2025/2/632 浏览0 点赞

编程语言AI算法

AI 时代产品经理核心能力：如何利用大模型提升工作效率与竞争力

探讨人工智能对产品经理职业的影响，分析大模型在需求文档撰写、竞品分析、数据处理及用户调研等场景的具体应用。介绍 AI 产品经理的学习路径，涵盖提示词工程、平台应用开发及微调技术，旨在帮助从业者掌握工具以提升效率，避免被替代。文章详细阐述了从基础理论到行业实战的七个阶段，强调了全栈思维、数据敏感度及伦理合规的重要性，指出 AI 产品经理角色正从执行者向设计者转…

发布于 2025/2/634 浏览0 点赞

编程语言AI算法

大语言模型架构：Attention 机制详解

详细讲解了大语言模型中的核心架构组件。首先阐述了 Attention 机制的核心思想、计算步骤及其与 Seq2Seq 的区别，分析了 Self-Attention 与 Target-Attention 的差异。接着深入解析了 Transformer 模型，包括 Multi-Head Attention 的降维原理、权重共享机制及点积缩放原因。随后介绍了 BE…

发布于 2025/2/620 浏览0 点赞

编程语言AI算法

大模型时代程序员如何提升核心竞争力与生产力

随着 ChatGPT 及后续大模型的爆发，AI 技术正重塑软件开发行业。当前 AI 领域的技术进展与市场人才需求，探讨了程序员如何利用 AI 工具升级核心竞争力。内容涵盖认知提升、工具上手及工作流整合三个关键步骤，并提供了具体的实践建议与未来展望，帮助开发者在 AI 浪潮中实现生产力转化与职业增值。

发布于 2025/2/632 浏览0 点赞

Java大前端java

互联网大厂 Android 面试题大全与核心知识点解析

互联网大厂 Android 面试的高频考点，涵盖 Java 异常机制、Activity 生命周期、Handler 与 Looper 原理、Binder IPC 通信机制、Flutter 架构与生命周期以及 View 系统渲染流程。内容详细解析了 Exception 与 Error 区别、子线程更新 UI 限制、Binder 零拷贝原理、Stream 订阅模式…

发布于 2025/2/631 浏览0 点赞

PythonAI算法

大学退学后自学 Python 实现职业逆袭的真实经历

讲述了一名大学退学青年从建筑工地转行至 IT 行业，通过自学 Python 技术最终获得大厂 Offer 的经历。内容涵盖其心路历程、学习动机以及具体的 Python 技术学习路径，包括基础语法、Web 开发、数据分析及人工智能方向的应用。强调了坚持学习与技能提升对职业转型的重要性，为类似背景的初学者提供了参考案例与学习建议。

发布于 2025/2/621 浏览0 点赞

PythonAI算法

Python 数据可视化：Seaborn 库使用指南

Seaborn 是基于 Matplotlib 的高级绘图库，提供简洁 API 生成统计图表。介绍安装方法、核心 API 形式及散点图、箱线图、小提琴图等七种常用图表的绘制代码与参数详解。内容涵盖数据准备、样式设置、图表定制及结果保存，帮助开发者快速掌握 Python 数据可视化技能。

发布于 2025/2/626 浏览0 点赞

PythonAI算法

大模型开发通用流程

阐述了大模型开发的核心概念、应用场景及通用技术流程。首先介绍了 AIGC、Transformer 架构及扩散模型等基础原理，分析了自然语言处理、计算机视觉等领域的实际应用与局限性。随后详细梳理了从需求分析、数据准备、模型选择、微调策略、提示词工程到部署监控的完整开发生命周期，强调了数据质量与评估优化的重要性。文章旨在为技术人员提供一套系统化的大模型落地指南，…

发布于 2025/2/621 浏览0 点赞

Python

35 岁失业后推荐的 5 种职业方向及应对策略

针对 35 岁失业人群，文章分析了五种可行的职业方向，包括早餐店、外卖、家政、电商及程序员。强调放下包袱，根据能力选择，并指出中年危机需通过持续学习技能来应对，保持积极心态是度过难关的关键。

发布于 2025/2/625 浏览0 点赞

Python算法

Python 爬虫开发与项目实战：从入门到精通指南

Python 爬虫开发涵盖基础语法、Web 协议解析、数据存储及分布式架构。梳理了从零开始的学习路径，包括 Python 环境搭建、HTML 解析技术（正则、BeautifulSoup）、静态与动态网站抓取策略、Scrapy 框架应用以及反爬机制应对。内容涉及增量式爬虫、Redis 分布式调度及 PySpider 等工具，适合希望系统掌握数据采集技能的开发者…

发布于 2025/2/621 浏览0 点赞

PythonAI大前端算法

Python 学习路线图与核心技术栈详解

Python 在大数据与人工智能领域具备显著优势，通过调用 NumPy、pandas 等库可高效处理海量数据。系统梳理了从语言基础、高级特性到全栈开发、运维自动化及数据科学的完整技术路线，涵盖爬虫、数据库、机器学习等核心模块，旨在帮助开发者建立清晰的知识体系并掌握实战技能。

发布于 2025/2/631 浏览0 点赞

dehua dong

发布的文章

Transformer 注意力机制详解：自注意力、交叉与因果自注意力 PyTorch 实现

基于 LangChain 与 LangGraph 的嵌入式多 Agent 通信架构

10 个大型语言模型 (LLM) 核心面试题与解析

视觉大模型深度解析：架构、训练与应用全景指南

利用 DeepSeek 提升 Excel 数据处理效率指南

AI 大模型训练与微调实操经验总结

大模型压缩技术详解：量化、剪枝与蒸馏原理

Python 核心应用场景与开发环境配置指南

QVQ-72B 视觉推理大模型开源评测与代码实现

云服务器部署 ComfyUI+SVD 生成 AI 视频实战指南

AI 时代产品经理核心能力：如何利用大模型提升工作效率与竞争力

大语言模型架构：Attention 机制详解

大模型时代程序员如何提升核心竞争力与生产力

互联网大厂 Android 面试题大全与核心知识点解析

大学退学后自学 Python 实现职业逆袭的真实经历

Python 数据可视化：Seaborn 库使用指南

大模型开发通用流程

35 岁失业后推荐的 5 种职业方向及应对策略

Python 爬虫开发与项目实战：从入门到精通指南

Python 学习路线图与核心技术栈详解