魔法巫师的博客文章

PythonAI算法

AI 大模型微调与推理实战指南

详细阐述了 AI 大模型微调与推理的完整技术流程。首先解释了微调的必要性，即通过特定数据集将通用模型转化为垂直领域专家。接着深入介绍了数据准备、模型选择、训练策略（如 LoRA、QLoRA）、超参数配置及评估方法。随后讲解了如何将模型部署为在线推理服务，涵盖 API 封装、推理优化（量化、KV Cache）及监控维护。最后提供了显存优化、幻觉抑制及成本控制等…

发布于 2025/2/733 浏览0 点赞

PythonAI算法

Qwen2 大模型微调实战：命名实体识别（NER）任务解析

基于 Qwen2-1.5B-Instruct 大模型进行命名实体识别（NER）任务的指令微调实战。采用 LoRA 方法降低显存消耗，结合 SwanLab 监控训练过程。教程涵盖环境配置、CCFBDCI 数据集处理、模型加载与微调、效果评估及推理测试。通过实例展示如何从文本中精准提取地点、人名、组织等实体信息，适合初学者入门 LLM 微调。

发布于 2025/2/729 浏览0 点赞

PythonAI算法

大模型提示工程进阶：思维链与思维树详解

深入探讨大模型提示工程中的高级推理技术，涵盖零样本、少样本提示法，重点解析思维链（CoT）、最少到最多（LtM）及思维树（ToT）等进阶方法。通过具体示例说明如何利用提示词引导模型进行复杂逻辑推理与问题解决，帮助开发者优化大模型应用效果，提升在数学、逻辑及算术场景下的回答质量。

发布于 2025/2/732 浏览0 点赞

编程语言AI算法

大型语言模型在疾病诊断中的应用综述

综述了大型语言模型在疾病诊断中的应用现状。文章分析了 LLMs 在不同临床专科、数据类型及技术方法上的应用情况，探讨了提示工程、检索增强生成及微调等技术路径。同时，总结了当前研究面临的隐私、幻觉及评估标准等挑战，并提出了未来研究方向，旨在为基于 LLM 的临床诊断系统开发提供理论参考与实践指导。

发布于 2025/2/740 浏览0 点赞

Shell / BashAI算法

DeepSeek-R1 本地部署指南

DeepSeek-R1 是一款开源大模型，支持本地部署以解决在线访问延迟问题。基于 Ollama 工具在本地运行 DeepSeek-R1 的完整流程，涵盖软件安装、多版本模型拉取、命令行交互及 API 调用方法。同时提供了不同参数量版本的硬件配置建议，帮助用户在离线环境下高效使用大模型能力。

发布于 2025/2/730 浏览0 点赞

编程语言AI算法

AI 体操视频暴露物理缺陷，LeCun：视频生成模型并不懂物理

AI 生成的体操视频出现肢体扭曲、违反物理规律的现象，引发业界对视频生成模型是否理解物理世界的讨论。Yann LeCun 指出当前模型缺乏基本物理知识，属于生成性而非世界模型。文章探讨了 Sora、Dream Machine 等模型在物理模拟上的表现差异，分析了扩散模型在隐空间学习导致的物理约束缺失问题，以及数据标注不足的影响。同时介绍了 Runway Ge…

发布于 2025/2/723 浏览0 点赞

编程语言AI算法

大语言模型基础与前沿：Devin 上线与 LLM 技术发展趋势

探讨了全球首个自主 AI 软件工程师 Devin 的上线及其对行业的影响，深入分析了大语言模型（LLM）的技术原理与发展趋势。内容涵盖 Transformer 架构的核心机制、高质量数据耗尽的挑战及自我改进方案、稀疏专家模型的优势，以及检索增强生成（RAG）、人类偏好对齐和视觉语言模型等前沿方向。此外，还讨论了 LLM 在减少偏见、环境影响等方面的社会议题，…

发布于 2025/2/733 浏览0 点赞

JavaScriptAI大前端算法

基于 Transformers.js 实现前端图片对象检测

如何利用 Transformers.js 库在前端浏览器中实现图片对象检测功能。通过导入 Xenova/detr-resnet-50 模型，用户可以上传本地图片，在客户端完成推理并渲染检测框。文章涵盖了从环境准备、代码实现到性能优化的完整流程，重点解决了模型加载、坐标计算及错误处理等关键问题，展示了边缘 AI 在 Web 开发中的应用潜力。

发布于 2025/2/630 浏览0 点赞

PythonAI算法

LLM 基础知识备忘录

档详细梳理了大语言模型（LLM）的基础知识体系，涵盖预训练阶段的超参数调优、位置编码机制（Sinusoidal/ROPE/ALiBi）、Norm 结构差异及 DeepSeek 模型的具体实践。内容深入探讨了 MoE 架构（Mixtral 与 DeepSeekMoE）的原理与负载均衡策略，以及 SFT 和 DPO 对齐技术的数据构建与训练细节。此外，还对比了…

发布于 2025/2/631 浏览0 点赞

PythonAI算法

多模态大模型技术路线与构建实践指南

系统梳理了视觉语言模型（VLMs）的技术路线，涵盖架构选择、训练策略及评估挑战。文章对比了交叉注意力与自注意力架构的优劣，分析了多阶段预训练、图像 - 文本对及文档数据的使用效果，并指出了基准测试中的污染与偏差问题。重点介绍了 Idefics3 的构建实践，包括基于 Llama 3.1 和 SigLIP-SO400M 的架构设计、像素重排策略及三阶段预训练方…

发布于 2025/2/630 浏览0 点赞

PythonAI算法

大语言模型智能体（Agent）核心机制与开发实践

介绍大语言模型智能体（Agent）的核心概念与实现机制。智能体由 LLM 大脑、规划、记忆和工具使用三部分组成。规划能力包括任务分解、思维链（CoT）、思维树（ToT）及反思完善；记忆分为短期上下文与长期向量库；工具使用通过 Function Calling 实现外部交互。文章结合 MetaGPT 示例展示了调研智能体的运行流程，并详细解析了 OpenAI…

发布于 2025/2/631 浏览0 点赞

PythonAI算法

Python 爬虫入门基础教程：流程、模块与框架详解

Python 爬虫入门基础教程涵盖爬虫定义、HTTP 协议原理、Requests 库使用、解析技术（XPath、BeautifulSoup）、Scrapy 框架架构及分布式方案。内容包含 GET/POST 请求示例、代理设置、多线程并发处理及 Scrapy 组件详解，适合初学者快速掌握网络数据采集的核心流程与工具链。

发布于 2025/2/626 浏览0 点赞

TypeScriptAI算法

构建 AI Agent 框架：从规划到执行的全流程解析

AI Agent 利用语言模型作为推理引擎，具备自主发现问题、确定目标及执行方案的能力。核心组件包括规划（Planning）、记忆（Memory）和工具（Tool）。思维链（CoT）和 ReAct 框架在 Agent 中的应用，展示了如何通过 Prompt 工程引导模型进行多步推理和工具调用。通过构建 AgentExecutor 实现执行循环，协调工具调用与…

发布于 2025/2/628 浏览0 点赞

PythonAI算法

AI 领域必读精选：6 部名家名作

AI 领域发展迅速，涵盖多模态大模型、可解释人工智能、扩散模型、深度生成模型、PyTorch 框架及图深度学习。精选 6 部名家著作，介绍技术原理、实战案例及应用场景，适合初学者到专业人士阅读，帮助读者系统掌握大模型时代的核心技术与开发实践。

发布于 2025/2/631 浏览0 点赞

编程语言AI算法

李沐：大模型发展趋势与创业感悟

李沐关于大模型趋势的演讲内容。文章首先分析了算力层面的带宽、内存瓶颈及成本趋势，指出内存将制约模型上限。其次探讨了模型演进，包括语言模型参数规模主流区间、语音模型的低延迟优势、图像视频生成的现状及多模态整合方向。接着讨论了应用落地，区分了白领与蓝领工作的自动化难度，并指出杀手级应用尚在探索。最后分享了创业感悟，强调后训练是关键技术环节，数据决定模型上限，评估…

发布于 2025/2/625 浏览0 点赞

Python算法

Python 爬虫入门：构建简单数据抓取程序

Python 爬虫通过模拟浏览器请求获取网页数据，主要涉及发送请求、解析源码、存储数据三个核心步骤。使用 requests 库发起 HTTP 请求并处理状态码，利用 BeautifulSoup 结合 lxml 解析 HTML 结构提取特定信息，演示了将数据写入本地文件的完整流程。此外，补充了设置请求头规避反爬、异常捕获处理、遵守 Robots 协议及数据序列…

发布于 2025/2/624 浏览0 点赞

Kotlin大前端java

基于整洁架构优化 Gradle Module 设计与依赖管理

探讨了如何利用整洁架构（Clean Architecture）的设计原则优化 Android 项目中的 Gradle Module 划分与依赖管理。文章详细阐述了 Module 粒度划分的三大原则（REP、CCP、CRP）以及依赖关系的三大原则（ADP、SDP、SAP），并通过不稳定度公式和抽象度公式量化评估组件健康度。文中结合短视频应用案例，演示了如何通过…

发布于 2025/2/626 浏览0 点赞

Shell / Bash

网络安全攻防：黑客攻击简要流程

详细阐述了网络安全攻防中黑客攻击的九个核心阶段，涵盖踩点、扫描、查点、访问、提升特权、窃取信息、掩踪灭迹、创建后门及拒绝服务。文章分析了各阶段的攻击目的、常用技术手段与工具，并针对性地提出了防御建议。通过深入理解攻击生命周期，安全人员能够构建更完善的纵深防御体系，有效降低系统风险。内容强调伦理合规与持续监控的重要性，适用于网络安全学习与防护实践参考。

发布于 2025/2/635 浏览0 点赞

PythonAI算法

Python 入门教程：环境搭建、基础语法与数据类型详解

Python 编程的基础知识，涵盖从环境搭建到核心语法的完整流程。内容包括 Python 的安装配置、常用 IDE 选择、变量与数据类型（数字、字符串、列表、元组、字典、集合）、运算符使用、条件语句与循环结构、函数的定义与调用、文件读写操作以及异常处理机制。文章通过具体的代码示例解释了缩进规则、切片操作、模块导入等关键概念，旨在帮助初学者建立扎实的 Pyth…

发布于 2025/2/627 浏览0 点赞

魔法巫师

发布的文章

AI 大模型微调与推理实战指南

AI 大模型技术原理、应用场景与学习路径

Qwen2 大模型微调实战：命名实体识别（NER）任务解析

大模型提示工程进阶：思维链与思维树详解

大型语言模型在疾病诊断中的应用综述

DeepSeek-R1 本地部署指南

AI 体操视频暴露物理缺陷，LeCun：视频生成模型并不懂物理

大语言模型基础与前沿：Devin 上线与 LLM 技术发展趋势

基于 Transformers.js 实现前端图片对象检测

LLM 基础知识备忘录

多模态大模型技术路线与构建实践指南

大语言模型智能体（Agent）核心机制与开发实践

Python 爬虫入门基础教程：流程、模块与框架详解

构建 AI Agent 框架：从规划到执行的全流程解析

AI 领域必读精选：6 部名家名作

李沐：大模型发展趋势与创业感悟

Python 爬虫入门：构建简单数据抓取程序

基于整洁架构优化 Gradle Module 设计与依赖管理

网络安全攻防：黑客攻击简要流程

Python 入门教程：环境搭建、基础语法与数据类型详解