落日余晖的博客文章

编程语言AI算法

Ovis: 多模态大语言模型的结构化嵌入对齐

Ovis 提出了一种多模态大语言模型架构，旨在通过结构化嵌入对齐解决视觉与文本嵌入不一致的问题。该方法引入可学习的视觉嵌入查找表，将图像块映射为概率标记并索引该表生成最终视觉嵌入，使其与文本嵌入策略保持一致。实验表明，Ovis 在多个多模态基准测试中优于同规模开源模型，部分性能超越专有模型 Qwen-VL-Plus，展现了结构化视觉表示的潜力。

发布于 2025/2/728 浏览0 点赞

PythonAI算法

基于 FastAPI 的 AI 知识库 RAG 流程基础功能实现

基于 FastAPI 与异步 ORM 构建 AI 知识库，涵盖文档分块、大模型调用、流式响应及向量检索生成等核心功能。文章详细介绍了如何使用 DocumentChunk 处理文档，LLMEngine 对接多种大模型接口，以及通过向量化技术实现 QA 对的自动生成与存储。此外，补充了完整的检索增强生成（RAG）流程，包括问题嵌入、向量检索、上下文构建及最终回答…

发布于 2025/2/626 浏览0 点赞

PythonAI算法

LLM 大模型训练优化策略详解：数据并行、模型并行与 ZeRO

详细解析了大模型训练中的显存优化策略。内容涵盖 GPU 显存构成分析，包括参数、梯度、优化器状态及中间激活值的占用计算。深入探讨了集合通信操作（Broadcast, AllReduce 等）及其在多卡协同中的作用。重点阐述了数据并行、模型并行、ZeRO（1/2/3 级）及流水线并行的原理、流程与显存收益对比。此外，还介绍了混合精度训练（FP16/FP32）的…

发布于 2025/2/624 浏览0 点赞

PythonAI算法

大模型时代：程序员转型 AI 的传统机器学习路径

探讨了大模型时代下程序员转型 AI 的技术路径。文章分析了大型预训练模型在资源消耗、数据需求及可解释性方面的局限性，强调了传统机器学习和神经网络作为基础技术的重要性。内容涵盖了数学基础、推荐学习路径（从 Python 基础到传统 ML 再到深度学习与大模型），并通过代码示例展示了传统机器学习流程。结论指出，扎实的底层基础有助于更深入理解 AI 本质，是长期职…

发布于 2025/2/628 浏览0 点赞

Python

Python 面向对象学生管理系统设计与实现

基于面向对象编程思想构建的 Python 学生管理系统，涵盖添加、删除、修改、查询及显示学生信息功能。系统采用 CSV 格式实现数据持久化，定义了 Student 和 StudentManagementSystem 类以封装业务逻辑。代码包含完整的命令行交互循环、输入验证机制及文件读写异常处理，适合作为 Python 入门实战项目参考。

发布于 2025/2/628 浏览0 点赞

PythonAI算法

大模型技术入门：概念、发展历程与核心特点

探讨了大模型技术的定义及其与大模型的区别，梳理了从规则模型到 Transformer 架构的发展脉络。重点分析了大模型的规模、泛化能力、预训练微调范式及多模态特性。同时介绍了基于任务、模态和架构的分类方法，并指出当前面临的技术挑战与伦理问题。旨在为读者提供系统的大模型技术认知框架。

发布于 2025/2/622 浏览0 点赞

编程语言AI算法

8 款实用 AI 绘画工具推荐：从 Midjourney 到 Stable Diffusion

8 款主流 AI 绘画工具，涵盖 Midjourney、Stable Diffusion、Microsoft Designer 等。文章分析了各工具的特点，如 Midjourney 的艺术渲染能力、Stable Diffusion 的可控性与开源优势、以及 Microsoft Designer 的海报生成功能。内容包含使用方式、适用人群及优缺点对比，旨在帮助…

发布于 2025/2/627 浏览0 点赞

PythonAI算法

本地部署私有开源大型语言模型（LLM）的 7 种主流方法汇总

详细梳理了七种本地部署开源大语言模型的主流方法，包括 Hugging Face Transformers、Llama.cpp、Llamafile、Ollama、vLLM、TGI 和 DeepSpeed。文章分析了各工具的核心优势、技术特点、安装使用方式及适用场景，并通过对比表格帮助用户根据性能需求、硬件条件和易用性偏好选择合适的部署方案。内容涵盖从个人快速体…

发布于 2025/2/627 浏览0 点赞

PythonAI算法

AI Agent 核心概念解析与 LangChain 实战指南

AI Agent 是基于大语言模型构建的智能体，具备自主规划、决策和执行复杂任务的能力。深入解析了 AI Agent 的核心架构，包括 LLM、规划技能、记忆机制及工具使用四大要素，并阐述了 ReAct 决策循环的工作原理。同时，提供了基于 LangChain 框架的完整实战指南，涵盖环境配置、模型加载、工具集成及 Agent 初始化的具体代码示例。此外，文…

发布于 2025/2/624 浏览0 点赞

PythonAI算法

Python 语言简介与开发环境搭建指南

Python 语言的核心特性，包括解释型、交互式及面向对象特点。详细阐述了 Python 在 Web 开发、自动化运维、网络爬虫、人工智能及科学计算等领域的应用。内容涵盖 Linux 与 Windows 平台的 Python 安装步骤、PyCharm IDE 配置方法，以及虚拟环境的创建、激活与管理流程。此外，补充了常见环境问题排查与最佳实践建议，帮助开发者…

发布于 2025/2/623 浏览0 点赞

PythonAI算法

Python 入门指南：特性、优势与学习路径

Python 是一种解释型、面向对象的高级编程语言，以其简洁的语法和强大的生态系统著称。详细解析了 Python 的核心特性、主要应用领域如数据分析与人工智能，并提供了从环境搭建到进阶开发的学习路线图。内容涵盖基础语法、常用库介绍及职业发展方向，旨在帮助初学者建立系统的认知框架，高效掌握编程技能。

发布于 2025/2/633 浏览0 点赞

编程语言java算法

网络安全基础与黑客技术入门指南

网络安全的基础知识与黑客技术入门，涵盖黑客分类、基本技能、网络协议、漏洞原理、加密解密及安全软件分类。文章详细解释了 IP 地址、端口、服务器与客户端的概念，分析了常见漏洞类型如弱口令和溢出，并对比了白帽与黑帽的区别。内容还涉及操作系统选择、必备工具推荐及法律道德边界，强调合法合规的重要性，旨在引导初学者建立正确的安全观并掌握基础防护技能。

发布于 2025/2/625 浏览0 点赞

PythonAI算法

大模型算法岗常见面试题 100 道

大模型算法岗位的常见面试题，涵盖基础架构、进阶微调、LangChain 应用框架、分布式训练及推理优化等核心领域。内容涉及 Transformer 原理、Tokenizer 实现、LoRA 与 SFT 微调策略、RAG 检索增强生成、以及 Flash Attention 等推理加速技术。旨在帮助求职者系统复习大模型相关知识，掌握从预训练到部署的全流程关键技术…

发布于 2025/2/622 浏览0 点赞

编程语言算法

漏洞挖掘入门教程：从零基础到精通的完整指南

漏洞挖掘是将应用程序比作迷宫，通过枚举入口点并寻找不安全状态的过程。文章介绍了发现漏洞的三个步骤、所需的知识体系（开发技术、攻防理念、工具使用、应用理解）以及四种分析模型（用途、执行条件、通信、代码二进制）。强调白盒与黑盒测试的区别，指出现代利用往往依赖漏洞链而非单一漏洞，并提倡在团队中保持坦诚与高效学习。

发布于 2025/2/631 浏览0 点赞

编程语言

网络安全众测平台与SRC漏洞奖励计划汇总

汇总了国内主流网络安全众测平台、前沿漏洞研究奖励计划、行业 SRC 及企业应急响应中心列表。涵盖互联网、金融、物流、社交等多个领域的知名厂商 SRC 入口。文章同时补充了参与 SRC 的安全规范与法律指引，强调授权原则、测试范围界定、漏洞提交标准及数据隐私保护的重要性，旨在为安全研究人员提供合规的漏洞挖掘参考指南。

发布于 2025/2/626 浏览0 点赞

PythonAI算法

教育行业垂直领域大模型 LLM4Edu 的前景与机遇

探讨了教育行业垂直领域大模型 LLM4Edu 的发展前景与机遇。文章分析了传统教育面临的个性化需求不足、资源分配不均等挑战，阐述了 LLM 在实现个性化学习、智能辅导及自动化评估方面的优势。同时指出了数据隐私安全、模型可解释性与公平性、实际部署成本等核心挑战。文中详细列举了 LLM 在教育行业的十二个应用场景，涵盖学习辅助、内容创作、语言教学及职业规划等。最…

发布于 2025/2/627 浏览0 点赞

编程语言AI算法

AIGC 产品经理定义、核心职责及与 AI 产品经理的区别解析

详细阐述了 AIGC 产品经理的定义、核心职责及与传统 AI 产品经理的区别。AIGC 产品经理主要负责将 AI 生成内容能力结合于现有业务，需具备技术理解、不确定性管理、跨领域知识融合及商业化落地能力。文章对比了两者在工作流、关注重点及交付物上的差异，并梳理了 AIGC 产品经理所需的关键技能树，包括提示词工程、评估体系搭建、成本优化及安全合规。此外，文中…

发布于 2025/2/626 浏览0 点赞

PythonSaaSAI算法

2024 年国内主流 AI 大模型平台全方位测评

对比了阿里云魔搭、百度飞桨星河社区、华为昇思及哩布哩布等国内主流 AI 大模型平台。从社区规模、基础设施能力、生态建设三个维度进行评测，涵盖开源模型库、算力支持、SFT 微调、课程赛事及商业化模式。同时补充了垂直领域自然语言生成平台的分析，涉及智谱、讯飞等厂商。旨在帮助开发者根据需求选择合适的平台，共建 AIGC 生态。

发布于 2025/2/634 浏览0 点赞

PythonAI算法

58 行代码将 Llama 3 扩展至 100 万上下文，适用于微调版

如何通过 58 行代码将 Llama 3 70B 模型的上下文窗口从 8k 扩展至 1048k。核心技术包括 Gradient AI 团队采用的 NTK-aware RoPE 位置编码优化和 Blockwise RingAttention 训练方法，以及开发者 Eric Hartford 利用 Mergekit 提取参数差异生成 LoRA 权重。该方案允许用…

发布于 2025/2/632 浏览0 点赞

落日余晖

发布的文章

Ovis: 多模态大语言模型的结构化嵌入对齐

Gomoon 开源：一款支持多模型与本地向量化存储的桌面大模型工具

基于 FastAPI 的 AI 知识库 RAG 流程基础功能实现

LLM 大模型训练优化策略详解：数据并行、模型并行与 ZeRO

大模型时代：程序员转型 AI 的传统机器学习路径

Python 面向对象学生管理系统设计与实现

大模型技术入门：概念、发展历程与核心特点

8 款实用 AI 绘画工具推荐：从 Midjourney 到 Stable Diffusion

本地部署私有开源大型语言模型（LLM）的 7 种主流方法汇总

AI Agent 核心概念解析与 LangChain 实战指南

Python 语言简介与开发环境搭建指南

Python 入门指南：特性、优势与学习路径

网络安全基础与黑客技术入门指南

大模型算法岗常见面试题 100 道

漏洞挖掘入门教程：从零基础到精通的完整指南

网络安全众测平台与SRC漏洞奖励计划汇总

教育行业垂直领域大模型 LLM4Edu 的前景与机遇

AIGC 产品经理定义、核心职责及与 AI 产品经理的区别解析

2024 年国内主流 AI 大模型平台全方位测评

58 行代码将 Llama 3 扩展至 100 万上下文，适用于微调版