
AI Agent 与大模型经典论文推荐
AI Agent 与大模型经典论文推荐。内容涵盖更有趣的 AI Agent、更有用的 AI Agent、任务规划与分解、幻觉、多模态、图片视频生成、语音合成、大模型基础、GPT、开源大模型、微调及性能优化等板块。收录了包括 CLIP、ViT、LLaVA、Transformer、Diffusion Models 在内的多篇核心论文及其链接,旨在帮助读者深入理解…
博客作者
实时计算工程师
366
已发布文章
13K
博客获赞
823K
博客浏览
第 17 页

AI Agent 与大模型经典论文推荐。内容涵盖更有趣的 AI Agent、更有用的 AI Agent、任务规划与分解、幻觉、多模态、图片视频生成、语音合成、大模型基础、GPT、开源大模型、微调及性能优化等板块。收录了包括 CLIP、ViT、LLaVA、Transformer、Diffusion Models 在内的多篇核心论文及其链接,旨在帮助读者深入理解…

Python 作为当前排名第一的编程语言,广泛应用于人工智能、数据分析、Web 开发及自动化运维等领域。文章分析了 Python 工程师在企业中的四大定位:验证算法、快速开发、测试运维和数据分析。详细阐述了全栈开发、运维开发及数据分析岗位的技能要求,涵盖语法、Linux、数据库、前端框架及算法设计等六个层级。同时提供了薪资趋势参考及学习路径建议,强调系统规划…

Android 性能优化是衡量开发者技术深度的关键指标。梳理了启动速度、内存管理、构建效率及崩溃监控等核心优化方向,结合互联网大厂的实际案例与最佳实践,解析了 Gradle 框架优化、Native 内存分析、H5 首屏加载等具体技术方案。旨在帮助开发者掌握行业前沿的调优思路,提升应用质量与用户体验,为技术进阶与职业发展提供实用参考。

基于 CTFd 框架和 Docker 技术搭建动态 CTF 竞赛靶场的完整流程。内容涵盖 Ubuntu 环境准备、Docker 及 Docker-compose 安装、国内镜像源配置、CTFd 项目部署、Frp 内网穿透设置、Whale 插件配置以及动态题目的创建与测试。文章还补充了平台安全加固、数据库备份、性能调优及常见故障排查方案,旨在帮助技术人员高效构…

详细梳理了 Linux、Windows 及 Android 三大操作系统中常见的敏感目录及其安全风险。在网络安全应急响应中,恶意文件常隐藏于系统配置、日志、临时文件及用户数据目录中。文章列举了各系统的关键路径如 Linux 的/etc、/var/log,Windows 的 System32、AppData,以及 Android 的/data、/system…

文章以 OpenAI o1 模型发布为背景,引出强化学习中的核心策略 Exploit and Explore(利用与探索)。通过约会吃饭的场景类比,解释了在多臂老虎机问题中如何平衡已知最优策略与未知探索。详细介绍了三种经典算法:ϵ-贪心算法、UCB 算法及 Thompson Sampling 算法,并提供了相应的数学原理与 Python 代码实现,帮助读者理…

10 个开源免费的大模型学习资料,涵盖学习路径、开源模型使用指南、基础理论、应用开发及视频教程。资源包括 GitHub 项目如 mlabbone/llm-course、datawhale 系列教程,以及 B 站相关公开课。内容涉及 Transformer 架构、API 调用、微调实战及行业应用案例,适合从入门到进阶的开发者参考。文章还补充了提示词工程、RAG…

总结了大模型 LLM 微调的技术进展与热门方法。介绍了 PEFT 参数高效微调技术,包括 Prompt Tuning、Prefix Tuning、LoRA、QLoRA 等主流方案。详细分析了多篇代表性论文在指令微调、领域适配(金融、法律)、中文优化及数据规模化方面的研究成果。文章对比了全参数微调与参数高效微调的差异,阐述了 LoRA 等方法的原理与优势,并结…

梳理了跨境外贸中视频营销、设计、写作、客服、投放及生产力六大类 AI 工具,涵盖 Midjourney、Deepseek、Notion 等主流应用。同时提供了从系统设计到微调开发的大模型学习路线图,旨在帮助从业者利用 AI 降本增效,提升运营效率与内容质量。

大语言模型入门所需的基础要求,包括编程语言、数学知识和开发工具库。详细阐述了 Transformer 架构的核心组件如 Attention 机制,并提供了基于 TensorFlow/Keras 的深度学习代码示例。此外,还涵盖了 Prompt 工程、RAG 技术、微调、从零训练及部署优化等进阶内容,帮助初学者建立系统化的学习框架。

深入分析了 Android Activity.finish() 后 onDestroy 延迟 10 秒调用的原因。通过源码追踪发现,onStop 和 onDestroy 的触发依赖于主线程空闲时的 IdleHandler 回调。当新 Activity 启动时主线程繁忙,导致 IdleHandler 无法执行,系统会启用 10 秒超时机制强制销毁。文章提供了复…

Android 性能优化已成为开发者必备技能。涵盖启动流程、内存管理、构建打包及网络渲染等核心领域。结合腾讯、字节、阿里等大厂实战案例,解析启动加速、内存泄漏排查、包体瘦身及弱网优化等关键技术点。通过体系化梳理底层原理与架构设计方法,帮助开发者提升代码质量,降低崩溃率,并在技术面试中展现深度与广度,实现职业持续发展。

QLoRA 是一种在量化模型基础上进行高效微调的技术,能在不降低性能的情况下显著减少显存占用。基于 LLaMA 模型的 QLoRA 实战流程,包括环境搭建、数据集准备、模型权重转换及微调训练。通过 7B 和 65B 模型的实测,展示了单卡及多卡场景下的显存占用情况,验证了 4bit 量化后微调 65B 模型仅需约 48G 显存的可行性。此外,文章还涵盖了 L…

大语言模型推理端的架构与实现,重点分析了 llama.cpp 的核心工作流程。内容涵盖从参数解析、模型加载、上下文创建到 Token 化、推理计算及结果输出的完整链路。深入探讨了 Transformer 架构中的 Attention 机制及其底层算子实现,包括 QKV 矩阵乘法、Softmax 及 Mask 操作。此外,文章还阐述了工程优化策略,如多硬件后端…

华为诺亚方舟实验室在 AAAI2025 提出 Eve 框架,一种具有弹性视觉专家的高效视觉语言模型。该模型通过三阶段训练整合适应性视觉专业知识,平衡语言能力与多模态能力。Eve 仅含 18 亿参数,在 30 亿参数以下配置中表现突出,VLM 基准测试达 68.87%,超越部分 70 亿参数模型如 LLaVA-1.5。核心创新包括弹性视觉编码器与弹性视觉前馈网…

LangChain 提供了构建 LLM 应用的核心工具。通过 9 个范例演示其核心功能,包括文本总结、文档问答、信息抽取、结果评估、数据库查询、代码理解、API 交互、聊天机器人及智能体。内容涵盖短长文本处理、向量检索、结构化输出解析及 Agent 工具调用,帮助开发者快速掌握 LangChain 在自然语言处理与自动化任务中的实际应用。

深入解析大语言模型(LLM)的核心原理与构建流程。涵盖预训练、指令微调及对齐技术(RLHF/DPO),详解参数高效微调方法(如 LoRA)。同时介绍提示词工程技巧及在自然语言处理、推荐系统等领域的应用,为开发者提供系统的学习路径与技术实践参考。

探讨了大语言模型在法律领域的颠覆性应用。文章首先回顾了从统计模型到 Transformer 架构的技术演进,阐述了法律 NLP 的特殊性。接着详细介绍了法律大模型的训练流程,包括多源数据清洗、微调策略及多维评估体系。在应用层面,涵盖了智慧审判辅助、法律研究咨询、合同审查等核心场景,并分析了幻觉、隐私、责任归属等面临的挑战。最后总结了 AI 与人机协作的未来趋…

如何使用 Python 和 Pygame 库创建一个彩球碰撞动画程序。内容涵盖环境搭建、核心代码实现(包括初始化、屏幕设置、小球类定义、主循环)、碰撞检测原理及性能优化技巧。通过封装 Ball 类处理位置更新与边界反弹,利用双缓冲机制保证渲染流畅,并提供了帧率控制和交互扩展建议,帮助读者掌握 Pygame 基础图形编程能力。

Hugging Face Transformers 库中统一的 LLM 工具调用 API 设计。通过扩展聊天模板支持工具定义,实现了跨模型的工具调用一致性。文章详细讲解了如何将 Python 函数自动转换为 JSON Schema 传递给模型,以及在聊天历史中标准化工具调用和响应的消息格式。通过 Hermes-2-Pro-Llama-3-8B 模型的实战示例…