
学习大语言模型原理必看的 10 篇论文
梳理了支撑 ChatGPT 的核心论文与技术脉络。从 Transformer 架构革新开始,介绍了 GPT-3 的大规模少样本学习能力,以及 InstructGPT 和 Sparrow 引入的人类反馈对齐机制。重点阐述了 RLHF、TAMER 和 PPO 在强化学习中的应用,并探讨了 In-Context Learning 的隐式优化原理及 Prompt 工…
博客作者
服务端架构师
320
已发布文章
7.5K
博客获赞
352K
博客浏览
第 3 页

梳理了支撑 ChatGPT 的核心论文与技术脉络。从 Transformer 架构革新开始,介绍了 GPT-3 的大规模少样本学习能力,以及 InstructGPT 和 Sparrow 引入的人类反馈对齐机制。重点阐述了 RLHF、TAMER 和 PPO 在强化学习中的应用,并探讨了 In-Context Learning 的隐式优化原理及 Prompt 工…
如何在 VS Code 编辑器中关闭 GitHub Copilot 的代码补全功能。通过点击右下角 Copilot 图标并取消勾选 Inline Suggestions 选项即可实现。重新开启时操作类似,用户可通过图标状态变化确认当前设置。
介绍如何在 Windows 11 下通过 QTTabBar 插件增强资源管理器功能。对比了替换式与增强式管理器的优劣,推荐轻量、低学习成本的增强方案。提供了中文优化版的获取建议及基础安装步骤说明,旨在帮助用户提升文件管理效率。
在 OpenClaw 中配置多个 Agent 并分别绑定不同飞书机器人的步骤。主要包括创建新 Agent、配置飞书渠道参数(AppID 和 Secret)、将 Agent 与特定飞书账号绑定以及重启网关服务。同时提供了配置文件示例及常见问题的排查建议,如确保使用独立飞书应用、检查 Token 配置等。
综述了世界模型(World Models)的发展脉络,涵盖其定义、历史演进、关键技术及应用。世界模型旨在构建环境的内部表示以理解机制并预测未来状态。发展历程从早期的统计方法(HMM、卡尔曼滤波)到 Dyna 架构,再到深度学习时代的 VAE-RNN、Dreamer 系列及 MuZero。当前趋势聚焦于多模态融合、大规模预训练及物理先验。文章总结了在强化学习、…

HTML5 与 AI 技术的融合应用,涵盖 Canvas 绘图、智能表单及天气应用等场景。内容涉及前端 AI 推理架构、接口封装、性能优化策略及安全注意事项。通过实际案例展示了如何利用 AI 增强用户体验,并提供了实施步骤与最佳实践,旨在帮助开发者掌握 HTML5 结合 AI 的开发流程与安全防护要点。

Google Stitch 是一款由 Google 推出的 AI 驱动 UI 设计工具,支持通过文字描述或草图快速生成网页和移动端界面,并导出前端代码。用户需使用 Google 账户登录,目前主要支持美国地区访问。工具提供多种模型模式(如 3 Flash、3 Pro、Redesign、Ideate),支持创建 Web 或移动端项目。用户可以生成多个 UI 变…
介绍 OpenAI 提出的 Consistency Model(一致性模型),该技术通过噪声直接映射数据的架构实现单步图像生成,相比传统扩散模型速度显著提升。文章分析了其核心突破包括速度革命、质量效率平衡及极简开发接口,探讨了在家居设计、移动端等场景的应用,并展望了多模态融合与 3D 生成的未来趋势。

60 个针对学术论文的 AI 指令,涵盖润色提升、降重去 AI 化、逻辑优化及格式规范等方面。内容涉及引言、文献综述、方法、结果、讨论等章节的修改建议,以及降低 AIGC 检测率的技巧,如增加个人学术观点、丰富细节描述和调整句式结构等。旨在帮助研究者利用 AI 工具提高论文质量并符合学术规范。

CC-Switch 是一款跨平台桌面工具,用于管理 AI 编码助手(如 Claude Code)的配置。它支持多供应商 API 密钥与 URL 的一键切换,自动备份配置文件以防误操作,并集成 MCP 服务器管理与 Skills 安装功能。通过图形界面替代手动编辑 settings.json,提升开发效率并确保 Token 安全。支持 macOS、Window…
如何利用 Llama-Factory 对大语言模型进行领域微调,并结合 LangChain 构建智能 Agent 工作流。针对通用模型在业务场景中缺乏领域知识和行动能力的问题,文章阐述了通过 QLoRA 技术在消费级 GPU 上高效微调模型的方法。随后展示了如何将微调后的模型接入 LangChain,利用 ReAct 范式实现工具调用和任务执行。流程涵盖需求…

前端开发中常用的几种加密与编码技术,包括 Base64 编码、MD5 和 SHA-256 哈希算法,以及 AES 对称加密和 RSA 非对称加密。文章详细解释了各算法的原理、特点、适用场景,并提供了基于 CryptoJS 和 JSEncrypt 库的代码示例。同时对比了对称与非对称加密的区别,阐述了哈希算法的核心特征及其在缓存校验、密码存储等场景的应用,帮助…
在 WSL2 环境下运行 Webots 与 ROS2 时,webots-controller 常因自动推断出错误的 IP 地址(如 10.255.255.254)而启动失败。根本原因是 webots_ros2_driver 错误地将 /etc/resolv.conf 中的 nameserver 当作 Webots 主机地址。解决方案包括启用 mirrored…
使用 Ollama 部署本地大模型的方法。针对公有云 API 费用高和数据隐私问题,Ollama 提供本地化解决方案,支持 Llama、Mistral 等模型且兼容 OpenAI 接口。内容涵盖环境准备(Docker、Python)及快速启动步骤,展示了如何在本地高效运行大模型以满足应用需求。
OpenClaw 是基于 Node.js 的开源 AI 助手,支持浏览器自动化、桌面控制及多端接入。详述在 Windows、macOS 或 Linux 下的安装流程,包括环境准备(Node.js 22+、API Key)、多种安装方式(脚本、npm、源码、Docker)、配置向导(onboard)及验证步骤。完成后可通过 Web 界面交互或对接微信、飞书等平…
汇总了人工智能面试的核心考点,涵盖基础概念(AI/ML/DL 关系、学习类型)、机器学习算法(回归、决策树、集成学习、SVM)、深度学习技术(CNN、RNN/LSTM、Transformer、生成式 AI)、框架工程实践(TensorFlow/PyTorch、数据预处理、模型部署、大模型微调)及前沿趋势(涌现能力、多模态、强化学习)。内容兼顾理论原理与工程落…

JavaScript 原生 Number 类型在处理大数及高精度小数时的精度丢失问题,推荐使用 BigNumber.js 库解决。内容涵盖库的介绍、安装配置、常用方法(加减乘除、幂运算、格式化等)以及实际场景下的精度对比示例,适用于金融、区块链等对数值精度要求较高的前端开发场景。

介绍 OpenClaw 自定义 Skill 的开发流程,以 Excel 数据批量处理为例。内容包括 Skill 核心原理、代码实现(继承 BaseSkill 类)、注册配置及调用方法。通过 pandas 读取多文件、合并去重并保存结果。解决了手动处理数据的效率问题,实现了办公自动化。提供了调试技巧与拓展方向,帮助开发者快速构建专属 AI 技能。
介绍使用 Stable Diffusion v1.5 模型生成故障艺术与赛博朋克融合风格图像的方法。涵盖提示词构建公式、关键参数调优策略及从单图到系列作品的迭代工作流。通过英文提示词结合特定风格关键词,配合采样步数与引导系数调整,可实现霓虹未来感与数字破碎感的视觉融合,适合 AI 绘画爱好者进行风格化创作探索。
记录了在 DCU BW1000 计算卡上尝试使用 llama.cpp 和 transformers 框架推理 Qwen3-Coder-30B 模型的实验过程。主要遇到 llama.cpp 路径配置问题及模型加载错误,以及 transformers 加载 AWQ 量化模型时因缺少 gptqmodel 依赖导致安装失败。最终由于模型文件不匹配及环境库兼容性问题,…