
学习大语言模型原理必看的 10 篇论文
系统梳理了支撑 ChatGPT 及大语言模型发展的核心论文与技术脉络。内容涵盖 Transformer 架构的基础原理,GPT-3 的大规模少样本学习能力,InstructGPT 与 Sparrow 引入的人类反馈强化学习(RLHF)以实现意图对齐,以及 PPO 等强化学习算法的具体应用。此外,文章还探讨了 In-Context Learning 的内在机制…
博客作者
追光者
332
已发布文章
10K
博客获赞
604K
博客浏览
第 5 页

系统梳理了支撑 ChatGPT 及大语言模型发展的核心论文与技术脉络。内容涵盖 Transformer 架构的基础原理,GPT-3 的大规模少样本学习能力,InstructGPT 与 Sparrow 引入的人类反馈强化学习(RLHF)以实现意图对齐,以及 PPO 等强化学习算法的具体应用。此外,文章还探讨了 In-Context Learning 的内在机制…
阅读了多篇关于 AI 科学家及科研自动化的前沿论文。涵盖 PaperSearchQA(基于 RLVR 的科学论文搜索与推理)、ChemCRAFT(利用智能体强化学习赋能化学语言模型)、金属合金 3D 打印配置优化、Deep Research(交互式多智能体工作流)、Bohrium+SciMaster(代理科学基础设施)、QMBench(量子材料研究基准)以及…

一个包含 650 对图像的无人机光伏缺陷检测数据集,涵盖红外热成像与可见光双模态数据。数据集标注了电池片隐裂、热斑、二极管故障等 10 类缺陷,采用 YOLO 格式。文章提供了红外 - 可见光图像配准脚本(基于 SIFT+RANSAC)以及双模态 YOLOv8 融合模型代码,支持光伏电站智能巡检、缺陷定位及发电量评估。方案建议先使用可见光单模态训练,再扩展至…

对文心一言 4.5 进行了详细的能力测评,涵盖图像识别、通识问答、逻辑推理等方面,并与 Claude、DeepSeek、Qwen3 等模型进行对比,指出其在中文处理上表现优异。文章还提供了基于 FastDeploy 的 Linux 及 Windows 本地部署步骤,包括环境配置(CUDA、cuDNN)、虚拟环境搭建及模型运行命令,适合开发者尝试本地化运行大模…
介绍如何使用 PyTorch CUDA v2.7 容器环境部署 Stable Diffusion 等 AI 模型。通过 Docker 封装 PyTorch、CUDA 及常用库,解决本地开发中环境配置复杂、依赖冲突及 GPU 识别困难等问题。文章涵盖镜像拉取、容器启动、Jupyter 与 SSH 访问方式,以及显存管理、数据持久化和安全实践建议,旨在提供一套标…

介绍 R 语言在 AIGC 时代的应用。涵盖基础特性,如统计分析、可视化及数据处理能力。详细阐述在数据预处理、文本分析、机器学习及可视化报告中的场景,并提供金融、医疗、社交媒体等领域的具体案例。最后展望 R 语言与深度学习框架、云计算及自动化工具的集成趋势,展示其在数据驱动时代的潜力。

介绍如何利用 Python、Gradio 及大模型 API 开发一款交互式海龟汤(情境猜谜)游戏。通过调用 LLM 生成谜题并评估玩家回答,实现动态推理体验。文章涵盖 API 配置、代码实现及项目总结,展示了 AI 在游戏逻辑交互中的应用。

系统介绍了 AI Agent 开发入门知识,涵盖核心概念、技术原理、实践应用及案例分析。文章指出 AI Agent 正从对话工具进化为执行引擎,详细解析了其底层架构(应用层、Agent 层、工具层、模型层)及核心算法(基础执行、ReAct 循环)。通过企业自动化与个人效率场景分析,提供了实施步骤、最佳实践及成本安全控制策略。同时总结了技术演进历程与未来趋势,…

介绍 Stable Diffusion(基于潜在扩散模型 LDM)的论文原理及本地部署实践。内容涵盖自编码器感知压缩、潜在空间扩散操作、条件机制(Cross-Attention)等核心架构。提供环境配置指南(Python/Conda/Git)、WebUI 安装步骤、提示词编写技巧及模型管理方法。旨在帮助开发者理解底层逻辑并实现高质量的 AI 图像生成。

在 Flutter 中集成 google_generative_language_api 以适配鸿蒙 HarmonyOS 系统的实战方案。内容包括 API 密钥的安全存储、流式响应处理、多模态数据支持以及安全设置配置。通过示例代码展示了如何初始化模型、发送请求并实时渲染 AI 生成内容,同时提供了错误降级和上下文管理建议,旨在帮助开发者构建高效、安全的鸿蒙端…

介绍 Java 智能仿真无人机项目 V4 版本的开发。新增定点任务处理、鼠标交互、多线程协作及状态机管理四大功能。通过 Task 类封装任务,TaskProThread 线程分配任务,Drone 类管理多状态(巡逻/跟随/任务)。利用勾股定理计算距离实现最近无人机匹配,结合 Swing 实现界面交互与可视化。解决了任务生成、分配、执行及完成的闭环逻辑,并包含…

在钉钉中创建自定义 Webhook 机器人的步骤,包括获取 Webhook 地址及配置安全加签。提供了多种消息类型发送示例,涵盖文本、Markdown、@提醒、链接及按钮卡片,并包含 cURL 调用方式。最后列出了频率限制、消息长度及安全注意事项,帮助开发者快速集成钉钉通知功能。

基于 Microi 吾码低代码框架结合 Vue 技术构建高效应用的完整流程。内容涵盖系统环境准备、后端与前端安装配置、数据库初始化、项目创建、Vue 组件开发与注册、数据状态管理以及用户事件处理等核心环节。通过该框架的可视化设计与自动化能力,开发者可快速搭建具备良好可维护性的应用系统。

深入探讨了从 XMLHttpRequest 迁移至 Fetch API 的技术细节与优势。对比了两者在回调机制、错误处理及状态管理上的差异,指出 XHR 存在的回调地狱与模糊错误问题。文章提供了基于 Promise 的 Fetch 使用示例,涵盖流式处理、请求中断、超时控制及拦截器模式等高级特性。通过渐进式迁移策略与兼容性降级方案,帮助开发者构建更现代化、可…
VSCode Copilot 登录失败常见于多平台,表现为重定向循环或报错。原因涉及 Token 失效、网络代理拦截及缓存损坏。解决方案包括清除凭证缓存、刷新个人访问令牌、重装扩展及检查网络策略。企业环境下需注意防火墙对 OAuth 回调端口的限制。定期更新扩展版本可预防兼容性问题。

总结了 2024 年前端领域的主要技术进展,涵盖 React、Vue、Svelte 及 Qwik 四大框架。React 重点介绍了 Server Components、并发渲染及 SSR 集成优化;Vue 梳理了 3.3 至 3.5 版本的性能提升与新特性如 v-memo、defineModel;Svelte 强调了编译时优化带来的运行时性能优势;Qwik…

介绍如何在 VS Code 中使用 Overleaf Workshop 插件连接 Overleaf 账号,通过浏览器开发者工具获取 Cookie 进行登录,从而在本地编辑器中利用 Copilot 等 AI 工具辅助 LaTeX 论文写作,实现远程编译与预览功能。
探讨了前端表单验证的重要性及常见误区,对比了仅依赖 HTML5 验证、逻辑混乱及缺少实时反馈的反面案例。介绍了基于原生 JavaScript 的实时验证实现方案,以及使用 Yup、Formik 和 React Hook Form 等库的最佳实践。强调分层验证前后端结合、规则配置化、异步校验及可访问性设计,旨在提升数据质量、用户体验并保障安全性。
介绍 AI 辅助测试用例生成的全流程。内容涵盖主流工具选择(如 Selenium AI、Testim)、环境搭建(Python、Node.js)、四步生成流程(需求分析、AI 生成、人工优化、流水线集成)及最佳实践。文章分析了常见挑战如误报率高的解决方案,并通过金融 App 案例展示覆盖率提升效果,帮助测试从业者掌握智能化测试方法。
档详细介绍了如何在本地环境部署 AI 增强的 SearXNG 搜索引擎。内容涵盖系统架构设计、Docker 及直接安装方式、Ollama/LocalAI 等 AI 模型集成方案、联网搜索配置、以及性能优化与安全策略。通过整合自然语言处理与语义搜索,实现了智能查询理解、结果重排序和内容摘要生成。该方案支持企业知识搜索、学术研究及多语言应用,强调隐私保护与数据所…