大前端

LLM应用架构 LLM application architectures

Ne0inhk

12 Oct 2023 — 5 min read

在本课程的最后一部分，您将探讨构建基于LLM的应用程序的一些额外考虑因素。首先，让我们把迄今为止在本课程中所见的一切汇总起来，看看创建LLM驱动应用程序的基本组成部分。您需要几个关键组件来创建端到端的应用程序解决方案，从基础设施层开始。该层提供了计算、存储和网络，以提供LLMs，并托管应用程序组件。您可以利用您的本地基础设施，或者通过按需和按使用量计费的云服务提供此基础设施。

www.zeeklog.com - LLM应用架构 LLM application architectures

接下来，您将包括您希望在应用程序中使用的大型语言模型。这些可能包括基础模型，以及您根据特定任务进行了自定义的模型。这些模型部署在适合您推理需求的基础设施上。考虑到您是否需要与模型进行实时或准实时交互。

您还可能需要从外部来源检索信息，例如在检索增强生成部分讨论的那些。

您的应用程序将从大型语言模型返回完成内容给用户或消费应用程序。根据您的用例，您可能需要实现一种机制来捕获和存储输出。例如，您可以构建在会话期间存储用户完成内容以增加LLM的固定上下文窗口大小的容量。

您还可以从用户那里收集反馈，这可能对进一步的微调、调整或评估在应用程序成熟时很有用。

接下来，您可能需要使用大型语言模型的其他工具和框架，以帮助您轻松实施本课程中讨论的某些技术。例如，您可以使用Len Chains内置库来实施PowReact或思维链提示等技术。您还可以利用模型中心来集中管理和共享模型，以供应用程序使用。

在最后一层，通常会有某种用户界面，应用程序将通过该界面进行访问，例如网站或REST API。这一层还包括与应用程序交互所需的安全组件。

从高层次来看，这个架构堆栈代表了构建生成式AI应用程序的各种组成部分。无论是人类最终用户还是通过其API访问您的应用程序的其他系统，您的用户都将与整个堆栈进行交互。正如您所看到的，模型通常只是构建端到端生成式AI应用程序的一部分。

恭喜您完成了完整的生成式AI项目生命周期。希望您感到已经形成了一些关于在构建LLM应用程序时需要考虑的重要问题的直觉。

本周，您了解了如何通过使用一种名为“强化学习与人类反馈”的技术，或简称RLHF，微调模型，以使其与人类偏好（如帮助、无害和诚实）保持一致。
鉴于RLHF的流行，存在许多现有的RL奖励模型和人类对齐数据集，使您能够快速开始对模型进行对齐。在实践中，RLHF是一种非常有效的机制，可用于改善模型的对齐性，降低其响应的毒性，并让您更安全地将模型用于生产。
您还学会了通过压缩、量化或修剪模型来优化模型以用于推理的重要技术。这可以减小为在生产环境中提供LLMs所需的硬件资源的数量。
最后，您还探讨了通过结构化提示和与外部数据源和应用程序的连接来帮助模型在部署中表现更好的方法。

LLMs可以在应用程序中充当理性引擎的精彩角色，充分利用它们的智能来支持令人兴奋和实用的应用程序。像Lang Chain这样的框架正在使快速构建、部署和测试LLM驱动的应用程序成为可能，对于开发人员来说是一个非常令人兴奋的时刻。

在TEA的课程结尾，我们将探讨一些正在积极研究的领域，这些领域可能会在未来几个月和年份中塑造该领域的发展轨迹。

Reference

https://www.coursera.org/learn/generative-ai-with-llms/lecture/LLhcT/llm-application-architectures

如何微调和部署OpenVLA在机器人平台上

这个教程来自这个英伟达网址教程的目标是提供用于部署 VLA 模型的优化量化和推理方法，以及针对新机器人、任务和环境的参考微调流程。在一个自包含的仿真环境中，结合场景生成和领域随机化（MimicGen）对性能和准确性进行严格验证。未来阶段将包括与 Isaac Lab 和 ROS2 的 sim2real 集成、对 CrossFormer 等相关模型的研究，以及针对实时性能的神经网络结构优化。 * ✅ 针对 VLA 模型的量化和推理优化 * ✅ 原始 OpenVLA-7B 权重的准确性验证 * ✅ 基于合成数据生成的参考微调工作流程 * ✅ 在 Jetson AGX Orin 上使用 LoRA 进行设备端训练，以及在 A100/H100 实例上进行完全微调 * ✅ 在示例积木堆叠任务中通过领域随机化达到 85% 的准确率 * ✅ 提供用于复现结果的示例数据集和测试模型 1. 量化已在 NanoLLM 的流式 VLM

Flutter 三方库 shelf_modular 的鸿蒙化适配指南 - 掌控服务器路由资产、精密模块治理实战、鸿蒙级服务端专家

欢迎加入开源鸿蒙跨平台社区：https://openharmonycrossplatform.ZEEKLOG.net Flutter 三方库 shelf_modular 的鸿蒙化适配指南 - 掌控服务器路由资产、精密模块治理实战、鸿蒙级服务端专家在鸿蒙跨平台应用执行高级服务端管理与多维 Shelf 路由资产指控（如构建一个支持全场景秒级交互的鸿蒙大型全量后端服务中枢、处理海量 API Route Payloads 的语义认领或是实现一个具备极致指控能力的资产管理后台路由审计中心）时，如果仅仅依赖官方的基础 Shelf 处理器或者是极其繁琐的手动路由映射，极易在处理“由于模块嵌套导致的资产认领偏移”、“高频服务请求下的认领假死”或“由于多语言环境导致的符号解析冲突死结”时陷入研发代码服务端逻辑崩溃死循环。如果你追求的是一种完全对齐现代模块化标准、支持全量高度可定制路由（Modular-driven Backend）且具备极致指控确定性的方案。今天我们要深度解析的 shelf_modular——一个专注于解决“服务端资产标准化认领与模块化解耦”痛点的顶级工具库，正是帮你打造“鸿蒙超

FPGA实现MIPI协议全解析 + MIPI协议完整时序规范

一、MIPI协议核心基础认知百度网盘链接：https://pan.baidu.com/s/1rDsLAXGj8WbX82teSkhuIw?pwd=1234 提取码: 1234 包含FPGA系统学习资料，免费分享 1. MIPI协议定义与核心特点 MIPI（Mobile Industry Processor Interface，移动产业处理器接口）是由MIPI联盟制定的高速串行差分接口协议，最初为手机、平板等移动设备设计，目前广泛应用于FPGA/嵌入式的图像采集（摄像头）、显示驱动（液晶屏）、高速数据传输场景。核心特点： ✅ 采用差分信号传输，抗干扰能力强、EMI电磁辐射小； ✅ 支持高低速双模切换，兼顾高速大数据传输和低速控制指令传输； ✅ 串行传输，引脚数量极少（对比并行RGB的几十根引脚，MIPI仅需时钟+1~4路数据差分对），硬件设计简洁； ✅ 传输速率高：单lane（数据通道）速率可达1Gbps~

FPGA 50 ，Xilinx Vivado 2020 版本安装流程，以及常见问题解析，附中文翻译（ Vivado 2020 版本安装教程）

前言 Xilinx 统一安装程序（Unified Installer）是进行 FPGA 与异构计算平台开发的重要基础工具，集成了 Vivado、Vitis 以及相关文档与设备支持组件。正确完成安装是后续进行硬件设计、软件开发与系统验证的前提。本文以 Xilinx 统一安装程序 2020.1 为例，结合实际安装过程，对安装步骤进行逐步说明，并对关键选项的含义进行必要解释。同时，针对安装过程中可能出现的常见错误（如归档文件无法打开、安装中断等问题），给出原因分析与解决建议，帮助用户快速定位并解决问题。需要注意的是，安装文件的完整性与安装环境的稳定性对安装成功率影响较大。若安装过程中出现异常，建议优先检查安装包是否完整、磁盘空间是否充足以及系统权限与安全软件设置是否合理。希望本文能够为初次接触 Xilinx 工具或在安装过程中遇到问题的用户提供参考和帮助。

Reference

Read more

如何微调和部署OpenVLA在机器人平台上

Flutter 三方库 shelf_modular 的鸿蒙化适配指南 - 掌控服务器路由资产、精密模块治理实战、鸿蒙级服务端专家

FPGA实现MIPI协议全解析 + MIPI协议完整时序规范

FPGA 50 ，Xilinx Vivado 2020 版本安装流程，以及常见问题解析，附中文翻译（ Vivado 2020 版本安装教程 ）

FPGA 50 ，Xilinx Vivado 2020 版本安装流程，以及常见问题解析，附中文翻译（ Vivado 2020 版本安装教程）