Amazon SageMaker 部署 AIGC 应用:训练、优化、部署与 Web 前端集成实践
背景
Amazon SageMaker 汇集广泛采用的亚马逊云科技机器学习和分析功能,统一访问所有数据,为分析和人工智能提供一体式体验。它支持模型开发、生成式人工智能、数据处理和 SQL 分析,在融通式合作开发工作室中加快协作和构建,借助强大的生成式人工智能软件开发助手 Amazon Q 开发者版提升效率。
前言
本文将通过 Amazon SageMaker Notebook 实例完成 AIGC 模型的测试与验证,再将模型部署至 Amazon SageMaker Inference Endpoint 实现服务化,最后利用 Amazon Cloud9 调试 Web 应用,并调用已部署的 SageMaker Inference Endpoint 实现 AIGC 模型的实际应用。
Amazon SageMaker 部署 AIGC 模型
步骤一:创建亚马逊云科技账户
- 注册亚马逊云科技账号。
- 进入注册页面(使用电子邮件地址进行注册),输入根用户电子邮件地址,编辑亚马逊云科技账户名称,然后选择验证电子邮件地址。
- 设置用户信息:输入根用户密码和确认根用户密码,选择个人或企业。
- 添加付款信息(账单信息页面上,输入付款方式的信息,然后选择验证并添加)。
- 用户信息验证(选择接收验证码的联系方式、选择电话号码的国家或地区代码)。
- 客户验证与激活账户(选择亚马逊云科技支持服务计划)。
- 注册成功。
步骤二:创建 Amazon SageMaker Notebook 实例
- 登录亚马逊云科技控制台。
- 进入 SageMaker 服务,查找服务处搜索 SageMaker。
- 进入 Notebook 笔记本实例控制面板(左侧菜单栏,点击笔记本实例)。
- 创建笔记本实例。
- 配置笔记本实例设置,创建笔记本实例详情页中,配置笔记本实例的基本信息(设置笔记本实例的名称、选择笔记本实例、以及存储的大小)。
- 配置笔记本实例权限(笔记本实例创建一个 IAM 角色,用于调用包括 SageMaker 和 S3 在内的其他服务,例如上传模型,部署模型等)。IAM 角色出,点击下拉列表,选择创建新角色。
- 弹出的配置页面中,默认配置即可。
- 成功创建 IAM 角色。
- 创建实例(检查先前配置的信息,确认无误点击创建笔记本实例)。
- 等待实例创建成功,进入 Jupyter Notebook。
- 构建 Stable-Diffusion 环境(Jupyter Lab 控制台,选择最下面的 Terminal)。
- 下载 Notebook 代码文件。
- 打开刚刚下载的 Notebook 文件,内核选择 conda_pytorch_p39。
步骤三:Amazon Cloud9 构建前后端 Web 应用
- 亚马逊云科技控制台进入 Cloud9 服务。
- 创建 Cloud9 环境。
- 配置 Cloud9 环境名字配置,其他部分配置保持默认,等待创建成功即可。
- 进入 Amazon Cloud9 环境。
- Cloud9 下方的控制台中输入以下指令下载保存 Web 应用程序代码压缩文件,并将该压缩文件进行解压。 解压后 SampleWebApp 文件夹包含以下内容:后端代码 app.py(接收前端请求并调用 SageMaker Endpoint 将文字生成图片)、两个前端 html 文件 image.html 和 index.html。
- Amazon Cloud9 上安装 Flask 和 boto3。
- 运行 app.py,并且点击 Amazon Cloud9 上方的 Run 按钮运行代码。
- 预览 web 前端页面。
- Amazon Cloud9 环境打开 web 页面。
- 输入信息生成图片(自定义图片长度和宽度,Prompt 输入框处输入语句或描绘性词汇生成图片)。输入语句时,详细描述需求信息,以便 AI 绘制出的图片更贴合预期,比如通过描述性词语,如 cartoon style、van gogh style、realistic 表明图片的整体风格。例如:可将长度和宽度都设置成 512,输入以下描绘性语句生成一张卡通风格的宇航员猴子图片,以及一张超级英雄的图片。
- 成功页面展示。
Amazon SageMaker 工作原理
Amazon SageMaker 全托管机器学习服务,通过整合数据处理、模型训练、超参数优化、部署推理的全流程能力,支持开发者使用 Notebook 实例快速调试 AIGC 模型,借助分布式训练集群加速算法迭代,并将模型高效部署为可自动扩缩容的 Inference Endpoint,同时深度集成亚马逊云科技生态 S3 存储、CloudWatch 监控等,以容器化架构和 Kubernetes 集群管理实现从开发到生产的无缝衔接,大幅降低机器学习工程化门槛。
- 完全托管服务:用户无需操心服务器等基础设施的管理,SageMaker 负责处理硬件资源的配置、管理和维护,将用户从复杂的运维工作中解放出来,使开发者专注于机器学习模型的开发,大大降低运维成本和复杂性。
- 集成开发环境强大:提供基于 Web 的可视化界面,集成了数据探索、模型训练、调试、评估和部署等所有机器学习开发步骤,为数据科学团队提供了一站式的工作平台,能显著提高工作效率。
- 支持自动模型构建:依据用户提供的数据自动构建、训练和调整最佳机器学习模型,无需人工进行特征准备、算法测试和模型参数优化等繁琐工作,让没有深厚机器学习专业知识的用户也能快速构建分类和回归模型。
总结
本文通过创建亚马逊云科技账户、搭建 SageMaker Notebook 实例测试 Stable-Diffusion 模型、利用 Cloud9 构建 Web 应用并调用模型 Endpoint,实现 AIGC 应用从训练到前端集成的全流程实践,展现 SageMaker 全托管、集成开发及自动化模型构建的核心优势,降低 AIGC 工程化门槛。如果决定不再使用服务的话,记得要在控制台关闭服务,以防超过免费额度产生扣费。


