微信小程序集成 AI 模型主要有云端调用、本地推理和外部 API 三种主流方案,分别适用于文本生成、图像识别及语音处理等场景。开发者可根据实时性要求、隐私策略及成本预算选择合适路径。
1. 使用微信云开发集成 AI 大模型
这种方式上手门槛最低,适合快速接入腾讯混元等大模型服务。无需自行部署模型,只需在云函数中调用 API,配合云开发免费额度,非常适合聊天机器人或文本生成类应用。
落地时先在小程序开发者工具中开通云开发环境,并在微信公众平台绑定腾讯云账号。注意 API 调用存在配额限制,完整对话需结合上下文管理。
初始化模型实例后,即可在页面逻辑中发送请求:
const cloud = wx.cloud;
cloud.init(); // 初始化云开发
const hy = cloud.extend.AI.createModel("hunyuan"); // 创建 Hunyuan 模型实例
hy.generate({
prompt: "请生成一个旅游攻略",
max_tokens: 200
}).then(res => {
console.log(res.choices[0].text); // 处理输出
});
渲染响应到 UI 后即可看到效果,这种方式对初学者非常友好。
2. 使用小程序 AI 推理能力(本地运行 ONNX 模型)
从 2023 年起,小程序支持 ONNX 格式模型的本地推理。对于图像分类、物体检测等实时任务,本地推理能显著降低延迟且支持离线场景,但模型包体通常限制在 10MB 以内。
具体流程如下:
首先将训练好的模型转换为 ONNX 格式(PyTorch 或 TensorFlow 导出)。接着在开发者工具中创建 ai 目录,将 .onnx 文件上传至小程序包内。
数据预处理是关键一步,例如从摄像头采集图像并转为张量:
// 采集图像
wx.createCameraContext().takePhoto();
// 转换:将 RGBA 像素数组 reshape 为 [1, 3, 224, 224](根据模型输入调整)
初始化模型并执行预测:
const model = wx.createAIModel({ path: 'ai/model.onnx' });
model.({ : [inputTensor] }).( {
.(output);
});

