基于 CodeBuddy Code 与腾讯混元构建 AI 识菜通应用
介绍如何使用 CodeBuddy Code 命令行工具配合腾讯混元大模型 API,快速开发一款名为 AI 识菜通的应用。主要步骤包括安装配置 CodeBuddy CLI,申请并获取腾讯混元 API 密钥,编写开发提示词生成项目文档,利用 AI 辅助完成 React 前端开发,最终部署至 Vercel。应用功能涵盖多语言菜单图片识别、菜品信息翻译与生成、购物车管理及订单字符串输出,旨在解决跨语言点餐场景下的沟通障碍。

介绍如何使用 CodeBuddy Code 命令行工具配合腾讯混元大模型 API,快速开发一款名为 AI 识菜通的应用。主要步骤包括安装配置 CodeBuddy CLI,申请并获取腾讯混元 API 密钥,编写开发提示词生成项目文档,利用 AI 辅助完成 React 前端开发,最终部署至 Vercel。应用功能涵盖多语言菜单图片识别、菜品信息翻译与生成、购物车管理及订单字符串输出,旨在解决跨语言点餐场景下的沟通障碍。

CodeBuddy CLI 是腾讯推出的终端命令行 AI 编程工具,支持通过自然语言指令进行代码生成与管理。它采用终端命令行的操作方式,标志着腾讯在开发者生态中已形成插件、IDE 与 CLI 三足鼎立的格局。
使用 npm 全局安装:
npm install -g @tencent-ai/codebuddy-code
命令行输入即可自动下载。
提供多种登录方式,包括 GitHub 登录等。选择登录方式回车后进入网页授权,登录成功后可在当前目录下运行。
安装登录完毕后进行简单测试。GitHub 登录通常提供一定的免费 Token 额度。
访问腾讯云控制台中的腾讯混元大模型页面,点击立即开通。
进入腾讯云控制台中的 API 密钥管理界面,开通腾讯原 API 密钥。
参考官方 API 文档进行开发。以下为调用示例:
POST / HTTP/1.1 Host: hunyuan.tencentcloudapi.com Content-Type: application/json X-TC-Action: ImageQuestion <公共请求参数> { "Model": "hunyuan-vision-image-question", "Messages": [ { "Role": "user", "Contents": [ { "Type": "text", "Text": "解答图片中的问题" }, { "Type": "image_url", "ImageUrl": { "Url": "https://qidian-qbot-1251316161.cos.ap-guangzhou.tencentcos.cn/public/0/0/image/hy/2c4dda9e032a477a6572866de2419ecd9e59076a-6145-46a0-9f47-1048f65cf4f8.png" } } ] } ], "Stream": false }
准备好开发提示词:
我要做一个"AI 识菜通"APP。它的输入是一张菜单图片,它可能是任何语言的。我需要调用腾讯混元模型,使用腾讯混元图片模型的 API 去理解图片,然后在网页上用户来上传这张图片,上传之后调用 腾讯混元文本大模型理解图片之后进入第二个页面就是点菜的页面,点菜的页面会包含,会把整个单变成中文的,用户可以点菜。每一道菜都包含它的名字、它的介绍和一张图片,图片也调用 腾讯混元 的生成图片的模型来生成,腾讯混元 API 放在 UI 中让用户输入并且存在 local storage 里,然后用户点加号可以把这道菜加入他的购物车,最后点提交生成一个一串字符,上面写他想要点哪些菜,方便他跟服务员说他要点哪些。这个字符应该包合中文名和他元语言的名字。项目需要使用|react 实现 U,使用 shadcn、redix 组件库。
将提示词输入到 CodeBuddy 中,先生成 CodeBuddy.md 文档供分析确认。保存至本地后,可编辑修正内容,确认无误后让 CodeBuddy 对照文档开始开发项目。
生成的项目文档结构如下:
# AI 识菜通 APP 项目文档
## 项目概述
"AI 识菜通"是一个基于 AI 的智能点菜应用,用户可以上传任何语言的菜单图片,系统会自动识别并翻译成中文,生成带有图片和介绍的点菜界面,最终生成订单字符串方便用户与服务员沟通。
## 技术栈
- **前端框架**: React
- **UI 组件库**: shadcn/ui + Radix UI
- **AI 服务**: 腾讯混元大模型
- **状态管理**: React Context + useState
- **本地存储**: localStorage (存储 API 密钥和购物车)
## 数据结构
### 菜品对象 (Dish)
```typescript
interface Dish {
id: string;
originalName: string; // 原语言名称
chineseName: string; // 中文名称
description: string; // 菜品介绍
imageUrl: string; // AI 生成的图片 URL
price?: string; // 价格 (如果能识别出来)
quantity: number; // 购物车中的数量
}
### 3. 全速开发
CodeBuddy 会根据文档进行分析并执行开发步骤。可选择全速模式以减少交互等待。
## 成果展示
### 1. 部署阶段
项目部署于 Vercel 平台,利用其自动化构建与持续集成能力,实现高效交付。
### 2. 首页

### 3. 设置 API 密钥
API 密钥存放在本地的 storage 中,确保用户密钥安全。

### 4. 识别菜单
上传图片后 AI 开始分析,识别完毕后可看到生成的中文菜单。




### 5. 点餐进入购物车
点击生成订单汇总,会生成一份 TXT 格式的清单,包含中文名和原语言名。



微信公众号「极客日志」,在微信中扫描左侧二维码关注。展示文案:极客日志 zeeklog
生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online
基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online
将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online
将字符串、文件或图像转换为其 Base64 表示形式。 在线工具,Base64 文件转换器在线工具,online
将 Markdown(GFM)转为 HTML 片段,浏览器内 marked 解析;与 HTML 转 Markdown 互为补充。 在线工具,Markdown 转 HTML在线工具,online
将 HTML 片段转为 GitHub Flavored Markdown,支持标题、列表、链接、代码块与表格等;浏览器内处理,可链接预填。 在线工具,HTML 转 Markdown在线工具,online