【LLM】大模型vibe coding(cursor、copilot、comate)

【LLM】大模型vibe coding(cursor、copilot、comate)

note

2025年,Karpathy分享了自己的Vibe Coding指南1.0:

  • 把所有相关内容塞进上下文里(在大型项目中可能需要很久。如果项目够小,就直接把所有文件都塞进去。
  • 描述我们接下来要实现的那个具体的、增量式的小改动。不要直接要代码,而是要几种高层次的思路,并分析它们的优缺点。几乎总是会有多种做法,而大语言模型的判断并不总是可靠。然后(可选)再具体化。
  • 选择一种思路,请它写出第一版代码。
  • 进入复查/学习阶段:手动在浏览器里打开我不熟悉或没调用过的API文档,向模型提问解释、澄清、修改,必要时回退并尝试另一种思路。
  • 测试。
  • Git commit。
  • 询问可以接下来实现什么。然后重复这个循环。

文章目录

一、相关vibe coding工具

在这里插入图片描述

1、cursor

Cursor 是一款基于 VS Code 二次开发的 AI 编辑器,它深度融合了 AI 技术,提供了前所未有的用户体验
。它不仅借助 VS Code 强大的插件生态系统,还通过 AI 提升了整体使用感受。与 GitHub Copilot 等其他类似产品相比,Cursor 的最大优势在于其与编辑器本身的深度集成,这意味着它不仅仅是一个附加组件,而是成为编辑器不可分割的一部分,使用户在日常使用中能够更加自然、高效地利用这些智能功能。

2、copilot

GitHub Copilot 是一种 AI 编码助手,由大型语言模型 (LLM) 提供支持,可在整个 Microsoft 云中提供创新解决方案
。它旨在提高工作效率、创造力和数据可访问性,同时提供企业级数据安全和隐私功能。GitHub Copilot 集成在 GitHub 平台中,为开发人员提供了一个支持性环境,用于应对编程挑战并增强其编码工作流。此外,GitHub Copilot 可用于学习新的编程语言或框架,方法是根据开发人员输入提供实时代码建议。

3、comate

(1)支持的语言。目前文心快码支持全部主流编程语言,其中在以下语言/框架编码场景表现更优:

后端(Backend): C、C#、C++、Java、Python、Go、PHP、Rust
前端(Frontend): HTML、JavaScript、CSS、Less、swan、San、Vue、Scss、Sass、Stylus、pug、mermaid
App端(APP): ObjectC、Kotlin、Swift
其它(Others): Perl、Ruby、Shell、vhdl、GraphQL、Dockerfile

zulu使用文档:https://cloud.baidu.com/doc/COMATE/s/vm66asjm4

(2)Chat 和 Zulu 的区别
Chat:代码问答,需要用户主导问题解决过程。用户通过提问、理解答案、多轮追问的流程来解决问题。生成的代码经手动点击“采纳”后合入代码文件。
Zulu:智能体,支持从需求到代码的端到端生成。用户只需给出需求,智能体会自主规划工作,确定相关文件,编辑代码库,调用开发工具。还会自主验证结果、持续迭代、解决问题,直至达成用户的目标。

(3)端到端任务执行
Zulu 具备自助任务执行和反思能力,能够端到端从需求生成代码。

例如,当您要求 Zulu 为一个在线商城的项目的支付系统增加微信支付时。Zulu 会:

  • 了解项目的结构和现有支付逻辑,并找到支付宝的相关实现
  • 了解上游的订单服务如何调用支付服务
  • 实现微信支付的代码
  • 总结复盘,查漏补缺,发现遗漏的 pom.xml 修改
  • Zulu 会依据代码库的实际情况动态调整规划和执行的过程,确保生成效果。

(4)代码库的理解:介绍项目的业务目标,核心功能、整体架构、业务流程

在这里插入图片描述

二、vibe coding综述

1、code agent

综述:
https://arxiv.org/abs/2508.00083
A Survey on Code Generation with LLM-based Agents
https://github.com/JiaruQian/awesome-llm-based-agent4code

在这里插入图片描述

2、vibe coding

【代码编程进展】Vibe Coding 的一个综述,A Survey of Vibe Coding with Large Language Models,
https://arxiv.org/pdf/2510.12399,
https://github.com/YuyaoGe/Awesome-Vibe-Coding

在这里插入图片描述

三、斯坦福CS146S

《The Modern Software Developer》(现代软件开发者)
https://themodernsoftware.dev

前两周讲的是从提示词到 Agent,核心思想是:AI 已经是一个带工具的系统了,你得学会怎么搭这个系统。
第 1 周:先把 LLM 的工作原理、犯错的原因、怎么引导它稳定输出讲清楚,作业是做一个 Prompting Playground,把提示词从玄学变成可验证的实验。
第 2 周:直接进入 Agent 架构,讲 Tool Use、Function Calling,还有现在大火的 MCP(Model Context Protocol),作业是自己动手搭一个 MCP Server。

第 3 ~ 4 周讲 AI IDE 和上下文工程。
第 3 周:关键词是 Context Engineering,课上讨论了长上下文为什么会失败、Specs 和 PRD 为什么是新的源代码、怎么让 AI 理解复杂的代码库。这周的必读材料里有一篇叫《Specs Are the New Source Code》,我觉得是整门课最值得深思的一篇。
第 4 周:讲 Agent 的自治程度怎么管控、人机协作模式怎么设计,阅读材料包括 Anthropic 的 Claude Code 使用方式和最佳实践。作业就是直接上手用 Claude Code 写项目,训练你成为一个 Agent Manager。

第 5 周讲现代终端,介绍 Warp 这类 AI 终端怎么把命令行操作产品化。AI IDE 解决的是写代码的问题,AI 终端解决的是把代码跑起来、把系统管起来的问题。

第 6 ~ 7 周讲安全与质量,这两周是我觉得整门课最有含金量的部分。
第 6 周:讲 Secure Vibe Coding,直接上硬核案例:Prompt Injection 怎么导致远程代码执行?OWASP Top 10 在 Agent 时代有哪些新威胁?看得我脊背发凉……
第 7 周:讲 Code Review,核心问题是:AI 产出的代码,我们能信任到什么程度?

第 8 周:讲自动做应用,一句 Prompt 搞出一个端到端的完整应用,嘉宾是 Vercel 的 AI 研究负责人。这节课的实战价值很大,但课程真正想传达的是:快速原型只是起点,你得能把它纳入测试、安全、Code Review 这些工程规范中。

第 9 周:讲上线后的运维,包括监控、可观测性、事件响应、自动化排查。很多人学 AI 编程只学造,不学养。这门课把养系统也补上了,非常加分。

第 10 周:讲未来趋势,嘉宾是 a16z(全球最牛的风投之一)的合伙人 Martin Casado,帮你把前 9 周串起来,知道自己学的是一种新的工程范式。

作业代码:https://github.com/mihail911/modern-software-dev-assignments

四、vibe coding建议

1、YC建议

参考:YC合伙人深度实践:15个让你玩转Vibe Coding的秘诀

1、开局:选对工具,谋定而后动

  • 新手和老手选择不同:如果你是编程新手,可以从 Replit 或 Lovable 这类可视化工具入手,它们能让你快速搭建界面。但文章指出,当你需要更精细地控制后端逻辑时,这类工具可能力不从心。如果你有基础,那么像 Cursor 或 Claude Code 这类更专业的编码AI工具会是更好的选择,它们提供更精准的控制。
  • 别直接写代码,先做计划:这是最重要的建议之一。不要一上来就让AI直接生成代码,而是应该先和AI一起制定一份详细的开发计划,就像建筑蓝图一样。把这份计划保存在项目里,然后和AI一起,一部分一部分地去实现它,每完成一步就检查、测试,再继续下一步。

2、过程:用好“安全绳”,避免翻车

  • 把Git当作“后悔药”:严格使用Git进行版本控制。在开始新功能前,确保有一个干净的状态。一旦AI的修改把代码搞乱了,可以立刻用 git reset 命令回滚到上一个正常状态,推倒重来,而不是在错误的代码上越陷越深。
  • 让AI为你写“验收标准”:不要只让AI写细碎的单元测试,而是让它编写高级别的集成测试。这种测试模拟用户点击操作,能确保整个功能流程是通的。它能有效捕捉到AI“手滑”修改了不相干代码而引入的bug。
  • AI不止能写代码:充分利用AI处理各种周边任务,比如配置服务器、设置域名解析(DNS)、甚至设计图标。这让AI同时扮演你的运维(DevOps)和设计师角色,极大提升综合效率。

3、技巧:精准沟通,高效排错

  • 错误信息是最好的提示:遇到报错时,直接把完整的错误信息日志复制给AI,通常它自己就能看懂并给出修复方案,你甚至不需要多做解释。
  • 不行就换“脑袋”:不同的AI模型(如Claude、GPT、Gemini)各有擅长。如果一个模型总在一个问题上卡住,果断切换另一个模型,很可能就迎刃而解了。
  • 给它一份“岗位说明书”:你可以为AI编写详细的指导规则(Instructions),告诉它项目的背景、代码风格偏好、常用库等。这能极大提升AI输出代码的准确率和符合度。

4、架构:化整为零,降低复杂度

  • 复杂的活儿单独干:对于特别复杂的新功能,最好在独立的新项目里让AI先实现一个demo,成功后再整合进主项目。这能避免主项目复杂的代码干扰AI的判断。
  • 小即是美:无论是人还是AI,都更容易理解短小精悍、模块化的代码。保持文件小巧、功能独立,这被认为是Vibe Coding下的最佳实践。

2、对技术人的影响

  • AI 极大释放了研究者的决策空间,比方说Cursor 像“高效工程师”,负责处理琐碎的画图代码与实验分析;而Gemini 3 Pro 则堪比“科学家”,辅助进行逻辑推演与理论梳理。
  • 技术人正从“代码写作者”转变为“问题提问者”。写 Prompt 的本质,是“找真问题、解真问题”的过程。
  • 未来技术从业者将转型为“项目管理者”与“架构设计师”,核心能力包括三方面:
    • 架构设计:搭建系统整体框架,规划核心逻辑,把控技术路线。
    • 智能体调度:根据任务特性,精准选择 AI 工具组合,实现效率最大化。
    • 批判思维:AI 生成代码多处于平均水平,核心代码难达最优,需以高阶视角 Review 代码,避免破坏现有优质框架。
  • 沟通能力:
    • 跨领域沟通:工程师需理解商业逻辑,设计师需参与编程环节,打破专业壁垒才能形成高效协作。
    • 精准意图表达:项目推进速度从“按天算”变为“按分钟算”,短时间内让 AI 准确理解核心需求,是提升效率的核心前提。
  • 传统程序员会缩减为少数负责核心风险把控、架构设计的专家;更多人会利用 Vibe Coding 为原有行业赋能(如投资人写爬虫分析资讯、设计师自主开发工具),催生出更多多元化社会工种,拓宽行业边界。

Reference

[1] Cursor 完全使用教程
[2] 微软Copilot怎么用?如何使用微软Copilot AI的10个技巧!
[3] 程序员的SK-II神仙水:GitHub Copilot,让你时刻拥有巅峰战力!
[4] AI Coding工具怎么用? 看看滴滴人怎么说? | 技术桔有话说
[5] 技术思辨|AI Coding:经验壁垒正在失效,工具进化重塑编程.高德技术
[6] 构建可扩展的智能体系统:工程化方法与实践(一).bili
[7] 一篇Copilot、Cursor、Claude Code三代产品背后AI Code技术最新全面综述
[8] 阿里、百度、腾讯、美团齐聚的Vibe Coding 圆桌,却被12岁小孩姐“军训”
[9] Vibe Coding 中怎样避免屎山,ref:https://github.com/karminski/trae-meetup-materials
[10] 阿里妈妈效果广告引擎团队在 AI Coding 领域的探索与实践经验。依托历时三年打造的 CommonAds 研发体系,我们构建了智能研发助手「元芳」,并通过集成至 IFLOW-CLI 以多 Agent 协同的方式,探索出一套可胜任于「严肃的广告引擎场景的高质量代码生成解决方案」 让 AI 写出生产级代码:阿里妈妈效果广告引擎AI Coding实践
[11] 【干货】当代码下沉为“氛围”,程序员如何免于被 AI “断代”?
[12] Anthropic 黑客松获奖者的ClaudeCode 配置:github.com/affaan-m/everything-claude-code
[13] trae-研发场景十大热门 Skills 推荐
[14] https://themodernsoftware.dev
[15] 【Vibe Coding开源项目】Vibe Coding 指南,https://github.com/2025Emma/vibe-coding-cn
[16] Claude Code 完全新手指南(2026 版):从入门到精通

Read more

SpringAI 大模型应用开发篇-SpringAI 项目的新手入门知识

SpringAI 大模型应用开发篇-SpringAI 项目的新手入门知识

🔥博客主页: 【小扳_-ZEEKLOG博客】 ❤感谢大家点赞👍收藏⭐评论✍ 文章目录         1.0 SpringAI 概述         1.1 大模型的使用         2.0 SpringAI 新手入门         2.1 配置 pom.xml 文件         2.2 配置 application.yaml 文件         2.3 配置 ChatClient         2.4 同步调用         2.5 流式调用         2.6 System 设定         2.7 日志功能         2.8 会话记忆功能

架构大揭秘:单 Agent vs. 多 Agent,你的 AI 团队该怎么组建?

架构大揭秘:单 Agent vs. 多 Agent,你的 AI 团队该怎么组建?

架构大揭秘:单 Agent vs. 多 Agent,你的 AI 团队该怎么组建? 文章目录 * 架构大揭秘:单 Agent vs. 多 Agent,你的 AI 团队该怎么组建? * 前言:AI 世界的“单打独斗”与“团队协作” * 一、专业解读:Agent 的“独行侠”与“群英会” * 1.1 单 Agent:披荆斩棘的“全能战士” * 1.2 多 Agent:分工协作的“梦之队” * 1.3 核心对比:单 Agent vs.

揭秘AI大模型通信机制:深入理解流式传输与数据封装逻辑

揭秘AI大模型通信机制:深入理解流式传输与数据封装逻辑

文章目录 * 前言 * 一、 核心数据传输格式详解 * 1. 请求格式 * 2. 响应格式:非流式 * 3. 响应格式:流式 * 二、 流程图分析:从输入到输出 * 1. 流程逻辑描述 * 2. 流程图 (Mermaid 代码表示) * 三、 原理架构图分析 * 1. 架构层级说明 * 2. 架构图 (Mermaid 代码表示) * 四、 关键技术原理深度解析 * 1. 为什么选择 SSE 而不是 WebSocket? * 2. Token 与数据传输的关系 * 3. 数据压缩 * 五、 总结 前言 Ai聊天工具(如ChatGPT、Claude、文心一言等)的数据传输是核心功能的基石。要深入理解其背后的机制,

AI提示词:零基础入门与核心概念

AI提示词:零基础入门与核心概念

AI提示词:零基础入门与核心概念 📝 本章学习目标:理解什么是提示词,掌握提示词的核心概念,建立正确的AI对话思维,为后续学习打下坚实基础。 一、什么是提示词? 1.1 提示词的定义 提示词(Prompt),简单来说,就是你发给AI的指令或问题。它是人类与人工智能沟通的桥梁,是你告诉AI"我想要什么"的方式。 想象一下,你雇佣了一位超级聪明但对你的需求一无所知的助手。这位助手知识渊博、能力强大,但它需要你清晰地告诉它要做什么。提示词就是你给这位助手的工作指令。 💡 核心认知:提示词不是简单的"提问",而是一种结构化的指令设计。好的提示词能让AI精准理解你的意图,输出高质量的结果;糟糕的提示词则会让AI"答非所问",浪费你的时间。 1.2 提示词的重要性 为什么提示词如此重要?让我们通过一个对比来说明: ❌ 糟糕的提示词: 帮我写点东西 ✅ 好的提示词: 请帮我写一篇关于&