【LLM】大模型vibe coding(cursor、copilot、comate)

【LLM】大模型vibe coding(cursor、copilot、comate)

note

2025年,Karpathy分享了自己的Vibe Coding指南1.0:

  • 把所有相关内容塞进上下文里(在大型项目中可能需要很久。如果项目够小,就直接把所有文件都塞进去。
  • 描述我们接下来要实现的那个具体的、增量式的小改动。不要直接要代码,而是要几种高层次的思路,并分析它们的优缺点。几乎总是会有多种做法,而大语言模型的判断并不总是可靠。然后(可选)再具体化。
  • 选择一种思路,请它写出第一版代码。
  • 进入复查/学习阶段:手动在浏览器里打开我不熟悉或没调用过的API文档,向模型提问解释、澄清、修改,必要时回退并尝试另一种思路。
  • 测试。
  • Git commit。
  • 询问可以接下来实现什么。然后重复这个循环。

文章目录

一、相关vibe coding工具

在这里插入图片描述

1、cursor

Cursor 是一款基于 VS Code 二次开发的 AI 编辑器,它深度融合了 AI 技术,提供了前所未有的用户体验
。它不仅借助 VS Code 强大的插件生态系统,还通过 AI 提升了整体使用感受。与 GitHub Copilot 等其他类似产品相比,Cursor 的最大优势在于其与编辑器本身的深度集成,这意味着它不仅仅是一个附加组件,而是成为编辑器不可分割的一部分,使用户在日常使用中能够更加自然、高效地利用这些智能功能。

2、copilot

GitHub Copilot 是一种 AI 编码助手,由大型语言模型 (LLM) 提供支持,可在整个 Microsoft 云中提供创新解决方案
。它旨在提高工作效率、创造力和数据可访问性,同时提供企业级数据安全和隐私功能。GitHub Copilot 集成在 GitHub 平台中,为开发人员提供了一个支持性环境,用于应对编程挑战并增强其编码工作流。此外,GitHub Copilot 可用于学习新的编程语言或框架,方法是根据开发人员输入提供实时代码建议。

3、comate

(1)支持的语言。目前文心快码支持全部主流编程语言,其中在以下语言/框架编码场景表现更优:

后端(Backend): C、C#、C++、Java、Python、Go、PHP、Rust
前端(Frontend): HTML、JavaScript、CSS、Less、swan、San、Vue、Scss、Sass、Stylus、pug、mermaid
App端(APP): ObjectC、Kotlin、Swift
其它(Others): Perl、Ruby、Shell、vhdl、GraphQL、Dockerfile

zulu使用文档:https://cloud.baidu.com/doc/COMATE/s/vm66asjm4

(2)Chat 和 Zulu 的区别
Chat:代码问答,需要用户主导问题解决过程。用户通过提问、理解答案、多轮追问的流程来解决问题。生成的代码经手动点击“采纳”后合入代码文件。
Zulu:智能体,支持从需求到代码的端到端生成。用户只需给出需求,智能体会自主规划工作,确定相关文件,编辑代码库,调用开发工具。还会自主验证结果、持续迭代、解决问题,直至达成用户的目标。

(3)端到端任务执行
Zulu 具备自助任务执行和反思能力,能够端到端从需求生成代码。

例如,当您要求 Zulu 为一个在线商城的项目的支付系统增加微信支付时。Zulu 会:

  • 了解项目的结构和现有支付逻辑,并找到支付宝的相关实现
  • 了解上游的订单服务如何调用支付服务
  • 实现微信支付的代码
  • 总结复盘,查漏补缺,发现遗漏的 pom.xml 修改
  • Zulu 会依据代码库的实际情况动态调整规划和执行的过程,确保生成效果。

(4)代码库的理解:介绍项目的业务目标,核心功能、整体架构、业务流程

在这里插入图片描述

二、vibe coding综述

1、code agent

综述:
https://arxiv.org/abs/2508.00083
A Survey on Code Generation with LLM-based Agents
https://github.com/JiaruQian/awesome-llm-based-agent4code

在这里插入图片描述

2、vibe coding

【代码编程进展】Vibe Coding 的一个综述,A Survey of Vibe Coding with Large Language Models,
https://arxiv.org/pdf/2510.12399,
https://github.com/YuyaoGe/Awesome-Vibe-Coding

在这里插入图片描述

三、斯坦福CS146S

《The Modern Software Developer》(现代软件开发者)
https://themodernsoftware.dev

前两周讲的是从提示词到 Agent,核心思想是:AI 已经是一个带工具的系统了,你得学会怎么搭这个系统。
第 1 周:先把 LLM 的工作原理、犯错的原因、怎么引导它稳定输出讲清楚,作业是做一个 Prompting Playground,把提示词从玄学变成可验证的实验。
第 2 周:直接进入 Agent 架构,讲 Tool Use、Function Calling,还有现在大火的 MCP(Model Context Protocol),作业是自己动手搭一个 MCP Server。

第 3 ~ 4 周讲 AI IDE 和上下文工程。
第 3 周:关键词是 Context Engineering,课上讨论了长上下文为什么会失败、Specs 和 PRD 为什么是新的源代码、怎么让 AI 理解复杂的代码库。这周的必读材料里有一篇叫《Specs Are the New Source Code》,我觉得是整门课最值得深思的一篇。
第 4 周:讲 Agent 的自治程度怎么管控、人机协作模式怎么设计,阅读材料包括 Anthropic 的 Claude Code 使用方式和最佳实践。作业就是直接上手用 Claude Code 写项目,训练你成为一个 Agent Manager。

第 5 周讲现代终端,介绍 Warp 这类 AI 终端怎么把命令行操作产品化。AI IDE 解决的是写代码的问题,AI 终端解决的是把代码跑起来、把系统管起来的问题。

第 6 ~ 7 周讲安全与质量,这两周是我觉得整门课最有含金量的部分。
第 6 周:讲 Secure Vibe Coding,直接上硬核案例:Prompt Injection 怎么导致远程代码执行?OWASP Top 10 在 Agent 时代有哪些新威胁?看得我脊背发凉……
第 7 周:讲 Code Review,核心问题是:AI 产出的代码,我们能信任到什么程度?

第 8 周:讲自动做应用,一句 Prompt 搞出一个端到端的完整应用,嘉宾是 Vercel 的 AI 研究负责人。这节课的实战价值很大,但课程真正想传达的是:快速原型只是起点,你得能把它纳入测试、安全、Code Review 这些工程规范中。

第 9 周:讲上线后的运维,包括监控、可观测性、事件响应、自动化排查。很多人学 AI 编程只学造,不学养。这门课把养系统也补上了,非常加分。

第 10 周:讲未来趋势,嘉宾是 a16z(全球最牛的风投之一)的合伙人 Martin Casado,帮你把前 9 周串起来,知道自己学的是一种新的工程范式。

作业代码:https://github.com/mihail911/modern-software-dev-assignments

四、vibe coding建议

1、YC建议

参考:YC合伙人深度实践:15个让你玩转Vibe Coding的秘诀

1、开局:选对工具,谋定而后动

  • 新手和老手选择不同:如果你是编程新手,可以从 Replit 或 Lovable 这类可视化工具入手,它们能让你快速搭建界面。但文章指出,当你需要更精细地控制后端逻辑时,这类工具可能力不从心。如果你有基础,那么像 Cursor 或 Claude Code 这类更专业的编码AI工具会是更好的选择,它们提供更精准的控制。
  • 别直接写代码,先做计划:这是最重要的建议之一。不要一上来就让AI直接生成代码,而是应该先和AI一起制定一份详细的开发计划,就像建筑蓝图一样。把这份计划保存在项目里,然后和AI一起,一部分一部分地去实现它,每完成一步就检查、测试,再继续下一步。

2、过程:用好“安全绳”,避免翻车

  • 把Git当作“后悔药”:严格使用Git进行版本控制。在开始新功能前,确保有一个干净的状态。一旦AI的修改把代码搞乱了,可以立刻用 git reset 命令回滚到上一个正常状态,推倒重来,而不是在错误的代码上越陷越深。
  • 让AI为你写“验收标准”:不要只让AI写细碎的单元测试,而是让它编写高级别的集成测试。这种测试模拟用户点击操作,能确保整个功能流程是通的。它能有效捕捉到AI“手滑”修改了不相干代码而引入的bug。
  • AI不止能写代码:充分利用AI处理各种周边任务,比如配置服务器、设置域名解析(DNS)、甚至设计图标。这让AI同时扮演你的运维(DevOps)和设计师角色,极大提升综合效率。

3、技巧:精准沟通,高效排错

  • 错误信息是最好的提示:遇到报错时,直接把完整的错误信息日志复制给AI,通常它自己就能看懂并给出修复方案,你甚至不需要多做解释。
  • 不行就换“脑袋”:不同的AI模型(如Claude、GPT、Gemini)各有擅长。如果一个模型总在一个问题上卡住,果断切换另一个模型,很可能就迎刃而解了。
  • 给它一份“岗位说明书”:你可以为AI编写详细的指导规则(Instructions),告诉它项目的背景、代码风格偏好、常用库等。这能极大提升AI输出代码的准确率和符合度。

4、架构:化整为零,降低复杂度

  • 复杂的活儿单独干:对于特别复杂的新功能,最好在独立的新项目里让AI先实现一个demo,成功后再整合进主项目。这能避免主项目复杂的代码干扰AI的判断。
  • 小即是美:无论是人还是AI,都更容易理解短小精悍、模块化的代码。保持文件小巧、功能独立,这被认为是Vibe Coding下的最佳实践。

2、对技术人的影响

  • AI 极大释放了研究者的决策空间,比方说Cursor 像“高效工程师”,负责处理琐碎的画图代码与实验分析;而Gemini 3 Pro 则堪比“科学家”,辅助进行逻辑推演与理论梳理。
  • 技术人正从“代码写作者”转变为“问题提问者”。写 Prompt 的本质,是“找真问题、解真问题”的过程。
  • 未来技术从业者将转型为“项目管理者”与“架构设计师”,核心能力包括三方面:
    • 架构设计:搭建系统整体框架,规划核心逻辑,把控技术路线。
    • 智能体调度:根据任务特性,精准选择 AI 工具组合,实现效率最大化。
    • 批判思维:AI 生成代码多处于平均水平,核心代码难达最优,需以高阶视角 Review 代码,避免破坏现有优质框架。
  • 沟通能力:
    • 跨领域沟通:工程师需理解商业逻辑,设计师需参与编程环节,打破专业壁垒才能形成高效协作。
    • 精准意图表达:项目推进速度从“按天算”变为“按分钟算”,短时间内让 AI 准确理解核心需求,是提升效率的核心前提。
  • 传统程序员会缩减为少数负责核心风险把控、架构设计的专家;更多人会利用 Vibe Coding 为原有行业赋能(如投资人写爬虫分析资讯、设计师自主开发工具),催生出更多多元化社会工种,拓宽行业边界。

Reference

[1] Cursor 完全使用教程
[2] 微软Copilot怎么用?如何使用微软Copilot AI的10个技巧!
[3] 程序员的SK-II神仙水:GitHub Copilot,让你时刻拥有巅峰战力!
[4] AI Coding工具怎么用? 看看滴滴人怎么说? | 技术桔有话说
[5] 技术思辨|AI Coding:经验壁垒正在失效,工具进化重塑编程.高德技术
[6] 构建可扩展的智能体系统:工程化方法与实践(一).bili
[7] 一篇Copilot、Cursor、Claude Code三代产品背后AI Code技术最新全面综述
[8] 阿里、百度、腾讯、美团齐聚的Vibe Coding 圆桌,却被12岁小孩姐“军训”
[9] Vibe Coding 中怎样避免屎山,ref:https://github.com/karminski/trae-meetup-materials
[10] 阿里妈妈效果广告引擎团队在 AI Coding 领域的探索与实践经验。依托历时三年打造的 CommonAds 研发体系,我们构建了智能研发助手「元芳」,并通过集成至 IFLOW-CLI 以多 Agent 协同的方式,探索出一套可胜任于「严肃的广告引擎场景的高质量代码生成解决方案」 让 AI 写出生产级代码:阿里妈妈效果广告引擎AI Coding实践
[11] 【干货】当代码下沉为“氛围”,程序员如何免于被 AI “断代”?
[12] Anthropic 黑客松获奖者的ClaudeCode 配置:github.com/affaan-m/everything-claude-code
[13] trae-研发场景十大热门 Skills 推荐
[14] https://themodernsoftware.dev
[15] 【Vibe Coding开源项目】Vibe Coding 指南,https://github.com/2025Emma/vibe-coding-cn
[16] Claude Code 完全新手指南(2026 版):从入门到精通

Read more

DeepSeek-R1-Distill-Llama-8B在数学解题中的应用案例

DeepSeek-R1-Distill-Llama-8B在数学解题中的应用案例 你是否曾经被复杂的数学题困扰,需要一个智能助手来帮你理清思路?DeepSeek-R1-Distill-Llama-8B可能就是你要找的解决方案。这个专门针对推理任务优化的模型,在数学解题方面展现出了令人印象深刻的能力。 本文将带你深入了解这个模型在数学领域的实际应用效果。通过多个真实案例展示,你会看到它是如何一步步解决从初中数学到竞赛级别的各种题目,不仅能给出正确答案,还能提供清晰的解题思路。 1. 模型能力概述 DeepSeek-R1-Distill-Llama-8B是DeepSeek团队推出的推理专用模型,专门针对数学、编程和逻辑推理任务进行了优化。虽然参数量只有80亿,但在数学解题方面的表现却相当出色。 从基准测试结果来看,这个模型在多个数学相关评测中都有不错的表现: * AIME 2024竞赛题:50.4%的通过率 * MATH-500数据集:89.1%的准确率 * GPQA钻石级难题:49.0%的解决率 这些数字意味着什么?简单来说,这个模型能够解决大约一半的高中数学竞赛题目

By Ne0inhk

llama.cpp docker 镜像pull国内加速地址

目前llama cpp官方提供的llama.cpp提供的docker 镜像下载命令:docker pull ghcr.io/ggml-org/llama.cpp:server-cuda-b6222 服务器下载速度非常的慢。 比较好的方法是把ghcr.io替换为国内镜像源地址ghcr.nju.edu.cn进行下载: // 官方命令: docker pull ghcr.io/ggml-org/llama.cpp:server-cuda //国内源地址命令 docker pull ghcr.nju.edu.cn/ggml-org/llama.cpp:server-cuda 速度快了几十倍,非常节约时间 推荐给大家!

By Ne0inhk
【AI】基于 LLaMa-Factory 和 LoRA 算法的大模型微调

【AI】基于 LLaMa-Factory 和 LoRA 算法的大模型微调

目录 1.Windows 2.Linux 3.微调操作(待更新) 1.Windows LLaMA-Factory 的 Github地址:https://github.com/hiyouga/LLaMA-Factory 克隆仓库(我的windows目录是D:\Program Files\LLaMa-Factory,linux可以直接在根目录克隆) git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git 切换到项目目录 cd LLaMA-Factory 修改配置,将 conda 虚拟环境安装到数据盘 (如果你已经配置过则不用这步) mkdir -p "D:\Program Files\conda\pkgs&

By Ne0inhk
不只是 Copilot:Kimi Code 正在改变写代码的方式

不只是 Copilot:Kimi Code 正在改变写代码的方式

之前介绍过,在 Claude Code 中使用 Kimi,现在Kimi也推出自己的 CLI 了。但是目前是会员专供! Kimi Code 是由 Moonshot AI(Kimi) 推出的下一代 AI 编程助手/代码智能体,作为 Kimi 会员订阅中专为开发者设计的增值权益,旨在帮助开发者更快、更智能、更高效地完成编程任务。它可以直接融入开发流程、终端工具和主流 IDE,让 AI 编程能力成为日常开发的一部分。 核心定位:你的 AI 代码伙伴 Kimi Code 不只是简单的补全工具,而是一个智能编程代理(AI Code Agent): * 自动理解问题和代码结构,回答开发者的问题。 * 辅助编写、调试、重构和测试代码,覆盖开发生命周期。 * 直接运行在终端与

By Ne0inhk