AI 编程零基础教程(合集)大纲

AI 编程零基础教程(合集)大纲

适合谁

  • 完全零基础:不要求会编程,也能看懂并做出作品
  • 想系统搞清楚:AI 编程的概念、原理、边界、落地路径与工程化方法
  • 想从“会用工具”升级为“能交付项目”

学完你能做到什么

  • 能用自己的话解释:LLM、Token、上下文、幻觉、Embedding、RAG、Agent、Tool Calling、MCP、Skills、评测与安全
  • 能把一个模糊需求写成可交付规格:输入/输出/约束/验收标准
  • 能做出 4 个可运行小项目:从本地跑通到最小上线形态(含日志、成本与安全边界)
  • 能建立一套可复用工作流:从需求拆解 → 生成 → 自检 → 测试 → 回归 → 发布

卷 0:认知与准备(6 篇)

01|AI 编程到底是什么:从写代码到指挥系统

  • 关键概念:LLM、IDE 助手、Agent、工具、工作流
  • 本篇产出:你的学习目标清单(做什么、不做什么)

02|能力边界与常见幻觉:为什么“看起来对”会害人

  • 关键概念:幻觉、可验证性、不确定性、回归测试
  • 本篇产出:任务分级表(可全托管/需人工审/禁止托管)

03|模型与产品形态:Chat、IDE、API、本地模型怎么选

  • 关键概念:上下文长度、延迟、成本、隐私、模型路由
  • 本篇产出:选型决策树(个人版)

04|最小工程素养:文件、命令行、依赖、环境变量、Git

  • 关键概念:项目结构、依赖管理、版本控制、.env
  • 本篇产出:一份“从 0 跑起项目”的检查清单

05|把需求写成规格:输入、输出、约束、验收标准

  • 关键概念:PRD-lite、DoD、边界条件、失败策略
  • 本篇产出:PRD-lite 模板(1 页可复用)

06|AI 参与开发的安全底线:别把密钥和隐私喂进去

  • 关键概念:PII、密钥管理、最小权限、审计
  • 本篇产出:个人安全使用守则(10 条)

卷 1:LLM 核心原理与基础概念(8 篇)

07|Token 与上下文窗口:为什么它会忘、为什么会贵

  • 关键概念:Token、上下文、截断、成本估算
  • 本篇产出:Token 成本估算表(简化版)

08|温度与采样:为什么同一句话结果不同

  • 关键概念:temperature、top_p、随机性、稳定性
  • 本篇产出:三类任务参数建议(代码/总结/创作)

09|训练 vs 推理:它不是数据库,它在预测

  • 关键概念:预训练、对齐、推理、分布外
  • 本篇产出:三句话讲清“它为什么会编造”

10|系统提示与对话:角色与优先级如何影响输出

  • 关键概念:system/user、指令冲突、越权
  • 本篇产出:你的通用系统提示骨架(可复用)

11|结构化输出:为什么 JSON 能让系统更稳定

  • 关键概念:schema、解析失败、可验证输出
  • 本篇产出:一个通用 JSON 输出规范模板

12|Embedding:把文本变成向量到底在干嘛

  • 关键概念:向量、相似度、语义检索、向量库
  • 本篇产出:相似检索的最小心智模型图

13|Tool Calling:让模型“执行”而不只是“回答”

  • 关键概念:函数调用、参数、工具结果回灌
  • 本篇产出:工具调用的输入输出协议模板

14|多模态入门:图像/文档如何进入工作流

  • 关键概念:OCR、版式、表格抽取、引用
  • 本篇产出:文档处理任务拆解清单

卷 2:Prompt 与对话式开发工作流(8 篇)

15|Prompt 结构化:目标-上下文-约束-输出格式

  • 关键概念:约束、格式、验收、边界
  • 本篇产出:通用 Prompt 模板(可复制)

16|示例驱动(Few-shot):用例子教会风格与边界

  • 关键概念:正例/反例/边界例、对齐输出
  • 本篇产出:示例库结构(如何存放与复用)

17|三轮迭代法:澄清 → 生成 → 自检与修复

  • 关键概念:澄清问题、自检、回归
  • 本篇产出:三轮对话 SOP

18|面向代码任务的提示:Debug、重构、加测试、性能优化

  • 关键概念:定位、最小复现、改动范围、风险控制
  • 本篇产出:代码任务提示卡(4 张)

19|让 AI 像代码审查一样挑错:Checklist 驱动的提问

  • 关键概念:review 维度、可维护性、边界检查
  • 本篇产出:Review Checklist(团队可用)

20|反幻觉策略:引用、可执行验证、拒答与降级

  • 关键概念:可验证证据、拒答策略、工具验证
  • 本篇产出:反幻觉提示片段合集

21|Prompt 工程化:版本、A/B、回归、可观测

  • 关键概念:prompt 版本、评测集、指标
  • 本篇产出:Prompt 目录规范与命名约定

22|从“对话”到“流程”:把一步步操作固化成可复用工作流

  • 关键概念:工作流分层、输入输出契约
  • 本篇产出:工作流定义模板(步骤 + 验收)

卷 3:工程化扩展:工具、MCP 与 Skills(7 篇)

23|工具生态全景:本地文件、网络、数据库、浏览器自动化

  • 关键概念:工具边界、权限、失败处理
  • 本篇产出:你的工具能力清单(可逐步扩充)

24|MCP 入门:让 Agent 以标准方式接入外部系统

  • 关键概念:工具发现、会话、权限隔离、审计
  • 本篇产出:一个“工具接入需求说明”模板

25|Skills 入门:把 SOP/脚本/模板打包成可移植能力

  • 关键概念:Skill、渐进式披露、可复用流程
  • 本篇产出:一个最小 Skill 目录与 SKILL.md 模板

26|Skills 设计原则:单一职责、确定性、可失败、可回滚

  • 关键概念:输入输出契约、失败码、幂等性
  • 本篇产出:技能设计 Checklist

27|MCP × Skills 分层:连接能力与流程知识如何组合

  • 关键概念:工具负责“能做什么”,技能负责“怎么做/何时做/怎么停”
  • 本篇产出:一个端到端示例流程图(任务→工具→回滚)

28|技能治理:安装、版本、禁用回滚、团队共享

  • 关键概念:技能注册表、灰度、应急开关
  • 本篇产出:团队技能管理规范(最小版)

29|前沿互操作概念速览:跨平台复用与生态演进

  • 关键概念:技能市场、互操作、执行环境差异
  • 本篇产出:你的“跟进清单”(未来更新点)

卷 4:知识与数据:Embedding、RAG 与结构化信息(7 篇)

30|什么时候需要 RAG:直接 Prompt/微调/RAG 的决策

  • 关键概念:知识时效性、可追溯、成本
  • 本篇产出:选型决策树(项目版)

31|知识采集:文档、网页、代码库、数据库怎么进知识库

  • 关键概念:来源、权限、清洗、去重
  • 本篇产出:数据源登记表模板

32|切分与元数据:chunk、重叠、标题、时间、权限标签

  • 关键概念:chunk 策略、元数据、可检索性
  • 本篇产出:切分策略指南(可复用)

33|检索:召回、重排、过滤与多路检索

  • 关键概念:召回率、重排、查询改写
  • 本篇产出:检索效果自测用例(20 条)

34|生成:引用、拒答、答案结构与证据链

  • 关键概念:引用片段、证据优先、可解释性
  • 本篇产出:带引用的回答格式规范

35|结构化数据:表格/JSON/数据库与“可计算答案”

  • 关键概念:结构化提取、校验、数值一致性
  • 本篇产出:从文本到结构化数据的输出 schema

36|RAG 评测与回归:命中率、覆盖率、引用正确性

  • 关键概念:离线评测、回归、指标
  • 本篇产出:RAG 评测表与通过门槛

卷 5:Agent 系统:规划、执行、记忆与可靠性(7 篇)

37|Agent 是什么:计划-执行-反馈循环与停止条件

  • 关键概念:planner、executor、stop condition
  • 本篇产出:一个通用 Agent 状态机图

38|任务分解:从模糊目标到可执行子任务

  • 关键概念:依赖图、优先级、最小步进
  • 本篇产出:任务分解模板(含验收)

39|记忆与上下文管理:短期记忆、长期记忆、检索记忆

  • 关键概念:摘要记忆、向量记忆、遗忘策略
  • 本篇产出:记忆策略选择表

40|自检与反思:不是“思维链”,而是可执行的校验步骤

  • 关键概念:自检清单、工具验证、回归
  • 本篇产出:自检步骤库(可插拔)

41|并发与队列:多任务、限流、重试与幂等

  • 关键概念:rate limit、retry、幂等、去重
  • 本篇产出:可靠执行策略清单

42|长任务运行:断点续跑、任务日志、可恢复执行

  • 关键概念:checkpoint、事件日志、恢复
  • 本篇产出:任务运行记录格式规范

43|多 Agent 协作:角色分工、交付物契约与冲突处理

  • 关键概念:职责边界、协作协议、合并策略
  • 本篇产出:多角色协作模板(产品/研发/测试/安全)

卷 6:评测、可观测、成本与上线(7 篇)

44|评测入门:从“能用”到“稳定可用”

  • 关键概念:金标、回归、自动评分、人审
  • 本篇产出:最小评测集(通用 30 条)

45|提示与 Agent 的评测:行为正确性、工具使用正确性

  • 关键概念:任务成功率、工具错误率、越权率
  • 本篇产出:评测维度与计分规则模板

46|可观测性:日志、追踪、指标与失败复盘

  • 关键概念:trace、span、事件日志、可重放
  • 本篇产出:失败复盘模板(含时间线)

47|成本与性能:缓存、批处理、模型路由与降级

  • 关键概念:缓存命中、路由、降级、预算
  • 本篇产出:成本预算表与降本策略清单

48|上线形态:本地脚本、服务端 API、前端产品、插件

  • 关键概念:部署、权限、配置、密钥管理
  • 本篇产出:上线检查清单(最小版)

49|运行治理:灰度、开关、回滚、事故响应

  • 关键概念:feature flag、回滚、应急预案
  • 本篇产出:应急预案模板(简化版)

50|团队落地:规范、角色分工、代码审查与知识沉淀

  • 关键概念:流程、度量、治理
  • 本篇产出:团队 AI 开发规范(最小可行版)

卷 7:安全与合规(含 OpenSec)(6 篇)

51|威胁建模:你的系统会被怎么攻击

  • 关键概念:资产、攻击面、威胁模型
  • 本篇产出:威胁建模表(轻量版)

52|提示注入:为什么“文档内容”能劫持你的 Agent

  • 关键概念:prompt injection、数据与指令分离
  • 本篇产出:注入防护规则清单

53|工具与权限安全:最小权限、沙箱、审计与隔离

  • 关键概念:sandbox、least privilege、审计日志
  • 本篇产出:权限分级与审批策略

54|数据安全:PII、密钥、合规与脱敏

  • 关键概念:脱敏、数据保留、访问控制
  • 本篇产出:数据处理与保留规范模板

55|安全评测与校准:用 OpenSec 思路评估“何时不该行动”

  • 关键概念:校准、证据门控动作、注入违例率、爆炸半径
  • 本篇产出:安全用例集(越权/注入/误操作 20 条)

56|供应链与依赖风险:模型、插件、技能包与脚本的可信来源

  • 关键概念:依赖审查、签名/版本、回滚
  • 本篇产出:第三方资源准入清单

卷 8:项目实战合集(12 篇,4 个项目)

项目 A:个人 AI 编程工作流(3 篇)

57|从需求到任务拆解:把 PRD-lite 变成任务树
  • 交付:一份真实需求的任务树与验收标准
58|生成与自检:让它自己跑“检查清单”
  • 交付:可复用的自检步骤库
59|回归与发布:让改动可追踪、可回滚
  • 交付:一次完整迭代的变更记录与复盘

项目 B:个人知识库问答(RAG)(3 篇)

60|数据接入与切分:把资料变成可检索知识
  • 交付:一个小型知识库(含元数据策略)
61|回答带引用:让每句话都能追溯证据
  • 交付:带引用的回答接口与格式规范
62|评测与优化:命中率与引用正确性回归
  • 交付:RAG 评测集与指标看板定义

项目 C:多步骤自动化助手(Agent + 工具)(3 篇)

63|设计 Agent 状态机:计划、执行、停止与回滚
  • 交付:Agent 流程图与停止条件
64|接入工具:文件/网络/数据库至少两类工具
  • 交付:工具清单、权限边界与审计格式
65|失败可恢复:断点续跑与任务日志可重放
  • 交付:可重放的任务事件日志

项目 D:团队可复用技能包(Skills)(3 篇)

66|把团队 SOP 写成 Skills:从“口口相传”到“按需加载”
  • 交付:3 个技能(debug/test/review)最小实现
67|技能治理:版本、禁用回滚与共享策略
  • 交付:技能注册表与发布流程(最小版)
68|安全与评测:技能是否越权、是否稳定
  • 交付:技能回归集 + 安全用例集

Read more

LTX-2.3:开源AI视频生成的新标杆,一个模型同时生成视频和音频

LTX-2.3:开源AI视频生成的新标杆,一个模型同时生成视频和音频

当 AI 视频生成不再是闭源巨头的专利 在 AI 视频生成领域,我们见证了太多令人惊艳的 demo,但它们大多藏在闭源的高墙之后。而今天,Lightricks 发布的 LTX-2.3 正在改写这个故事——这是一个完全开源、可本地运行、能同时生成高质量视频和同步音频的基础模型。更重要的是,它不只是一个实验室产物,而是一个真正为生产环境设计的创作引擎。 什么是 LTX-2.3? LTX-2.3 是 Lightricks 推出的最新一代音视频生成基础模型,它基于 Diffusion Transformer(DiT)架构构建,拥有约 190 亿参数,其中 140 亿用于视频处理,50 亿用于音频生成。这是业界首批能够在单一统一架构中同时生成同步音频和视频的开源模型之一。 与前代 LTX-2 相比,2.3 版本带来了全面的质量提升。它重建了

一文彻底搞懂 OpenClaw:是什么、怎么装、怎么用、结合2026最新AI趋势完整教程

一文彻底搞懂 OpenClaw:是什么、怎么装、怎么用、结合2026最新AI趋势完整教程 (超详细版,新手也能一步步跟着做) 一、先讲清楚:OpenClaw 到底是什么? 1. 最简单定义 OpenClaw 是一个开源、免费、本地优先、能让AI“动手操作电脑”的智能体框架。 它不是大模型本身,而是给大模型装上手、眼睛、记忆、工具,让 AI 能: * 控制电脑、操作文件 * 自动打开浏览器、查新闻、搜资料 * 执行命令、写代码、跑脚本 * 自动完成一系列复杂任务 你可以把它理解为: ChatGPT 只是聊天,OpenClaw 是真的能帮你打工。 2. 结合 2026 最新新闻背景 2026 年被称为 AI

AI调参技巧:贝叶斯优化Optuna

AI调参技巧:贝叶斯优化Optuna

AI调参技巧:贝叶斯优化Optuna 📝 本章学习目标:本章聚焦性能优化,帮助读者提升模型效率。通过本章学习,你将全面掌握"AI调参技巧:贝叶斯优化Optuna"这一核心主题。 一、引言:为什么这个话题如此重要 在人工智能快速发展的今天,AI调参技巧:贝叶斯优化Optuna已经成为每个AI从业者必须掌握的核心技能。Python作为AI开发的主流语言,其丰富的生态系统和简洁的语法使其成为机器学习和深度学习的首选工具。 1.1 背景与意义 💡 核心认知:Python在AI领域的统治地位并非偶然。其简洁的语法、丰富的库生态、活跃的社区支持,使其成为AI开发的不二之选。掌握Python AI技术栈,是进入AI行业的必经之路。 从NumPy的高效数组运算,到TensorFlow和PyTorch的深度学习框架,Python已经构建了完整的AI开发生态。据统计,超过90%的AI项目使用Python作为主要开发语言,AI岗位的招聘要求中Python几乎是标配。 1.2 本章结构概览 为了帮助读者系统性地掌握本章内容,我将从以下几个维度展开: 📊 概念解析 → 原理推导 → 代

AI赋能原则6解读思考:深度专业、跨界能力与工具协同的复合竞争力-AI时代的人才新逻辑

AI赋能原则6解读思考:深度专业、跨界能力与工具协同的复合竞争力-AI时代的人才新逻辑

目录 一、专业深度的相对退场 二、跨界组合能力:新型核心竞争力 三、从理论到实践:跨界能力的实操路径 (一)主动构建“深度+广度”的复合能力 (二)工具即能力——让AI成为你的生产力倍增器 (三)构建跨界网络——能力的加速器 (四)快速实验与迭代——把理论变成可验证能力 四、思考延伸:人类优势的再定义 (一)人类优势的多维重构 (二)专业深度仍是基础,但已非护城河 (三)AI工具的角色重定义 (四)未来社会的竞争逻辑 五、总结 感谢您的阅读! 在《AI赋能》中,里德·霍夫曼提出的第六条原则是对未来人才竞争力的一条尖锐洞察:“在AI时代,专业知识与跨界能力必须同时进化。” 这不仅是一句简单的职场忠告,而是对人类能力结构在智能化浪潮下的深刻重构。单一技能的深度已经不足以应对复杂问题,学会快速组合知识和工具,是生存与创新的关键。