【AI大模型入门】02：豆包——字节出品，国内用户最顺手的AI助手

优质文章学习记录

04 Apr 2026 — 6 min read

【AI大模型入门】02：豆包——字节出品，国内用户最顺手的AI助手

📖 阅读时长：约8分钟
🎯 适合人群：想找一个好用、免费、无障碍访问的AI工具的新手
💡 你将学到：豆包是什么、有哪些功能、和其他AI有什么区别、怎么快速上手

一、豆包是什么？

豆包（Doubao）是字节跳动（抖音、今日头条的母公司）推出的AI大模型产品，于2023年8月正式上线。

如果你用过抖音、今日头条，那你已经间接体验过字节AI技术的成果了。豆包就是字节把这些技术能力集中打包，做成了一个对话式AI助手。

字节跳动 AI 产品矩阵： ┌─────────────────────────────────┐ │ 豆包（对话助手） ←── 本篇主角 │ │ 即梦（图像/视频生成） │ │ 剪映AI（视频剪辑AI） │ │ 扣子（AI Agent搭建平台） │ └─────────────────────────────────┘

二、为什么推荐新手先用豆包？

在所有AI产品里，我特别推荐国内新手从豆包开始，原因很简单：

优势	说明
✅ 无需翻墙	国内直接访问，app/网页/小程序都有
✅ 完全免费	基础功能全免费，不用信用卡
✅ 中文理解强	专门优化了中文，读懂你的意思更准确
✅ 功能全面	聊天、搜索、写作、画图、语音全都有
✅ 手机端体验好	App做得很流畅，随时随地用

三、豆包能做什么？

📝 1. 智能对话与写作

这是豆包最基础也最强大的功能：

场景示例：写小红书文案

你：帮我写一条小红书风格的文案，推荐杭州西湖旅游， 要有emoji，要有标题，字数200字以内 豆包：🏔️【西湖，每一帧都是屏保】 三月的西湖，是上天打翻的调色盘🎨 粉嫩的桃花 + 嫩绿的柳枝 倒映在如镜湖面，美得像一场梦～ 必打卡路线👇 📍 断桥残雪 → 苏堤春晓 → 花港观鱼 早上7点去，人少景美，随手一拍都出片！ Tips： ✨ 带个轻便三脚架，自拍更稳 🎒 穿汉服打卡超出片 🚗 景区内有共享单车，骑行最惬意 #西湖 #杭州旅游 #春日出行 #江南美景

🔍 2. AI搜索（联网版）

豆包支持联网搜索，回答更新的信息：

最新新闻事件
实时股票/天气（需开启搜索功能）
最近发布的产品评测

🎨 3. AI绘图

直接用文字生成图片：

你：帮我画一只穿着宇航服的橘猫，背景是星空，卡通风格 （豆包会生成一张图）

🎙️ 4. 语音对话

支持语音输入和语音朗读输出，适合：

开车时用语音提问
英语口语练习对话
不想打字的时候

📄 5. 文件处理

上传 PDF、Word、Excel，豆包帮你：

提取核心内容
总结文章要点
回答文件里的问题

🤖 6. AI智能体（角色扮演）

豆包提供了很多预设角色：

英语老师（陪你练口语）
简历优化师（帮你改简历）
心理倾听者（情绪疏导）
代码助手（帮你写/改代码）
……还有上百种角色可以选择

四、豆包的底层模型：Doubao 系列

字节跳动自研了 Doubao 系列大模型，主要包括：

Doubao-pro-32k ── 综合能力强，支持3.2万字上下文 Doubao-pro-128k ── 超长上下文，处理长文档 Doubao-lite-* ── 轻量版，速度更快 Doubao-vision-* ── 视觉理解版，能"看图说话"

豆包App默认会根据你的需求自动选择合适的模型，新手无需关心这些细节。

五、豆包 vs. ChatGPT vs. 文心一言

三款最主流的对话AI横向对比：

 豆包 ChatGPT(免费) 文心一言 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 国内访问 ✅ 无障碍 ⚠️ 需要工具 ✅ 无障碍 完全免费 ✅ ✅（有限制） ✅ 中文能力 ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐ ⭐⭐⭐⭐⭐ 英文能力 ⭐⭐⭐⭐ ⭐⭐⭐⭐⭐ ⭐⭐⭐ 联网搜索 ✅ ✅（有限） ✅ AI绘图 ✅ ❌（免费版） ✅ 手机App ✅ 很好用 ✅ ✅

六、快速上手教程（5分钟搞定）

Step 1：下载/打开豆包

手机：App Store / 应用宝搜索"豆包"下载
电脑：浏览器打开 doubao.com
微信：搜索"豆包"小程序

Step 2：注册登录

用手机号或抖音账号登录，30秒搞定。

Step 3：开始你的第一次对话

直接在对话框输入你想问的问题，比如：

"帮我制定一个健身入门计划，每周3次，每次30分钟" "把这段英文翻译成中文：[粘贴英文]" "帮我想5个适合送给妈妈的生日礼物，预算500元以内"

Step 4：试试上传文件

点击对话框左侧的 📎 图标，上传一份PDF或Word，然后问：

"请帮我总结这份文件的核心内容，用3-5个要点列出"

七、豆包的使用技巧

技巧1：用"角色扮演"让它更专业

❌ "帮我改简历" ✅ "你是一位有10年招聘经验的HR，请帮我优化这份简历， 让它更适合互联网产品经理岗位"

技巧2：让它分步骤来

❌ "帮我写一个商业计划书" ✅ "帮我写一个商业计划书，先给我列出大纲， 我确认后再逐章节展开"

技巧3：不满意就继续追问

你：[豆包的回答] 你：这个太简单了，帮我写得更详细一些， 特别是第三点展开说说

八、豆包的局限

创意类任务：对于极度需要原创性的内容，偶尔会有"模板化"倾向
数学计算：复杂数学运算可能出错，建议用计算器验证
最新信息：虽然支持联网，但实时性不如专业搜索引擎
隐私注意：不要把公司机密、个人隐私信息输入任何AI工具

九、总结

豆包可能不是世界上最强的AI，但它绝对是最适合中国普通用户入门的AI工具：

🆓 免费
🇨🇳 中文友好
📱 手机体验好
🔌 功能够用

如果你今天就想开始用AI，豆包是最简单的起点。

🔔 下一篇预告

【AI大模型入门】03：文心一言——百度的AI战略，中文理解的先行者

觉得有用就 点个赞 吧～评论区欢迎分享你用豆包的有趣经历 👇

本文为【AI大模型入门专栏】第02篇
作者：[孤岛站岗] | 更新时间：2026年3月

VLA机器人革命：解析当下10篇最关键的视觉-语言-动作模型论文

VLA机器人革命：解析当下10篇最关键的视觉-语言-动作模型论文概览 2024-2026年，机器人领域正经历一场范式转换：从传统的任务特定编程转向视觉-语言-动作（Vision-Language-Action, VLA）模型。这些模型将视觉感知、自然语言理解和动作执行统一在单一框架中，让机器人能够像人类一样理解指令、推理场景并执行复杂操作。本文精选5篇最fundamental的基础性论文和5篇热度最高的前沿论文，深入剖析VLA领域的核心思想、技术演进和未来方向。这些论文代表了从Google DeepMind、NVIDIA、斯坦福、Physical Intelligence等顶尖机构的最新突破，涵盖了从单臂操作到双臂人形机器人、从模拟环境到真实家庭场景的全方位进展。 Part I: 五篇Fundamental基础性论文这些论文奠定了VLA领域的理论基础和技术范式，是理解整个领域发展脉络的关键。 1. RT-2: New Model Translates Vision and Language into Action 发表机构：Google DeepMind 时间：

开源分享：AI Agent Skills 资源合集，一键安装 Cursor/Claude Code/Copilot 技能包

前言最近在使用 Cursor 和 Claude Code 进行开发，发现 Agent Skills 这个功能非常强大——它可以让 AI 更专业地完成特定任务，比如代码审查、生成 Git Commit、自动生成测试用例等。但网上的资源比较零散，于是我整理了一个开源合集分享给大家。项目地址 GitHub：https://github.com/JackyST0/awesome-agent-skills 什么是 Agent Skills？ Agent Skills 是 AI Agent 可以发现和使用的指令、脚本和资源包。简单来说，就是给 AI 一套「技能说明书」，让它知道如何更专业地帮你完成工作。比如： * 代码审查 Skill：AI 按照最佳实践审查代码，给出改进建议

LLM项目实战：使用Llama-factory进行DPO训练

前言 LLM训练三板斧，预训练，微调，RHLF。DPO属于是最后环节RHLF中的一个方法，关于RLHF主流方法有PPO,DPO,GROP。关于这三种介绍RLHF方法，我之前分享过对着三种方法的一些思考，有兴趣的同学可以看看。因为DPO对硬件的需求最小，显存占用最低，所以我们先采用DPO进行训练。硬件信息： 4070 12g*2 、64g内存、操作系统:Ubuntu24.04、模型：QWEN-3vl-2B（因为我这个模型是上个多模态任务sft过的，所以选择vl模型，没有图片输入需求的同学可以下载纯语言模型）本篇教程仅关于DPO训练，请提前配置好环境和下载好LLamafactory（关于llamafactory环境配置其实也是一大头疼的点，注意如果想要使用分布式训练，llamafactory仅支持到deeospeed10.0-16.0，截止到2025年11月20日llamafactory还没有完成对deepspeed最新版本的适配碎碎念：很多初学大模型的同学还是使用Windows系统进行训练，本人之前也是。但是由于Windows总是出现各种奇怪的报错和显存不稳定

OpenClaw 集成 GitHub Copilot 指南

OpenClaw 集成 GitHub Copilot 指南本文档介绍如何将 GitHub Copilot 作为模型提供商集成到 OpenClaw 中，实现通过 GitHub 账户调用 Copilot 模型能力。目录 * 什么是 OpenClaw * 什么是 GitHub Copilot * 前提条件 * 安装 OpenClaw * 两种集成方式 * 方式一：内置 GitHub Copilot 提供商（推荐） * 方式二：Copilot Proxy 插件 * 设置默认模型 * 配置文件示例 * 模型管理 * 常见问题排查 * 参考资料什么是 OpenClaw OpenClaw 是一个开源的 AI 助手平台，提供自托管的 AI 网关（

【AI大模型入门】02：豆包——字节出品，国内用户最顺手的AI助手

一、豆包是什么？

二、为什么推荐新手先用豆包？

三、豆包能做什么？

📝 1. 智能对话与写作

🔍 2. AI搜索（联网版）

🎨 3. AI绘图

🎙️ 4. 语音对话

📄 5. 文件处理

🤖 6. AI智能体（角色扮演）

四、豆包的底层模型：Doubao 系列

五、豆包 vs. ChatGPT vs. 文心一言

六、快速上手教程（5分钟搞定）

Step 1：下载/打开豆包

Step 2：注册登录

Step 3：开始你的第一次对话

Step 4：试试上传文件

七、豆包的使用技巧

技巧1：用"角色扮演"让它更专业

技巧2：让它分步骤来

技巧3：不满意就继续追问

八、豆包的局限

九、总结

🔔 下一篇预告

Read more

VLA机器人革命：解析当下10篇最关键的视觉-语言-动作模型论文

开源分享：AI Agent Skills 资源合集，一键安装 Cursor/Claude Code/Copilot 技能包

LLM项目实战：使用Llama-factory进行DPO训练

OpenClaw 集成 GitHub Copilot 指南