人工智能、机器学习和深度学习，其实不是一回事

优质文章学习记录

10 Apr 2026 — 8 min read

一、人工智能、机器学习与深度学习的真正区别

在当今科技领域，我们经常听到人工智能、机器学习和深度学习这三个词。它们虽然相关，但含义不同。

1.1 人工智能

人工智能是计算机科学的一个分支，旨在研究如何合成与分析能够像人一样行动的计算主体。简单来说，AI 的目标是利用计算机来模拟甚至替代人类大脑的功能。

一个理想的 AI 系统通常具备以下特征：像人一样思考、像人一样行动、理性地思考与行动。

1.2 机器学习

机器学习是实现人工智能的一种途径。它的核心定义是：赋予计算机在没有被显式编程的情况下进行学习的能力。

与传统的基于规则的编程不同，机器学习不依赖程序员手写每一条逻辑指令，而是通过算法让机器从大量数据中寻找规律，从而对新的数据产生预测或判断。

1.3 深度学习

深度学习是机器学习的一种特殊方法，也称为深度神经网络。它受人类大脑结构的启发，通过设计多层的神经元网络结构，来模拟万事万物的特征表示。

1.4 三者之间的层级关系

厘清这三者的关系对于初学者至关重要。人工智能 AI是最宏大的概念，包含了所有让机器变聪明的技术。机器学习 ML是 AI 的一个子集，是实现 AI 的目前最主流的方法。深度学习 DL又是 ML 的一个子集，是 ML 中利用深层神经网络进行学习的技术流派。

二、机器究竟是如何学习的

为了更好地理解机器学习，我们需要对比传统的解决问题方式与机器学习方式的区别。

2.1 规则驱动的传统编程方式

在传统编程模式下，程序员基本上就是规则的制定者。所有逻辑都要提前想清楚，然后用if-else这样的判断语句一条条写进去。

比如做图像判断时，程序往往只能依赖显式条件去推断结果

识别到轮子而且是圆形 → 可能是车
识别到车窗 → 可能是车
再叠加更多结构特征

问题很快就会暴露出来。

当问题边界清晰时，比如税务计算，这种方式非常高效。但面对复杂场景，例如图像识别或自然语言处理，规则会迅速膨胀。

现实世界没有固定模板。同一个目标在不同光照、角度、遮挡情况下都会发生巨大变化。想靠穷举条件覆盖所有情况，几乎不现实。

规则可以不断增加，但复杂度增长的速度，远远快于系统可维护的程度。

2.2 模型驱动的机器学习方式

机器学习采用的是归纳法。我们不直接编写规则，而是提供大量的历史数据，让机器通过算法去训练一个模型。

案例：房价预测
假设我们有一组房屋面积与销售价格的数据：

123$m^2$ ->250万 150$m^2$ ->320万 ...

我们可以假设房价与面积之间存在线性关系，即模型为 y = a x + b y = ax + b y=ax+b。

$y$ 是房价，$x$ 是面积。 $a$（斜率）和 $b$（截距）是我们需要求解的参数。

机器学习的过程，就是通过历史数据找到最合适的 a a a 和 b b b，使得这条直线尽可能拟合所有数据点。一旦确定了参数，当输入一个新的面积 x x x 时，模型就能预测出房价 y y y。

三、人工智能的发展与现实应用

3.1 机器学习已经渗透的领域

如今，机器学习已经渗透到我们生活的方方面面

用户分析：社交网络画像、商品评论情感分析。搜索引擎：搜索结果排序、以图搜图。推荐系统：抖音/B站的视频推荐、淘宝的商品推荐。计算机视觉：人脸识别闸机、自动驾驶车辆检测、医疗影像诊断。AIGC：机器翻译、ChatGPT文本生成、Midjourney绘图。

3.2 三次浪潮：人工智能的发展阶段

人工智能并非新生事物，其发展经历了三次主要浪潮：

第一阶段（1950-1970年代）：符号主义。以1956年达特茅斯会议提出人工智能术语为起点。代表事件是IBM的跳棋程序战胜人类。
第二阶段（1980-2000年代）：统计主义。统计模型开始解决实际问题。代表事件是1997年IBM深蓝战胜国际象棋冠军卡斯帕罗夫。
第三阶段（2010年至今）：深度学习。随着算力提升，神经网络复兴。2016年AlphaGo战胜李世石是标志性事件。2022年ChatGPT的出现标志着大模型时代的到来。

3.3 AI 爆发背后的三大基础

为什么 AI 在近年来才爆发？因为三大基石的共同作用。

1.数据：互联网时代产生了海量数据，为模型提供了燃料。
2.算法：深度学习算法的突破。
3.算力：硬件的飞跃。

CPU：适合逻辑控制和I/O操作。
GPU：擅长大规模矩阵运算，是训练神经网络的主力。
TPU：Google专门为张量计算设计的处理器。

四、机器学习常见术语

1.样本
一行数据就是一个样本。
它代表现实世界中的一个实体或一条记录。多个样本组成了数据集。

2.特征
数据表中的列（通常是除去最后一列）
特征是从数据中抽取出来的、对预测结果有用的属性信息。

3.标签/目标值
模型要预测的那一列数据。
这是模型学习的最终答案。

4.数据集划分
为了验证模型的有效性，我们不能用所有数据来训练。通常将数据集按比例（如 8:2 或 7:3）划分为两部分：

训练集：用于让模型学习规律，建立模型。
测试集：用于评估模型表现。

最后，当我们把人工智能、机器学习、深度学习放回各自的位置，很多问题其实就变得清晰了。AI 是目标，机器学习是路径，深度学习是其中的一种实现方式。理解层级，比记住名词更重要。

日期：2025年2月24日
专栏：机器学习

Android端Whisper中文语音识别实战：从模型部署到性能优化

快速体验在开始今天关于 Android端Whisper中文语音识别实战：从模型部署到性能优化的探讨之前，我想先分享一个最近让我觉得很有意思的全栈技术挑战。我们常说 AI 是未来，但作为开发者，如何将大模型（LLM）真正落地为一个低延迟、可交互的实时系统，而不仅仅是调个 API？这里有一个非常硬核的动手实验：基于火山引擎豆包大模型，从零搭建一个实时语音通话应用。它不是简单的问答，而是需要你亲手打通 ASR（语音识别）→ LLM（大脑思考）→ TTS（语音合成）的完整 WebSocket 链路。对于想要掌握 AI 原生应用架构的同学来说，这是个绝佳的练手项目。从0到1构建生产级别应用，脱离Demo，点击打开从0打造个人豆包实时通话AI动手实验在Android设备上实现高效的语音识别一直是个挑战，尤其是处理中文这种复杂的语言。最近我尝试将OpenAI的Whisper模型集成到Android应用中，过程中遇到了不少坑，也总结了一些优化经验，分享给大家。移动端语音识别的特殊挑战 1. 算力限制：相比服务器，手机CPU和GPU性能有限，特别是低端设备。

告别复杂操作：灵感画廊极简AI绘画体验

告别复杂操作：灵感画廊极简AI绘画体验 "见微知著，凝光成影。将梦境的碎片，凝结为永恒的视觉诗篇。" 你是否曾经被复杂的AI绘画工具劝退？参数太多、界面太乱、学习成本太高...现在，这一切都将成为过去。灵感画廊（Atelier of Light and Shadow）基于Stable Diffusion XL 1.0打造，却彻底摒弃了工业化的复杂界面，为你提供一个如艺术沙龙般恬静的创作空间。 1. 为什么选择灵感画廊？传统的AI绘画工具往往让人望而生畏。密密麻麻的参数滑块、晦涩难懂的技术术语、需要反复调试的复杂设置...这些都不是创作者想要的。灵感画廊完全不同。它相信：真正的创作应该专注于灵感本身，而不是技术细节。这里没有"提示词"，只有"梦境描述"；没有"反向词"

ClawdBot效果展示：语音消息→Whisper转写→英译日→Telegram推送全链路

ClawdBot效果展示：语音消息→Whisper转写→英译日→Telegram推送全链路你有没有试过在 Telegram 群里听一段英语语音，想立刻知道它在说什么，又不想手动点开翻译软件、复制粘贴、再切回群聊？或者收到朋友发来的日语语音，却只能干瞪眼？ ClawdBot 不是概念演示，也不是半成品 Demo。它是一套真正跑在你本地设备上的「端到端多模态翻译流水线」——从 Telegram 收到一条语音，到你在手机上看到准确的日语文字回复，全程无需上传云端、不依赖境外服务、不经过第三方服务器，耗时不到 3 秒。这不是科幻设定，而是今天就能搭起来的真实体验。 1. 全链路效果实测：一条语音，三秒落地我们不做抽象描述，直接看真实操作流。以下所有步骤均在一台普通笔记本（i5-1135G7 + 16GB 内存 + RTX3050）上完成，模型全部本地运行，无网络请求穿透防火墙。 1.1 场景还原：群聊中的一条英语语音

Matlab报错找不到编译器？5分钟搞定MinGW-w64 C/C++环境配置（附环境变量设置）

Matlab报错找不到编译器？5分钟搞定MinGW-w64 C/C++环境配置（附环境变量设置）最近在尝试用Matlab调用一些C/C++写的算法库，或者想编译一个别人分享的.mex文件时，是不是经常在命令行里敲下 mex -setup 后，迎面而来的就是一个冰冷的报错窗口？"未找到支持的编译器或 SDK"——这句话对很多刚接触Matlab混合编程的朋友来说，简直像一盆冷水。别担心，这几乎是每个Matlab用户进阶路上的必经之坎。问题的核心，往往不在于Matlab本身，而在于你的电脑缺少一个它认可的“翻译官”：C/C++编译器。对于Windows用户，官方推荐且免费的解决方案就是MinGW-w64。这篇文章，就是为你准备的从报错到成功配置的完整路线图。我们不只告诉你步骤，更会解释每一步背后的逻辑，并附上那些容易踩坑的细节和验证方法，目标是让你一次配置，终身受益。 1. 理解问题根源：为什么Matlab需要单独的编译器？在深入操作之前，花几分钟搞清楚“为什么”，能帮你避免未来很多“是什么”的困惑。Matlab本身是一个强大的解释型语言环境，