什么是人工智能
人工智能的定义
人工智能,英文名称为 Artificial Intelligence,简称 AI,这个概念最早由约翰·麦卡锡在 1956 年的达特茅斯会议上提出。简单来说,人工智能就是让机器能够像人类一样思考、学习和解决问题的技术。
从更学术的角度来讲,人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。
我们可以从日常生活中的例子来理解。比如说,当你使用手机上的语音助手时,它能够理解你的问题并给出答案;当你在购物网站浏览商品时,系统会根据你的浏览历史推荐你可能感兴趣的商品;当你使用导航软件时,它能够根据实时路况为你规划最优路线。这些都是人工智能在我们生活中的应用。
人工智能的分类
从能力层面来看,人工智能可以分为三个层次:
弱人工智能:也称为狭义人工智能或专用人工智能,指的是专注于且只能解决特定领域问题的人工智能。比如下围棋的 AlphaGo、识别人脸的人脸识别系统、推荐商品的推荐系统等。这些系统在特定任务上可能表现得非常出色,甚至超越人类,但它们无法处理其他类型的任务。目前我们所有的 AI 应用都属于弱人工智能。
强人工智能:也称为通用人工智能,指的是能够像人类一样理解、学习和应用知识的人工智能,能够执行任何人类智力任务。这种 AI 具有自我意识,能够独立思考和解决各种问题。目前强人工智能还只存在于科幻作品中,是科学家们努力追求的目标。
超人工智能:指在几乎所有领域都比最聪明的人类大脑都聪明很多的智能,包括科学创新、通识和社交技能等。这是一个更加遥远的概念,目前还处于理论探讨阶段。
从技术实现的角度来看,人工智能的发展经历了几个不同的阶段和流派:
早期的人工智能主要基于符号主义,也就是通过规则和逻辑推理来实现智能。比如专家系统,就是把某个领域专家的知识和经验编码成规则,让计算机按照这些规则来做决策。这种方法在一些特定领域取得了成功,但面对复杂多变的现实世界问题时显得力不从心。
后来,连接主义逐渐兴起,也就是我们现在说的神经网络方法。这种方法模仿人脑神经元的连接方式,通过大量数据的学习来获得智能。这就引出了我们接下来要讲的机器学习和深度学习。
什么是机器学习
机器学习的基本概念
机器学习是人工智能的一个重要分支,它的核心思想是让计算机通过数据来学习规律,而不是通过人工编写规则。传统的编程方式是:我们告诉计算机规则,计算机根据规则和输入数据产生输出结果。而机器学习的方式是:我们给计算机输入数据和对应的输出结果,让计算机自己学习其中的规律。
举个简单的例子,假设我们要让计算机判断一封邮件是不是垃圾邮件。传统的方法是我们制定规则,比如'如果邮件中包含'中奖'、'免费'等词汇,就判定为垃圾邮件'。但这种方法有很多问题,因为规则很难穷尽所有情况,而且垃圾邮件发送者也会想办法绕过这些规则。
而机器学习的方法是:我们准备大量已经标注好的邮件数据(哪些是垃圾邮件,哪些不是),然后让机器学习算法从这些数据中自动学习出判断垃圾邮件的规律。这样学习出来的模型往往比人工制定的规则更加准确和灵活。
机器学习的工作流程
机器学习的典型工作流程包含以下步骤:
- 数据收集:这是机器学习的第一步,也是最重要的一步。没有数据就无法进行机器学习。数据的质量和数量直接影响最终模型的效果。
- 数据预处理:收集到的原始数据往往存在各种问题,比如缺失值、异常值、数据格式不统一等。我们需要对数据进行清洗和整理,使其适合用于模型训练。
- 特征工程:特征是用来描述数据的属性。特征工程就是从原始数据中提取和构造有用的特征,这一步往往需要领域知识和经验。
- 选择模型:根据问题的类型选择合适的机器学习算法。比如分类问题可以用决策树、支持向量机等,回归问题可以用线性回归、随机森林等。
- 训练模型:使用准备好的数据来训练模型,让模型学习数据中的规律。
- 模型评估:使用测试数据来评估模型的性能,看看模型在未见过的数据上表现如何。
- 调整优化:如果模型效果不理想,需要调整模型参数或者尝试其他模型,然后重新训练和评估。
- 部署应用:当模型效果满意后,就可以将其部署到实际应用中。
机器学习的主要类型
机器学习根据学习方式的不同,可以分为以下几类:
监督学习:这是最常见的机器学习类型。在监督学习中,我们给模型提供带有标签的训练数据,也就是说每个输入数据都有对应的正确答案。模型通过学习输入和输出之间的关系,来预测新数据的输出。


