AI 思维解析:从感知到决策的核心逻辑
颠覆互联网思维的应该是 AI 思维。AI 思维是百度创始人李彦宏在'2017 百度联盟峰会'上首次提出的概念,标志着技术认知进入新阶段。
背景与定义
智能时代,人人都需要有 AI 思维。就像互联网时代人人都要有互联网思维一样。AI 是以智能决策为核心的系统,它能够将像 5G、物联网这样的新技术很好地串联起来,这些技术的应用将会大大提高生产效率,从而引发新的变革,颠覆已有的形态。
目前主流的 AI 技术都是通过机器学习实现的。简单来说,机器学习是在不断地学习和训练中寻找规律的过程,因而更像是自然科学。自然科学主要研究'无意识的行为',即一个或一些事件导致行为的发生,比如膝跳反应。自然科学包括物理学、化学、生物学、天文学和气象学;而社会科学是研究'有意识的行为',比如心理学、社会学、人类学等问题。
这里提到自然科学和社会科学,是为了相对广泛地涵盖 AI 可能会涉及的问题和领域。有意识的行为会破坏客观规律,从而影响机器学习。人工智能是一个建立在概率论上的系统,我们要尽可能提高人工智能决策的准确率,比如达到 99.9%,100% 是不可能的,那是自动化解决的问题。而打破规律的事物是降低人工智能准确率的脏数据,而在自然科学中基本没有有意识的行为。
例如,自然科学里植物的生长,是根据环境的温度、湿度、光照等因素共同决定的,是一个相对确定的、有规律的事物。而人不一样,人可以因为自己不想出门而决定不出门('自己不想'就是有意识的行为),植物不会因为自己不想生长而停止生长。因此,'有主观意识的行为'参与越少,人工智能所做的决策越准确。但有意思的是,我们希望机器通过在'无意识的行为'中学习后,做出符合人类'有主观意识'标准的决策。
01 看见:机器视觉
就像人具备看到东西的能力一样,人工智能也可以看见。也就是机器视觉,展开来说,包括图像识别、视频识别、文字识别,具体是怎么实现识别的呢?
我们拿图像识别说明一下,图像识别是将一张图片分割为很多的小块(像素点),然后与机器已知的事物对比,来判断物品是什么。比如机器已经知道猫的眼耳口鼻子分成小块后长什么样,当给了机器一张新的照片时,它发现新照片分块后和之前定义的猫的各个部分长得一样,那么机器就会输出这是一只猫,从而完成图像识别。
常见的机器识别应用领域是智能安防。比如我们在北京火车站检票进站,最早是由工作人员人工核实乘客的身份证、火车票等信息是否一致,现在通过摄像头智能识别解决,这大大缩短了进站的时间。同样的方式也适用于警方破案。传统的方式中,他们需要人力查看监控录像,找到可疑的嫌疑人。现在通过视频识别,系统可以根据警方提供的照片快速找到有嫌疑犯的视频。
目前,摄像头的采集方式都是按照人眼的方式进行的,当摄像头可以按照机器的方式采集,那将带来更大的效率提升。随着卷积神经网络(CNN)等技术的发展,机器视觉不仅能识别物体,还能理解场景中的空间关系和动态变化。
02 理解:自然语言处理
人是如何理解彼此的呢?是建立在我们有共同的认知之上。比如我们都知道人饿了要吃饭,于是你说饿了的时候,你的妈妈会给你做饭。人工智能也一样,它要先理解人类,才能帮助人类做决策。这就涉及到了自然语言处理(NLP),我们以声音和文字的形式向机器传达信息,它通过自然语言处理之后,就可以理解我们要表达的意思了。
人工智能如何能够理解我们说的话呢?这就需要我们预先对事物进行归类和定义。比如你和机器说:'帮我订一张明天早上去美国的机票。'
那人工智能根据已有的信息储备,将这句话转化为结构化数据:
- 我 = 我的主人,他的名字是张三
- 明天早上 = 12 号 6:00 到 12:00,已知今天是 11 号
- 美国 = 目的地是美国
- 机票 = 票的类别是机票,不是火车票也不是汽车票
这里面'姓名'是张三,'早上'代表 6 点到 12 点,'美国'是一个国家(国家可以是到达的目的地),'机票'是一张出行的所需的票务(它和火车票、汽车票是一类的)。这些信息是需要让机器提前学习的。
这一部分的技术常常应用到翻译、智能客服等领域。但智能客服并不是自然语言一项技术就能解决的,它还涉及到信息的搜集、查找、做出决策等。现代 NLP 技术还包括语义分析、情感分析和意图识别,使机器能更精准地捕捉用户背后的真实需求。
03 分析:推荐与反欺诈
人是具备分析事物的能力的,我们会分析'这个人喜欢什么?'、'这个人有没有骗我?',对应到人工智能就是智能推荐系统和反欺诈系统。
我们是如何分析一个人喜欢什么呢?一种是通过观察他的行为;另一种是将人分类,把新朋友分类到我们已知的类别,根据已知类别的喜好推断出这个新朋友可能的喜好。
对应到人工智能是一个道理。在第一种方式里,机器会给用户打标签,例如用户的标签是娱乐八卦、科技、互联网,那机器就可以根据标签信息推荐对应类别的内容给用户;在第二种方式里,机器通过建立用户画像给人分类,如果用户是属于 20-30 岁的一线城市的职场女性这个画像,机器就可以根据这个画像的喜好进行推荐。
应用场景就是我们经常接触到的内容推荐,以及广告精准营销等。但推荐系统也会存在问题。它在探索人的喜好的同时,也会影响人的选择。当用户看了一种东西系统就会推荐同类的东西,用户看这种东西越来越多,最终造成数据失衡。如果用户最初的行为只是误操作或非本人的操作,那系统就帮助用户做了决策,并培养了用户的兴趣。这种现象被称为'信息茧房',需要通过引入多样性算法来平衡。


