近几年,从亚马逊、Facebook 到谷歌、微软,再到国内的 BAT,全球最具影响力的技术公司都将目光转向了人工智能(AI)。2016 年 AlphaGo 战胜李世石,将公众的目光也聚集到了人工智能。创新氛围最活跃的中国,已将人工智能定位为国家战略。2017 年 11 月 15 日,中国新一代人工智能发展规划暨重大科技项目启动会在京召开,公布我国第一批国家人工智能开放创新平台,包括百度自动驾驶、阿里云城市大脑、腾讯医疗影像、科大讯飞智能语音等开放创新平台。现在中国的所有互联网公司,不论大小都在布局人工智能,大量的科技巨头和专家预测人工智能将带来第四次革命,继农业革命、工业革命、信息革命后从底层改变我们的工作和生活。
作为一个充满好奇心的产品经理,经过一段时间的学习思考,将个人对于 AI 产品经理需要掌握的基础知识进行总结。因为 AI 产品经理是一个全新的岗位,至今没有明确的能力模型定义,本文只是将个人的学习和思考进行汇总,将产品经理需要了解的 AI 知识进行框架梳理,希望对想要转型 AI 产品的朋友有所帮助。
本文将分成三个部分展开论述:第一部分,介绍 AI 产品经理能力模型,人工智能发展史及看待人工智能的几个视角;第二部分,介绍人工智能的常见算法,如何零基础通过 TensorFlow 实现手写数字识别;第三部分,分析 AI 产品经理在 2B 和 2C 领域的能力差异,介绍一些 AI 产品。
一、AI 产品经理能力模型
1. AI 产品经理能力模型概述
从现在的招聘市场来看,产品经理岗位已经出现大量细分,如数据产品经理、支付产品经理、ERP 产品经理、CRM 产品经理、供应链产品经理、POP 产品经理等。AI 产品经理可能将成为未来的一个主流细分岗位,而且因为 AI 对应的行业不同,AI 产品经理下面将衍生出大量的细分行业 AI 产品经理。
在讨论 AI 产品经理之前,我们来看看非 AI 产品在公司中需要面对哪些角色,而面对这些角色需要的能力模型是什么,在这个基础上再来讨论 AI 产品经理的能力模型。
产品经理需要每天与工程师、设计、老板、运营、市场、用户/客户、测试等部门同事沟通。AI 产品经理从对接人上来看,增加了 AI 科学家或者 AI 工程师。为了可以顺畅沟通,产品经理的知识结构必然需要增加相应的知识,以提升沟通效率,清楚产品设计边界。同时,因为 AI 产品与客户的业务结合得更加密切,所以需要对所设计产品的行业纵深理解能力。在这个基础上,我们来尝试搭建 AI 产品经理能力模型。
产品能力模型可以从人、事、知识三个角度搭建。通过上文的分析,我们可以看到,在人和事上产品经理的能力几乎没有太大变化,但是在知识层面需要进行基础储备,以提高与 AI 科学家和 AI 工程师的沟通效率。人工智能技术正处于高速发展时期,充满了不确定性,所以产品经理的认知极限一定程度上影响了产品的未来。本文将总结人工智能领域的一些基本概念,认知极限需要靠阅读最前沿的 paper 和团队的 AI 科学家/工程师多交流,行业纵深的理解需要真实的参与到业务的整个过程中学习,这就为一些非互联网领域的、有着多年细分行业工作经验的、清楚全业务流程痛点的非互联网人提供了转型机会。
2. AI 产品经理≠AI 科学家,应用实现门槛不高
提到 AI 大家第一印象可能想到的是复杂的数学公式,天书一样的算法模型,需要学习 AI 难如登天。但实际情况是,即使做一名 AI 应用开发工程师,可能也未必要需要理解那些天书一样的复杂算法。Google 的深度学习框架 TensorFlow 极大的降低了数学门槛,这个框架内置了损失函数优化方法,而 Keras(基于 TensorFlow 构建的深度学习框架)可以把一个模型代码量大大减少。
究竟能减少多少呢?我们以机器识别猫狗照片的分类器模型为例,可以通过寥寥几行代码搞定。寥寥几行代码就把一个拥有着卷积层、池化层和全连接层并且使用 Adam 这个较高级优化方法的深度学习网络架构写出来了。
网上有一张图,很有意思,生动的表明了不同的人对机器学习的理解。我们的目标是成为一名合格的 AI 产品经理,而不是工程师,所以只要清楚这些技术的实现框架就可以了,只要可以清楚的描述客户需求场景,深刻理解客户诉求,并将其清晰的描述给 AI 科学家,并能听懂 AI 科学家的话就可以了,至于他们使用了什么模型,什么算法并不需要你去操心。
3. 非互联网行业转型的新机会
前文中提到了 AI 产品和服务对于垂直行业知识的要求比较严格。可以看出,传统行业中的从业者可以利用其多年经验为 AI 团队提供认知价值,所以非互联网行业的从业者完全可以通过补全上文提到的互联网产品经理相关知识,转型进入到高速增长的 AI 领域。
二、人工智能发展史
智能:以宽泛的心理能力,能够进行思考、计划、解决问题、抽象思维、理解复杂理念、快速学习和从经验中学习等操作。
人工智能:制造出智能的机器,尤其是智能的计算机程序,它能做一些以前需要人才能做的事情,这个机器或者计算机程序就叫人工智能。
人工智能有很多种的表现形式,目前在各个专业的方向,出现了很多超越人类的人工智能。比如在国际象棋上,有 IBM 的国际象棋大师 Deep Blue;围棋上有 Google 的 AlphaGo 和 AlphaZero;医学上有 IBM 的 Watson;私人助理上有苹果的 Siri,微软的 Cortana;甚至搜索引擎百度和 Google,你也可以把它看做是一个人工智能。它们都由一段段代码、一个个算法、一堆堆的数据组成。
人工智能的黄金时代(20 世纪 50~70 年代)
1950 年,一位名叫马文·明斯基 (后被人称为'人工智能之父') 的大四学生与他的同学邓恩·埃德蒙一起,建造了世界上第一台神经网络计算机。这也被看做是人工智能的一个起点。同年,被称为'计算机之父'的阿兰·图灵提出了一个举世瞩目的想法——图灵测试。按照图灵的设想:如果一台机器能够与人类开展对话而不能被辨别出机器身份,那么这台机器就具有智能。而就在这一年,图灵还大胆预言了真正具备智能机器的可行性。
1956 年,在由达特茅斯学院举办的一次会议上,计算机专家约翰·麦卡锡提出了'人工智能'一词。后来,这被人们看做是人工智能正式诞生的标志。在 1956 年的这次会议之后,人工智能迎来了属于它的第一次高潮。在这段长达十余年的时间里,计算机被广泛应用于数学和自然语言领域,用来解决代数、几何和英语问题。
人工智能的第一次低谷(20 世纪 70~80 年代)
由于科研人员在人工智能的研究中对项目难度预估不足,导致与美国国防高级研究计划署的合作计划失败,社会舆论的压力也开始慢慢压向人工智能这边,导致很多研究经费被转移到了其他项目上。当时,人工智能面临的技术瓶颈主要是三个方面:
- 计算机性能不足,导致早期很多程序无法在人工智能领域得到应用;
- 问题的复杂性,早期人工智能程序主要是解决特定的问题,因为特定的问题对象少,复杂性低,可一旦问题上升维度,程序立马就不堪重负了;
- 数据量严重缺失,在当时不可能找到足够大的数据库来支撑程序进行深度学习,这很容易导致机器无法读取足够量的数据进行智能化。
人工智能的繁荣期(1980 年~1987 年)
1980 年,卡内基梅隆大学为数字设备公司设计了一套名为 XCON 的'专家系统'。这是一种采用人工智能程序的系统,可以简单的理解为'知识库 + 推理机'的组合,XCON 是一套具有完整专业知识和经验的计算机智能系统。这套系统在 1986 年之前能为公司每年节省下来超过四千美元经费。在这个时期,仅专家系统产业的价值就高达 5 亿美元。
人工智能的冬天(1987 年~1993 年)
仅仅在维持了 7 年之后,这个曾经轰动一时的人工智能系统就宣告结束历史进程。80 年代末,美国国防先进研究项目局高层认为人工智能并不是'下一个浪潮',至此,人工智能再一次成为浩瀚太平洋中那一抹夕阳红。
人工智能的新春(1993~现在)
1994 年 Chinook Checkers,机器国际跳棋上超越了人类;
1997 年 Deep Blue 深蓝战胜国际象棋世界冠军;
2006 年,辛顿发表了一篇突破性的文章《A Fast Learning Algorithm for Deep Belief Nets》,这篇论文里辛顿介绍了一种成功训练多层神经网络的办法,他将这种神经网络称为深度信念网络。
2008 年卡内基梅隆大学和通用的无人驾驶汽车 CMU Boss 研发成功;
2012 年 Amazon 的仓储机器人 Kiva,减少工人在仓库中走动的频次;
2013 年,深度学习算法在语音和视觉识别上取得成功,识别率分别超过 99% 和 95%,进入感知智能时代。
2014 年计算机被当 13 岁男孩首次通过图灵测试;
2014 年没有刹车、没有方向盘,只有一个启动 Button 的 Google Car;
2016 年 AlphaGo 4:1 战胜李世石;
2017 年神秘 Master 60 盘连胜,狂扫棋坛高手。
三、看待人工智能的几个视角
人工智能领域包含大量的概念和定义,如监督学习、机器学习、强化学习、强人工智能等,最初学习的时候很容易弄混,其实很多概念是不同角度观察的结果,还有些概念是嵌套关系,现将人工智能领域的概念从不同视角进行梳理。
1. 从数据标注属性来看
- 非监督学习 (Unsupervised Learning):非监督学习学的是没有标准答案的样本。拿猫和狗的图片识别举例。算法要自己去寻找这些图片的不同特征,然后把这些图片分为两类。它实际上不知道这两类是什么,但它知道这两类各有什么特征,当再出现符合这些特征的图片时它能识别出来,这是第一类图片,那是第二类图片。
- 监督学习 (Supervised Learning):是从标记的训练数据来推断一个功能的机器学习任务。训练数据包括一套训练示例。在监督学习中,每个实例都是由一个输入对象(通常为矢量)和一个期望的输出值(也称为监督信号)组成。监督学习算法是分析该训练数据,并产生一个推断的功能,其可以用于映射出新的实例。拿猫和狗的识别来举例子。算法看一张图就告诉它,这是猫;再看一张图片,告诉它这也是猫,再看一张图,告诉它这是狗,如此往复。当它看了几十万张猫和狗的图片后,你再给它一张陌生的猫或者狗的图片,就基本能'认'出来,这是哪一种。这样的学习方法很有可能造成模型把所有答案都记了下来,但碰到新的题目又不会了的情况,这种情况叫做'过拟合'。
- 强化学习 (Reinforcement Learning):所谓强化学习就是智能系统从环境到行为映射的学习,以使奖励信号 (强化信号) 函数值最大。强化学习不同于连接主义学习中的监督学习,主要表现在教师信号上,强化学习中由环境提供的强化信号是对产生动作的好坏作一种评价 (通常为标量信号),而不是告诉强化学习系统 RLS 如何去产生正确的动作。由于外部环境提供的信息很少,RLS 必须靠自身的经历进行学习。通过这种方式,RLS 在行动 - 评价的环境中获得知识,改进行动方案以适应环境。在智能控制机器人及分析预测等领域有许多应用。我们小时候,看到马戏团的猴子居然会做算术题,感觉到很惊讶,这是怎么做到的呢?其实就是每次拿对了数字的时候,训练人员就给它一些食物作为奖励,这些奖励让他'知道',这么做是'对的',如果拿错了,可能就会有惩罚,这些惩罚就是要让它'知道',这样做是'错的'。
2016 年的 NIPS 会议上,吴恩达给出了一个未来 AI 方向的技术发展图,毋庸置疑,监督学习是目前成熟度最高的,可以说已经成功商用。
2. 从智能水平来看
因为好莱坞大量 AI 题材的影视作品,我们看到的大量的超人工智能,所以再来看现在的 AI 产品就感觉没那么智能。从智能水平上划分,我们可以将人工智能分为三类:
- 弱人工智能 (Artificial Narrow Intelligence, ANI):弱人工智能是擅长于单个方面的人工智能。比如有能战胜象棋世界冠军的人工智能,但是它只会下象棋,你要问它怎样更好地在硬盘上储存数据,它就不知道怎么回答你了。
- 强人工智能 (Artificial General Intelligence, AGI):人类级别的人工智能。强人工智能是指在各方面都能和人类比肩的人工智能,人类能干的脑力活它都能干。创造强人工智能比创造弱人工智能难得多,我们现在还做不到。
- 超人工智能 (Artificial Superintelligence, ASI):牛津哲学家,知名人工智能思想家 Nick Bostrom 把超级智能定义为'在几乎所有领域都比最聪明的人类大脑都聪明很多,包括科学创新、通识和社交技能。'超人工智能可以是各方面都比人类强一点,也可以是各方面都比人类强万亿倍的。
3. 从技术分层来看
- 认知:是指收集信息和解析信息来感知世界,比如图片识别、语音识别、自然语言处理等;
- 预测:是指通过计算,来预测行为和结果。比如广告推荐、歌曲推荐等;
- 决策:是指确定实现的方式和路径,比如移动路线规划、自动买卖股票等;
- 集成解决方案:是指人工智能和其他技术结合时,产生的多种集成解决方案,比如和汽车结合就是无人驾驶,和医疗器械结合就是手术机器人。
目前商业化比较普遍的,是认知和预测领域的应用。
4. 从技术分类来看
- 基础架构层:云计算、芯片、Tensorflow 等框架;
- 中间层:图像识别、语音识别、语义识别、机器翻译等;
- 应用层:智能滤镜,讲故事机器人,私人助理,搜索引擎,内容推荐,阿里鲁班等。
5. 从应用场景来看
- 互联网和移动互联网应用:搜索引擎、精准营销、用户画像、反欺诈;
- 智能交通:自动驾驶、共享出行、自动物流;
- 智能金融:银行业、保险业、证券投资(风控、反欺诈、投资决策);
- 智能医疗:辅助诊断、手术机器人、智能制药、辅助器官、外骨骼;
- 智能农业:智慧农业管理系统、智慧农业设备;
- 智能写作:写稿机器人、收集资料机器人;
- 机器翻译:文字翻译、声音翻译、图像翻译;
- 机器仿生:动物仿生、器官仿生;
- 智能助理:律师助理、时间管理助理;
- 创作艺术:编曲、写歌、绘画。
p.s. 人工智能 > 机器学习 > 深度学习 > 神经网络模型 > 卷积神经网络 = 递归神经网络
四、常见 AI 算法详解
作为 AI 产品经理,了解常见算法的原理和适用场景至关重要,这有助于评估技术可行性和成本。
1. 线性回归 (Linear Regression)
用于预测连续数值。例如预测房价、销售额。假设输入变量 x 和输出变量 y 之间存在线性关系 y = wx + b。优点是简单易懂,缺点是只能处理线性关系,对非线性数据效果差。
2. 逻辑回归 (Logistic Regression)
虽然名字里有回归,但实际上是一种分类算法。用于预测二分类或多分类问题。例如判断邮件是否为垃圾邮件。它通过 Sigmoid 函数将输出压缩到 0 到 1 之间,表示概率。
3. 决策树 (Decision Tree)
通过一系列规则对数据进行分类。类似于流程图,每个内部节点表示一个属性上的判断,每个分支代表一个判断结果,每个叶节点代表最终类别。优点是可视化强,易于解释;缺点是容易过拟合。
4. 支持向量机 (SVM)
旨在找到一个超平面,使得不同类别的数据点之间的间隔最大化。适用于小样本、非线性及高维模式识别问题。在文本分类、图像识别中表现优异。
5. 神经网络 (Neural Networks)
受生物神经元启发,由输入层、隐藏层和输出层组成。每一层包含多个神经元,神经元之间通过权重连接。通过反向传播算法调整权重,使网络输出接近真实值。
6. 卷积神经网络 (CNN)
专门用于处理网格状拓扑数据,如图像。通过卷积层提取局部特征,池化层降低维度,全连接层进行分类。在图像识别、目标检测中是主流架构。
7. 循环神经网络 (RNN)
专门用于处理序列数据,如文本、语音。它具有记忆功能,能够利用之前的信息来影响当前的输出。常用于自然语言处理、时间序列预测。
8. Transformer
近年来在 NLP 领域占据主导地位,基于自注意力机制 (Self-Attention),能够并行处理序列数据,解决了 RNN 的长距离依赖问题。是大模型的基础架构。
五、零基础通过 TensorFlow 实现手写数字识别
为了帮助产品经理理解 AI 实现的流程,我们以经典的 MNIST 手写数字识别为例,展示如何使用 Keras 框架快速构建模型。
1. 准备数据
MNIST 数据集包含 70,000 张 28x28 像素的手写数字灰度图。我们需要将其归一化到 0-1 之间,并将标签转换为 one-hot 编码。
import tensorflow as tf
from tensorflow import keras
(x_train, y_train), (x_test, y_test) = keras.datasets.mnist.load_data()
x_train = x_train.astype("float32") / 255.0
x_test = x_test.astype("float32") / 255.0
x_train = x_train.reshape(-1, 28, 28, 1)
x_test = x_test.reshape(-1, 28, 28, 1)
2. 构建模型
使用 Sequential API 构建一个简单的 CNN 模型。包含两个卷积层和两个池化层,最后接全连接层。
model = keras.Sequential([
keras.layers.Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1)),
keras.layers.MaxPooling2D((2, 2)),
keras.layers.Conv2D(64, (3, 3), activation='relu'),
keras.layers.MaxPooling2D((2, 2)),
keras.layers.Flatten(),
keras.layers.Dense(128, activation='relu'),
keras.layers.Dropout(0.5),
keras.layers.Dense(10, activation='softmax')
])
3. 编译模型
选择优化器、损失函数和评估指标。对于分类问题,通常使用 'adam' 优化器和 'categorical_crossentropy' 损失函数。
model.compile(optimizer='adam',
loss='sparse_categorical_crossentropy',
metrics=['accuracy'])
4. 训练模型
使用训练数据对模型进行训练。epochs 表示训练的轮数,batch_size 表示每批处理的样本数。
model.fit(x_train, y_train, epochs=5, batch_size=128)
5. 评估模型
使用测试集评估模型的准确率。PM 应关注准确率 (Accuracy) 和混淆矩阵,了解模型在哪些数字上容易出错。
test_loss, test_acc = model.evaluate(x_test, y_test)
print(f'Test accuracy: {test_acc}')
通过这个流程,产品经理可以理解数据准备、模型构建、训练和评估的基本步骤,从而更好地与技术团队沟通需求。
六、2B 与 2C 领域的 AI 产品差异
1. 准确度要求
从产品对于 AI 技术准确性需求的角度来看,分成两种情况:
- 准确度要求极高的产品或服务:如手术机器人、自动驾驶技术、智慧交通等。这些产品和服务直接关系到人的生死,要求具有极高的准确度,需要 AI 科学家持续的优化,只有达到近乎百分之百的准确度才会商用。
- 准确度要求不高的产品或服务:如面部识别、语音机器人、无人机农药喷洒、艺术设计、搜索引擎、精准营销等。这些产品和服务对于精确度要求不高,因为即使不精确也不会直接造成人员伤亡。
2. 行业垄断程度
- 垄断程度高的行业:行业的垄断程度越高,头部公司的体量越大,最初可能因为缺乏 AI 技术而采购技术,当技术环境成熟,BAT 和 Google 这类公司开源了大量技术后,行业垄断型公司则会搭建自己的 AI 团队,搭建自己的大数据、云计算和 AI 实验室。以运营商行业为例,资源垄断型市场,三家独大,每家都在搭建自己的大数据分析平台,也在搭建自己的人工智能实验室。
- 垄断程度低的行业:如衣食住行相关的制造业和零售行业,因为分散,他们有需求,但是没有足够体量和资本自己搭建 AI 团队,所以他们会将 AI 技术作为一项工具,以合理的价格采购成套服务,来实现+AI 的升级。如同当年的互联网+和 + 互联网一样,也会演化出 AI+ 和 +AI 的发展方向。
3. 企业属性视角
关于 2B 类的服务,这里提供给大家两个视角,第一个视角,从民营企业视角看 AI。第二个视角,从国营企业视角看 AI,笔者个人感觉,民营企业和国有企业在+AI 上的需求上差异性极大。
- 从民营企业视角看 AI:民营企业的核心诉求就是创造更多的价值,赚更多的钱,可以从开源和节流两个角度进行+AI。民营企业家和管理者有充足的动力去进行改革升级,只要技术是有用的,可以提升效率或压缩成本的,民营企业会积极拥抱改变。BAT 可以考虑在尽可能多民营企业家聚集的场合,推广真实高效的+AI 产品和服务。
- 从国营企业视角看 AI:国营企业即承担创造价值的责任,也同时承担着保证国有资产不流失的责任,组织内部员工多是对上级和自己的职位负责,所以创新一定要稳妥。而且国营企业有个有趣的现象,每年年底写第二年工作计划时,必须要有创新,也就是每年都要有新的创新点,但是不能太激进。国有企业的核心诉求是不犯错,未必有功,但求无过,所以如果 BAT 的产品只是专注于提升效率并不符合国有企业的中层和领导的诉求。但是,国有企业其实有大型互联网公司赋能创新的需求,这个时候需要 BAT 等 AI 企业积极主动的提供解决方案。现在的国有企业技术服务招标有一套冗长的流程,所以要想搞定这些国有企业,首先提供高效便捷的 AI 产品和服务,同时从顶层或中层得到领导支持,从执行层面为企业招标准备完善资料和陪标公司。大型的国有企业的定制化要求很高,现在用友和亚信等软件开发团队多是长期驻厂,提供运维服务和新需求开发,如果想要做垂直领域的服务,则需要 BAT 放下架子,做好持久战的准备。
七、结论
学习 AI 是当前科技发展的趋势,它不仅能够为我们提供更多的机会和挑战,还能够让我们更好地理解和应用人工智能技术。通过学习 AI,我们可以深入了解深度学习、神经网络等核心概念,并将其应用于自然语言处理、计算机视觉、语音识别等领域。同时,掌握 AI 知识还能够为我们的职业发展增添竞争力,成为未来技术领域的领导者。
对于 AI 产品经理而言,核心竞争力在于对业务场景的深刻理解以及对 AI 技术边界的清晰认知。不需要成为算法专家,但必须懂得如何用 AI 解决实际问题,如何在成本、效率和体验之间找到平衡。随着大模型技术的普及,AI 正在从工具走向基础设施,产品经理需要保持持续学习的心态,紧跟技术前沿,才能在激烈的市场竞争中立于不败之地。