转型 AI 产品经理需要掌握的硬知识、能力模型和常见 AI 概念梳理
近几年,从亚马逊、Facebook,到谷歌、微软,再到国内的 BAT,全球最具影响力的技术公司都将目光转向了人工智能(AI)。2016 年 AlphaGo 战胜李世石,把公众的目光也聚集到了人工智能。创新氛围最活跃的中国,已将人工智能定位为国家战略。2017 年 11 月 15 日,中国新一代人工智能发展规划暨重大科技项目启动会在京召开,公布我国第一批国家人工智能开放创新平台,包括:百度 - 自动驾驶人工智能开放创新平台;阿里云 - 城市大脑人工智能开放创新平台;腾讯 - 医疗影像人工智能开放创新平台;科大讯飞 - 智能语音人工智能开放创新平台。
现在中国的所有互联网公司,不论大小都在布局人工智能,似乎产品中没有人工智能的元素都不好意思找投资人。大量的科技巨头和专家预测人工智能将带来第四次革命,继农业革命、工业革命、信息革命后从底层改变我们的工作和生活。也有很多专家认为人工智能是中国超越美国的一次千载难逢的机会。
作为一个充满好奇心的产品经理,经过一段时间的学习思考,将我个人对于 AI 产品经理需要掌握的基础知识进行总结。因为 AI 产品经理是一个全新的岗位,至今没有明确的能力模型定义,本文只是将我个人的学习和思考进行汇总,将产品经理需要了解的 AI 知识进行框架梳理,将学习过程中看到的一些资料进行归纳总结,希望对想要转型 AI 产品的朋友有所帮助。
因为内容较多,将分成三个部分展开论述:第一部分,介绍 AI 产品经理能力模型,人工智能发展史及看待人工智能的几个视角,总结学习资料和方法;第二部分,介绍人工智能的常见算法,如何零基础通过 TensorFlow 实现手写数字识别;第三部分,分析 AI 产品经理在 2B 和 2C 领域的能力差异,介绍一些 AI 产品。
一、AI 产品经理能力模型
1. AI 产品经理能力模型概述
从现在的招聘市场来看,产品经理岗位已经出现大量细分,如数据产品经理、支付产品经理、ERP 产品经理、CRM 产品经理、供应链产品经理、POP 产品经理等。AI 产品经理可能将成未来的一个主流细分岗位,而且因为 AI 对应的行业不同,AI 产品经理下面将衍生出大量的细分行业 AI 产品经理。
在讨论 AI 产品经理之前,我们来看看,非 AI 产品在公司中需要面对哪些角色,而面对这些角色需要的能力模型是什么,在这个基础上我们再来讨论 AI 产品经理的能力模型。
产品经理需要每天与工程师、设计、老板、运营、市场、用户/客户、测试等部门同事沟通。AI 产品经理从对接人上来看,增加了 AI 科学家或者 AI 工程师。为了可以顺畅沟通,产品经理的知识结构必然需要增加相应的知识,以提升沟通效率,清楚产品设计边界。同时,因为 AI 产品与客户的业务结合更加的密切,所以需要对所设计产品的行业纵深理解能力。在这个基础上,我们来尝试搭建 AI 产品经理能力模型。
产品能力模型可以从人、事、知识三个角度搭建。通过上文的分析,我们可以看到,在人和事上产品经理的能力几乎没有太大变化,但是在知识层面需要进行基础储备,以提高与 AI 科学家和 AI 工程师的沟通效率。人工智能技术正处于高速发展时期,充满了不确定性,所以产品经理的认知极限一定程度上影响了产品的未来。本文将总结人工智能领域的一些基本概念,认知极限需要靠阅读最前沿的 paper 和团队的 AI 科学家/工程师多交流,行业纵深的理解需要真实的参与到业务的整个过程中学习。这就为一些非互联网领域的,有着多年细分行业工作经验的,清楚全业务流程痛点的非互联网人提供了转型机会,后面会详细论述。
2. AI 产品经理≠AI 科学家,应用实现门槛不高
提到 AI 大家第一印象可能想到的是复杂的数学公式,天书一样的算法模型,需要学习 AI 难如登天。但实际情况是,即使做一名 AI 应用开发工程师,可能也未必要需要理解那些天书一样的复杂算法。Google 的深度学习框架 TensorFlow 极大的降低了数学门槛,这个框架内置了损失函数优化方法,而 Keras(基于 TensorFlow 构建的深度学习框架)可以把一个模型代码量大大减少。
究竟能减少多少呢?我们以机器识别猫狗照片的分类器模型为例,可以通过寥寥几行代码搞定。寥寥几行代码就把一个拥有着卷积层、池层和全连接层并且使用 Adam 这个较高级优化方法的深度学习网络架构写出来了。
网上有一张图,很有意思,生动的表明了不同的人对机器学习的理解。我们的目标是成为一名合格的 AI 产品经理,而不是工程师,所以只要清楚这些技术的实现框架就可以了。只要可以清楚的描述客户需求场景,深刻理解客户诉求,并将其清晰的描述给 AI 科学家,并能听懂 AI 科学家的话就可以了,至于他们使用了什么模型,什么算法并不需要你去操心。
3. 非互联网行业转型的新机会
前文中提到了 AI 产品和服务对于垂直行业知识的要求比较严格。下面为 face++ 招聘安防类 AI 产品经理招聘要求:
- 熟悉安防视频业务逻辑,熟悉雪亮工程项目建设内容,熟悉平安城市业务建设要求,熟悉智慧交通业务需求,具备实际产品设计与研发、交付全周期经验者优先。
- 2 年以上安防行业产品设计经验,负责安防行业产品整体规划,配合公司行业发展,支撑产品行业解决方案。
- 负责安防行业的产品市场分析及竞争分析,制定相应产品策略。
- 负责安防系统平台的产品定义、平台产品导入和平台产品策略。
可以看出,传统行业中的从业者可以利用其多年经验为 AI 团队提供认知价值,所以非互联网行业的从业者完全可以通过补全上文提到的互联网产品经理相关知识,转型进入到高速增长的 AI 领域。
二、人工智能发展史
智能:以宽泛的心理能力,能够进行思考、计划、解决问题、抽象思维、理解复杂理念、快速学习和从经验中学习等操作。
人工智能:制造出智能的机器,尤其是智能的计算机程序,它能做一些以前需要人才能做的事情,这个机器或者计算机程序就叫人工智能。
人工智能有很多种的表现形式,目前在各个专业的方向,出现了很多超越人类的人工智能。比如在国际象棋上,有 IBM 的国际象棋大师 Deep Blue;围棋上有 Google 的 AlphaGo 和 AlphaZero;医学上有 IBM 的 Watson;私人助理上有苹果的 Siri,微软的 Cortana;甚至搜索引擎百度和 Google,你也可以把它看做是一个人工智能。它们都由一段段代码、一个个算法、一堆堆的数据组成。
人工智能的黄金时代(20 世纪 50~70 年代)
1950 年,一位名叫马文·明斯基 (后被人称为'人工智能之父') 的大四学生与他的同学邓恩·埃德蒙一起,建造了世界上第一台神经网络计算机。这也被看做是人工智能的一个起点。同年,被称为'计算机之父'的阿兰·图灵提出了一个举世瞩目的想法——图灵测试。按照图灵的设想:如果一台机器能够与人类开展对话而不能被辨别出机器身份,那么这台机器就具有智能。而就在这一年,图灵还大胆预言了真正具备智能机器的可行性。
1956 年,在由达特茅斯学院举办的一次会议上,计算机专家约翰·麦卡锡提出了'人工智能'一词。后来,这被人们看做是人工智能正式诞生的标志。在 1956 年的这次会议之后,人工智能迎来了属于它的第一次高潮。在这段长达十余年的时间里,计算机被广泛应用于数学和自然语言领域,用来解决代数、几何和英语问题。
人工智能的第一次低谷(20 世纪 70~80 年代)
由于科研人员在人工智能的研究中对项目难度预估不足,导致与美国国防高级研究计划署的合作计划失败,社会舆论的压力也开始慢慢压向人工智能这边,导致很多研究经费被转移到了其他项目上。当时,人工智能面临的技术瓶颈主要是三个方面:
- 计算机性能不足,导致早期很多程序无法在人工智能领域得到应用;
- 问题的复杂性,早期主要是解决特定的问题,因为特定的问题对象少,复杂性低,可一旦问题上升维度,程序立马就不堪重负了;
- 数据量严重缺失,在当时不可能找到足够大的数据库来支撑程序进行深度学习,这很容易导致机器无法读取足够量的数据进行智能化。
人工智能的繁荣期(1980 年~1987 年)
1980 年,卡内基梅隆大学为数字设备公司设计了一套名为 XCON 的'专家系统'。这是一种采用人工智能程序的系统,可以简单的理解为'知识库 + 推理机'的组合,XCON 是一套具有完整专业知识和经验的计算机智能系统。这套系统在 1986 年之前能为公司每年节省下来超过四千美元经费。在这个时期,仅专家系统产业的价值就高达 5 亿美元。
人工智能的冬天(1987 年~1993 年)
仅仅在维持了 7 年之后,这个曾经轰动一时的人工智能系统就宣告结束历史进程。80 年代末,美国国防先进研究项目局高层认为人工智能并不是'下一个浪潮',至此,人工智能再一次成为浩瀚太平洋中那一抹夕阳红。
人工智能的新春(1993~现在)
1994 年 Chinook Checkers,机器国际跳棋上超越了人类;
1997 年 Deep Blue 深蓝战胜国际象棋世界冠军;
2006 年,辛顿发表了一篇突破性的文章《A Fast Learning Algorithm for Deep Belief Nets》,这篇论文里辛顿介绍了一种成功训练多层神经网络的办法,他将这种神经网络称为深度信念网络。
2008 年卡内基梅隆大学和通用的无人驾驶汽车 CMU Boss 研发成功;
2012 年 Amazon 的仓储机器人 Kiva,减少工人在仓库中走动的频次;
2013 年,深度学习算法在语音和视觉识别上取得成功,识别率分别超过 99% 和 95%,进入感知智能时代。
2014 年计算机被当 13 岁男孩首次通过图灵测试;
2014 年没有刹车、没有方向盘,只有一个启动 Button 的 Google Car;
2016 年 AlphaGo 4:1 战胜李世石;
2017 年神秘 Master 60 盘连胜,狂扫棋坛高手。
三、看待人工智能的几个视角
人工智能领域包含大量的概念和定义,如监督学习、机器学习、强化学习、强人工智能等,最初学习的时候很容易弄混,其实很多概念是不同角度观察的结果,还有些概念是嵌套关系,现将人工智能领域的概念从不同视角进行梳理。
1. 从数据标注属性来看
非监督学习 (unsupervised learning):非监督学习学的是没有标准答案的样本。拿猫和狗的图片识别举例。算法要自己去寻找这些图片的不同特征,然后把这些图片分为两类。它实际上不知道这两类是什么,但它知道这两类各有什么特征,当再出现符合这些特征的图片时它能识别出来,这是第一类图片,那是第二类图片。
监督学习 (supervised learning):是从标记的训练数据来推断一个功能的机器学习任务。训练数据包括一套训练示例。在监督学习中,每个实例都是由一个输入对象(通常为矢量)和一个期望的输出值(也称为监督信号)组成。监督学习算法是分析该训练数据,并产生一个推断的功能,其可以用于映射出新的实例。拿猫和狗的识别来举例子。算法看一张图就告诉它,这是猫;再看一张图片,告诉它这也是猫,再看一张图,告诉它这是狗,如此往复。当它看了几十万张猫和狗的图片后,你再给它一张陌生的猫或者狗的图片,就基本能'认'出来,这是哪一种。这样的学习方法很有可能造成模型把所有答案都记了下来,但碰到新的题目又不会了的情况,这种情况叫做'过拟合'。
强化学习 (reinforcement learning):所谓强化学习就是智能系统从环境到行为映射的学习,以使奖励信号 (强化信号) 函数值最大。强化学习不同于连接主义学习中的监督学习,主要表现在教师信号上,强化学习中由环境提供的强化信号是对产生动作的好坏作一种评价 (通常为标量信号),而不是告诉强化学习系统 RLS(reinforcement learning system) 如何去产生正确的动作。由于外部环境提供的信息很少,RLS 必须靠自身的经历进行学习。通过这种方式,RLS 在行动 - 评价的环境中获得知识,改进行动方案以适应环境。在智能控制机器人及分析预测等领域有许多应用。我们小时候,看到马戏团的猴子居然会做算术题,感觉到很惊讶,这是怎么做到的呢?其实就是每次拿对了数字的时候,训练人员就给它一些食物作为奖励,这些奖励让他'知道',这么做是'对的',如果拿错了,可能就会有惩罚,这些惩罚就是要让它'知道',这样做是'错的'。
2016 年的 NIPS 会议上,吴恩达给出了一个未来 AI 方向的技术发展图,毋庸置疑,监督学习是目前成熟度最高的,可以说已经成功商用。
2. 从智能水平来看
因为好莱坞大量 AI 题材的影视作品,我们看到的大量的超人工智能,所以再来看现在的 AI 产品就感觉没那么智能。从智能水平上划分,我们可以将人工智能分为三类,弱人工智能,强人工智能,超人工智能。
弱人工智能 Artificial Narrow Intelligence (ANI):弱人工智能是擅长于单个方面的人工智能。比如有能战胜象棋世界冠军的人工智能,但是它只会下象棋,你要问它怎样更好地在硬盘上储存数据,它就不知道怎么回答你了。
强人工智能 Artificial General Intelligence (AGI):人类级别的人工智能。强人工智能是指在各方面都能和人类比肩的人工智能,人类能干的脑力活它都能干。创造强人工智能比创造弱人工智能难得多,我们现在还做不到。
超人工智能 Artificial Superintelligence (ASI):牛津哲学家,知名人工智能思想家 Nick Bostrom 把超级智能定义为'在几乎所有领域都比最聪明的人类大脑都聪明很多,包括科学创新、通识和社交技能。'超人工智能可以是各方面都比人类强一点,也可以是各方面都比人类强万亿倍的。
3. 从技术分层来看
认知:是指收集信息和解析信息来感知世界,比如图片识别、语音识别、自然语言处理等;
预测:是指通过计算,来预测行为和结果。比如广告推荐,歌曲推荐等;
决策:是指确定实现的方式和路径,比如移动路线规划、自动买卖股票等;
集成解决方案:是指人工智能和其他技术结合时,产生的多种集成解决方案,比如和汽车结合就是无人驾驶,和医疗器械结合就是手术机器人。
目前商业化比较普遍的,是认知和预测领域的应用。
4. 从技术分类来看
基础架构层:云计算、芯片、TensorFlow 等框架;
中间层:图像识别、语音识别、语义识别、机器翻译等;
应用层:智能滤镜,讲故事机器人,私人助理,搜索引擎,内容推荐,阿里鲁班等。
5. 从应用场景来看
互联网和移动互联网应用:搜索引擎、精准营销、用户画像、反欺诈
智能交通:自动驾驶、共享出行、自动物流
智能金融:银行业、保险业、证券投资(风控、反欺诈、投资决策)
智能医疗:辅助诊断、手术机器人、智能制药、辅助器官、外骨骼
智能农业:智慧农业管理系统、智慧农业设备
智能写作:写稿机器人、收集资料机器人
机器翻译:文字翻译、声音翻译、图像翻译
机器仿生:动物仿生、器官仿生
智能助理:律师助理、时间管理助理
创作艺术:编曲、写歌、绘画
p.s. 人工智能 > 机器学习 > 深度学习 > 神经网络模型 > 卷积神经网络 = 递归神经网络
四、学习资料和方法
推荐书籍
《AI 赋能:AI 重新定义产品经理》
个人感觉产品经理的这些有一个宏观的认知就可以了,核心是对业务纵深的理解,对 AI 技术边界的理解,对 AI 技术知识的框架理解(后面会介绍机器学习的常见算法及应用场景)。
在线课程
平时可以看看吴恩达教授的系列课程,都是满满的干货!建议关注 Coursera 上的 Machine Learning 和 Deep Learning Specialization 课程,这些课程系统地讲解了从线性回归到神经网络的理论基础。
读 Paper 网站
https://www.semanticscholar.org/search?q=ai&sort=relevance、google 论文
因为 AI 产品经理能力模型中很重要的一点就是拓宽认知边界,所以非常有必要读最前沿的 paper,不用纠结与算法,只看这样的算法可以做什么!
P.S. BAT 做 AI 能不能成?最大的机会在哪里?
在回答这个问题之前,我们先来看人工智能当下的发展现状,当下的人工智能是有明确边界的,有一种说法叫一秒法则,人工智能可以处理人 1 秒中可以想出答案的问题,这个问题还需要有以下几个特点:大规模,重复性,限定领域,快速反馈。从前文中人工智能发展史我们可以看到,资本在人工智能发展中扮演重要角色,而当下人工智能的特性非常适用于企业层面的效率提升,而且企业可以承担更高的采购费用,企业投资和个人消费的逻辑差异性极大,企业计算的是相对人工的长期成本差异,一个机器人 10 万元,可以持续升级并使用四年,这个成本就远低于一个工人的四年人力成本总和,而且机器人不用休息。所以我们能看到,今天的 AI 主要也是在 2B 端发力,2C 端的产品多是音响,助理等,用户付费意愿不强,或者使用场景单一,曾经看过一份报告,语音机器人的最主要交互是查询天气预报,定闹钟,听音乐,这远远达不到家用机器人的要求。
再来看 BAT 在人工智能方面有哪些优势,BAT 在人工智能的布局早早开始,百度 A(AI)B(Big data)C(Cloud) 战略,阿里腾讯也有各自云服务,大数据中心,人工智能实验室,这些大公司胜在基础架构层、数据量和资本优势上,拥有大量的人工智能科学家,可以持续优化算法,提升算法模型的准确度。
从产品对于 AI 技术准确性需求的角度来看,分成两种情况,一种是需要算法准确度需要达到 99.9999% 才能应用的产品,一种是算法准确率达到 99% 或者 95% 就可以的产品。
准确度要求极高的产品或服务。如手术机器人,自动驾驶技术,智慧交通等,这些产品和服务直接关系到人的生死,要求具有极高的准确度,需要 AI 科学家持续的优化,只有达到近乎百分之百的准确度才会商用。
准确度要求不高的产品或服务。如面部识别,语音机器人,无人机农药喷洒,艺术设计,搜索引擎,精准营销等,这些产品和服务对于精确度要求不高,因为即使不精确也不会直接造成人员伤亡。
再来从行业的垄断程度看,分为垄断程度高的行业和垄断程度低的行业。
垄断程度高的行业。行业的垄断程度越高,头部公司的体量越大,最初可能因为缺乏 AI 技术而采购技术,当技术环境成熟,BAT 和 google 这类公司开源了大量技术后,行业垄断型公司会则会搭建自己的 AI 团队,搭建自己的大数据,云计算和 AI 实验室,以运营商行业为例,资源垄断型市场,三家独大,每家都在搭建自己的大数据分析平台,也在搭建自己的人工智能实验室。
垄断程度低的行业。如衣食住行相关的制造业和零售行业,因为分散,他们有需求,但是没有足够体量和资本自己搭建 AI 团队,所以他们会将 AI 技术作为一项工具,以合理的价格采购成套服务,来实现+AI 的升级。如同当年的互联网+和 + 互联网一样,也会演化出 AI+ 和+AI 的发展方向。
通过上面的分析,我们可以绘制象限图。我认为第一象限因为 BAT 拥有科学家优势,虽然垄断程度高的企业很有钱,但是因为 BAT 有数据优势和科学家优势,在这个领域 BAT 优势明显,可以向企业提供独特的 AI 服务,提升垄断企业效率,这部分产品需要靠 AI 科学家驱动。第三象限虽然技术门槛低,垄断程度低,会出现大量小 AI 公司进入这个市场,BAT 进入这个市场拥有足够的品牌优势,因为市场需求量较大,BAT 可以考虑做开放平台,为有垂直领域的 AI 公司体统底层服务,如果自己来做,这部分服务和产品将是运营和产品来主要驱动。第二象限暂时来看不太适合进场,第四象限垄断企业会自己组建 AI 团队来做,我们能看到,手机制造这个还不算垄断的行业中,因为资本实力雄厚,各个厂家已经在组建自己的 AI 研发团队。
回答最初的问题,个人感觉 BAT 做 AI 有机会,在第一象限有合作研发的机会,在第三象限有平台或垂直服务的机会,垂直领域的知识可以通过招聘获取,垂直领域的市场拓展是最困难的,下面将从企业属性来分析这个问题。
关于 2B 类的服务,这里提供给大家两个视角,第一个视角,从民营企业视角看 AI。第二个视角,从国营企业视角看 AI,笔者个人感觉,民营企业和国有企业的在+AI 上的需求上差异性极大。
从民营企业视角看 AI。民营企业的核心诉求就是创造更多的价值,赚更多的钱,可以从开源和节流两个角度进行+AI,民营企业家和管理者有充足的动力去进行改革升级,只要技术是有用的,可以提升效率或压缩成本的,民营企业会积极拥抱改变,从吴晓波老师的激荡三十年可以看到,中国的企业家不缺乏面对变革时转型的决心和行动力。BAT 可以考虑在尽可能多民营企业家聚集的场合,推广真实高效的+AI 产品和服务,如吴晓波频道的年会,罗胖的年会等。
从国营企业视角看 AI。国营企业即承担创造价值的责任,也同时承担着保证国有资产不流失的责任,组织内部员工多是对上级和自己的职位负责,所以创新一定要稳妥,而且国营企业有个有趣的现象,每年年底写第二年工作计划时,必须要有创新,也就是每年都要有新的创新点,但是不能太激进,国有企业的核心诉求是不犯错,未必有功,但求无过,所以如果 BAT 的产品只是专注于提升效率并不符合国有企业的中层和领导的诉求。
但是,国有企业其实有大型互联网公司赋能创新的需求,这个时候需要 BAT 等 AI 企业积极主动的提供解决方案。现在的国有企业技术服务招标有一套冗长的流程,所以要想搞定这些国有企业,首先提供高效便捷的 AI 产品和服务,同时从顶层或中层得到领导支持,从执行层面为企业招标准备完善资料和陪标公司。大型的国有企业的定制化要求很高,现在用友和亚信等软件开发团队多是长期驻厂,提供运维服务和新需求开发,如果想要做垂直领域的服务,则需要 BAT 放下架子,做好持久战的准备。
五、如何转行/入门 AI 产品经理?
现在社会上大模型越来越普及了,已经有很多人都想往这里面扎,转行/入门 AI 产品经理,但是却找不到适合的方法去学习。作为一名资深码农,初入大模型时也吃了很多亏,踩了无数坑。现在我想把我的经验和知识分享给你们,帮助你们学习 AI 大模型,能够解决你们学习中的困难。
学习路径建议
大模型学习路线图,整体可以分为几个阶段:
第一阶段:从大模型系统设计入手。讲解大模型的主要方法,理解 Transformer 架构的基本原理,包括 Self-Attention 机制、Positional Encoding 等核心组件。
第二阶段:在通过大模型提示词工程从 Prompts 角度入手。更好发挥模型的作用,学习如何编写高质量的 Prompt,掌握 Few-Shot Learning 和 Chain of Thought 技巧。
第三阶段:大模型平台应用开发。借助阿里云 PAI 平台构建电商领域虚拟试衣系统,了解云原生部署和 API 调用流程。
第四阶段:大模型知识库应用开发。以 LangChain 框架为例,构建物流行业咨询智能问答系统,掌握 RAG(检索增强生成)技术。
第五阶段:大模型微调开发。借助以大健康、新零售、新媒体领域构建适合当前领域大模型,学习 LoRA、P-Tuning 等参数高效微调方法。
第六阶段:以 SD 多模态大模型为主。搭建了文生图小程序案例,理解扩散模型的基本原理和应用场景。
第七阶段:以大模型平台应用与开发为主。通过星火大模型,文心大模型等成熟大模型构建大模型行业应用,完成端到端的落地实践。
学习资源推荐
作为一名热心肠的互联网老兵,我决定把宝贵的 AI 知识分享给大家。至于能学习到多少就看你的学习毅力和能力了。我已将重要的 AI 大模型资料包括 AI 大模型入门学习思维导图、精品 AI 大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
建议重点关注以下方向:
- 数学基础:线性代数、概率论、微积分,这是理解算法的基石。
- 编程能力:熟练掌握 Python,熟悉 PyTorch 或 TensorFlow 框架。
- 业务理解:深入理解所在行业的业务流程,思考 AI 如何降本增效。
- 持续学习:关注 Arxiv 最新论文,参加技术社区活动,保持对新技术的敏感度。
通过系统的学习和实践,相信各位都能顺利转型为优秀的 AI 产品经理。