前言
OpenAI 研究人员曾发文称「约 80% 美国人的工作将被 AI 影响」。研究结论指出,至少 80% 的美国劳动力会受到影响,他们的工作的 10% 会被 GPT 所替代。其中甚至有 19% 的美国劳动力的 50% 工作会被替代。
基于中国过去 8 年数亿条招聘数据,结合 O*net 标准与 GPT 自动化标注技术,分析了各职业被大语言模型替代的可能性。研究发现,翻译、设计、文字创作等职业替代风险超 80%,而制造业蓝领及服务类工种风险较低。数据显示,职业的成长性(年限工资增长率)与 AI 替代率呈显著正相关,意味着依靠后天经验积累快速增值的岗位更易被 AI 取代。文章指出,AI 已超越人类通过实践积累知识的效率,建议从业者重视基础技术能力与持续学习,以适应技术变革。

OpenAI 研究人员曾发文称「约 80% 美国人的工作将被 AI 影响」。研究结论指出,至少 80% 的美国劳动力会受到影响,他们的工作的 10% 会被 GPT 所替代。其中甚至有 19% 的美国劳动力的 50% 工作会被替代。
但需要注意的是,OpenAI 的研究主要针对美国职业,中国的劳动力市场与美国存在显著差异。因此,我们需要基于中国的数据来分析哪些职业的替代率最高,哪些最低。
为了得出准确结论,我们使用中国在过去 8 年的数亿条招聘数据完成了这项研究,分析中国哪些职业最有可能被 GPT 之类的大语言模型及其衍生品替代。
分析不同职业被 GPT 替代的可能性,需要对每种职业的职能和具体工作进行分拆。笼统地问'人力资源专员'被替代的可能性很难回答,因为太模糊。
我们可以根据招聘网站的情况,将'人力资源专员'分拆成不同的职能:
进一步分拆,把'安排以及开展新员工入职培训',可以细化为:撰写、准备培训材料;交流、沟通并安排计划时间表;演讲、培训,提升员工技能等。
我们用 Onet 的数据,将中国的职业映射到 Onet,再分拆成 19265 条工作任务和 23534 种工作内容。这么分拆下来,每一个职业拆分研究,再汇总,我们对每一个职业中有多少部分可以被 GPT 替代就有了把握。
要分析 19265 种工作任务,23534 种工作内容其中的每一种被 GPT 替代的可能性有多大,是一个非常繁重的工作。一般来说我们会让人工来打标,标注 4 万条内容,大概一个人就需要 1 周,人力成本至少 1 万元。
参考 OpenAI 的工作论文方法,我们让 GPT 来打标。使用了 GPT 的 API,让 GPT 扮演打分者。Prompt 设计如下:
你是一名'大型语言模型替代劳动力评估师'。你需要从'该任务是否能够在大语言模型帮助下,在同样时间达成同样产出或者同样效果的前提下,减少人类劳动时间的参与'的角度,给下列每一个任务打分。评分从 0 到 5 分,0 代表该任务不能通过大语言模型的帮助减少人类劳动投入,5 代表可以减少 100% 的人类劳动投入,即该任务不再需要人类劳动参与。
这段算是 API 里面 system 部分输入的内容,然后在内容部分输入具体的工作任务和工作内容,GPT 就会返回分数。一次可以输入 100 条,gpt-3.5-turbo 的返回很快。
使用 GPT 打标,成本之低令人发指。标注 4 万条内容,每次标注 100 条,只需要 400 次。使用 GPT-4 的模型,每标注 100 条,仅需要 0.12 美元。也就是说,共标注 4 万条内容,只需要耗费 48 美元。如果使用 gpt-3.5-turbo 模型,4 万条只需要耗费 3 美元。而两者的质量是几乎一样的。
人类数据标注员要完成 4 万条内容的标注,需要至少 1 万元,一星期。GPT 只需要半小时,3 美元。这再次印证了一个事实——刚刚出现没几年的全新职业——人类标注员,他们喂养出来的大型语言模型 GPT,在完成一项'GPT 能够替代哪些职业'的标注工作任务时,首先替代掉了把 GPT 训练成材的人类数据标注员自己。
使用上述流程,我们将每一个具体工作被 GPT 替代的可能性汇总到每一个职业上。下表是招聘规模比较大的职业被 GPT 替代可能性的前 25 名和后 25 名。
AI 替代率最高的职业是翻译,其次是保险核保专业人员以及剧作家。这三个职业,有 90% 以上的工作任务和内容都暴露在 AI 替代的风险中。
接下来,视觉传达设计人员、装饰美工、美术编辑、广告设计师、剪辑师,这些与美术、视频、作图相关的职业,被 AI 替代的工作内容也超过了 80%。
文字编辑、网络编辑、文学作家、文字记者,这些与文字生成和修改高度相关的职业,被替代的工作内容也超过了 75%。
呼叫中心服务员、前厅服务员(即为宾客提供咨询、迎送、入住登记、结账等前厅服务的人员)、节目主持人、秘书……这些职业,也出现在了前 25 名中。
不过最出乎意料的可能还是排名第 25 的计算机程序设计员,平均来说,程序员有 75% 的工作内容,面临被 AI 替代的风险。
AI 替代率最低的职业主要是各种制造业相关蓝领人员。这并不意外,因为我们让 GPT 评分标注时扮演的角色就是'大型语言模型替代劳动力评估师',它自然无法评估可能被其他机器所替代的职业。
但仍然有几个制造业工人以外的人员值得注意——绿化工、保洁员、洗衣师、按摩师、美甲师、中式面点师……看起来并不需要太高学历,工资也不算最高的这些职业,反而成了最难被 AI 替代的职业。
在 OpenAI 的那篇工作论文中,研究者发现了稳定的正相关关系——工资越高的职业,被 GPT 们替代的可能性越高。这个趋势在年收入大于 10 万美元的职业之后才趋于相反。
但在我们的研究中,在中国,每个职业能够被 GPT 替代的程度和该职业的收入却并没有明显相关性。
但是,每个职业除了工资以外,还有一个重要的参数——成长性。
'成长性'是我们另外计算的一个数据,是使用分经验年度的招聘岗位数据,计算跨年度的经验 - 工资差异得出的。
举个例子,A 岗位,在 2018 年时,市场上对 0 年经验需求的招聘岗位平均工资为 5000 元。2019 年时,市场上对 1 年经验需求的 A 岗位招聘平均工资为 6000 元。
不难发现,2018 年 0 年经验的这批人,和 2019 年时有 1 年经验的这批人来自同一个队列。因此,6000÷5000=120%,就是同一个队列的人口,从 2018 到 2019 年,0 到 1 年经验带来的工资增长倍数。
我们算出所有年份,包括 2015 到 2016、2016 到 2017……2020 到 2021、2021 到 2022 这样 7 个 0 到 1 年的经验带来的工资增长倍数,再按照招聘人数加权求平均,就得到了 A 岗位在过去 8 年时的 0 到 1 年经验带来的工资增长倍数。
用同样的方法,我们再一次算出 1 到 2 年的工资增长倍数、2 到 3 年的工资增长倍数……8 到 9 年的工资增长倍数。将每一年的工资增长倍数连乘,就得到了这个岗位从 0 年经验到 9 年经验一共 10 年工作的工资增长倍数,将这个倍数再开九次方,就得到了这个职业的'成长性',即每增加一年工作年限,工资可能上升多少。
从业年限的工资增长率,即这个工作的'成长性',和每个职业的 AI 替代率之间存在非常显著的关系,两者之间存在正相关的显著性水平在 0.001 以下。
从趋势可以看到,每增加一年从业年限工资增长最慢,低于 8% 的职业,相对最不容易被 AI 替代的。但如果一个职业每工作一年工资增长超过 20%,被 AI 替代的可能性平均将大于 60%。
这个趋势,说明的是在本轮大语言模型和其衍生出来的相关 AI 的一个显著特征,那就是人们在一个行业上积累的经验、学到的技巧、掌握的诀窍,是被大语言模型首先替代掉的东西。
'成长性'越高的工作,越容易被替代,这说明什么呢?
第一种可能,是因为那些学习、工作后能积累更多经验,提高更快生产率的职业,本身更贵,因此更促使人们去找到能替代这些职业的 AI,给这样的 AI 产品更大的投资,因此这样更贵的劳动力就成了第一批牺牲品。
这样的说法初看有道理,但我们也能找到很多反例。最大的反例就是自动驾驶。一方面,驾驶这个技能,人们学习几个小时至多十几个小时就能掌握;另一方面,自动驾驶领域投资在人工智能行业内数一数二,但目前的效果距离全路况自动驾驶依然有很长一段距离。
反过来,一些生物、化学方面的技能,化合物寻找、蛋白质折叠,或者是在实验流程上的全自动化,这些人们需要数年专业训练才能掌握的知识,尽管资本的介入比起自动驾驶只能算九牛一毛,却已经有了非常不错的替代 AI。
从这点看,因为某职业劳动更贵——为了节省这些劳动力而更多投资 AI——更容易造出替代这些职业的 AI,这样的逻辑似乎是行不通的。
因此,我们不得不考虑第二种可能——AI 确实已经实现甚至超越了人类通过后天的实践学习知识、积累经验和诀窍的技能。
是的,有必要再强调一遍,不是单个技能,也不是一组技能,而是那种通过艰苦的学习实践来获取知识、积累经验的技能,人类已经落后于 AI。那些高成长性的职业,不管现在是否还处在安全区,出现替代 AI,也许就是这几年,甚至几个月之内的事。
到头来,那些人类孩提时期甚至出生时就已经掌握的技能,那些精巧的人类生物学本能,似乎反而是 AI 最难模仿和替代的部分。
而那些后天学习到的知识,花上好长时间学会算术、学会写作,学会画画,学会编程、学会做好看的 ppt、学会看 X 光片、学会写法律文书,学会很多种语言并且自如地交流……人类学会了各种各样以此为傲的东西,并觉得这些特征似乎使人类和其他生物产生了哲学上的差异。
但在 AI 看来,这些东西一文不值。
在现在的互联网行业,无论是大厂还是小公司,招聘人才的最核心要求是技术能力,只有自己的能力和岗位匹配的时候,你才能获得更多的工作机会。
无论做哪个行业,都是不进则退,所以一定不要忘记提升自己。尤其是技术人员一定要多注意最新的编程动向,紧跟时代的步伐,不要让时代遗忘。
为了适应未来的变化,建议关注以下几个方向的技术积累:
下面这些内容是各个应用方向都必备的基础知识,想做数据分析或者人工智能,都得先学会它们。任何高大上的东西,都是建立在原始的基础之上。打好基础,未来的路会走得更稳重。
爬虫作为一个热门的方向,不管是在自己兼职还是当成辅助技能提高工作效率,都是很不错的选择。通过爬虫技术可以将相关的内容收集起来,分析删选后得到我们真正需要的信息。
这个信息收集分析整合的工作,可应用的范畴非常的广泛,无论是生活服务、出行旅行、金融投资、各类制造业的产品市场需求等等,都能够借助爬虫技术获取更精准有效的信息加以利用。
数据分析人才缺口巨大,起薪较高。企业需要定期将冷数据从业务数据库中转移出来存储到一个专门存放历史数据的仓库里面,各部门可以根据自身业务特性对外提供统一的数据服务,这个仓库就是数据仓库。
传统的数据仓库集成处理架构是 ETL,利用 ETL 平台的能力,E=从源数据库抽取数据,L=将数据清洗、转化,T=将加工好的表以增量、全量、不同时间加载到数据仓库。
机器学习就是对计算机一部分数据进行学习,然后对另外一些数据进行预测与判断。机器学习的核心是'使用算法解析数据,从中学习,然后对新数据做出决定或预测'。
从基础的语法内容,到非常多深入的进阶知识点,了解编程语言设计,学完这里基本就了解了入门到进阶的所有的知识点。到这就基本就可以达到企业的用人要求了。
但学习编程并不是一蹴而就,而是需要长期的坚持和训练。不管是编程新手,还是需要进阶的有一定经验的程序员,都需要从中有所收获。
AI 的发展正在重塑职业格局。虽然某些高成长性的脑力劳动面临高风险,但人类独有的生物学本能和复杂环境下的适应能力依然是护城河。保持持续学习的心态,掌握核心硬技能,是应对未来不确定性的最佳策略。

微信公众号「极客日志」,在微信中扫描左侧二维码关注。展示文案:极客日志 zeeklog
使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online
生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online
基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。 在线工具,curl 转代码在线工具,online
将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online
将字符串、文件或图像转换为其 Base64 表示形式。 在线工具,Base64 文件转换器在线工具,online