前言
OpenAI 研究人员曾发文称「约 80% 美国人的工作将被 AI 影响」。研究结论指出,至少 80% 的美国劳动力会受到影响,他们的工作的 10% 会被 GPT 所替代。其中甚至有 19% 的美国劳动力的 50% 工作会被替代。
但需要注意的是,OpenAI 的研究主要针对美国职业,中国的劳动力市场与美国存在显著差异。因此,我们需要基于中国的数据来分析哪些职业的替代率最高,哪些最低。
研究方法
为了得出准确结论,我们使用中国在过去 8 年的数亿条招聘数据完成了这项研究,分析中国哪些职业最有可能被 GPT 之类的大语言模型及其衍生品替代。
任务拆解与映射
分析不同职业被 GPT 替代的可能性,需要对每种职业的职能和具体工作进行分拆。笼统地问'人力资源专员'被替代的可能性很难回答,因为太模糊。
我们可以根据招聘网站的情况,将'人力资源专员'分拆成不同的职能:
- 新员工的招聘,员工入职手续办理
- 安排以及开展新员工入职培训
- 考勤及工资绩效的核算
- 维护和拓展公司招聘渠道,协助社招及其他招聘活动
进一步分拆,把'安排以及开展新员工入职培训',可以细化为:撰写、准备培训材料;交流、沟通并安排计划时间表;演讲、培训,提升员工技能等。
我们用 Onet 的数据,将中国的职业映射到 Onet,再分拆成 19265 条工作任务和 23534 种工作内容。这么分拆下来,每一个职业拆分研究,再汇总,我们对每一个职业中有多少部分可以被 GPT 替代就有了把握。
自动化标注流程
要分析 19265 种工作任务,23534 种工作内容其中的每一种被 GPT 替代的可能性有多大,是一个非常繁重的工作。一般来说我们会让人工来打标,标注 4 万条内容,大概一个人就需要 1 周,人力成本至少 1 万元。
参考 OpenAI 的工作论文方法,我们让 GPT 来打标。使用了 GPT 的 API,让 GPT 扮演打分者。Prompt 设计如下:
你是一名'大型语言模型替代劳动力评估师'。你需要从'该任务是否能够在大语言模型帮助下,在同样时间达成同样产出或者同样效果的前提下,减少人类劳动时间的参与'的角度,给下列每一个任务打分。评分从 0 到 5 分,0 代表该任务不能通过大语言模型的帮助减少人类劳动投入,5 代表可以减少 100% 的人类劳动投入,即该任务不再需要人类劳动参与。
这段算是 API 里面 system 部分输入的内容,然后在内容部分输入具体的工作任务和工作内容,GPT 就会返回分数。一次可以输入 100 条,gpt-3.5-turbo 的返回很快。
使用 GPT 打标,成本之低令人发指。标注 4 万条内容,每次标注 100 条,只需要 400 次。使用 GPT-4 的模型,每标注 100 条,仅需要 0.12 美元。也就是说,共标注 4 万条内容,只需要耗费 48 美元。如果使用 gpt-3.5-turbo 模型,4 万条只需要耗费 3 美元。而两者的质量是几乎一样的。
人类数据标注员要完成 4 万条内容的标注,需要至少 1 万元,一星期。GPT 只需要半小时,3 美元。这再次印证了一个事实——刚刚出现没几年的全新职业——人类标注员,他们喂养出来的大型语言模型 GPT,在完成一项'GPT 能够替代哪些职业'的标注工作任务时,首先替代掉了把 GPT 训练成材的人类数据标注员自己。
分析结果
使用上述流程,我们将每一个具体工作被 GPT 替代的可能性汇总到每一个职业上。下表是招聘规模比较大的职业被 GPT 替代可能性的前 25 名和后 25 名。
高替代风险职业
AI 替代率最高的职业是翻译,其次是保险核保专业人员以及剧作家。这三个职业,有 90% 以上的工作任务和内容都暴露在 AI 替代的风险中。
接下来,视觉传达设计人员、装饰美工、美术编辑、广告设计师、剪辑师,这些与美术、视频、作图相关的职业,被 AI 替代的工作内容也超过了 80%。
文字编辑、网络编辑、文学作家、文字记者,这些与文字生成和修改高度相关的职业,被替代的工作内容也超过了 75%。
呼叫中心服务员、前厅服务员(即为宾客提供咨询、迎送、入住登记、结账等前厅服务的人员)、节目主持人、秘书……这些职业,也出现在了前 25 名中。
不过最出乎意料的可能还是排名第 25 的计算机程序设计员,平均来说,程序员有 75% 的工作内容,面临被 AI 替代的风险。
低替代风险职业
AI 替代率最低的职业主要是各种制造业相关蓝领人员。这并不意外,因为我们让 GPT 评分标注时扮演的角色就是'大型语言模型替代劳动力评估师',它自然无法评估可能被其他机器所替代的职业。
但仍然有几个制造业工人以外的人员值得注意——绿化工、保洁员、洗衣师、按摩师、美甲师、中式面点师……看起来并不需要太高学历,工资也不算最高的这些职业,反而成了最难被 AI 替代的职业。


