人工智能(AI)大模型正在重塑世界,改变我们身边的每一个人。
如今,全球范围内的科技大厂、明星独角兽及新兴大模型初创企业,都在争先恐后踏入大模型的浪潮。业内人士一直在思考:为什么是 OpenAI 打造出了震惊世界的顶级模型 ChatGPT(GPT-4)和 Sora?
事实上,除了优质的数据、充足的算力和高效的算法,断档式的技术与工程人才储备,也是 OpenAI 能够在大模型领域始终遥遥领先的资本。古语有云,得人才者得天下。在未来的某一个时间,人们憧憬的通用人工智能(AGI)、超级智能(Super Intelligence),也将由大模型人才借助更好的数据、算法、算力和知识来实现。
因此,对于 AI 领域的研究者、从业者和决策者而言,全面了解全球大模型发展现状和人才分布,意义重大。
为此,AMiner 发布了《全球十个大模型核心团队成员分析报告》,旨在为大模型领域的相关人员在今后的研究交流、人才引进提供参考。该报告结合当下模型知名度和专家建议选取了全球十个大模型(GPT、Gemini、Claude、GLM、LLaMA、Qwen、Falcon、PaLM、BERT、T5),从地域分布、年龄结构、教育背景、华人占比和学术影响力 5 个维度进行全面分析,揭示了十个大模型核心成员的人才现状。
其中,以下几个结论特别值得关注:
- 大模型核心人才整体呈年轻化趋势,968 人中有 69% 的成员年龄在 40 岁及以下。团队中以青年成员居多,因此较年轻的核心成员在 H-Index 上表现普遍较低。但仍有个别成员具有卓越的影响力,最高 H-index 达到了 103,其中有 86 人被评为'AI 2000 全球人工智能学者'。
- 华人在大模型领域具有一定竞争力,在挑选的国外(除 GLM、Qwen)大模型团队成员 899 人中,华人成员共计 167 位,占比达 18.7%。
- 十个大模型团队全部核心成员的智慧摇篮主要集中在世界著名的高校,其中加州大学系统和斯坦福大学为最主要的培养基地。清华大学为唯一一所上榜的中国高校,占居重要地位。
- 十个大模型核心成员最高学历曾在中国高校就读的 139 位中有 86 位进入国际市场,说明国际市场对中国高校教育水准的认可,以及对未来人才回归的展望。
十个大模型核心成员数量
本报告基于 AMiner 开放平台,结合当下模型知名度和专家建议选取了全球十个大模型,对其团队进行分析。本报告选择 2023 年前(包括 2023 年)十个大模型推出时发布的技术论文和相关报告(共计 22 篇)。如果该模型没有技术报告(或技术报告未罗列作者),则挑选该模型所属机构较为代表性的对应技术论文。(所选模型报告,不包含变体衍生模型技术报告)根据报告的作者在 AMiner 平台查询出的学者作为十个大模型的核心成员,共计 968 位。
其中报告覆盖最多的核心成员是来自 Google 的 Gemini 和来自 OpenAI 的 GPT 团队,分别为 417 人和 262 人。

数据来源:AMiner 开放平台
(注:因存在核心成员同时参与多个模型开发创立,故核心团队人数加总>968)
核心成员年龄分布
中国注重培养新锐力量,青年成员(小于 40 岁)占比高达 84%。
全球十个大模型核心成员的年龄分布呈现鲜明特征。当下在中国的核心成员中 40 岁及以下占比高达 84%,相较之下,美国和全球分别为 67% 和 69%。中国学者在这一年龄段的 TGI 达到显著的 122.9。
数据表明挑选的十个大模型团队 986 人中核心成员成年轻化趋势,中国核心成员更偏好集中于青年成员,表明了中国大模型团队对新兴力量的强烈关注。
在 41~55 岁年龄段中,美国主导,占比为 32%,中国占比为 16%。在大于 55 岁年龄段中,中国未有核心成员分布,美国有 9 位成员分布在这一年龄段。综合而言,大模型核心力量主要集中在年轻人才(<=40),且相较于美国,中国在大模型领域更注重挖掘和培养新兴力量。

图|中、美、全球十个大模型核心成员年龄分布
数据来源:AMiner 开放平台(注:中、美成员按照当前所在机构国家统计)
TGI =(当前国家年龄段分布占比/全球成员分布占比)× 100
核心成员的教育经历
TOP10 高校主要分布在美、英、中、印。







