12 月 6 日,当 ChatGPT 低调地庆祝它的'一周岁'生日之际,谷歌推出 Gemini 大模型,引发科技圈广泛关注。Gemini 将大模型带入原生多模态时代,不仅可以处理文本内容,还可以处理代码、音频、图像和视频等多种模态信息,是谷歌目前规模最大、能力最强的大模型。
一年前,ChatGPT 的问世,掀起人工智能的巨浪。如今,不断'涌现'的 AI 能力,正让未来变得更加未知。谁都不想错过一个时代的来临。一面是科技巨头纷纷加入,另一面是众多初创公司积极参与,试图以技术创新和市场占领赢得先机。然而随着大模型创业的逐渐升温,竞争的火焰也变得愈发炽热。在这场角逐中,资源投入巨大,无论是研发、硬件基建还是人才争夺,都成为创业公司需要克服的巨大困境。
奔腾的浪潮
一年以来,各行各业的公司都在争先恐后推出自己的'大模型',大模型创业潮如同一场狂风骤雨,让整个科技产业陷入了一片热潮,百度、阿里、华为、京东等互联网大厂重金押注,无一缺席。他们不仅投入大量的资金和资源,还积极招募人才,加强技术研发,以保持自己在人工智能领域的领先地位。在这之中,也有无数创业者奔涌而至,希望能在这个新兴的市场中抢占先机。
最新发布的《北京市人工智能行业大模型创新应用白皮书(2023 年)》显示,仅国内而言,截至 2023 年 10 月,我国拥有 10 亿参数规模以上大模型的厂商及高校院所共计 254 家,分布于 20 多个省市/地区,国内大模型总数达 238 个,'百模大战'再次升级。
面对持续火爆的'百模大战',业内也开始出现一些'冷'思考。'中国的大模型很多,但是基于大模型开发出来的 AI 原生应用却非常少。'11 月 15 日,在深圳 2023 西丽湖论坛上,百度创始人、董事长兼首席执行官李彦宏谈及国内 AI 行业现状时表示。
国内目前大模型创业企业的现状如何?目前的大模型可分为通用大模型和垂类行业大模型。通用大模型具有强大泛化能力,可在不进行微调或少量微调的情况下完成多场景任务,相当于完成了'通识教育'的 AI,ChatGPT、百度的文心一言、阿里的通义千问等都是通用大模型。
行业大模型则是利用行业知识对大模型进行微调,让 AI 完成'专业教育',以满足在能源、金融、医疗、制造、传媒等不同领域的需求。
基础大模型的技术创新,更多是大公司的角斗场,对于大多数创业公司而言,不管是算力、资金还是数据,有限的创业资源都决定了垂直行业大模型是创业者们的主战场。
旋涡中的竞争与困境
多位接受采访的业内人士认为,'数据'和'人才'是如今大模型创业公司的竞争中最重要的核心资源。
数据是推动大模型能力演进的核心'能源'。浦因科技(上海)有限公司首席科学家秦兴虎表示,不管是模型的训练还是后续对模型的进一步更新以满足其实际应用,都需要大量的数据来支撑,在模型开发的成本中,数据成本也占据了很大的比重。
从事医学垂直 AI 模型研究的英国邓迪大学博士研究员王宸禹也表示,AI 医疗行业的数据获取难度较高,成本也更大。
北京医者信息科技有限公司 CEO 刘呈辉认为,即使早期各大公司之间技术有所差距,但随着竞争到后期,技术的鸿沟被抹平,数据会成为最重要的战略资源,尤其是专业领域里的高质量私域数据,更是稀缺资源,还涉及数据资产的采集、产权、安全隐私等问题。
在秦兴虎看来,从事医疗行业大模型的开发需要既懂人工智能技术,又懂相关生物信息技术,专业性要求极高,人才争夺成了创业公司需要克服的另一个困境。'一方面是要求高,另一方面,初创公司对于人工智能人才的吸引力很多时候是不如大厂的。'
'现在国内做基座类模型的人才 90% 都出自清华,国内真正会调模型、训练模型的甚至不超过 200 个人。'刘呈辉也表示,由于行业本身的人才储备有限,加上大模型的突然'火爆',人才短缺问题显得尤为突出,如果不在高校具备一定的人才资源,创业公司连招人都会变得很困难。
脉脉高聘人才智库发布的《2023 泛人工智能人才洞察》显示,今年 1 月到 8 月,新发 AI 岗位平均月薪超 4.6 万元,人才供需比仅为 0.39,相当于 5 个岗位争夺 2 个人才。
vivo 副总裁周围接受媒体采访时曾表示,


