当养老遇上 AI 大模型:ATEC 2023 科技助老赛题解析
引言
大模型技术的落地应用,往往始于对真实场景的深刻洞察。在大模型发展的初期阶段,研发与产品边界模糊,程序员群体既是技术实现者也是产品定义者。这种双重身份使得他们对 AI 大模型究竟能解决什么问题、如何解决某个问题有着独特的思考,从而在一定程度上刻画了第一批大模型落地应用的模样。
基于这一背景,由中国电子学会主办、ATEC 前沿科技探索社区承办的第四届 ATEC 科技精英赛(ATEC2023),将镜头聚焦在了程序员与大模型技术的对话上,探索如何利用大模型技术解决现实生活中的实际难题,特别是'科技助老'这一社会痛点。
上周,ATEC 2023 的比赛内容以真人综艺节目《燃烧吧!天才程序员》的形式播出,让观众在 48 小时的直播中观看了青年一代程序员应用大模型思考应用解法的真实工作情况,在各大网络平台上引起了广泛关注。
从赛题的内容设置来看,ATEC 2023 一反常规,在评测程序员的大模型解法时,不是基于现有的学术界制定的性能评测榜单,如 C-Eval 等,而是从真实世界的用户体验出发,围绕老人用支付宝在生活缴费、医疗服务、红包社交等场景中的问题,直接向程序员发起挑战。这也是国内首个围绕大模型如何解决真实社会难题的程序员比赛。
01. 48 小时的大模型极限挑战
4 月 21 日晚,国内首个基于真实场景的大模型全链路应用竞赛——ATEC 2023 的最后一轮比赛结束。通过多轮线上赛、线下赛的比拼与评委的层层筛选,最终角逐出一支冠军队伍。团队成员分别是毕业于哈尔滨工业大学 (深圳) 电子与通信工程专业的周青松,东南大学软件工程专业硕士在读的吴东冬,华中科技大学软件工程专业硕士在读的'最年少选手'邱晨浩,以及华中科技大学网络空间安全专业硕士在读的王浩宇。
ATEC 2023 的线下比赛是一个「48 小时大模型极限挑战」,进入线下赛的 16 名选手面对直播镜头的全程记录,使用由赛事提供的近 50 张 A100 卡的资源实战,最终胜出者能获得 100 万元奖金。
作为国内程序员与在校大学生首选的一线赛事,这已经是 ATEC 科技精英赛连续举办的第四个年头了。与传统的技术竞赛不同,ATEC 通过紧扣社会价值的命题设计,搭建模拟真实工作环境的比赛环境,旨在考察选手及其团队成员间的综合性问题解决能力。这种赛制设计不仅考验参赛者的专业技能,也锻炼了他们的团队合作和现场应变能力,为应用型技术人才的培养提供了实践平台。
ATEC 一直倡导紧贴当下技术发展趋势和产业实际需求命题,以反映真实工业场景中的挑战。选手们在参赛过程中所面临的技术难题和解决方案,正是工业界中亟待解决的技术或产品痛点。
围绕真实场景和数据设计考点,ATEC 还为产业界提供了一个观察和选拔人才的机会。在前三届,线下赛的命题分别为「野生动物保护」、「科技反诈」与「科技助实」。通过运营《燃烧吧!天才程序员》这一业内首档代码竞技真人秀,ATEC 科技社区全景展现了比赛过程中青年科技选手间的竞争与合作、挑战与反击,真实地呈现了中国年轻一代科技从业者的面貌。
刚刚结束的 ATEC 2023 则首次围绕大模型技术,以「科技助老」为题,基于真实场景和数据,使用清华大学计算机科学与技术系与智谱华章公司共同研发的千亿参数多模态大模型 GLM,并采用全链路应用的考察形式,对选手的算法及工程实现能力提出了更高的要求。
比赛由中国电子学会主办,ATEC 前沿科技社区承办,清华大学、浙江大学、西安交通大学、上海交通大学、蚂蚁集团共同协办,包括北京大学、南京大学、新加坡南洋理工大学在内的 12 所高校参与合作。
作为本届赛事的命题方之一,清华大学全程参与了线上赛、答辩、线下赛阶段的命题及组织工作。
评审组负责人、清华大学副教授任炬在赛后指出:'我们希望用贴近真实工业场景的考察方式,鼓励技术从业者和学习者脚踏实地,关注实践应用、拒绝空中楼阁;每年会锚定一个具有社会价值的命题,提醒所有的行业同侪,技术应当造福社会;同时借助科技竞技、甚至极限挑战的形式,培养青年科技人坚忍不拔、勇于奋进的态度和面貌。'
比赛吸引了行业内众多年轻有为的高手,赛事报名人数创下了历史新高,一共有 1901 支队伍、3000 余位选手报名,并且超过 51% 的报名者来自 211 及以上院校。选手们来自清华大学、北京大学、中国科学技术大学、华中科技大学、中山大学、哈尔滨工业大学等高校,平均年龄只有 26 岁。
经过「大模型的知识引入」、「大模型的工具学习」、「AI 新闻检测」、「网络安全大模型」这四个赛道长达三个月的线上淘汰赛后,最终有 16 支队伍从千人竞技中脱颖而出,成功杀入线下赛环节。
线下赛赛题贴近工业真实,清华大学与蚂蚁集团围绕「科技助老」来联合命题,从「生活助老」、「智慧医疗」、「安全守护」三大板块展开,选手们需要依托大模型技术,为银发族开发一套能够提供服务多方面养老需求的智能助理。
具体而言,这 16 支队伍需要基于支付宝智能助理的真实场景,以老年人在支付宝上常用的生活类场景为例(生活缴费、医疗服务、红包社交等),去探索如何借助大模型提供的自然语言交互的方式,使得老年人无需学习繁琐的 App 操作方式,即可便捷地完成想要的操作。
在综合性的考察下,选手们需要在 48 小时的极限直播中通过大模型技术破解老年人异地就医所遇到的一系列现实问题。
冠军团队中的周青松认为,本届比赛「科技助老」的主题很有实用价值,能降低智能工具的学习门槛,帮助老年人及其他存在学习障碍的人群,借助 AI 大模型的帮助,以简单的对话就能办理业务。
02. 当养老乘上 Agent 快车
为什么本届 ATEC 会聚焦「科技助老」呢?
ATEC 出题人、蚂蚁集团基础智能部技术总监张志强告诉媒体,人口老龄化已经成为当前国家人口变化发展趋势的重要主题。一方面技术日新月异给银发族带来了科技鸿沟,另一方面,城市与农村地区人口分布不均衡带来了失养难题,生活需求、医疗需求、安全保障需求,已经成为满足银发族养老需求、改善养老环境的三大重要命题。


