2024 年 6 月 6 日,中国计算机学会大模型论坛(CCF FoLM)主题会议在北京清华科技园科技大厦举办。本次会议主题为'大模型技术进展与挑战',各位专家围绕大模型技术的前沿动态、发展趋势及技术挑战等议题展开深入探讨。
CCF 大模型论坛于今年 3 月正式成立,由腾讯、中国移动、三六零集团、海光信息、智谱 AI、第四范式、稀宇科技、并行科技、无问芯穹、瑞莱智慧科技、生数科技、清程极智、麦伽智能、面壁智能、聆心智能共同发起,旨在建设专注于大模型研究与应用的领先智库和高效交流平台,促成国内大模型的生态合力,共同推进大模型技术的前沿发展和应用。


本次会议上午部分由 CCF 大模型论坛学术秘书、复旦大学邱锡鹏教授主持,下午部分由 CCF 大模型论坛学术秘书、清华大学东昱晓教授主持。
CCF 杰出会员、常务理事、CCF 大模型论坛副主席、中国人民大学人工智能学院院长文继荣教授作开幕式致辞。
智谱 AI GLM 技术团队研究员顾晓韬、清华大学长聘教授、国家杰青黄民烈、华为语音语义首席科学家刘群、复旦大学计算机学院教授邱锡鹏、阿布扎比技术创新研究所研究员 Quentin Malartic、清华大学电子工程系长聘教授、系主任汪玉、清华大学计算机系长聘教授、清华大学计算机系高性能所副所长翟季冬、清华大学计算机系博世 AI 教授、清华大学人工智能研究院副院长朱军、哈尔滨工业大学计算学部长聘教授,人工智能研究院副院长车万翔等大模型领域专家学者受邀出席并做主题报告。(按姓名拼音首字母排序)
来自阿布扎比技术创新研究所的 Quentin Malartic 博士发表了主题报告《The Falcon Series of Open Language Models》,他主要讲解了 Falcon 模型的研究进展,包括数据处理、训练分解、模型架构,以及如何去构建对话树来进行研究。他还介绍了对于 Falcon 模型的评价细节,以及视觉语言模型的情况。

CCF 大模型论坛常委会员、清华大学黄民烈教授围绕大语言模型尤其是中文大语言模型的对齐和超级对齐问题,阐述了其在弱到强泛化(weak-to-strong generalization)、规模化监督(scalable oversight)、精确对齐、黑盒对齐、模型权重外插、自动红队测试等方面的工作。

清华大学汪玉教授的报告聚焦于大模型时代下软硬件系统方面的关键挑战和发展现状,向参会嘉宾们介绍了面向 AI 2.0 的高能效电路与系统设计方法,包括从算法模型优化到硬件架构设计的一系列软硬件协同优化策略。在报告中,他还简要介绍了 AI 2.0 时代算力生态建设的初步探索,并对未来发展趋势进行展望。











