大模型探索产业化落地新路径
数字化智能化转型加快推进的大趋势,一方面释放了人工智能的需求空间,大模型的应用推广正在加速商业变革;另一方面,顺应了大语言模型的技术变革,在供给端改变了技术创新的应用范式,释放着新质生产力。
同时,数字经济和 AI 大模型的快速发展,也从供需两端推进宏观研究的数字化转型,带动研究变革。
因此,利用海量数据和大模型等数字科技,来窥探宏观经济发展的新脉络和新趋势,已经变得非常必要、非常紧迫。
12 月 11 日至 12 日举行的中央经济工作会议提出,要以科技创新推动产业创新,特别是以颠覆性技术和前沿技术催生新产业、新模式、新动能,发展新质生产力。我国积极支持培育发展人形机器人、生成式人工智能等未来产业,加快形成新质生产力,正是因为看到了大模型的颠覆性影响。
近年来,随着 ChatGPT 的横空出世,一轮大模型热潮涌现。此后,国内外一系列的大模型相继推出,参数规模不断扩大,训练时间不断延长,模型性能不断提升。大模型的快速进化和推广应用,将人机交互、数字化智能化转型推向了新的高度,引发了新一轮的技术变革、商业变革、研究变革。在这个全球纷纷布局抢滩,抢占人工智能发展制高点的关键时刻,讨论大模型的技术变革和发展应用,具有十分重要的意义。
一、大模型引发技术性变革
大模型是具有庞大参数和复杂结构的机器学习模型,背后是具有数百万到数千亿参数的神经网络模型,用于训练和存储的大规模计算资源和存储空间,以及作为支撑的分布式计算能力和硬件加速技术。从发展历程看,大模型发端于自然语言处理领域,通过参数规模、数据量级的持续提升,带动了模型能力的快速提高。
(一)相对于传统机器学习,大模型实现了三大突破
人工智能拥有数据、算法、算力三大要素,当前的大模型相对于逻辑回归、决策树、朴素贝叶斯等传统模型,在三个方面都实现了大突破。
一是大规模数据处理能力。 当前大模型普遍采用 Transformer 模型,不但可以处理海量数据,还可以同时处理文本、图像、音频等不同数据模态;可以理解距离较远但联系密切的词汇关系,并在不同数据类型之间建立联系和实现融合。这些让大模型可以应对更加复杂、庞大的数据集,大大提高了机器学习模型的泛化能力。
二是复杂性问题解决能力。 复杂的大型神经网络模型、多模态信息处理机制加上人工干预的反馈机制,让大模型实现了复杂性和灵活性统一,为解决更加复杂的问题提供了有力支持。
三是准确率与解释性保障能力。 更多的参数和更复杂的结构,使得大模型具备了更加智能的语言指令理解能力,可以更加准确地表达数据分布和学习到更复杂的特征,进而提高模型的准确率和解释性。例如,GPT-4 Turbo 支持高达 128k 的上下文对话长度,相当于可以一次性处理多达 300 多页文本内容的提示词,从而可以输出更加准确的信息。
(二)大模型带动人工智能蝶变,催生新技术变革
基于对数据处理、问题解决、准确性保障方面的突破,大模型正在推动以下三方面的技术变革:
一是大模型重新定义人机交互。 以前的人机交互是命令式的、用户界面式的,属于'教什么会什么',而大模型下的人机交互则是人们可以用自然语言与电脑、手机交互,属于生成式的,而且'不教也能学会'。
二是大模型重新定义营销和客服。 在大模型的支持下,企业可以为每个客户提供一个独特匹配的营销方案和客服,可以'7×24 小时'在线服务,从而在营销和客服上真正实现'千人千面'和'私人订制'。
三是大模型催生 AI 原生应用。 大模型可以帮助企业做创造性营销方案,为孩子提供一对一的辅导服务,代替人进行绘画写作等。正因如此,业界认为在大模型时代,每个产品每个行业都可以重新做一遍。
(三)大模型加速技术迭代,呈现出非线性升级趋势
大模型在技术创新、优化迭代等方面改变非常明显,大大缩短了技术升级迭代周期。
在技术迭代方面,改变了原有技术升级迭代路径。在芯片产业有一个著名的'摩尔定律':集成电路上可以容纳的晶体管数目在每经过 18 个月到 24 个月便会增加一倍。但随着大模型的快速发展,AI 模型达到人类认知水平所需时间越来越短,10 年前发布的模型达到人类水平大约需要 6 年,而大模型的迭代速度大大加快,一般仅需要 1 年。未来人工智能进步的速度将呈现出非线性或指数型增长趋势。
在技术优化方面,通用性和专业性模型双头并进。大数据、大算力、大模型推动人工智能从辨别式走向生成式,通用性与专业性模型双箭齐发。2023 年 3 月,微软研究称 GPT-4 已成为通用人工智能的一个早期版本。虽然还存在着缺陷,但是通用人工智能离我们越来越近了。同时,大模型正在快速深度融合到实体经济中去,通用性模型与产业大数据相结合推出专业性大模型,未来每一个行业都可能会拥有特定的专业性大模型。
二、大模型加速产业化落地
数字化智能化转型加快推进的大趋势,释放了大模型产业化应用空间。一方面,数字化智能化转型释放了人工智能的需求空间,大模型的实践应用快速铺开。国际咨询公司 IDC 预测,2026 年中国人工智能软件及应用市场规模将达到 211 亿美元,人工智能已经进入大规模落地应用的关键期;另一方面,大语言模型在供给端改变了技术输出方式,提高了适用性和客户体验,更易于被市场主体感知和传播。ChatGPT 推出仅两个月后,月活跃用户已经突破 1 亿,成为史上用户增长速度最快的消费级应用程序,而达到同样用户量级的应用市场(APP Store)及脸书(Facebook)则分别用了 2 年和 4 年半时间。
(一)从通用性看,大模型的基础应用场景非常广泛
大模型的通用性应用场景,在以下三方面已经得到验证:
一是自然语言处理,如机器翻译、文本生成、语言模型等。 这些任务都需要强大的语言理解和生成能力,而大模型正是具备这些能力的,如 GPT-4 可以生成更加自然和流畅的文本。
二是计算机视觉,如图像分类、目标检测、图像生成等。 大模型通过训练大规模的神经网络,可以使计算机更好地理解和处理图像信息,如 DALLE(一款人工智能图像生成模型)可以生成更加逼真和多样化的图像。
三是语音识别,如语音转文字、语音识别等。 通过训练大规模的神经网络,大模型可以使计算机更好地理解和处理语音信息,如 ChatGPT 可以进行智能和个性化的对话。这些技术的进步将为人们的生活和工作带来更加便利和高效的体验。
(二)从专业性看,大模型正在各个行业加速落地
打造专业性大模型,赋能产业发展成为重要趋势。在通用性大模型基础上,利用行业数据进行混合训练,形成具体行业的大模型,输出 MaaS 服务(模型即服务),推动商业模式创新和产品服务创新。有了专业性大模型,客户就可以推动行业性大语言模型在实际生产中投入应用,并在生产应用中推动大模型持续迭代优化。如 GPT 已经推出定制化服务,让开发者可以用自然语言对话的形式,根据自己的需求、场景等创建自己的 GPTs 应用——自动化客户服务、生成专业内容等。
在各个行业领域,大模型的探索应用积极推进。在制造业,人工智能可以与生产流程、质量控制等技术相结合,以提高制造业的生产效率和产品质量;在金融领域,人工智能可以与风险评估、投资决策等技术相结合,以提高金融机构的风险管理和投资收益;在医疗领域,人工智能可以与医疗影像、病理诊断等技术相结合,以提高疾病的诊断和治疗效果。
(三)面对自身缺陷,大模型探索产业化落地新路径
在具体的落地应用层面,大模型当前面临两个关键性问题。如何确保大模型生成内容的准确性,避免'一本正经地胡说八道',是当前大模型应用需要首先解决的一大问题。同时,还需要确保大模型知识(参数)的实时维护和基于业务逻辑的深层推理,即大模型与行业知识、业务场景深度融合。
一些科技企业探索改进方案,让大模型'从产业中来,到产业中去'。一方面,融合外部通用数据与自己的产业专有数据,以此训练产业大模型,让大模型依托供应链深入具体产业;另一方面,将产业知识注入模型,采用推理低延时策略,大幅提升推理速度和降低部署成本;此外,采用超大规模计算集群,大幅提升算力和节约推理成本。在此基础上拓展大模型应用场景,实现'边使用边优化',提高大模型在不同场景的适用性和精准度。
三、大模型推进数智化研究
数字经济和 AI 大模型的快速发展,从供需两端推进宏观研究的数字化转型。在供给端,大模型、数字科技为大数据宏观研究提供了技术支撑,大数据和人工智能的结合能够打破传统经济学研究的禁锢和枷锁。在需求端,数字经济发展需要宏观研究的数字化转型来更好把握数字经济的运行机制和发展规律,数字化时代的生产函数和产业政策需要重新审视。正因如此,利用海量数据和大模型等数字科技,来窥探宏观经济发展的新脉络和新趋势,已经变得非常必要、非常紧迫。
宏观经济研究数智化是一次全新尝试,需要新思路和新方法。一方面,积极推进大数据宏观研究,创新编制大数据消费指数,改进宏观经济研判。2019 年,我们基于大数据推出全国消费(综合区域和品类两个维度)、人口迁移的结构性分析模型,为全面研判消费变化趋势、城镇化发展提供了新的视角;2020 年,我们基于大数据识别城市返工情况、不同收入人群和不同线级城市的消费变化、'工作/闲暇时段订单数据'识别工作饱和度等,分析了新冠疫情对不同人群就业的结构性冲击,以及对消费复苏的影响;2021 年,我们又在积极探索推出大数据消费信心指数和消费升级指数,判断消费发展的变化趋势。这些大数据模型正在不断完善,未来可以用于实时分析不同地区和人群的消费行为变化、消费升级的结构性特征、各个地区的吸引力和城市群的辐射效应等。
另一方面,将宏观研究积累与 AI 模型等相结合,设计推出'AI 经济学家'。'AI 经济学家'是一款旨在实时监测经济形势和替代常规宏观经济分析人员的宏观研究数字化产品,将常规宏观数据源与异类大数据相结合,将新兴数字技术与经典的计量经济模型相结合,同时将前期宏观研究积累的数据图表与图表报告自动生成技术相结合,实现了数据整合更新、经济运行监测、经济发展预测的统一。该系统已经应用于一些城市的数字治理现代化系统,用于实时监测经济产业运行和预测未来经济走势。
大模型的加持,为宏观经济研究数智化转型提供了有力的技术支撑。随着大模型与宏观经济研究的融合范围不断拓宽、融合深度不断加深,预计未来会有越来越多的'AI 经济学家'出现,宏观经济研究的发展范式和竞争结构也将发生实质性改变。
四、未来展望
大模型技术的持续演进将深刻重塑产业格局与研究范式。随着算力成本的进一步降低和数据隐私保护技术的完善,大模型将在更多垂直领域实现深度渗透。企业应抓住机遇,构建自身的数据壁垒与模型应用能力,避免陷入同质化竞争。同时,政策制定者需关注技术伦理与安全风险,引导大模型健康有序发展。对于研究人员而言,掌握大模型工具将成为提升研究效率的关键,数智化研究将成为主流趋势。通过技术与产业的良性互动,大模型有望成为推动经济社会高质量发展的核心引擎,释放出更大的新质生产力潜能。