跳到主要内容 AI 大模型在各国政务领域应用深度研究报告 | 极客日志
Python AI 算法
AI 大模型在各国政务领域应用深度研究报告 AI 大模型正推动全球数字政府改革,18 个国家已将其应用于政务管理,覆盖内部办公、信息公开、服务交互等五大领域。各国通过临时指南规范使用,重点关注隐私安全、偏见歧视及技术依赖风险,并采取订阅付费、定制化部署等方式推进。我国政务大模型应用处于起步阶段,多家厂商布局,重点在热线、客服及城市管理场景落地。未来需平衡风险收益,强化技术与场景融合,推动生态建立及高质量数据供给。
SparkGeek 发布于 2025/2/6 更新于 2026/4/21 3 浏览当前,生成式人工智能大模型成为各行各业关注重点和热议话题。以 ChatGPT、Bard 为代表的大模型是人工智能技术的一次飞跃,代表着 AI 技术从感知世界、理解世界向创造世界的跃迁。政务领域涉及大量内容生产及人与人交互环节,与生成式 AI 大模型高度的信息收集、文本总结、智能交互能力契合度较高,是未来生成式 AI 大模型应用的肥沃土壤。
自大模型工具出现以来,全球各国纷纷探索新技术在政府治理中的应用可能,推动形成一波以智能化为主要特征的数字政府改革浪潮。从应用广度看,大模型在政务领域的应用探索已较为普遍,包括美国、英国、澳大利亚、加拿大、新加坡、日本、韩国在内的 18 个国家或地区已将大模型应用在政府事务管理中,场景覆盖政府内部办公、政务信息公开、政务服务提供、民生服务优化和国防航天等 5 大领域 13 个细分场景。
从应用深度看,部分国家在政务领域的大模型认知率、利用率达到较高水平,罗兰贝格咨询公司预计,在充分应用的前提下,预计大模型将推动公共服务行业降低 1.8% 的经营成本。
从部署推进看,新加坡、日本、美国等实践较为靠前,已推动地方分散探索向集成应用转变,在部署方式、数据处理等方面做出统筹安排。为用好大模型技术这把'双刃剑',各国积极推动组织、人才、技术等变革以适应新的治理挑战,同时加快政务领域大模型应用规范。
2023 年以来,韩国、新加坡、美国、英国、澳大利亚、新西兰、日本、加拿大、丹麦等 9 个国家相继出台政府机关(公务员)使用生成式 AI 的临时指南,通过明确使用原则、框定场景范围、建立监管规范等规避技术风险,推动应用趋向合规。但由于技术尚处于快速发展阶段,治理政策的模糊性仍然存在:一方面尚未形成有关政府应用人工智能技术的完善风险治理框架;另一方面,场景分类分级和全流程监管规范较为粗糙,无法实现新技术应用行为的全覆盖。
我国政务领域大模型应用尚处于起步探索阶段。
经梳理统计,国内至少有 56 家大模型厂商在政务领域开展了布局,其中,百度、智谱华章、科大讯飞、商汤科技、中国科学院自动化研究所、阿里云、360 和昆仑万维等 15 家厂商的大模型产品通过备案。
北京、上海、杭州、深圳等地出台政策推动政务领域大模型应用落地,政务热线、智能客服、城市治理、医疗、教育是重点落地方向。
随着生成式 AI 大模型的快速发展,预计未来相关技术将广泛应用于各地智慧城市建设、政务服务提供中,成为推动新一轮治理变革的强大力量。政府机构需要强化前瞻部署,主动应对新技术变革带来的机遇和挑战,从战略、业务、组织、风险多个层面对大模型技术形成充分认知,加快探索适合我国的政务大模型开发和应用可行路径,加速政府治理现代化。
一、AI 大模型带来政府治理变革新机遇
当前,人工智能领域科技创新异常活跃,日益成为改变世界竞争格局的重要力量。一批里程碑意义的前沿成果陆续突破,以 ChatGPT 为代表的大模型技术引发通用人工智能新一轮发展热潮。凭借强智能性、强通用性、强交互性优势,大模型与交通、医疗、工业等传统行业深入融合,成为进一步推动产业发展和治理变革的关键力量。
在工业领域,大模型实现汽车、建模等设计的自动优化,通过物流、安防实现智能化管理;在医疗领域,大模型实现蛋白分子的结构预测,辅助医生影像读片与分析病例报告,推出 AI 陪护与交互式心理咨询;
在金融领域,大模型催生了数字员工,借助 AI 客服、AI 投资顾问、AI 财务实现服务的自动化,并进一步优化投资管理与风险管理。
政务领域涉及大量内容生产及人与人交互环节,与生成式 AI 高度的信息收集、文本总结、智能交互能力重叠较高,是未来大模型应用的肥沃土壤。一方面,政府应用人工智能技术具备良好基础。
IDC 数据显示,2022 年中国人工智能政府行业应用渗透度为 52%,仅次于互联网行业(83%)和金融行业(62%)。据国家发展改革委官方披露,我国政府数据资源占全国数据资源的比重超过 3/4,将为大模型训练和持续更迭提供丰富的基础燃料。另一方面,随着数字政府建设深入,政务服务的普惠化便利化水平不断提升,线上线下服务量随之激增,迫切需要运用新的技术手段解决政府回应能力不足问题。以 12345 政务服务热线为例,2020-2022 年北京市受理群众热线反映分别为 1104、1485、7592 万件,三年增长 588%,其中,简单的咨询答复类热线 2022 年占比达 88%。利用生成式 AI 智能交互、文档制作等核心能力,能大幅缓解超大城市热线咨询激增带来的服务压力。
AIGC 时代数字政府建设也将面临新的变革机遇。
其一,改变现有人机互动模式,推动'互联网 + 政务服务'向'智能 + 政务服务'演进升级。在服务需求端,通过拟人化交流、类人化互动,大模型能够增强问询系统对用户自然语言和问询上下文的理解能力,自动精准抽取用户需求,提高回复准确性和办事成功率;在服务供给端,能够实现对服务引导、咨询等重复性工作的取代或智能辅助,大规模替代和优化政务服务前端人力劳动,减轻服务压力。
其二,革新内容生产方式,实现会议记录、文书撰写等部分行政活动的自动化替代,消解不必要的行政负担,让政府人员尤其是基层人员从'繁文缛节'中解放出来,投入到前瞻性、全局性、创新性的工作之中,更多地扮演回应复杂问题的综合协调者和最终决断者。
其三,形成'模型即服务(MaaS)'的新型服务形态,与传统的 IaaS(基础设施即服务)、PaaS(平台即服务)、SaaS(应用即服务)一起成为政务云平台的构成要素,共同为'一网通办''一网统管''一网协同'等上层政务应用系统赋能,改变现有数字政府建设格局。
二、全球掀起政务领域大模型应用浪潮
(一)探索推进较快,应用前景广阔
自以 ChatGPT 为代表的大模型工具出现以来,全球各国纷纷探索新技术在政府治理中的应用可能,推动形成新的一波以智能化为主要特征的数字政府改革浪潮。
相关免费在线工具 加密/解密文本 使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online
RSA密钥对生成器 生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online
Mermaid 预览与可视化编辑 基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online
curl 转代码 解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。 在线工具,curl 转代码在线工具,online
Base64 字符串编码/解码 将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online
Base64 文件转换器 将字符串、文件或图像转换为其 Base64 表示形式。 在线工具,Base64 文件转换器在线工具,online
从应用广度看,生成式 AI 大模型在政务领域的应用探索已较为普遍。截至 2023 年 10 月,已有美国、葡萄牙、英国、爱尔兰、丹麦、澳大利亚、加拿大、阿联酋、卡塔尔、以色列、新加坡、日本、韩国、印度、马来西亚、柬埔寨等 18 个国家或地区将大模型应用在政府事务管理中。在应用层级上,既包括当地中央政府部门,也包括地方机构,如美国联邦政府机构总务管理局、华盛顿州政府、波士顿市等同步推进大模型技术应用,日本中央政府部门农林水产省、一级行政区划东京都、地方政府横须贺市等也均在政府办公中使用 ChatGPT 等大模型工具。在应用场景上,覆盖了文本生成、服务提供、决策分析到科研创新等多类场景,大模型作为辅助工具融入到政府活动的方方面面。此外,也有个别地区或部门出于数据安全风险等原因颁布指令,有期限地禁止公务人员使用大模型工具,如美国环保局、缅因州政府等。
从应用深度看,大模型在政务领域的认知率、利用率达较高水平,应用前景广阔。人工智能研究公司 Goatman 发布的调研数据显示,50% 以上的日本都道府县政府在使用 ChatGPT。
日本野村综合研究所开展的网络问卷调查显示,政府部门对 ChatGPT 的利用率达 17.5%,仅次于信息通信业(32.8%)和制造业(19.2%)。针对加拿大公共服务部门 1320 名公务员的调查显示,11% 的公务员在工作中使用过 ChatGPT、Bard 等 AI 大模型工具。著名管理咨询公司罗兰贝格(Roland Berger)预计,生成式人工智能大模型落地的第二波就是教育、通信、公共服务等行业,这些行业虽然信息化投入相对较少,但生成式人工智能技术带来的价值空间广阔。在充分应用的前提下,预计大模型将推动公共服务行业降低 1.8% 的经营成本。
从部署推进看,新加坡、日本、美国等实践较为靠前,已推动各地分散探索向集成应用转变。部分国家深刻认识到大模型技术对政府治理的变革性影响及其突出的安全风险隐患,开始尝试在部署方式、数据处理等方面做出统筹安排,以提升政府对新技术的集成应用能力。
日本数字厅与微软合作,在政府数据中心设置 AI 大模型产品使用的高处理能力设备,以处理政府机密信息;新加坡设置 AI 创新沙盒,为公共部门提供预训练的生成式人工智能模型和初级代码开发工具。部分大模型厂商适应政府集成应用需要,提供面向政府侧的定制化服务能力。
微软先后和美国、日本政府达成合作,向其提供通过微软 Azure 智能云平台调用 ChatGPT 的服务;埃森哲发布专供美国联邦政府机构使用的 FedGPT;韩国互联网巨头 NAVER 为阿拉伯国家等提供符合其文化背景 AI 大模型。
从各国(地区)实践看,大模型技术已在政府内部办公、政务信息公开、政务服务提供、民生服务优化和国防航天等 5 大领域 13 个细分场景落地。应用场景从政府内部扩展至对外服务及治理,从简单办公延伸至智慧民生建设,且部分场景取得了良好应用成效。
基于庞大的训练数据,大模型可根据提示瞬间收集大量信息,深度学习算法还可使大模型对信息进行分类和聚类,实现对分散信息的组织和总结,为公务人员提供匹配度高、整合度高的信息,成为公务员的'智能问询助手'。具体来看,公务人员可使用大语言模型等工具开展资讯收集、政策研究、招投标标准了解等方面的知识检索。例如,爱尔兰农业部利用 ChatGPT 检索处理技术和软件有关问题。英国、韩国和澳大利亚推荐其政府工作人员在政策调研、信息收集中使用 ChatGPT 等工具。
日本横须贺市公务员使用 ChatGPT 检索信息,以获得业务灵感和政策建议。调查结果显示,横须贺市政府中 30.4% 的公务员将 ChatGPT 应用于知识检索,是使用占比最高的场景;54.3% 的公务员认为,知识检索功能为其提供了传统方法无法提供的信息和创意。
横须贺市还利用 ChatGPT 开发并上线了面向其他政府部门的问答系统,以供其他城市查询和了解本市政府 ChatGPT 的使用情况。
日本千叶县开展的生成式人工智能应用调查结果显示,约 70% 的公务人员认为使用 ChatGPT 等大模型工具能提高其业务效率,其中,九成的公务人员认为,效率提高最明显的场景是创建 VBA 和编程代码知识。
政府公文写作是内部事务中任务量大、机械性高、有'模板'可循的事项之一。大模型及其衍生产品在经过高质量语料库训练后,能胜任内容校对、资料整合、摘要总结等任务,还能按照指定框架、指定模板输出文本信息。将大模型工具应用于政府公文写作中,能将公务员从繁复的文案工作中解放出来,使其更加投入到创造性的工作中。目前,大模型已被用于政府简报、报告、会议纪要、邮件等各类应用型文书写作中。例如,新加坡开源科技部开发 Pair 公务员文书写作系统,可在几秒钟内整理大量咨询,撰写电邮及政府报告初稿,再辅以工作人员修改。数据显示,在试运行阶段,Pair 系统服务了 100 余个政府机构的超 11000 名用户,周活跃用户超 4500 名。美国众议院将 ChatGPT 主要应用于内部办公中创建和总结文本内容,包括总结演讲信息、撰写政策文件及法案草稿等。日本政府与微软达成协议,微软将为日本数字厅等部门提供大模型工具,主要用于统计分析政府数据、提供政府官员对议会质询的答复草稿等场景。此外,日本横须贺市和东京都、中国台湾省花莲县、柬埔寨数字政府委员会等地区或部门均已将 ChatGPT 应用至政府内部文书准备中。
区别于面向政府内部公务人员的场景应用,大模型应用于政务信息公开是指借助大模型类工具,面向群众输出政府意图或信息。此领域的应用不仅依托于大模型的自然语言处理能力,大模型所具备的多语言、多模态能力也有助于政府扩大信息受众范围、丰富信息公开形态。此外,大模型类工具能根据指定语气和风格输出内容,可帮助政府转化为群众站位,输出符合群众需求且简明易懂的信息,提高政务信息群众接受度和理解度。目前,大模型在撰写公开新闻稿件、政策文件简化改写、生成政府宣传物料三类细分场景中得到有效应用。
例如,2023 年 4 月 18 日,日本横须贺市政府官网发布题为《地方政府尚属首次!横须贺市政府开始在全市范围内演示 ChatGPT 的使用》的公开新闻,且在新闻内容中明示'该新闻由 ChatGPT 撰写,工作人员仅进行部分校对与润色'。中国台湾省花莲县使用新闻科专属封闭资料库对 ChatGPT 进行微调,用以产出活动类新闻稿,每篇新闻稿撰写节省时间约为 15 分钟。美国众议院数字服务团队称,ChatGPT 将在众议院中应用于生成选民回应草案和新闻文件。
例如,日本农林水产省使用 ChatGPT 更新监管文件,该机构每年需修订上千页监管文件,ChatGPT 的引入大幅降低了文件修订的负担。该机构还使用 ChatGPT 简化补贴申请等在线操作指南,以帮助群众顺利完成业务申请。福岛县政府将 ChatGPT 运用于创建县计划的摘要和儿童版本。美国波士顿政府将简化文本写作、多语种文本写作作为大模型技术的推荐使用场景,以进政府信息面向不同年龄、不同受教育水平、不同语言的人群的公开。
例如,日本北海道当别町、神奈川县横须贺市等地使用 ChatGPT 制作政府宣传文案。茨城县将 ChatGPT 融入县政府认证的虚拟旅游网络达人'井原日和'中,增强群众与虚拟人互动的乐趣,提升该县旅游吸引力。美国众议院使用 ChatGPT 为政府品牌宣传生成 Logo 图案。波士顿还将政府宣传海报、视频、歌曲等的制作作为推荐使用案例。
大模型类人化的对话交互能力可重塑政府为用户提供服务咨询和业务办理的模式,已有实践主要体现为政务服务问询系统的优化升级上。问询系统是政府为群众和企业提供服务最前端、最重要的环节,传统政务问询系统仅支持'一问一答',需要用户使用特定词汇或专业性语言触发回复,且回复宽泛、办事指引不够直接精准。大模型技术与政务问询系统结合,能够提高问询系统对用户自然语言和问询上下文的理解能力,自动精准抽取用户需求,提高回复准确性和办事成功率。多轮对话交互还能助力政务问询系统实现业务办理全程引导和协助,打造'对话即服务''平台即助理'等政务服务提供模式。
目前,大模型技术已在问询系统中的政务热线电话、政府门户网站问答机器人以及专业领域政务知识问答系统等三类细分场景落地。
例如,韩国首尔市 120 茶山呼叫中心计划将 ChatGPT 应用于其城市咨询热线中,推动违规信息举报、信访处理和咨询等事务的全自动化。葡萄牙政府正在测试基于 ChatGPT 的新人工智能系统,用于 112 政府紧急热线的接听答复、问题评估、工单派发等环节,以期缩短电话响应时间,提高接通率。
例如,阿联酋迪拜水电局将 ChatGPT 嵌入到聊天机器人中,为用户提供 7×24 的服务支持,可提供账单查询、停机更新和服务请求等业务咨询。卡塔尔通信和信息技术部将 GPT 技术嵌入到国家政府门户网站 Hukoomi 中,以改善用户体验,提高服务效率。阿联酋电信和数字政府监管局在政府网站中使用 ChatGPT 为中小企业提供网站域名推荐服务,企业可通过对经营业务的描述获取以'.ae'为后缀的阿拉伯语或英文域名。阿联酋国家政府门户网站也将 ChatGPT 嵌入到其问询系统 U-ASK 中。新加坡政府科技局基于政府文档资料形成知识库并链接至谷歌和微软提供的大语言模型上,已将 21 个政务服务聊天机器人转化至大语言模型驱动的引擎上。
此前工作人员必须手动开发多达 10 到 15 种不同的提问方式来触发同一问题的关键词,而借助大模型的自然语言处理和人类反馈强化学习能力,此过程得以简化,节省了训练、维护和更新聊天机器人所需的人力和时间。
该部门计划于 2023 年底将所有政府聊天机器人转移至大语言模型驱动的引擎上。马来西亚科技创新部称,正在将 ChatGPT 嵌入政府服务中,以处理公众咨询。美国纽约市政府通过推出 MyCity 门户网站,将 AI 技术应用于帮助家庭获取儿童看护服务,并推出首个 AI 聊天机器人试点项目,帮助企业主和创业者更便捷获取纽约市政府网站信息。
专栏 1:迪拜水电局借助 ChatGPT 提升虚拟人工智能员工 Rammas 的技能
2023 年 2 月,迪拜水电局子公司 Moro Hub 与微软合作,宣布将使用 ChatGPT 技术增强服务,对原有虚拟人工智能员工 Rammas 进行升级改造,迪拜水电局由此成为全球首个使用大模型技术的政府部门。
与 ChatGPT 集成后,一方面,Rammas 数据学习、理解分析客户询问的能力得到提升,能更为及时准确地响应用户需求;另一方面,在大模型加持下,Rammas 还能根据用户的使用行为习惯和偏好,为其提供定制化的答案。此外,它还能分析数据,如传感器、电表和天气预报等,为水电局的运营提供基于数据驱动的建议。
数据显示,自 2023 年 4 月底到 2023 年 6 月末,ChatGPT 支撑下的 Rammas 回复了 32084 个查询,客户满意度达 90%。随着 ChatGPT 在政务咨询系统的应用成功,迪拜水电局将在更多的服务提供中利用大模型技术,助力其数字化转型。
例如,印度电子信息技术部基于印度政府文件和当地常用 12 种语言对 ChatGPT 进行训练,同时接入语音识别软件,将 ChatGPT 嵌入到聊天软件 WhatsAPP 中,为不同语言背景、文化水平较低的农民、低收入者等弱势群体提供政府补贴支持相关政策和项目查询。葡萄牙政府利用大模型技术辅以法律专业知识训练,开发司法领域知识问答指南项目,向公民提供关于司法诉讼程序、证件办理程序等相关咨询服务。新加坡政府科技局将大模型技术引入 SupportGoWhere 政府援助申请网站中,居民可直接通过情况描述获得可申请的援助项目信息。
大模型在教育、医疗等民生领域中有着优异表现。OpenAI 官方称,ChatGPT-4 在 SAT 美国大学入学考试中数学成绩超越了 89% 的人类考生。ChatGPT-4 和 Med-PaLM 2(谷歌开发的医疗大语言模型)均通过了美国执业医师资格考试。目前,多地政府将大模型技术用于优化教育、医疗、就业等三方面的民生服务。
例如,台湾地区教育事务主管部门借助大模型技术和语音识别合成技术,开发 CoolE Bot 主题情景式英语聊天机器人,用于中小学生英语口语教学。台北市在其线上教育平台'酷客云'中利用 ChatGPT 开发了自动出题系统和 AI 助教老师,以降低教师负担、跟踪学生线上学习状态。台南市利 ChatGPT 研发出生成式 AI 辅助学习中介平台,具备提问引导教学、过滤不当信息、分析记录学习历程、即时诊断学习效果等功能,用以辅助师生进行编程、英语、文艺创作等相关学科的教学。印度政府使用全国教师平台 DIKSHA 的课程储存库对 ChatGPT 进行训练,再结合在线翻译软件为学生打造本地语言课程知识获取平台,以促进地方教育民主化。
例如,美国卫生与公共服务部艾滋病防控网站(HIV.gov)利用大语言模型处理分析来自疾病控制与预防中心的数据信息以辅助决策。新加坡卫生部直属卫生信息系统公司新联科技 Synapxe 借助微软 Azure 云中的 GPT 工具,开发面向医疗保健人员的专业 GPT 平台,为患者用户提供疾病护理方案,帮助医生跟踪患者用药情况和健康状态变化。
大模型具备强大的数据分析能力,能够将求职者个体特征与用人方职位要求进行精准匹配,还可进一步分析就业市场数据,为政府就业政策制定提供可靠数据支撑。例如,新加坡劳动力局利用 ChatGPT 和开源框架,打造了职业助手,不仅能实现求职者和岗位的双向精准推荐,还能针对岗位为求职者生成个性化简历摘要。
美国已探索大模型技术在国防安全、航空航天两类重大国家科技创新项目中的应用。美国国防部持续推进对大模型在国防安全领域应用的监测和探索。2023 年 1 月,美国国防部信息系统局将生成式人工智能技术列入 2023 年年度技术观察名单中,以提高国防部对新技术在改善情报、作战规划以及行政业务流程等方面潜力的认知。6 月,五角大楼称,正在联合学术界和企业界,共同训练开发为国防部专门定制的多模态大模型系统。同时,国防部在其'全球信息主导地位'实践中对多种生成式人工智能模型开展测试,旨在借助新技术提升美军联合全域指挥与控制作战结构的能力。8 月,美国海军陆战队系统司令部推进开发专用大模型聊天机器人,以提升其决策支撑系统的能力。NASA 正在开发类 ChatGPT 的航天 AI 助手,不仅可为宇航员提供对话式操作指引,还可提高航天器故障检测和修复效率。此外,NASA 员工也正在测试和评估 ChatGPT 在代码编写和研究总结等方面的可行性、准确性和成本等。
由于风险接受程度、政府创新传统、国情政策等因素不同,各国政府在大模型部署方式上存在差异,尚未形成统一模式。基于数据安全性、算力稳定性、部署成本等因素考量,大致可将目前主要国家的部署方式分为三类:订阅付费、定制化部署和打造政务专属模型。
订阅付费指政务机构或公务人员直接访问公开的第三方 AIGC 平台,或通过企业服务调用市场成熟大模型产品。以日本为代表的个地区采取订阅付费模式。日本农林水产省、美国众议院、柬埔寨数字政府委员会、英国、丹麦、以色列、加拿大等允许其公务人员直接将 ChatGPT 应用于日常办公事务处理。2023 年 6 月至 7 月,微软先后和美国、日本政府达成合作,向其提供通过微软 Azure 智能云平台调用 ChatGPT 的服务。
采用订阅付费模式可以降低政府财政投入,加快新技术赋能政府治理变革的速度,但同时弊端突出。
一是安全风险较高,市场既有大模型平台或工具本身尚存技术漏洞,数据安全事故时有发生,政府信息机密性极强,不当使用行为更易引发数据泄露、隐私侵犯等重大风险。
二是个性化服务程度较低,已有大模型训练语料库主要来源于维基百科、社交媒体平台等公开数据,政务专业知识占比较低,模型能力与政府机构治理活动贴合不紧密,政务应用场景较为有限。
定制化部署指在通用大模型底座基础上,结合政务领域数据和知识库进行训练与微调,并部署在政府专有服务器上,以提升回答专业性及数据安全性。以新加坡为代表的 9 个国家或地区采取定制化部署模式。
马来西亚、阿联酋、卡塔尔、韩国、美国等将 ChatGPT 嵌入到已有政务服务系统或政府门户网站中,利用大模型技术提升政务系统个性化服务能力。新加坡、印度、葡萄牙等则利用大模型技术能力,开发政府办公、民生服务等场景专用软件,提升政府服务效能、优化群众服务体验。
定制化部署较订阅付费模式的安全性和个性化程度均有提升。
一方面,应用场景更加贴合政务领域,由通用知识问答、公开文本生成延伸到政府文书写作、政务服务问答、法律政策咨询等场景,场景个性化程度提升。应用场景的深化意味着政府需针对相应场景,利用政务数据对模型进行微调。例如,印度电子和信息技术部开发的弱势群体政策咨询系统、葡萄牙司法部开发的'司法实用指南'、新加坡政府科技局的大模型聊天机器人项目等均使用了政府数据进行模型调整。
另一方面,大模型对政府信息的获取程度加深,促使政府采取措施降低安全风险。通常采取三种方式推动数据安全:
一是设置专属设备,如日本数字厅与微软合作,在政府数据中心设置 AI 大模型产品使用高处理能力设备,以处理政府机密信息。
二是数据独立储存,如新加坡、美国等在使用大模型工具时,将数据储存于政府云端并设置保密协议,确保数据不被企业获取。三是设置安全测试环境,如新加坡设置 AI 创新沙盒,为公共部门提供预训练的生成式人工智能模型和初级代码开发工具,机构可以在专属的云环境中构建和测试自己的 AI 解决方案,实现风险可控。
政务专属模型指基于领域专有大数据集从 0 开始构建内部生成式人工智能体系,打造适用于政务领域的专属大模型,一般需要强大的资金实力和研发人才支撑。目前仅美国国防局、NASA 宣称采用第三种模式,但尚未实现落地。
美国国防部称,五角大楼不会购买现成产品或依赖工业界提供解决方案,而是使用国防部数据,训练定制系统。NASA 也声称在自主研发航天器使用的专属人工智能模型。专属大模型由政府主导进行训练开发,所有环节均由政府进行把控,符合安全合规要求。
但同时,可能带来较高的开发成本,专属数据的训练也可能使大模型涌现能力和泛化能力不足,智能化程度有一定折扣。总的来看,采用哪种部署方式与国情政策、文化背景、技术实力、部署成本等密切相关。以日本为例,两方面因素推动其采取订阅付费模式。
一是新冠疫情暴露出日本数字社会建设水平低的严峻问题,倒逼政府加快对新技术的接受和使用节奏。
二是高龄少子化国情致使日本面临劳动力不足的困境,亟需在各个领域借助大模型等自动化工具,降低劳动力成本。采用定制化模式的政府前期一般已经形成了良好的部署条件或发展基础。如印度政府正在推进'数字印度'项目,着力为边缘化群体提供服务,ChatGPT 的嵌入有助于推进该项目落地。美国、新加坡、韩国、阿联酋、葡萄牙、马来西亚的电子政务发展指数均处于非常高水平,具备定制化部署的制度环境和基础能力。
为适应新一轮技术变革需求、有效赋能政府治理提升,主要国家均大力推动政府组织、人才、资金等改革,完善配套措施。
1.明确应用探索的专责团队大致有两种应对情形:一种是明确主管部门,一般由国家政府数字化转型及技术创新的主管部门负责推进大模型应用。例如,英国明确由中央数字和数据办公室和科学、创新与技术部,负责探索大模型技术的用例、风险和机遇;澳大利亚明确由数字化转型局、科学和资源部负责探索使用人工智能新技术相关的政府政策和标准。另一种是组建专门团队,加速技术推广使用。例如,日本东京都成立项目组,负责测试 ChatGPT 使用效率,探讨并制定政府大模型技术使用指南。
美国众议院成立人工智能工作专组,以在国会办公环境中测试和共享诸如 ChatGPT 等新的人工智能工具。美国国防部成立 AIGC 工作组 Lima,负责在整个国防部范围内'评估、协调和使用'AIGC 技术。
美国白宫总统科技顾问委员会(PCAST)成立了一个生成式人工智能工作组,以帮助评估联邦机构使用生成式 AI 的关键机遇和风险,并就如何更好确保技术开发和部署提供意见。
专栏 2:美国国防部成立 AIGC 工作组 Lima
2023 年 8 月 10 日,美国国防部宣布成立了一个专门研究生成式人工智能工具的新工作组——'利马特别工作组'(Task Force Lima)。'利马特别工作组'隶属于美国国防部的首席数字与人工智能办公室(CDAO),负责在整个国防部范围内'评估、协调和使用'生成式 AI 技术,以最大限度降低这种技术构成的潜在风险。9 月 27 日,美国防部 Lima 工作组表示,将在未来 18 个月内充分了解军方和国防部对于生成式 AI 技术的需求,以加快对该技术的理解、评估、部署及监测,大规模整合具备任务适应性的相关技术。Lima 工作组的工作包括:
①全面了解人工智能的工作原理和外部数据应用过程,并聚焦军事用例与作战过程的联系,与其他部门合作,训练多个种类的大语言模型;
②为国防部制定基于生成式 AI 的临时指南、框架和工作流程,参与国防部对大语言模型的实际研究和部署;
③建立周例会、月度会议和季度会议机制,让内部各级人员及时了解 Lima 工作组正在制定的计划和方法;
④向业界发布信息征询书,了解和探索创新型人工智能的开发与集成风险和收益。
一是在政府部门引入第三方技术力量。例如,英国内阁办公室计划从私营部门借调数据和人工智能专家,同时组建一支负责政府自动化技术创新的公务员团队,解决政府技术技能短缺问题。
二是加强公务人员新技术认识和使用能力培训。例如,美国新泽西州、加利福尼亚州等四州联合成立 InnovateUS 组织,旨在通过培训提升公务员生成式 AI 使用技能。新加坡为公务员提供 ePrimer 培训课程,通过视频和实际案例资料,提升公务员对 AI 新技术的认知。此外,迪拜、中国台湾等地区也开展了面向公务员的 ChatGPT 技能培训。
一是加强大模型技术投资和研发支撑力度。例如,日本数字厅计划每年花费 3.3 亿日元(约合 235 万美元)以在政府部门中使用并推广 ChatGPT。日本经济产业省引进尖端超级计算机,促进 AI 大模型赋能各个领域。韩国政府已经开放 15 亿条数据,涵盖制造、教育、金融、自动化、体育等 14 个领域供 AI 训练使用。
二是打造技术应用的社会氛围。例如,日本户田市举办创新大赛,促进公职人员、公民和企业共同参与探讨 ChatGPT 在市政运营中的安全使用。澳大利亚举办政府生成式人工智能峰会,邀请各界专家参与,解答政府机构如何使用新技术的紧迫问题。
大模型的应用是一把'双刃剑',在推动政府治理变革的同时,也带来多方面安全风险。为应对这一变革冲击,各国(地区)政府在推进应用的同时,同步出台政府机构使用生成式 AI 的相关规范,着力实现新技术应用的安全、向善、可信、可控。
截至 2023 年 10 月,已有韩国、新加坡、美国、英国、澳大利亚、新西兰、日本、加拿大、丹麦等 9 个国家出台了政府机关使用生成式 AI 的专项治理规范。美国、日本的部分地区还出台细化规范或要求,指导当地公务员合理使用 AIGC 新技术。政府对人工智能工具的使用趋向合规。
从出台背景看,各个国家或地区普遍认同 AIGC 技术将为政府机构提供诸多潜在好处,出台政策旨在最大限度释放新技术应用潜力,鼓励地方机构探索更多用途。但同时,AIGC 技术的迅速发展及在公务员群体的广泛流行,也带来了诸多不确定性风险,迫使政府不得不在短时间内制定临时性政策。西雅图市指出:'AIGC 在短时间内变得非常流行和普遍,公务员可能很有兴趣使用此类系统开展城市治理,其潜在政策影响和风险尚未充分了解,本临时政策旨在最大限度减少技术使用可能出现的问题。'加拿大政府也指出:'AIGC 作为一类新的技术尚处于不断发展阶段,潜在政策应用和风险不够明朗,不应在所有情况或场景中使用该技术,应将其使用限制在可以有效管理风险的活动中。'
从适用范围看,文件主要规范政府机关的内部使用行为。美国总务管理局将指南适用范围扩展至政府信息系统的承包商,波士顿市将适用范围扩展为公立学校外的所有城市机构和部门,圣何塞市要求所有政府相关人员(城市公务员、相关供应商、志愿者等)在工作中都需要遵循指南要求。
从有效期限看,各国或地区普遍将出台的指南作为临时性过渡政策,有效期多为一年或半年,或根据技术发展和应用情况持续更迭,体现了政策的灵活性和治理的敏捷性。从规范内容看,主要对政府机构使用生成式 AI 的风险、用例、规范做了提示或明确。从发布时间线看,各个国家或地区的政策内容相互借鉴,呈现逐步完善的过程。
2023 年 4 月 18 日,美国西雅图市率先发布全球首份适用于公共部门的生成式 AI 临时政策,对政府机构获得、使用 AIGC 技术及责任归属做了初步要求。5 月 18 日,波士顿市发布了首份临时指南,详细阐述了公共部门应用 AIGC 的目的、原则、示例及每个场景的详细操作规范。6 月,美国总务管理局、英国、澳大利亚集中发布相关政策规范,适用层级由地方上升至中央部门,内容上进一步明确了软件采购、安全测试、禁止使用场景等要求,同时细化各部门监管职责。
7 月,美国圣何塞市发布生成式 AI 使用协议,首次系统提出应用场景的分类分级方法。
9 月,加拿大发布联邦机构使用生成式 AI 的指南,除一般性风险外,还明确过度依赖人工智能可能会干扰行政判断、扼杀创造力、影响程序公平性等风险。
10 月 30 日,拜登签署《关于安全、可靠和可信的 AI 行政命令》,提出采取 3 项行动'确保政府负责任且有效地使用人工智能',一是为各机构使用人工智能发布指南,制定保护权利和安全的明确标准,改进人工智能采购,加强人工智能部署;二是通过更快速、更高效地签订合同,帮助机构更快、更便宜、更有效地获取指定的人工智能产品和服务;三是加快招聘 AI 专业人才,作为由人事管理办公室、美国数字服务部、美国数字军团和总统创新奖学金领导的全政府 AI 人才激增计划的一部分,各机构将为相关领域的各级员工提供 AI 培训。
表 3 主要国家(地区)发布的政府机构应用 AIGC 指南
作为一项新的技术工具,将 AIGC 引入政府治理面临多重风险,各国重点聚焦讨论和解决以下四类问题:
政务数据具有高敏感性,极易因误用或滥用导致信息泄露。当前,隐私和数据安全问题已经成为各国政府推进大模型应用的首要关注风险。日本鸟取县于 4 月 20 日宣布,禁止在答询资料、预算编列以及制定政策上使用 ChatGPT,不允许公务人员的电脑连到 ChatGPT。美国众议院于 6 月 8 日就 ChatGPT 使用制定新规,仅允许议员使用付费版 ChatGPT Plus,因 Plus 版本提供'保护国会数据等重要隐私'的功能,同时禁止输入未公开文本内容。韩国国家情报院要求各部门公务员在使用 GPT 系统时,除公开信息不得输入其他数据。
AIGC 工具可能生成歧视性或不具有代表性的内容,或者包含刻板印象(如与性别、种族和民族等多重交叉身份因素相关的偏见)。许多生成模型都是根据互联网数据进行训练的,这通常是生成偏差的根源。加拿大国际治理创新中心研究指出,ChatGPT 具有政治倾向,使用 ChatGPT 类工具进行政府治理容易导致政治价值观受到侵害。2023 年 3 月,美科技伦理组织向联邦贸易委员会投诉称,GPT-4 具有偏见性、欺骗性,易导致对边缘化群体的负面联想和有害的定型观念。6 月 9 日,美国两党参议员提出一项新法案,要求披露政府在教育、就业等领域关键政策制定中人工智能的使用情况,以避免政策歧视和偏见。
研究指出,已有大模型训练语料库主要来源于维基百科、社交媒体平台等公开数据,专业知识占比较低,应用在政府治理活动很可能产生不准确、不连贯、不完整的内容。日本横须贺市对政府机关工作人员使用 ChatGPT 情况的调查显示,近一半使用者认为 ChatGPT 会出现不恰当答案,希望提高回复准确性。
过度依赖生成式 AI 工具可能会干扰公务员个人的自主权和判断力,强化自动化偏见,还可能导致公务员批判性思维能力下降,从而抑制创新和创造力,导致对政策分析不全面或不完整。此外,生成式 AI 模型的不透明性使得追踪和理解其输出结果变得困难,在政府机构有义务向公众提供行政决策(如拒绝福利政策)理由的情况下,可能破坏程序的公平性。当公众使用政府提供的生成式 AI 工具(如聊天机器人)查找信息或进行公共通信时,可能接收到不适当内容或错误信息,从而导致政府承担不必要的责任。
各国出台的临时指南,也着重聚焦上述四方面风险,提出相应的管控原则。
普遍要求禁止输入非公开、涉密及公民个人隐私信息。美国总务管理局禁止工作人员私自访问公开的第三方 AIGC 平台。澳大利亚和新西兰要求,禁用工具保存聊天记录的权限,以避免大模型从聊天记录中推断出政府信息或将记录用于二次训练。
强调公共部门使用 AIGC 应有助于所有种族、年龄、性取向以及残障人士等人群的社会福祉,尽量减少技术弱势群体面临的风险,在部署系统之前持续测试数据、模型和输出中的偏差。
普遍要求公务员对通过 AIGC 得到的建议或决策进行验证及人工审查,不得将 AIGC 提供回复作为信息唯一来源。政府应用新技术若对公众产生影响,应当公开其使用过程,明确告知如何、何时、为何使用 AIGC 工具,以及如何解决潜在风险。四是降低技术依赖。强调公务员应当受过 AIGC 应用培训,了解工具的优点、局限,学习如何创建有效的提示并识别输出结果的潜在问题。对 AIGC 的使用应当有效支持组织业务需求,并非在所有情况下 AIGC 技术都是最佳选择。
表 4 主要国家(地区)关于政务领域 AIGC 应用原则
AIGC 赋能政府治理活动广泛,从政策咨询、方案设计到服务提供,受众和业务流程不同,可能产生的效益及风险也不同。从各国经验看,大致都明确了场景分级分类的总体治理思路,但在一些复杂场景应用规范上仍存在分歧。
一般采取三分法或两分法对场景分类。美国圣何塞市根据'信息泄露风险'和'不利影响风险'两大维度将应用场景分为中风险、高风险、不可接受风险三类。加拿大将场景归纳为谨慎使用、可以使用、不适用 AIGC 技术三类。英国内阁将场景分为一般示例、专业示例、不当示例三类,一般示例指使用生成式 AI 进行研究、总结信息等,专业示例指开发代码、文本数据分析等复杂场景。
澳大利亚简单分为低风险情形、不可接受风险情形两类,后者主要包括:需输入大量政府数据或机密、敏感信息,提供服务或做出决策,输出用于政府系统的代码等。从划分结果看,不管是两分法还是三分法,主要考虑的都是信息泄露风险和不利后果风险两大维度,不利后果包括歧视、决策偏差、输出信息不准确等。此外,韩国、美国波士顿市、华盛顿州等地仅列示推荐使用的场景清单,未对场景做出限制。
普遍强调不允许直接利用 AIGC 工具开展公共决策。加拿大政府认为,现阶段生成式人工智能可能不适合用于行政决策,因联邦政府无法确保 AIGC 决策的透明度、问责制和公平性。澳大利亚、美国圣何塞市强调,运用 AIGC 直接提供服务或做出决策,可能会改变个人或社区的权利、自由及获得服务的机会,构成不可接受风险。2023 年以来,美国多个州表达对政府机构使用生成式 AI 进行自动化决策偏见的担忧,并提出法案,要求政府工作者遵循负责任的人工智能采购和实施实践。同样,OpenAI 的使用条款指示用户,不要在有关信贷、就业、教育机构或公共援助服务的决策中使用 ChatGPT。谷歌禁止其生成式人工智能产品的用户'在影响物质或个人权利或福祉的领域做出自动决策'。
在翻译、编码、语音生成等场景应用上,各国态度存在分歧。
在翻译场景,圣何塞市认为,现阶段 ChatGPT 等大语言模型并不比 Google Translate 等专业的翻译软件更适合翻译,其性能还有待专业人员进行评估,因此禁止直接使用 ChatGPT 进行工作文档的翻译。其他国家或地区对该场景限制较少。在编程场景,英国、加拿大、美国总务管理局认为可以用 ChatGPT 等工具开发代码,用来创建网站前端界面等,并要求人工审查其准确性、功能有效性、安全性等。
日本东京都政府接受宏、VBA 等低代码生成。澳大利亚、新西兰、美国圣何塞市则认为,使用大模型开发用于政府系统的代码是不可接受风险,因为生成的代码可能是过时的、受版权保护的或存在漏洞的,但可以用来检查代码漏洞。在语音生成场景,圣何塞市禁止政府在公务活动中通过 AI 生成音频,因为在任何城市文件或录音中使用人工智能复制一个人的声音,可能会损害工作人员和居民对政府的信任,同时存在潜在的法律问题。其他国家和地区对该方面限制较少。
各国从制度机制、部署环境、使用行为等方面明确 AIGC 应用规范,力图形成覆盖各环节各主体的监管闭环。
英国、澳大利亚要求公务员使用政府工作邮箱在 AIGC 平台注册账号,账号使用需由首席信息安全官或数据官审批。圣何塞市要求市政员工每次使用 ChatGPT、Bard 或 Midjourney 等工具时,都要填一份登记表,进行报备。日本东京都政府要求,职员在使用前必须填写使用申请表,经过批准后才能使用,在使用前还应进行在线学习,掌握正确的使用方法。
日本东京都政府在推广使用 ChatGPT 前开展了有效性验证,澳大利亚、新西兰要求将技术应用到具体场景前开展安全风险评估。
美国、英国、澳大利亚等要求,使用者需定期向主管机构报告使用过程的例外情况。美国总务管理局通过互联网通信流量监控,掌握政府部门对 AIGC 平台的访问情况,并建立适当的网络安全防护能力,实现受控访问。
部署环境方面,除少数国家或地区外,大部分不禁止政府机构直接使用公开的 AIGC 工具开展工作,只要满足相关使用规范即可。新加坡要求在专属云环境中构建和测试公共部门的 AI 解决方案,实现风险可控。美国总务管理局要求采取本地化部署方式,并进行专门的评估和授权才可以使用 AIGC 工具。西雅图市要求,所有软件服务必须经过政府采购流程,以确保软件服务经过必要的审查,员工使用生成式 AI 服务,必须提交软件服务中心购买需求,获得部门批准。东京都政府要求职员通过 Microsoft 的