随着《互联网信息服务算法推荐管理规定》等政策落地,算法自评估报告已经成为备案的关键环节。本文整理出这份生成合成类的自评估报告模板,供参考。
一、算法情况
(一)算法流程
(以流程图的形式提供算法的描述,描述从原始数据输入开始到最终结果输出的整个算法服务链路,流程图中每个节点粒度不大于单个算法模型或干预策略)
(二)算法数据
(详细描述算法流程中各节点的输入数据、输出数据,以及整个算法流程的最终结果数据)
(对于训练数据的描述应在此处展开)
(对于文本、语音类的生成合成应描述输入数据的语种和输出数据的语种;对于跨模态的生成合成应描述输入数据的模态和输出数据的模态)
1.【名称】**类输入数据
(包括输入数据的模态、输入数据是否涉及生物特征信息及生物特征信息是什么、输入特殊物体等非生物识别信息等,按照数据类型逐一填写)
2.【名称】**类输出数据
(包括输出数据的模态、文件格式、文件大小等,按照数据类型逐一填写)
3.【名称】**类训练数据
(包括训练数据的类型、来源、规模等,按照数据类型逐一填写,如无训练数据,无需填写此项)
4.【等】数据
(三)算法模型
(算法模型在算法流程中指的是应用统计学习、深度学习等机器学习方法的节点,如 n-gram、GAN 等,基于规则的或人工定义的方法也应在此处进行描述。)
(对于训练数据的预处理和后处理方法应在本节进行详细描述)
1.【名称】深度合成模型
(包括模型的基本情况:模型名称、版本号、更新时间、数据情况等;模型的描述:模型类型、结构、优化目标、评价指标、指标效果、更新迭代策略等;如包含人脸替换、姿态操控等多个环节,可按照算法功能模块逐一填写)
2.【名称】人脸识别模型
(包括模型的基本情况:模型名称、版本号、更新时间、数据情况等;模型的描述:模型类型、结构、优化目标、评价指标、指标效果、更新迭代策略等)
3.【名称】深度合成检测模型
(包括模型的基本情况:模型名称、版本号、更新时间、数据情况等;模型的描述:模型类型、结构、优化目标、评价指标、指标效果、更新迭代策略等;如无此情况,可不进行填写。)
4.【名称】人脸/声纹比对模型
(包括模型的基本情况:模型名称、版本号、更新时间、数据情况等;模型的描述:模型类型、结构、优化目标、评价指标、指标效果、更新迭代策略等;如无此情况,可不进行填写。)
【等】模型
(四)干预策略
(干预策略指算法流程描述中通过运营或数据挖掘等方法设置的机制性节点,如:对数据的预处理、对结果的后处理等)
1.【名称】预处理和后处理
(提供策略描述,包括策略形式(人工/自动)、策略目标描述、策略生效时间描述、策略影响范围描述、策略预计失效时间估计、策略提出的依据、挖掘策略的算法)
2.【名称】内容审核
(描述输入输出数据审核方式、审核规则、审核流程、针对新闻内容等分级分类管理等)
3.【等】
(五)结果标识
(结果标识指对生成合成内容的标识方法,包含隐式标识和显式标识。)
1.【名称】溯源标识
(对提供溯源标识的方法进行描述、隐式标识是否具有追踪溯源功能以及如何实现追踪溯源等)
2.【名称】显式标识
(描述是否具备添加显式标识的功能、标识方法、标识是否显著、标识是否可篡改、标识位置等)
二、服务情况
(服务是指以当前评估算法为主要支撑的互联网信息服务)
(一)【名称】服务
1.服务简介
(应具体描述服务功能介绍、上线时间、展现形态、服务在应用产品中入口位置、服务流量、用户情况等)
2.算法在服务中应用情况
(应具体描述算法线上服务的数据来源、算法训练过程中的数据来源、数据的形态、算法的更新频率、算法中间结果与其他服务或应用的共享情况等)


