【证书】2025上海市人工智能训练师—高级/三级考试介绍与复习(SJTU版)

【证书】2025上海市人工智能训练师—高级/三级考试介绍与复习(SJTU版)

文章目录

1、考试介绍

职业定义1

  • 标准名称:人工智能训练师
  • 国家职业编号:4-04-05-05
  • 职业内容:使用智能训练软件, 在人工智能产品实际使用过程中进行数据库管理、 算法参数设置、 人机交互设计、 性能测试跟踪及其他辅助作业的人员。

职业技能等级

  • 本职业共设 5 个等级,分别为:
    五级/初级工、四级/中级工、(约对标初级职称)
    三级/高级工、(约对标中级职称)
    二级/技师、一级/高级技师 (约对标高级职称)

人工智能训练师(上海市)

报名资格

  • 中级/四级(符合以下任意一条即可)
    1,累计从事本职业或相关职业工作满5年。
    2,取得本职业或相关职业五级/初级工职业资格(职业技能等级)证书后,累计从事本职业或相关职业工作满3年。
    3,取得本专业或相关专业的技工院校或中等及以上职业院校、专科及以上普通高等学校毕业证书(含在读应届毕业生)。
  • 高级/三级(符合以下任意一条即可)
    1,累计从事本职业或相关职业工作满10年。
    2,取得本职业或相关职业四级/中级工职业资格 (职业技能等级) 证书后,累计从事本职业或相关职业工作满4年。
    3,取得符合专业对应关系的初级职称 (专业技术人员职业资格)后,累计从事本职业或相关职业工作满1年。
    4,取得本专业或 相关专业的技工院校高级工班及以上毕业证书(含在读应届毕业生)。
    5,取得本职业或 相关职业四级/中级工职业资格(职业技能等级)证书,并取得高等职业学校、专科及以上普通高等学校本专业或相关专业毕业证书(含在读应届毕业 生)。
    6,取得经评估论证的高等职业学校、专科及以上普通高等学校本专业或相关专业的毕业证书(含在读应届毕业生)。
    《人工智能训练师》相关专业:电子与信息大类、 医学卫生大类、 装备制造大类、 教育与体育大类等
  • 可申报二级/技师:
    (1)取得本职业或相关职业三级/高级工职业资格(职业技能等级)证书后,累计从事本职业或相关职业工作满5年。
    (2)取得符合专业对应关系的初级职称(专业技术人员职业资格)后,累计从事本职业或相关职业工作满5年,并在取得本职业或相关职业三级/高级工职业资格(职业技能等级)证书后,从事本职业或相关职业工作满1年。
    (3)取得符合专业对应关系的中级职称(专业技术人员职业资格)后,累计从事本职业或相关职业工作满1年
    (4)取得本职业或相关职业三级/高级工职业资格(职业技能等级)证书的高级技工学校、技师学院毕业生,累计从事本职业或相关职业工作满2年。
    (5)取得本职业或相关职业三级/高级工职业资格(职业技能等级)证书满2年的技师学院预备技师班、技师班学生。
  • 可申报一级/高级技师:( ~= 杭州高项 ~= 副高)
    (1)取得本职业或相关职业二级/技师职业资格(职业技能等级)证书后,累计从事本职业或相关职业工作满5年。
    (2)取得符合专业对应关系的中级职称后,累计从事本职业或相关职业工作满5年,并在取得本职业或相关职业二级/技师职业资格(职业技能等级)证书后,从事本职业或相关职业工作满1年
    (3)取得符合专业对应关系的高级职称(专业技术人员职业资格)后,累计从事本职业或相关职业工作满1年

有什么用处

  • 1、官方,2500*130%=3250。 12
    上海市总工会技师奖励中规定的“六个特定工种”为集成电路、生物医药和人工智能三大先导产业的半导体芯片制造工、化学合成制药工、药物制剂工、药物检验员、生化药品制造工和人工智能训练师
  • 2、《上海市居住证》积分模拟打分计算器,人工智能训练师可用于居住证积60分 1

参考资料: 12

2、考试复习

考试方式

考试分为:理论知识考试、技能考核
注:理论知识考试、技能考核均实行百分制,成绩皆达60分(含)以上者为合格。

在这里插入图片描述

2.1 理论知识

职业(工种)名称人工智能训练师三级
序号考核点代码名称·内容
0人工智能训练师认知
01职业道德
011人工智能训练师职业素养
10111职业认知
20112知识与技能
30113沟通与表达
40114学习与创新
012人工智能与人工智能科学
50121人工智能定义
60122人工智能研究内容
70123人工智能科学
80124人工智能应用领域
90125人工智能产品研发流程
013人工智能训练流程
100131数据准备
110132模型设计
120133确定评估指标
130134模型训练
140135模型验证
150136模型测试
02人工智能算法认知
021常用的机器学习算法
160211人工智能算法认知
170212机器学习定义
180213机器学习过程
190214线性回归
200215逻辑回归
210216决策树
220217支持向量机
230218K-最近邻
240219人工神经网络
2502110主成分分析
022常用的深度学习算法
260221深度学习定义
270222多层感知机
280223卷积神经网络
290224循环神经网络
300225长短时记忆网络
310226Transformer模型
023人工智能技术与分类
320231机器学习
330232知识图谱
340233类脑智能计算
350234量子智能计算
360235模式识别
370236自然语言处理
380237智能语音
390238计算机视觉
400239生物特征识别
4102310虚拟现实
4202311增强现实
4302312人机交互
03人工智能实现
031Python的机器学习工具包
440311sklearn
450312数据预处理模块
460313数据集模块
470314数据特征选择模块
480315数据特征降维模块
490316模型构建模块
500317模型评估模块
032常用人工智能开发工具
510321人工智能开发工具
520322深度学习框架
530323深度学习平台
540324通用框架TensorFlow
550325PyTorch
560326Keras
570327国产框架PaddlePaddle
580328MindSpore
1业务分析
11业务流程设计
111通用业务流程和业务数据
591111人工智能业务场景
601112信息流
611113业务与数据的关系
621114人工智能业务流程
631115业务流程构建方法
641116业务数据的采集
651117信息采集路径
661118业务数据
671119业务数据产生场合
6811110数据规范化
6911111单个业务数据的处理
7011112整体业务数据的处理
7111113数据标准化
7211114数据输入和输出关系
7311115业务数据预处理
7411116业务数据的审核
112文本类业务数据处理
751121常见文本类业务数据
761122文本类业务数据的特点
771123文本类业务数据的采集
781124文本类业务数据质量
791125文本类业务数据的预处理
801126文本类业务数据的特征提取
811127文本类业务数据的审核
113视觉类业务数据处理
821131视觉类业务数据的特点
831132视觉类业务数据的采集
841133视觉类业务数据压缩与传输
851134视觉类业务数据的预处理
861135视觉类业务数据的处理方法
871136视觉类业务数据的主观审核
881137视觉类业务数据的客观审核
891138PSNR审核方法
901139VMAF审核方法
114语音类业务数据处理
911141语音类业务数据的来源
921142语音类业务数据的特征
931143语音类业务数据的采集
941144语音类数据的质量
951145波形数据的预处理方法
961146语音类业务数据的数值分析
971147语音类业务数据的审核
115点云类业务数据处理
981151点云类业务数据的产生
991152点云类业务数据的特点
1001153点云类业务数据的采集
1011154点云类业务数据的处理
1021155点云类业务数据的审核
12业务模块效果优化
121业务流程构建及业务优化通用方法
1031211人工智能业务模块
1041212推荐系统功能模块
1051213智能搜索功能模块
1061214智能交互功能模块
1071215自动数据处理功能模块
1081216最优化决策功能模块
1091217智能控制功能模块
1101218业务模块构建方法
1111219业务流程优化过程
11212110业务流程优化方法
122简单场景业务流程分析与优化
1131221智慧医疗
1141222简单业务流程分析流程
1151223简单业务流程优化方法
1161224业务流程优化效果
123复杂场景业务流程分析与优化
1171231智能汽车
1181232综合业务流程分析流程
1191233复杂业务系统改进措施
1201234综合业务流程优化方法
2智能训练
21数据处理规范制定
211文本类数据处理规范制定
1212111数据处理的基本流程
1222112数据清洗
1232113数据标注
1242114数据审核
1252115数据质检
1262116数据处理规范的定义
1272117数据清洗规范
1282118数据标注规范
1292119常用的数据清洗工具
13021110常用的数据标注工具
212文本类数据处理规范制定
1312121文本类数据清洗定义
1322122文本类数据清洗方法
1332123非空检查清洗
1342124主键重复清洗
1352125错误值清洗
1362126数据格式检查
1372127缺失值清洗
1382128文本类数据清洗质量规范
1392129文本类数据标注
14021210序列标注
14121211关系标注
14221212属性标注及类别标注
14321213文本类数据标注质量规范
14421214实体标注规范
14521215关系标注规范
14621216情感标注规范
213视觉类数据处理规范制定
1472131视觉类数据清洗
1482132视觉类数据清洗规范
1492133图像标注
1502134关键点标注
1512135矩形框标注
1522136区域标注
1532137属性标注
1542138视觉类数据标注质量规范
1552139目标检测任务
15621310非倾斜目标框标注规范
15721311倾斜目标框标注规范
214语音类数据处理规范制定
1582141语音切割
1592142语音清洗
1602143语音标注
1612144语音类数据质量规范
1622145语音切割规范
1632146特殊语音切割
1642147有效语音判定规范
1652148无效语音判定方法
1662149语音内容转写规范(词语)
16721410语音内容转写规范(符号及噪音)
22算法测试
221算法测试基础
1682211人工智能算法测试的基本流程
1692212人工智能算法测试方案
1702213人工智能算法测试的基本方法(改变测试集及人机交互测试)
1712214人工智能算法测试的基本方法(增量式测试及调参)
1722215算法测试评价指标(精确率及准确率)
1732216算法测试评价指标(召回率及F1-score)
1742217混淆矩阵的概念
1752218真正类与假正类
1762219真负类与假负类
17722110算法测试报告的编写方法
222人工智能模型测试
1782221EasyDL
1792222模型选择
1802223数据准备
1812224数据导入
1822225数据标注
1832226智能标注
1842227模型创建
1852228模型训练
1862229模型评估
18722210模型优化
3智能系统设计
31智能系统监控和优化
311单一智能产品/系统的设计
1883111智能产品设计
1893112智能硬件产品设计
1903113OCR识别相关知识
1913114OCR识别模型
1923115数组形状修改
1933116reshape函数
1943117数据归一化
1953118数据规格化
1963119模型创建(Sequential模型)
19731110模型训练
19831111模型测试
19931112evaluate函数
20031113卷积层
20131114池化层
20231115Dropout层
20331116全连接层
20431117激活函数
20531118ReLU函数
20631119softmax函数
20731120过拟合
20831121损失函数
20931122模型评价
21031123模型评价指标
21131124训练集、验证集切分
21231125模型预测
21331126AI云平台
312单一智能产品/系统的设计优化
2143121模型优化步骤
2153122模型优化措施
2163123Transformer
2173124深度学习网络模型
2183125卷积神经网络
2193126循环神经网络
2203127长短期记忆网络
2213128中文票据识别面临的挑战
2223129中文票据OCR识别流程
22331210文本检测方法和模型
22431211文本识别方法和模型
22531212paddlepaddle开发环境安装
22631213票据OCR识别代码实现
22731214注意力机制
32人机交互流程设计
321人工和智能交互方式
2283211人工与智能系统之间的交互方式
2293212文字交互
2303213语音交互
2313214脑机接口
2323215触屏交互
2333216视觉交互
2343217姿态识别交互
2353218交互式人工智能系统的应用领域
2363219ChatGPT
23732110智能客服机器人概念与用途
23832111智能客服机器人系统构成
23932112智能客服机器人与用户的交互流程
322人工和智能交互过程的实现
2403221智能客服机器人的工作原理
2413222知识库架构
2423223知识库构建方法
2433224语音识别
2443225语音合成
2453226智能语义理解
2463227问答匹配
2473228机器人自主深度学习
2483229知识库配置
24932210简单客服机器人设计
4培训与指导
41培训
411能够编写初级培训讲义
2504111培训讲义编写原则
2514112培训讲义编写方法
2524113培训讲义编写步骤
412能够对五级/初级工、四级/中级工开展知识和技术培训
2534121常用培训方法
2544122培训方法优点
2554123培训方法缺点
2564124培训方法选择
42指导
421能够指导五级/初级工、四级/中级工解决数据采集、处理问题
2574211数据采集和处理流程中的常见问题点
2584212指导数据采集和处理问题的解决方法
422能够指导五级/初级工、四级/中级工解决数据标注问题
2594221数据标注流程中的常见问题点
2604222指导数据标注问题解决方法

2.2 实践知识

职业(工种)名称人工智能训练师三级
序号考核点代码名称·内容
项目章节细目
1业务分析
11业务流程设计
1111能够结合人工智能技术要求和业务特征,设计整套业务数据采集流程
2112能够结合人工智能技术要求和业务特征,设计整套业务数据处理流程
3113能够结合人工智能技术要求和业务特征,设计整套业务数据审核流程
12业务模块效果优化
4121能够结合业务知识,识别业务流程中单一模块的问题
5122能够结合人工智能技术设计业务模块优化方案并推动实现
22智能训练
21数据处理规范制定
6211能够结合人工智能技术要求和业务特征,设计数据清洗和标注流程
7212能够结合人工智能技术要求和业务特征,制定数据清洗和标注规范
22算法测试
8221能够维护日常训练集与测试集
9222能使用工具对算法进行训练
10223能够使用测试工具对人工智能产品的使用进行测试
11224能够对测试结果进行分析, 编写测试报告
12225能够运用工具,分析算法中错误案例产生的原因并进行纠正
32智能系统设计
31智能系统监控和优化
13311能够对单一智能产品使用的数据进行全面分析,输出分析报告
14312能够对单一智能产品提出优化需求
15313能够为单一智能产品的应用设计智能解决方案
32人机交互流程设计
16321能够通过数据分析,找到单一场景下人工和智能交互的最优方式
17322能够通过数据分析,设计单一场景下人工和智能交互的最优流程
4培训与指导
41培训
18411能够编写初级培训讲义
19412能够对五级/初级工、四级/ 中级工开展知识和技术培训
42指导
20421能够指导五级/初级工、四级/中级工解决数据采集、处理问题
21422能够指导五级/初级工、四级/中级工解决数据标注问题

Read more

AI 概念大扒皮:从 LLM 到 Agent,一次说清楚

🤖 AI 概念大扒皮:从 LLM 到 Agent,一次说清楚 这些词你认识几个?不管认识多少,今天都给你扒个底朝天。所谓智能体,其实是由所有"不需要智能"的部分拼凑而成的;那些花里胡哨的新概念,大多不过是新瓶装旧酒。 涉及关键词:LLMPromptContextMemoryAgentRAGFunction CallingMCPSkillSub-Agent 💡 先清空大脑 忘掉你已知的一切,跟着故事线走——你会发现这些概念都是从同一个起点,一步步生长出来的。 🧠 第一步:语言模型长大了 一切混乱的起点,是这个古老的东西——语言模型。早期的小模型基本上是个智障,只会简单的文字接龙。但随着参数规模不断膨胀,在某个临界点,它突然"涌现"出了真正的智能。 为了和之前的小模型做区分,我们在前面加了个"大"字: 🆕 词汇① 大语言模型(LLM) LLM

国产AI双雄对决:智谱GLM-5与MiniMax M2.5

国产AI双雄对决:智谱GLM-5与MiniMax M2.5

导读:2026年2月,中国AI领域迎来里程碑时刻——智谱GLM-5与MiniMax M2.5两大开源旗舰模型几乎同期发布。它们都瞄准了"Agentic Engineering"这一前沿方向,却在技术路线和能力侧重上形成了鲜明对比。本文将从技术架构、核心能力、实际案例等多个维度,为你深度解析这两款国产大模型的优劣与适用场景。 一、模型概览与核心定位 1.1 智谱GLM-5:开源Agent任务的王者 发布时间:2026年2月11日 开源协议:MIT License 总参数量:744B(激活参数40B) 训练数据:28.5万亿tokens 上下文窗口:200K GLM-5是智谱AI推出的最新一代大模型,定位是"当下顶尖的Coding模型"。在全球权威榜单Artificial Analysis上,GLM-5位列全球第四、开源第一。 核心突破: * Agentic Engineering能力:不仅能写代码,更能处理复杂系统工程与长程Agent任务

免费开源的AI短剧工具介绍--马上短剧

免费开源的AI短剧工具介绍--马上短剧

马上短剧生成系统,只需一个主题词,自动生成剧本、自动生成分镜、自动生成图片、自动生成视频,需要多少集,自由设定,实现角色、环境、声音的一致性。 这是个开源且免费的短剧生产力工具!非常英语出品 开源地址:https://github.com/frank36512/horseplay 单文件打包exe下载地址:https://pan.quark.cn/s/becdf8427ee9 使用python开发,只需要打包源码成为exe文件就可以直接运行,不需要下载依赖,也不需要任何运行库。可以直接下载打包好的exe文件,就可以用,甚至无需安装、无需注册。 📖 简介 马上短剧生成系统 (Horseplay) 是一款旨在革新短剧创作流程的综合性工具。通过集成最先进的 AI 模型(涵盖剧本创作、角色设计、图像生成、视频合成及语音合成),工具致力于赋能创作者,以极高的效率生产高质量的内容。 无论您是独立创作者还是制作团队,本工具都能帮助您保持角色一致性、生成动态的视觉叙事,