本书立足高等职业院校人才培养需求,同时适用于数据标注行业初级阶段从业者岗前培训。全书以实训为核心,聚焦数据标注岗位核心技能,其内容涵盖文本、图像、音频、视频四大标注类型,采用“任务背景→任务分析→相关知识→任务实施”的实操体例,依托数据堂实训平台设计真实的任务案例。本书弱化理论灌输,强化实战训练,精准对接行业标准与企业需求,助力学习者快速掌握数据标注流程、质量管控要点及工具操作方法,是培养高素质数据标注技能型人才的实用教程。
李奇功,河北软件职业技术学院信息基础教学部专任教师,从事人工智能通识课教学、数字标注通识课课程负责人,副教授,信息技术新工科教师。从事高职教育23 年,聚焦数字经济人才培养,深耕数字标注、AI 数据处理教学,构建 "理论 + 案例 + 实操” 教学体系,主编 / 参编教材5 部,发表论文 10余篇,参与省市级课题7项。长期合作企业,参与真实项目,指导学生实训,助力学生获取技能证书,毕业生深受企业认可。
项目1 数据标注概况――标注解读AI密码1
学习目标1
项目导读2
思维导图2
1.1 初识数据标注3
1.2 数据标注溯源3
1.2.1 初创期的“手动标注时代”(1956年―2005年)4
1.2.2 起步阶段的“外包探索期”(2006年―2015年)4
1.2.3 爆发式增长的“行业成型期”(2016年―2018年)5
1.2.4 质量与智能驱动的“产业升级期”(2019年至今)6
1.2.5 数据标注的进化逻辑与核心价值7
1.3 数据标注的分类8
1.3.1 图像标注8
1.3.2 文本标注9
1.3.3 音频标注10
1.3.4 视频标注11
1.4 数据标注工具11
1.4.1 标注工具的本质11
1.4.2 标注工具的分类11
1.4.3 标注工具的共性特征与选型原则16
1.5 数据标注的人机协同模式16
1.6 数据安全、标注规范与应用17
1.6.1 账号权限管理17
1.6.2 数据安全管理18
1.6.3 标注全流程解析19
1.6.4 数据标注的重要性20
1.6.5 数据标注的应用场景20
1.6.6 数据标注员的角色蜕变24
项目小结27
课后习题27
项目2 图像标注――让机器“看懂”世界30
学习目标30
项目导读31
思维导图31
2.1 图像数据标注的核心认知32
2.1.1 图像数据的基础32
2.1.2 图像标注的重要性33
2.1.3 图像标注的流程34
2.2 图像标注典型实战任务案例36
2.2.1 任务1:画线标注――无人驾驶道路线标注36
2.2.2 任务2:边界框标注――监控场景行人检测标注42
2.2.3 任务3:简单关键点标注――人脸5关键点标注47
2.2.4 任务4:复杂关键点标注――手势21关键点标注50
2.2.5 任务5:简单多边形标注――监控场景行人检测抠图57
2.2.6 任务6:复杂多边形标注――无人驾驶全品类精细标注61
2.2.7 任务7:属性标注――监控场景行人属性标注65
2.2.8 任务8:OCR识别标注――OCR票据标注69
2.2.9 任务9:3D点云标注――3D点云图物体单帧标注73
项目小结79
课后习题80
项目3 文本标注――让机器“读懂”文字84
学习目标84
项目导读85
思维导图85
3.1 文本标注基础86
3.1.1 文本标注的基本概念86
3.1.2 文本标注的重要性88
3.1.3 文本标注的基本流程89
3.2 文本标注典型实战任务案例89
3.2.1 任务1:序列标注――新闻稿件词性标注89
3.2.2 任务2:实体关系标注――汽修文本实体关系标注96
3.2.3 任务3:文本属性标注――数字拼音标注101
3.2.4 任务4:文本分类标注――用户评论情感标注104
3.2.5 任务5:文本理解标注――语文辅导阅读理解标注107
3.2.6 任务6:意图理解标注――闹钟设定意图标注110
项目小结113
课后习题114
项目4 音频标注――让机器“听懂”世界117
学习目标117
项目导读118
思维导图118
4.1 音频标注的核心认知119
4.1.1 音频数据的基础119
4.1.2 音频标注的定义120
4.1.3 音频标注的重要性121
4.1.4 音频标注的分类121
4.1.5 音频标注的规则122
4.2 音频标注典型实战任务案例123
4.2.1 任务1:音频分类标注――语音有效性判断123
4.2.2 任务2:语音转写标注――数字串朗读语音标注128
4.2.3 任务3:语音分割标注――对话语音标注132
4.2.4 任务4:情感标注――客服语音标注138
4.2.5 任务5:意图标注――语音助手语音标注141
4.2.6 任务6:轻口音朗读语音标注――轻口音语音标注144
4.2.7 任务7:重口音朗读语音标注――重口音语音标注147
项目小结149
课后习题150
项目5 视频标注――让AI“洞察”时空153
学习目标153
项目导读154
思维导图154
5.1 视频标注的核心认知154
5.1.1 视频数据的基础154
5.1.2 视频标注的定义156
5.1.3 视频标注的重要性156
5.1.4 视频标注的主要类型157
5.2 视频标注典型实战任务案例158
5.2.1 任务1:视频属性标注――人物属性标注158
5.2.2 任务2:时间区间标注――打架异常行为标注163
5.2.3 任务3:目标追踪标注――车辆视频轨迹标注167
5.2.4 任务4:多模态理解标注――多模态情感标注173
项目小结176
课后习题177