# 单段落语音模板
# 如何配置模板
# 术语解释
一键转换规则: 项目中有需要把阿拉伯数字转换成中文数字等类似需求时,可配置一键转换,在转写文本中检测到配置的转换前字符,点击一键转换即可替换为配置的转换后字符。
噪音符号配置: 项目中有噪音用符号表示的要求时,可在这里配置噪音符号,噪音符号释义方便标注员理解选择,在这里配置好噪音符号后,转写过程中通过右键选择噪音符号,可直接插入转写文本中。
属性内容: 针对整段音频的属性,如有无噪音、语音清晰度等。
# 配置工具名称
首先我们需要在工具名称栏填入一个唯一的、可自己识别的模板名称。
# 配置一键转换规则
在转换前字符一列填入需要转换的字符,在转换后字符中填入转换后需要的字符即可。
配置示例:
# 配置噪音符号
将噪音符号和噪音符号的含义填写进相应的表格即可。
配置示例:
# 配置属性内容
中文名字:属性的名称,相当于一个选择题或问答题的题目,便于标注员理解需要标什么属性。
英文名字:与中文名字对应的英文名称,在数据层面展示,导出后会显示在相应的位置。
选项类型:选择选项时使用的方式,支持单选、多选、列表(即下拉框)和输入,可根据项目需求配置。
选项设置:相当于一个选择题或问答题的选项或需要填的空,必须以“英文名称=中文名称”的形式填写,中文名称只展示给标注员便于选择,英文名称导出数据时使用。点击加号增加选项。
注意问题:想删除一个选项,只需要将鼠标移动到选项上点击×即可,删除按钮是删除整个属性。
配置示例:
# 其他配置
转写校验规则:转写时对转写内容的一种限制,如只能输入中文/英文/空格/符号等,可下拉选择常用表达式,支持以正则表达式的方式配置。
1屏显示语音时长:初始化时一屏显示的波形秒数,只对14寸屏幕显示正确,大屏会相应增大此数值。
前静音段长度:项目需求中需要前预留静音段的,可在此配置静音段长度,标注时会自动预留。
后静音段长度:项目需求中需要后预留静音段的,可在此配置静音段长度,标注时会自动预留。
是否显示采集信息:该处默认选择为“否”,无需做任何改动。
配置示例:
# 使用模板进行标注
配置完模板之后就可以用模板进行标注了,标注界面分为波形标注区、工具栏、属性标注区、语音转写区和语音信息区。
波形标注区: 用于拖动选中音频的有效起始时间。
工具栏: 包含播放/暂停按钮,控制音频播放和暂停;语谱图按钮,点击可展示音频对应的语谱图;清除选中按钮,可清除标注的音频区域。
属性标注区: 展示模板配置的属性,可在此区域选择这条语音的。
语音转写区: 语音的文本转写区域,可在输入框中输入转写文本。
语音信息区: 展示这条语音的基本信息。
标注操作
在波形区域拖动选中音频的有效起止时间,在段落的起点和终点会自动生成模板配置的前后静音时长。
在属性标注区选择这条音频的属性。
在语音转写区的输入框输入转写文本,文本规范化可转换字符,在输入框中点击右键可以选择噪音符号。
可在语音信息区核对标注信息。
← 图片:精细抠图模板 语音:无缝多段落模板 →