# 实体标注模板V2.0

# 如何配置模板

# 术语解释

标签配置:在实体打上一个标签,在项目需求里相当于一个实体的分类,如果实体没有任何属性,只有一个分类:如人名、地名和机构名可以使用标签。

  • 选项层级:标注物品的类别层级,如需要标注食品,那么一级标签可以是水果、零食、饮料,二级标签在一级类别下面细分,如水果又可以分为热带水果、普通水果,三级标签又在二级标签下细分,如热带水果可以分为香蕉、芒果、榴莲等。

  • 属性组选择:最小层级的标签可以关联一组属性,不同的标签可以关联不同的属性组。

选项层级:属性名称是这个属性的名称,相当于一个选择题或问答题的题目,便于标注员理解需要标什么属性;一级属性二级属性等为这个问题的答案,是一个属性的选项。

  • 选项类型:可以选择单选、多选、列表、输入和级联类型,单选、多选、列表只可设置一级属性,输入类型无需设置属性。级联类型支持设置多级属性。

# 标签配置

# 标签展示类型如何选择

标签展示类型分为:显示在属性内,显示在页面左侧,显示在标签列表

  • 显示在属性内:标签显示在属性内,先绘制框再选择标签;

  • 示在页面左侧:标签显示在页面左侧,先选择标签,再绘制框

  • 显示在标签列表:只有标签没有属性,以标签列表形式展示,绘制完框后弹出标签列表

# 如何新增标签

  1. 选择『标签配置』
  2. 点击『添加标签』按钮,可新增一个标签,新增的标签内容为空,我们需要添加标签信息实体-标签配置
  3. 添加信息:
    1. 序号:无需填写,自动生成,正序排列
    2. 层级:标签的级联层级,如果标签有多级,则层级表示标签在第几层级
    3. 英文名称:标签的英文名称,必填,同级的标签不允许重复,允许输入英文、英文下划线,中划线、数字、及特殊符号[&].《》'':。:() ,输入空格,请使用[&&]代替
    4. 中文名称:标签的中文名称,显示在标注页面的标签名称,必填,可以重复,但是不建议重复,允许输入大部分字符,也允许直接输入空格
    5. 属性组:不同标签可选择不同属性组,选择对应的属性组即可,需要在属性配置中去先配置属性。属性组非必填
    6. 颜色:标签的颜色,自持16进制的颜色选择,如果需要的颜色为RGB形式,可以在线转换一下 (opens new window)
    7. 最小长,最小宽:该标签的绘制出来的图形最小长,最小宽,可以为空,如果为空,则以『其他配置』中的限制为准,如果其他配置也未配置,则不再限制
    8. 操作:
      1. 新增子项:如果标签有级联,则可以点击该按钮,新增子标签
      2. 删除:删除该标签
      3. 上移:将标签的顺序上移一位
      4. 下移:将标签的顺序下移一位

# 如何新增标签属性

实体-标签属性配置

  1. 选择『属性配置』
  2. 点击『添加属性组』,可以添加一个属性组。属性组是针对不同标签不同属性而设计。如果所有标签都使用同一属性,则使用一个属性组即可
  3. 点击『添加属性』按钮,可新增一个属性,新增的标签内容为空,我们需要添加属性信息
    1. 层级:标签的属性层级,如果属性有多级,则层级表示属性在第几层级

    2. 必填:该属性在标注页面是否必填,默认不勾选,勾选了则为必填项,在标注页面不填写时则阻止提交,同时会以红色*表示必填项

    3. 类型:属性的类型,包含了输入框、下拉、单选、多选、级联

      1. 输入框:在标注页面展示为输入框
      2. 下拉:在前端页面为下拉框形式,支持搜索选择,可配置默认项,勾选默认项在前端则默认选择
      3. 单选:在前端展示为单选形式,可配置默认项,勾选默认项在前端则默认选择,只可勾选一个默认项
      4. 多选:在前端展示为单选形式,可配置默认项,勾选默认项在前端则默认选择,可勾选多个默认项
      5. 级联:在前端展示为单选下拉级联形式,可配置默认项,勾选默认项在前端则默认选择,只可勾选一个默认项
    4. 英文名称:属性的英文名称,必填,同级的属性不允许重复,允许输入、英文、英文下划线,中划线、数字、及特殊符号[&].《》'':。:() ,输入空格,请使用[&&]代替

    5. 中文名称:标签的中文名称,显示在标注页面的标签名称,必填,可以重复,但是不建议重复,允许输入大部分字符,也允许直接输入空格

# 整体属性配置

实体-整体属性配置

通过整体属性可对整个篇章进行分类,配置方法请参考属性配置

# 知识库

实体-知识库配置 通过知识库配置,可以实现对文本进行预标注。

# 其他配置

实体-其他配置

  • 外部参考链接:输入一个网址,供标注时参考用。
  • 字体大小:设置标注页面的字体大小,也可以在标注页面自行调整。
  • 行间距:设置行间距,也可以在标注页面自行调整。
  • 是否禁止复制:默认为否,用于控制在文本标注页面的复制功能。
  • 自动标注:选择是否将相同文字自动标注实体。
  • 重叠标注:选择是否允许已标记为实体的文字再次标记为其他实体。

# 标注

# 整体布局

配置完模板之后就可以用模板进行标注了,标注界面分为标签列表区、文本标注区、标注结果区和工具栏

# 标签列表

显示在页面左侧,当配置页面中标签形式选择为『显示在页面左侧』时,会显示该列表

实体-标签配置

# 图形列表

标注的结果列表,显示标注实体的ID、实体、文本内容及编辑、删除操作

也可进行标签筛选、ID搜索

实体-图形列表

# 工具栏

标注时使用的工具

实体-工具栏

  • 帮助:点击帮助可出现常见快捷键列表和标注的操作说明

实体-帮助

  • 设置:对个人标注习惯的一些设置

    • 字体大小:设置字体大小,默认获取的是配置页面输入的数字,建议值14~16
    • 行间距:设置文本的行间距,最大为5,建议2~3
    • 鼠标移入:设置鼠标移入实体,是否显示标签信息

    实体-设置

  • 删除:选择标注结果后点击删除可删除标注结果

  • 上一步/下一步:实体级别的撤销和重做,例如删掉一个标注结果,点击上一步可恢复这条标注结果,点击下一步可恢复

  • 自动标注:打开自动标注后,标注一个词语为一个实体类别,模板会将全文的相同词语自动标注为该类别。例如将一个北京标注为地名,文中所有的北京将被自动标注为地名

  • 重叠标注:当一个实体与另一个实体存在交集时,打开重叠标注按钮将允许两个实体存在重叠部分,不打开将限制重叠。如“北京大兴机场”,如打开重叠标注,将允许“北京”被标注为地名的同时,“北京大兴机场”被标为组织机构

# 新增一个实体

根据配置,有三种标注方式:

  1. 实体在左侧
    1. 选择实体,如果实体有级联,需要选择到最后一级实体
    2. 鼠标左键单击按住拖动,松开鼠标后完成对文本的划取
    3. 划取文本后自动弹出属性框,填写属性后,点击确定,完成标注
  2. 标签在属性内
    1. 鼠标左键单击按住拖动,松开鼠标后完成对文本的划取
    2. 形成矩形框后自动弹出属性框,填写标签/属性后,点击确定,完成标注
  3. 标签列表
    1. 鼠标左键单击按住拖动,松开鼠标后完成对文本的划取
    2. 形成矩形框后自动弹出标签列表,选择标签后,完成标注

# 修改

  1. 当需要修改标注的实体类别时,双击实体标签,在弹出的窗口中修改结果;也可以在标注结果区点击编辑小笔进行修改
  2. 当需要修改标注的文本内容时,请删除后重新标注

# 删除

  1. 鼠标移入实体,会自动弹出删除按钮
  2. 点击删除,删除已标注的实体

# 质检

# 实体质检

实体关系-实体质检

# 如何质检

  1. 双击要质检的实体文字,弹出属性框
  2. 在属性框中对标注的文本、实体标签、属性进行质检
  3. 勾选错误项后,点击不合格,质检为不合格,不合格的数据,实体标签底色会变为红色
  4. 直接点击合格,质检为合格,合格的数据,实体标签颜色会变为蓝色
  5. 实体关系-如何质检

# 返修

# 实体返修

实体关系-实体返修

  1. 双击要修改的实体,弹出属性框
  2. 勾选了错误项的代表有错误,修改后,错误项变为不勾选,但字体仍为红色,代表已修改
    1. 文本错误:需要将标注结果删除,重新标注才能置为已修改
    2. 实体/属性错误:修改实体或属性的选项,代表已修改
  3. 已修改的实体底色会变为黄色

实体关系-实体返修颜色