关系抽取使用说明

关系抽取可以理解为「先按类型标出两个(或多个)文本片段,再用关系类型把它们连起来」:例如先为「文天祥」打上名词类标签、为「他」打上代词类标签,再通过界面中的关系工具在二者之间建立一条边,表示代词指向该名词。它适合共指消解、实体关系分类、事件论元关联等场景,常与命名实体识别配合使用。

标注核心作用

  1. 输出实体对级别的结构化监督,便于训练关系分类器或图神经网络;
  2. 关系类型由 Relations 预定义,保证全项目口径一致;
  3. 可视化连线降低漏标、错向(头尾颠倒)的概率。

基础操作步骤

  1. 点选实体类型标签,并在文本中拖选对应片段完成实体标注(至少需要两个标注的实体才能进行关系抽取);
  2. 在下方面板切换到「信息」板块;
  3. 选中其中一个实体作为关系一端的区域;
  4. 点击关系图标,即可创建关系;
  5. 点击另一个实体,就能完成关系链接。

关系抽取标注示例

说明:完成以上步骤之后,点击截图中「关系」板块,选择对应的关系对即可选择具体关系类型(关系类型可自己定义)。

注意事项

  • 实体边界尽量紧凑,避免把标点或无关邻词选入同一跨度;
  • 同一对实体是否允许多条关系、是否区分方向,需在标注规范中写清;
  • 示例中的 org:founded_by / org:founded 仅为配置演示,与中文传记样例无字面语义对应时,应替换为真实关系集合。

模板预览

关系抽取模板预览

模板配置

完整代码块

<View>
   <Relations>
    <Relation value="org:founded_by"/>
    <Relation value="org:founded"/>
  </Relations>
  <Labels name="label" toName="text">
    <Label value="名词" background="green"/>
    <Label value="代词" background="blue"/>
  </Labels>

  <Text name="text" value="$text"/>
</View>

关系抽取配置代码说明

以上代码用于实现「文本实体划选 + 预定义关系类型连线」的基础关系标注流程。

1、关系组件:Relations 下列出可选关系类型;标注时在已选实体间创建边并从中择一(如 org:founded_by)。可按业务增删 Relation 条目。

2、标签组件:Labels name="label" toName="text" 将实体类别绑定到文本;先选标签再在正文中划选,即生成可作为关系端点的区域。

3、文本组件:Text name="text" value="$text" 用于加载待标注正文字符串。

示例数据(简要)

以下示例与截图中的传记短文一致,text 建议保持单行字符串,便于导出后做偏移校验。

{
  "data": {
    "text": "南宋末年著名的民族英雄文天祥少年时生活困苦,在好心人的帮助下才有机会读书。一次,文天祥被有钱的同学误会是小偷,他据理力争,不许别人践踏自己的尊严,终于证明了自己的清白,而且通过这件事,更加树立了文天祥金榜题名的志向。"
  }
}

说明

  • 代码可直接复制到标注配置文件中使用;
  • 修改 LabelRelation 后,建议同步更新质检规则与标注员培训材料;
  • 若需仅做实体而不允许建关系,可暂时移除 Relations 块(以平台兼容性为准)。