# 关系抽取 (Relation Extraction)<no value>

# 关系抽取使用说明

关系抽取可以理解为「先按类型标出两个（或多个）文本片段，再用关系类型把它们连起来」：例如先为「文天祥」打上名词类标签、为「他」打上代词类标签，再通过界面中的关系工具在二者之间建立一条边，表示代词指向该名词。它适合共指消解、实体关系分类、事件论元关联等场景，常与命名实体识别配合使用。

## 标注核心作用

1.  输出实体对级别的结构化监督，便于训练关系分类器或图神经网络；
2.  关系类型由 `Relations` 预定义，保证全项目口径一致；
3.  可视化连线降低漏标、错向（头尾颠倒）的概率。

## 基础操作步骤

1.  点选实体类型标签，并在文本中拖选对应片段完成实体标注（至少需要两个标注的实体才能进行关系抽取）；
2.  在下方面板切换到「信息」板块；
3.  选中其中一个实体作为关系一端的区域；
4.  点击关系图标，即可创建关系；
5.  点击另一个实体，就能完成关系链接。

![关系抽取标注示例](./images/relation-extraction-example.png)

说明：完成以上步骤之后，点击截图中「关系」板块，选择对应的关系对即可选择具体关系类型（关系类型可自己定义）。

## 注意事项

- 实体边界尽量紧凑，避免把标点或无关邻词选入同一跨度；
- 同一对实体是否允许多条关系、是否区分方向，需在标注规范中写清；
- 示例中的 `org:founded_by` / `org:founded` 仅为配置演示，与中文传记样例无字面语义对应时，应替换为真实关系集合。

## 模板预览

![关系抽取模板预览](./images/relation-extraction.png)

## 模板配置
### 完整代码块

```html
<View>
   <Relations>
    <Relation value="org:founded_by"/>
    <Relation value="org:founded"/>
  </Relations>
  <Labels name="label" toName="text">
    <Label value="名词" background="green"/>
    <Label value="代词" background="blue"/>
  </Labels>

  <Text name="text" value="$text"/>
</View>
```

### 关系抽取配置代码说明

以上代码用于实现「文本实体划选 + 预定义关系类型连线」的基础关系标注流程。

1、关系组件：`Relations` 下列出可选关系类型；标注时在已选实体间创建边并从中择一（如 `org:founded_by`）。可按业务增删 `Relation` 条目。

2、标签组件：`Labels name="label" toName="text"` 将实体类别绑定到文本；先选标签再在正文中划选，即生成可作为关系端点的区域。

3、文本组件：`Text name="text" value="$text"` 用于加载待标注正文字符串。

### 示例数据（简要）

以下示例与截图中的传记短文一致，`text` 建议保持单行字符串，便于导出后做偏移校验。

```json
{
  "data": {
    "text": "南宋末年著名的民族英雄文天祥少年时生活困苦，在好心人的帮助下才有机会读书。一次，文天祥被有钱的同学误会是小偷，他据理力争，不许别人践踏自己的尊严，终于证明了自己的清白，而且通过这件事，更加树立了文天祥金榜题名的志向。"
  }
}
```

说明
- 代码可直接复制到标注配置文件中使用；
- 修改 `Label` 或 `Relation` 后，建议同步更新质检规则与标注员培训材料；
- 若需仅做实体而不允许建关系，可暂时移除 `Relations` 块（以平台兼容性为准）。