本页目录
音频/语音处理
本栏目收录与音频 / 语音处理相关的标准模版,可按项目扩展音频字段名、事件/区段标签、话轮 JSON 结构、质量评分分制、情感与意图类别及快捷键。
模版列表
- 自动语音识别:内置音频播放器与波形,下方多行文本框整段转写,适配 ASR 数据构建与质检。
- 使用片段的自动语音识别:先标「语音 / 噪音」区段,再按区段转写(perRegion),适配长音频分段与噪声过滤。
- 语音转录:在语音区段上转写并选段级积极/中性/消极(表情),
region-list展示,仅在「语音」标签时显示控件。 - 对话分析:音频与对话 JSON 同步,气泡展示说话人与时间,对每段话轮打情感等标签,适配客服与会议场景。
- 意图分类:用多类语音片段标签划段,再对每个区段选择咨询、请求、反馈等意图,适配语音客服与指令理解。
- 信号质量监测:整段音频听辨后打 1–10 星,主观评价信噪与可懂度等,适配音质与链路人审。
- 声音事件监测:在波形上为「事件一 / 事件二」等类型划区段,标声音事件起止与类别,适配 SED 等强监督数据。
- 说话人分割:在波形上为「说话人一 / 说话人二」划区,标各说话人时间区间,适配 diarization 等说话人相关数据。