本栏目收录与生成式 AI、监督微调(SFT)、人类反馈(RLHF)等相关的标准模版,可按项目扩展样式、字段与校验规则。

模版列表

  • 监督式语言模型微调:上方展示指令或提示,下方在文本区撰写参考答案,适合指令跟随与代码/问答类 SFT 数据。
  • 人类偏好收集:同一提示下展示两条候选回答,点选更优项,适合成对偏好与奖励建模数据。
  • 聊天机器人模型评估:多轮对话 + 质量打分与多维度安全/合规问卷。