什么是试标空间?

试标空间 (Sandbox) 是据吉网独创的“赛马机制”。甲方通过发布占总量 1%-5% 的小样任务,让参与竞标的多个供应商在同一标准下进行实操。

为什么需要试标?

  • 质量可视化:不再只看乙方的 PPT 或历史介绍,直接看本次项目的成品。
  • 规避风险:避免在正式开工后才发现供应商不理解标注规则。
  • 择优录取:平台会根据各方的准确率响应速度吞吐量生成对比画像。

操作流程

第一步:创建试标任务

在项目管理后台点击“开启 Sandbox”,上传测试数据集。建议样本包含:

  • 常规场景:占 70%,测试基础稳定性。
  • Corner Cases (极端案例):占 30%,测试供应商处理复杂问题的能力。

第二步:设定基准 (Ground Truth)

甲方需亲自或指定专家标注一份“标准答案”。系统将以此为基准,自动计算乙方的标注准确率 (Precision)召回率 (Recall)

第三步:供应商竞标实操

选定的供应商进入隔离的 Sandbox 环境。他们无法看到其他人的进度,只能依据您上传的 标注规范 进行作业。

第四步:评估与录取

系统自动生成《试标对比报告》,指标包括:

  • 平均耗时:反映团队熟练度。
  • 初审通过率:反映内部质检水平。
  • 沟通成本系数:根据反馈频率与准确度综合计算。

最佳实践 Tips

  1. 规范先行:在试标开始前,务必确保您的标注文档已更新至最新版,避免因歧义导致的分数偏低。
  2. 小步快跑:试标周期建议控制在 24-48 小时内,以便快速进入大规模量产阶段。

下一步: 试标通过后,您可以进入 线上签约与托管 环节,启动全量生产。