# 试标空间 (Sandbox)<no value>

## 什么是试标空间？

**试标空间 (Sandbox)** 是据吉网独创的“赛马机制”。甲方通过发布占总量 1%-5% 的小样任务，让参与竞标的多个供应商在同一标准下进行实操。

### 为什么需要试标？
* **质量可视化**：不再只看乙方的 PPT 或历史介绍，直接看本次项目的成品。
* **规避风险**：避免在正式开工后才发现供应商不理解标注规则。
* **择优录取**：平台会根据各方的**准确率**、**响应速度**和**吞吐量**生成对比画像。

---

## 操作流程

### 第一步：创建试标任务
在项目管理后台点击“开启 Sandbox”，上传测试数据集。建议样本包含：
* **常规场景**：占 70%，测试基础稳定性。
* **Corner Cases (极端案例)**：占 30%，测试供应商处理复杂问题的能力。

### 第二步：设定基准 (Ground Truth)
甲方需亲自或指定专家标注一份“标准答案”。系统将以此为基准，自动计算乙方的**标注准确率 (Precision)** 和 **召回率 (Recall)**。

### 第三步：供应商竞标实操
选定的供应商进入隔离的 Sandbox 环境。他们无法看到其他人的进度，只能依据您上传的 [标注规范](../templates/_index.md) 进行作业。

### 第四步：评估与录取
系统自动生成《试标对比报告》，指标包括：
* **平均耗时**：反映团队熟练度。
* **初审通过率**：反映内部质检水平。
* **沟通成本系数**：根据反馈频率与准确度综合计算。

---

## 最佳实践 Tips
1. **规范先行**：在试标开始前，务必确保您的标注文档已更新至最新版，避免因歧义导致的分数偏低。
2. **小步快跑**：试标周期建议控制在 24-48 小时内，以便快速进入大规模量产阶段。



---

> **下一步：**
> 试标通过后，您可以进入 [线上签约与托管](./contract-escrow.md) 环节，启动全量生产。