CMDCEval.Suites.Internal (cmdc_eval v0.1.0)

Copy Markdown View Source

Internal Suite —— 验证 cmdc 内部特性。

5 个 scenario:

  1. basic_text —— 单 turn 纯文本回复
  2. simple_tool_call —— 调一个工具回复正确
  3. multi_turn_reasoning —— 多 turn 推理(mock provider 给固定回复)
  4. steering_response —— Steering 注入文字被 Agent 看到
  5. abort_clean —— abort/2 后 session clean stop

这些 scenario 互补外部基准(BFCL / tau2-bench 侧重 LLM 端能力), 验证 cmdc kernel 自身的"控制平面"能力,回归测试用。