Internal Suite —— 验证 cmdc 内部特性。
5 个 scenario:
- basic_text —— 单 turn 纯文本回复
- simple_tool_call —— 调一个工具回复正确
- multi_turn_reasoning —— 多 turn 推理(mock provider 给固定回复)
- steering_response —— Steering 注入文字被 Agent 看到
- abort_clean —— abort/2 后 session clean stop
这些 scenario 互补外部基准(BFCL / tau2-bench 侧重 LLM 端能力), 验证 cmdc kernel 自身的"控制平面"能力,回归测试用。