单个评测用例 struct。
Suite 实现的 cases/0 返回 [Case.t()] 列表,Runner 按 case 并发跑。
字段
:id—— case 唯一标识(在 Suite 内 unique):input—— 用户 prompt 字符串:expected—— 期望结果 spec(map / 字符串 / 函数),由 Suite 的assert/2解释:tools—— 该 case 启用的工具模块列表(覆盖 Suite 默认):metadata—— 附加 metadata(如:category,:difficulty):timeout_ms—— 单 case 超时(nil 表示用 Runner 默认)