RAG 发布门禁配方。
企业 AgentSpec 发布前可按该配方依次跑 RAG Eval、Tool Calling Eval、Safety Eval,
再用 check/2 对报告指标做阈值判断。失败返回结构化 failure 列表,由 CI 或发布
系统阻断上线。
Summary
Functions
检查报告是否满足发布阈值。
@spec default_thresholds() :: map()
默认阈值。集成方应按业务风险等级覆盖。
返回 AgentSpec 发布前 eval recipe。
把 Arcana / CMDCEval 报告压成发布门禁摘要。