Arcana Evaluation 与 cmdc_eval 的适配层。
本模块不重写 Arcana 的 evaluation 引擎,只做三件事:
- 把 Arcana test case 转成
CMDCEval.Case。 - 调用
Arcana.Evaluation.run/1,并把 run / metrics 归一化成可放入CMDCEval.Run.metadata的 map。 - 生成可传给 Arcana
:retriever的 search / ask / pipeline retriever。
Summary
Functions
返回 Arcana Evaluation retriever callback。
调用 Arcana Evaluation 并返回归一化 metadata。
把 Arcana Evaluation run 归一化为 CMDCEval.Run.metadata 友好 map。
把 Arcana test case 转成 CMDCEval.Case。
批量转换 Arcana test cases。
Types
Functions
返回 Arcana Evaluation retriever callback。
该 callback 符合 Arcana Evaluation.run/1 的契约:
(question, opts) -> {:ok, chunks} | {:ok, chunks, answer} | {:error, reason}。
调用 Arcana Evaluation 并返回归一化 metadata。
:target 可设为 :search、:ask、{:pipeline, opts} 或自定义 retriever。
测试中可传 evaluation: MyFakeEvaluation 替换 Arcana.Evaluation。
把 Arcana Evaluation run 归一化为 CMDCEval.Run.metadata 友好 map。
@spec to_cmdc_case( map(), keyword() ) :: CMDCEval.Case.t()
把 Arcana test case 转成 CMDCEval.Case。
@spec to_cmdc_cases( [map()], keyword() ) :: [CMDCEval.Case.t()]
批量转换 Arcana test cases。