CMDCEval.Reasoning (cmdc_eval v0.3.1)

Copy Markdown View Source

Reasoning Eval adapter。

接收 CMDC.Reasoning.Runner 返回值或 EventBus 中的 reasoning_* 事件, 归一化为可做发布门禁的指标 map。该模块只依赖公开事件 shape,不启动 Agent, 适合离线 fixture、CI 回放和 Hex 发布前的推理策略回归检查。

Summary

Functions

从 EventBus 事件列表构造 ReasoningEval context。

CMDC.Reasoning.Runner.run/4 返回 payload 构造 ReasoningEval context。

按门禁策略返回 :ok 或结构化 failures。

计算 reasoning 指标。

Types

failure()

@type failure() :: %{metric: atom(), expected: term(), actual: term()}

metrics()

@type metrics() :: map()

source()

@type source() :: map() | [term()]

Functions

from_events(events, opts \\ [])

@spec from_events(
  [term()],
  keyword()
) :: map()

从 EventBus 事件列表构造 ReasoningEval context。

from_result(result, opts \\ [])

@spec from_result(
  map(),
  keyword()
) :: map()

CMDC.Reasoning.Runner.run/4 返回 payload 构造 ReasoningEval context。

gate(source, policy)

@spec gate(source(), map() | keyword()) :: :ok | {:error, [failure()]}

按门禁策略返回 :ok 或结构化 failures。

metrics(source)

@spec metrics(source()) :: metrics()

计算 reasoning 指标。