Function printReport

printReport(
    result: {
        scores: {
            faithfulness?: number;
            contextRelevance?: number;
            answerRelevance?: number;
            contextRecall?: number;
            contextPrecision?: number;
            overall: number;
            [key: string]: unknown;
        };
        samples: {
            id?: string;
            question: string;
            scores: Record<string, number>;
            reasoning?: Record<string, string>;
            tenantId?: string;
            metadata?: Record<string, unknown>;
        }[];
        stats?: Record<
            string,
            { mean: number; min: number; max: number; stddev: number; count: number },
        >;
        meta: {
            totalSamples: number;
            metrics: string[];
            provider: string;
            model: string;
            startedAt: string;
            completedAt: string;
            durationMs: number;
        };
    },
    options?: PrintReportOptions,
): void
Prints a formatted evaluation report to the terminal.

Renders color-coded score bars, metric summaries, and optional per-sample breakdown. Colors are automatically disabled when stdout is not a TTY.
Parameters
- result: {
      scores: {
          faithfulness?: number;
          contextRelevance?: number;
          answerRelevance?: number;
          contextRecall?: number;
          contextPrecision?: number;
          overall: number;
          [key: string]: unknown;
      };
      samples: {
          id?: string;
          question: string;
          scores: Record<string, number>;
          reasoning?: Record<string, string>;
          tenantId?: string;
          metadata?: Record<string, unknown>;
      }[];
      stats?: Record<
          string,
          { mean: number; min: number; max: number; stddev: number; count: number },
      >;
      meta: {
          totalSamples: number;
          metrics: string[];
          provider: string;
          model: string;
          startedAt: string;
          completedAt: string;
          durationMs: number;
      };
  }
  The evaluation result from evaluate().
  - scores: {
        faithfulness?: number;
        contextRelevance?: number;
        answerRelevance?: number;
        contextRecall?: number;
        contextPrecision?: number;
        overall: number;
        [key: string]: unknown;
    }
    Aggregate scores averaged across all samples.
  - samples: {
        id?: string;
        question: string;
        scores: Record<string, number>;
        reasoning?: Record<string, string>;
        tenantId?: string;
        metadata?: Record<string, unknown>;
    }[]
    Per-sample detailed results.
  - Optionalstats?: Record<
    string,
    { mean: number; min: number; max: number; stddev: number; count: number },
    >
    Per-metric score distribution statistics (min, max, stddev, count).
    
    Keys are metric names (same as keys in scores, minus overall). Useful for understanding score variance and identifying which questions score poorly. overall is excluded — compute it from individual metric stats.
    
    Example
    const { stats } = await evaluate({ ... }) // High stddev indicates inconsistent pipeline behaviour: if ((stats.faithfulness?.stddev ?? 0) > 0.15) { console.warn('Faithfulness varies widely across samples — review your retrieval.') }
  - meta: {
        totalSamples: number;
        metrics: string[];
        provider: string;
        model: string;
        startedAt: string;
        completedAt: string;
        durationMs: number;
    }
    Metadata about the evaluation run.
    
    totalSamples: number
    Total number of samples evaluated.
    
    metrics: string[]
    Names of the metrics that were evaluated.
    
    provider: string
    LLM provider used (e.g. 'anthropic', 'openai').
    
    model: string
    LLM model used (e.g. 'claude-opus-4-6').
    
    startedAt: string
    ISO 8601 timestamp when evaluation started.
    
    completedAt: string
    ISO 8601 timestamp when evaluation completed.
    
    durationMs: number
    Wall-clock duration of the evaluation in milliseconds.
- options: PrintReportOptions = {}
  Optional display configuration.
Returns void
Example
```
import { evaluate, printReport } from 'rageval'

const result = await evaluate({ ... })
printReport(result)

// With per-sample breakdown:
printReport(result, { showSamples: true, maxSamples: 20 })
```
- Defined in src/utils/print-report.ts:78

Function printReport

Parameters

scores: {
    faithfulness?: number;
    contextRelevance?: number;
    answerRelevance?: number;
    contextRecall?: number;
    contextPrecision?: number;
    overall: number;
    [key: string]: unknown;
}

samples: {
    id?: string;
    question: string;
    scores: Record<string, number>;
    reasoning?: Record<string, string>;
    tenantId?: string;
    metadata?: Record<string, unknown>;
}[]

`Optional`stats?: Record<
string,
{ mean: number; min: number; max: number; stddev: number; count: number },
>

Example

meta: {
    totalSamples: number;
    metrics: string[];
    provider: string;
    model: string;
    startedAt: string;
    completedAt: string;
    durationMs: number;
}

totalSamples: number

metrics: string[]

provider: string

model: string

startedAt: string

completedAt: string

durationMs: number

Returns void

Example

Settings

Function printReport

Parameters

scores: { faithfulness?: number; contextRelevance?: number; answerRelevance?: number; contextRecall?: number; contextPrecision?: number; overall: number; [key: string]: unknown;}

samples: { id?: string; question: string; scores: Record<string, number>; reasoning?: Record<string, string>; tenantId?: string; metadata?: Record<string, unknown>;}[]

Optionalstats?: Record< string, { mean: number; min: number; max: number; stddev: number; count: number },>

Example

meta: { totalSamples: number; metrics: string[]; provider: string; model: string; startedAt: string; completedAt: string; durationMs: number;}

totalSamples: number

metrics: string[]

provider: string

model: string

startedAt: string

completedAt: string

durationMs: number

Returns void

Example

Settings

scores: {
faithfulness?: number;
contextRelevance?: number;
answerRelevance?: number;
contextRecall?: number;
contextPrecision?: number;
overall: number;
[key: string]: unknown;
}

samples: {
id?: string;
question: string;
scores: Record<string, number>;
reasoning?: Record<string, string>;
tenantId?: string;
metadata?: Record<string, unknown>;
}[]

`Optional`stats?: Record<
string,
{ mean: number; min: number; max: number; stddev: number; count: number },
>

meta: {
totalSamples: number;
metrics: string[];
provider: string;
model: string;
startedAt: string;
completedAt: string;
durationMs: number;
}