Source code for lm_polygraph.estimators.token_sar

import numpy as np

from typing import Dict, List

from .estimator import Estimator


[docs]def token_level_sar_scores(stats: Dict[str, np.ndarray]) -> List[np.ndarray]:
    batch_log_likelihoods = stats["greedy_log_likelihoods"]
    batch_token_similarity = stats["token_similarity"]

    all_E_t = []
    for log_likelihoods, token_similarity in zip(
        batch_log_likelihoods, batch_token_similarity
    ):
        log_likelihoods = np.array(log_likelihoods)
        R_t = 1 - token_similarity
        R_t_norm = R_t / R_t.sum()
        E_t = -log_likelihoods * R_t_norm
        all_E_t.append(E_t)
    return all_E_t


[docs]class TokenSAR(Estimator):
    """
    Estimates the sequence-level uncertainty of a language model following the method of
    "Token SAR" as provided in the paper https://arxiv.org/abs/2307.01379.
    Works only with whitebox models (initialized using lm_polygraph.utils.model.WhiteboxModel).

    This method calculates the weighted sum of log_likelihoods with weights computed using token relevance.
    """

    def __init__(self):
        super().__init__(["token_similarity", "greedy_log_likelihoods"], "sequence")

    def __str__(self):
        return "TokenSAR"

    def __call__(self, stats: Dict[str, np.ndarray]) -> np.ndarray:
        """
        Estimates the tokenSAR for each sample in the input statistics.

        Parameters:
            stats (Dict[str, np.ndarray]): input statistics, which for multiple samples includes:
                * log p(y_i | y_<i, x) in 'greedy_log_likelihoods'
                * similarity of the generated text and generated text without one token for each token in 'token_similarity',
        Returns:
            np.ndarray: float tokenSAR for each sample in input statistics.
                Higher values indicate more uncertain samples.
        """

        all_E_t = token_level_sar_scores(stats)
        return np.array([E_t.sum() for E_t in all_E_t])