Source code for lm_polygraph.generation_metrics.sbert

import numpy as np
import logging
from sentence_transformers import SentenceTransformer, util
from typing import List, Dict
from .generation_metric import GenerationMetric

log = logging.getLogger(__name__)


[docs]class SbertMetric(GenerationMetric):
    def __init__(self):
        super().__init__(["greedy_texts"], "sequence")
        self.sbert = SentenceTransformer("all-mpnet-base-v2")

    def __str__(self):
        return "Sbert"

    def _score_single(self, t1: str, t2: str):
        return util.cos_sim(self.sbert.encode(t1), self.sbert.encode(t2)).item()

    def __call__(
        self,
        stats: Dict[str, np.ndarray],
        target_texts: List[str],
    ) -> np.ndarray:
        embeddings = self.sbert.encode(stats["greedy_texts"])
        references = self.sbert.encode(target_texts)
        return util.pairwise_cos_sim(embeddings, references).numpy()


if __name__ == "__main__":
    """
    Kind of tests, while there is no test suite
    """
    metric = SbertMetric()
    stats = {
        "greedy_texts": [
            "Apple",
            "Orange",
            "Car",
            "The best drink is a beer",
            "January is before February",
        ]
    }
    target_texts = ["Apple", "Apple", "Apple", "Octoberfest", "Octoberfest"]

    scores = metric(stats, target_texts)
    logging.info(scores)

    assert scores.shape == (5,)
    assert scores[0] - 1 < 1e-5
    assert scores[1] > scores[2]
    assert scores[3] > scores[4]