llama-stack-provider-ragas/src/llama_stack_provider_ragas/remote/kubeflow/components.py at 9fd201fab3fc162548a0265e8367207fc30f90a3 · dmaniloff/llama-stack-provider-ragas · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
import logging
import os
from typing import List  # noqa

from dotenv import load_dotenv
from kfp import dsl
from kubernetes import client
from kubernetes.client.exceptions import ApiException

from ...constants import (
    DEFAULT_RAGAS_PROVIDER_IMAGE,
    KUBEFLOW_CANDIDATE_NAMESPACES,
    RAGAS_PROVIDER_IMAGE_CONFIGMAP_KEY,
    RAGAS_PROVIDER_IMAGE_CONFIGMAP_NAME,
)
from .utils import _load_kube_config

load_dotenv()
logger = logging.getLogger(__name__)
logger.setLevel(logging.INFO)


def get_base_image() -> str:
    """Get base image from env, fallback to k8s ConfigMap, fallback to default image."""

    if (base_image := os.environ.get("KUBEFLOW_BASE_IMAGE")) is not None:
        return base_image

    _load_kube_config()
    api = client.CoreV1Api()

    for candidate_namespace in KUBEFLOW_CANDIDATE_NAMESPACES:
        try:
            configmap = api.read_namespaced_config_map(
                name=RAGAS_PROVIDER_IMAGE_CONFIGMAP_NAME,
                namespace=candidate_namespace,
            )

            data: dict[str, str] | None = configmap.data
            if data and RAGAS_PROVIDER_IMAGE_CONFIGMAP_KEY in data:
                return data[RAGAS_PROVIDER_IMAGE_CONFIGMAP_KEY]
        except ApiException as api_exc:
            if api_exc.status == 404:
                continue
            else:
                logger.warning(f"Warning: Could not read from ConfigMap: {api_exc}")
        except Exception as e:
            logger.warning(f"Warning: Could not read from ConfigMap: {e}")
    else:
        # None of the candidate namespaces had the required ConfigMap/key
        logger.warning(
            f"ConfigMap '{RAGAS_PROVIDER_IMAGE_CONFIGMAP_NAME}' with key "
            f"'{RAGAS_PROVIDER_IMAGE_CONFIGMAP_KEY}' not found in any of the namespaces: "
            f"{KUBEFLOW_CANDIDATE_NAMESPACES}. Returning default image."
        )
        return DEFAULT_RAGAS_PROVIDER_IMAGE


@dsl.component(
    base_image=get_base_image(),
    packages_to_install=["llama-stack-provider-ragas[remote]"],
)
def retrieve_data_from_llama_stack(
    dataset_id: str,
    llama_stack_base_url: str,
    output_dataset: dsl.Output[dsl.Dataset],
    num_examples: int = -1,  # TODO: parse this
):
    import pandas as pd
    from llama_stack_client import LlamaStackClient

    client = LlamaStackClient(base_url=llama_stack_base_url)
    dataset = client.datasets.retrieve(dataset_id=dataset_id)
    df = pd.DataFrame(dataset.source.rows)
    df.to_json(output_dataset.path, orient="records", lines=True)


@dsl.component(
    base_image=get_base_image(),
    packages_to_install=["llama-stack-provider-ragas[remote]"],
)
def run_ragas_evaluation(
    model: str,
    sampling_params: dict,
    embedding_model: str,
    metrics: List[str],  # noqa
    llama_stack_base_url: str,
    input_dataset: dsl.Input[dsl.Dataset],
    result_s3_location: str,
):
    import logging

    import pandas as pd
    from ragas import EvaluationDataset, evaluate
    from ragas.dataset_schema import EvaluationResult
    from ragas.run_config import RunConfig

    from llama_stack_provider_ragas.compat import SamplingParams
    from llama_stack_provider_ragas.constants import METRIC_MAPPING
    from llama_stack_provider_ragas.logging_utils import render_dataframe_as_table
    from llama_stack_provider_ragas.remote.wrappers_remote import (
        LlamaStackRemoteEmbeddings,
        LlamaStackRemoteLLM,
    )

    logger = logging.getLogger(__name__)
    logger.setLevel(logging.INFO)

    # sampling_params is passed in from the benchmark config as model_dump()
    # we need to convert it back to a SamplingParams object
    sampling_params_obj = SamplingParams.model_validate(sampling_params)

    llm = LlamaStackRemoteLLM(
        base_url=llama_stack_base_url,
        model_id=model,
        sampling_params=sampling_params_obj,
    )
    embeddings = LlamaStackRemoteEmbeddings(
        base_url=llama_stack_base_url,
        embedding_model_id=embedding_model,
    )

    metrics = [METRIC_MAPPING[m] for m in metrics]
    run_config = RunConfig(max_workers=1)

    with open(input_dataset.path) as f:
        df_input = pd.read_json(f, lines=True)
        eval_dataset = EvaluationDataset.from_list(df_input.to_dict(orient="records"))

    ragas_output: EvaluationResult = evaluate(
        dataset=eval_dataset,
        metrics=metrics,
        llm=llm,
        embeddings=embeddings,
        run_config=run_config,
    )

    df_output = ragas_output.to_pandas()
    table_output = render_dataframe_as_table(df_output, "Ragas Evaluation Results")
    logger.info(f"Ragas evaluation completed:\n{table_output}")

    logger.info(f"Saving results to {result_s3_location}")
    df_output.to_json(result_s3_location, orient="records", lines=True)