change: change model and group tasks in LMEval HF tests (#394)

adolfo-ab · web-flow · commit d56baa8f88fc · 2025-06-30T12:29:56.000+02:00
diff --git a/tests/model_explainability/lm_eval/conftest.py b/tests/model_explainability/lm_eval/conftest.py
@@ -35,7 +35,7 @@ def lmevaljob_hf(
         name=LMEVALJOB_NAME,
         namespace=model_namespace.name,
         model="hf",
-        model_args=[{"name": "pretrained", "value": "Qwen/Qwen2.5-0.5B-Instruct"}],
+        model_args=[{"name": "pretrained", "value": "rgeada/tiny-untrained-granite"}],
         task_list=request.param.get("task_list"),
         log_samples=True,
         allow_online=True,
diff --git a/tests/model_explainability/lm_eval/test_lm_eval.py b/tests/model_explainability/lm_eval/test_lm_eval.py
@@ -10,19 +10,9 @@
     "model_namespace, lmevaljob_hf",
     [
         pytest.param(
-            {"name": "test-lmeval-hf-arc"}, {"task_list": {"taskNames": ["arc_challenge"]}}, id="arc_challenge"
-        ),
-        pytest.param(
-            {"name": "test-lmeval-hf-mmlu"},
-            {"task_list": {"taskNames": ["mmlu_astronomy_generative"]}},
-            id="mmlu_astronomy_generative",
-        ),
-        pytest.param({"name": "test-lmeval-hf-hellaswag"}, {"task_list": {"taskNames": ["hellaswag"]}}, id="hellaswag"),
-        pytest.param(
-            {"name": "test-lmeval-hf-truthfulqa"}, {"task_list": {"taskNames": ["truthfulqa_gen"]}}, id="truthfulqa_gen"
-        ),
-        pytest.param(
-            {"name": "test-lmeval-hf-winogrande"}, {"task_list": {"taskNames": ["winogrande"]}}, id="winogrande"
+            {"name": "test-lmeval-hf-tasks"},
+            {"task_list": {"taskNames": ["arc_challenge", "mmlu_astronomy", "hellaswag", "truthfulqa", "winogrande"]}},
+            id="popular_tasks",
         ),
         pytest.param(
             {"name": "test-lmeval-hf-custom-task"},