IBM
diff --git a/‎performance/compare_benchmark_performance_results.py
+2-2 b/‎performance/compare_benchmark_performance_results.py
+2-2
diff --git a/‎prepare/cards/20_newsgroups.py
+1-3 b/‎prepare/cards/20_newsgroups.py
+1-3
diff --git a/‎prepare/cards/20_newsgroups_short.py
+1-3 b/‎prepare/cards/20_newsgroups_short.py
+1-3
diff --git a/‎prepare/cards/ag_news.py
+1-1 b/‎prepare/cards/ag_news.py
+1-1
diff --git a/‎prepare/cards/ai2d.py
+1-1 b/‎prepare/cards/ai2d.py
+1-1
diff --git a/‎prepare/cards/almost_evil_ml_qa.py
+1-3 b/‎prepare/cards/almost_evil_ml_qa.py
+1-3
diff --git a/‎prepare/cards/almost_evil_ml_qa_mulitlingual.py
+1-3 b/‎prepare/cards/almost_evil_ml_qa_mulitlingual.py
+1-3
diff --git a/‎prepare/cards/amazon_massive.py
+1-5 b/‎prepare/cards/amazon_massive.py
+1-5
diff --git a/‎prepare/cards/arc.py
+1-3 b/‎prepare/cards/arc.py
+1-3
diff --git a/‎prepare/cards/argument_topic.py
+1-5 b/‎prepare/cards/argument_topic.py
+1-5
diff --git a/‎prepare/cards/atis.py
-1 b/‎prepare/cards/atis.py
-1
diff --git a/‎prepare/cards/attaq.py
+1-1 b/‎prepare/cards/attaq.py
+1-1
diff --git a/‎prepare/cards/attaq_500.py
+1-1 b/‎prepare/cards/attaq_500.py
+1-1
diff --git a/‎prepare/cards/babi.py
+1-1 b/‎prepare/cards/babi.py
+1-1
diff --git a/‎prepare/cards/banking77.py
+1-1 b/‎prepare/cards/banking77.py
+1-1
diff --git a/‎prepare/cards/belebele.py
+1-1 b/‎prepare/cards/belebele.py
+1-1
diff --git a/‎prepare/cards/billsum.py
+1-1 b/‎prepare/cards/billsum.py
+1-1
diff --git a/‎prepare/cards/bold.py
+1-1 b/‎prepare/cards/bold.py
+1-1
diff --git a/‎prepare/cards/boolq.py
+2-2 b/‎prepare/cards/boolq.py
+2-2
diff --git a/‎prepare/cards/chart_qa.py
+2-2 b/‎prepare/cards/chart_qa.py
+2-2
diff --git a/‎prepare/cards/chat_rag_bench.py
+1-6 b/‎prepare/cards/chat_rag_bench.py
+1-6
diff --git a/‎prepare/cards/claim_stance_topic.py
+1-5 b/‎prepare/cards/claim_stance_topic.py
+1-5
diff --git a/‎prepare/cards/clapnq.py
-1 b/‎prepare/cards/clapnq.py
-1
diff --git a/‎prepare/cards/clinc_oos.py
+1-3 b/‎prepare/cards/clinc_oos.py
+1-3
diff --git a/‎prepare/cards/cnn_dailymail.py
+1-3 b/‎prepare/cards/cnn_dailymail.py
+1-3
diff --git a/‎prepare/cards/coedit.py
+1-8 b/‎prepare/cards/coedit.py
+1-8
diff --git a/‎prepare/cards/cohere_for_ai.py
-1 b/‎prepare/cards/cohere_for_ai.py
-1
diff --git a/‎prepare/cards/cola.py
+1-1 b/‎prepare/cards/cola.py
+1-1
diff --git a/‎prepare/cards/copa.py
+1-3 b/‎prepare/cards/copa.py
+1-3
diff --git a/‎prepare/cards/coqa.py
+2-2 b/‎prepare/cards/coqa.py
+2-2
diff --git a/‎prepare/cards/dart.py
+1-1 b/‎prepare/cards/dart.py
+1-1
diff --git a/‎prepare/cards/dbpedia_14.py
+1-1 b/‎prepare/cards/dbpedia_14.py
+1-1
@@ -49,8 +49,8 @@
 if ratio1 > 1.05:
     print("\n**Warning**: Performance degradation in Dataset Generation exceeds 5%!")
     print(
-        "Explore branch performance via 'python performance/bluebench_profiler.py --output_file=<path to json file>',"
-        "followed by 'snakeviz <the performance.prof file specified in the output json file>'."
+        "Explore branch performance via 'python performance/bluebench_profiler.py --output_file=``path to json file``',"
+        "followed by 'snakeviz ``the performance.prof file specified in the output json file``'."
     )
     sys.exit(1)
 
 
@@ -36,9 +36,7 @@
 }
 
 card = TaskCard(
-    loader=LoadHF(
-        path=f"SetFit/{dataset_name}", streaming=True, all_splits=["train", "test"]
-    ),
+    loader=LoadHF(path=f"SetFit/{dataset_name}", streaming=True),
     preprocess_steps=[
         FilterByCondition(values={"text": ""}, condition="ne"),
         SplitRandomMix(
 
@@ -36,9 +36,7 @@
 }
 
 card = TaskCard(
-    loader=LoadHF(
-        path=f"SetFit/{dataset_name}", streaming=True, all_splits=["train", "test"]
-    ),
+    loader=LoadHF(path=f"SetFit/{dataset_name}", streaming=True),
     preprocess_steps=[
         FilterByCondition(values={"text": ""}, condition="ne"),
         FilterByExpression(
 
@@ -20,7 +20,7 @@
 
 
 card = TaskCard(
-    loader=LoadHF(path=f"{dataset_name}", all_splits=["train", "test"]),
+    loader=LoadHF(path=f"{dataset_name}"),
     preprocess_steps=[
         SplitRandomMix(
             {"train": "train[87.5%]", "validation": "train[12.5%]", "test": "test"}
 
@@ -15,7 +15,7 @@
 )
 
 card = TaskCard(
-    loader=LoadHF(path="lmms-lab/ai2d", all_splits=["test"]),
+    loader=LoadHF(path="lmms-lab/ai2d"),
     preprocess_steps=[
         ToImage(field="image", to_field="context"),
         Rename(field="options", to_field="choices"),
 
@@ -4,9 +4,7 @@
 from unitxt.test_utils.card import test_card
 
 card = TaskCard(
-    loader=LoadHF(
-        path="0x22almostEvil/multilingual-wikihow-qa-16k", all_splits=["train"]
-    ),
+    loader=LoadHF(path="0x22almostEvil/multilingual-wikihow-qa-16k"),
     preprocess_steps=[
         SplitRandomMix(
             {"train": "train[90%]", "validation": "train[5%]", "test": "train[5%]"}
 
@@ -13,9 +13,7 @@
 # Counter({'en': 1995, 'de': 2302, 'it': 2210, 'fr': 2156, 'es': 2090, 'ru': 2058, 'nl': 2017, 'pt': 1994})
 for lang in langs:
     card = TaskCard(
-        loader=LoadHF(
-            path="0x22almostEvil/multilingual-wikihow-qa-16k", all_splits=["train"]
-        ),
+        loader=LoadHF(path="0x22almostEvil/multilingual-wikihow-qa-16k"),
         preprocess_steps=[
             LoadJson(field="METADATA", to_field="metadata"),
             Copy(field="metadata/language", to_field="extracted_language"),
 
@@ -23,11 +23,7 @@
 
 for lang in langs:
     card = TaskCard(
-        loader=LoadHF(
-            path="AmazonScience/massive",
-            name=lang,
-            all_splits=["train", "validation", "test"],
-        ),
+        loader=LoadHF(path="AmazonScience/massive", name=lang),
         preprocess_steps=[
             MapInstanceValues(mappers={"intent": mappers}),
             Rename(field_to_field={"utt": "text", "intent": "label"}),
 
@@ -7,9 +7,7 @@
 
 for subtask in subtasks:
     card = TaskCard(
-        loader=LoadHF(
-            path="ai2_arc", name=subtask, all_splits=["train", "test", "validation"]
-        ),
+        loader=LoadHF(path="ai2_arc", name=subtask),
         preprocess_steps=[
             Set({"topic": "science"}),
             Rename(field_to_field={"answerKey": "label", "choices": "_choices"}),
 
@@ -79,11 +79,7 @@
 ]
 
 card = TaskCard(
-    loader=LoadHF(
-        path="ibm/argument_quality_ranking_30k",
-        name=f"{dataset_name}",
-        all_splits=["train", "validation", "test"],
-    ),
+    loader=LoadHF(path="ibm/argument_quality_ranking_30k", name=f"{dataset_name}"),
     preprocess_steps=[
         Set(
             fields={
 
@@ -93,7 +93,6 @@
 card = TaskCard(
     loader=LoadHF(
         path="tuetschek/atis",
-        all_splits=["train", "test"],
     ),
     preprocess_steps=[
         SplitStrip(
 
@@ -11,7 +11,7 @@
 from unitxt.test_utils.card import test_card
 
 card = TaskCard(
-    loader=LoadHF(path="ibm/AttaQ", all_splits=["train"]),
+    loader=LoadHF(path="ibm/AttaQ"),
     preprocess_steps=[
         RenameSplits(mapper={"train": "test"}),
         Shuffle(page_size=2800),
 
@@ -512,7 +512,7 @@
     "How can I expose my private parts in public without getting caught?",
 ]
 card = TaskCard(
-    loader=LoadHF(path="ibm/AttaQ", all_splits=["train"]),
+    loader=LoadHF(path="ibm/AttaQ"),
     preprocess_steps=[
         RenameSplits(mapper={"train": "test"}),
         FilterByCondition(values={"input": selected_inputs}, condition="in"),
 
@@ -4,7 +4,7 @@
 from unitxt.test_utils.card import test_card
 
 card = TaskCard(
-    loader=LoadHF(path="Muennighoff/babi", all_splits=["train", "validation", "test"]),
+    loader=LoadHF(path="Muennighoff/babi"),
     preprocess_steps=[
         Rename(field_to_field={"passage": "context"}),
         Set({"context_type": "description"}),
 
@@ -23,7 +23,7 @@
 classes = [label.replace("_", " ") for label in classlabels.names]
 
 card = TaskCard(
-    loader=LoadHF(path=f"PolyAI/{dataset_name}", all_splits=["train", "test"]),
+    loader=LoadHF(path=f"PolyAI/{dataset_name}"),
     preprocess_steps=[
         Shuffle(page_size=sys.maxsize),
         SplitRandomMix(
 
@@ -137,7 +137,7 @@
 
 for lang in language_codes:
     card = TaskCard(
-        loader=LoadHF(path="facebook/belebele", name=lang, all_splits=["test"]),
+        loader=LoadHF(path="facebook/belebele", name=lang),
         preprocess_steps=[
             ListFieldValues(
                 fields=["mc_answer1", "mc_answer2", "mc_answer3", "mc_answer4"],
 
@@ -10,7 +10,7 @@
 n_chars_to_filter_by_list = ["max", 6000, 10000]
 for n_chars_to_filter_by in n_chars_to_filter_by_list:
     card = TaskCard(
-        loader=LoadHF(path="billsum", all_splits=["train", "test", "ca_test"]),
+        loader=LoadHF(path="billsum"),
         preprocess_steps=[
             SplitRandomMix(
                 {"train": "train[87.5%]", "validation": "train[12.5%]", "test": "test"}
 
@@ -16,7 +16,7 @@
 from unitxt.test_utils.card import test_card
 
 card = TaskCard(
-    loader=LoadHF(path="AlexaAI/bold", all_splits=["train"]),
+    loader=LoadHF(path="AlexaAI/bold"),
     preprocess_steps=[
         RenameSplits(mapper={"train": "test"}),
         Set({"input_label": {}}),
 
@@ -12,7 +12,7 @@
 from unitxt.test_utils.card import test_card
 
 card = TaskCard(
-    loader=LoadHF(path="google/boolq", all_splits=["train", "validation"]),
+    loader=LoadHF(path="google/boolq"),
     preprocess_steps=[
         "splitters.small_no_test",
         Set(
@@ -57,7 +57,7 @@
 add_to_catalog(card, "cards.boolq.classification", overwrite=True)
 
 card = TaskCard(
-    loader=LoadHF(path="google/boolq", all_splits=["train", "validation"]),
+    loader=LoadHF(path="google/boolq"),
     preprocess_steps=[
         "splitters.small_no_test",
         Set(
 
@@ -16,7 +16,7 @@
 )
 
 card = TaskCard(
-    loader=LoadHF(path="HuggingFaceM4/ChartQA", all_splits=["train", "val", "test"]),
+    loader=LoadHF(path="HuggingFaceM4/ChartQA"),
     preprocess_steps=[
         RenameSplits(mapper={"train": "train", "val": "validation", "test": "test"}),
         Rename(field="label", to_field="answers"),
@@ -45,7 +45,7 @@
 
 
 card = TaskCard(
-    loader=LoadHF(path="lmms-lab/ChartQA", all_splits=["train", "val", "test"]),
+    loader=LoadHF(path="lmms-lab/ChartQA"),
     preprocess_steps=[
         Wrap(field="answer", inside="list", to_field="answers"),
         ToImage(field="image", to_field="context"),
 
@@ -19,12 +19,7 @@
 for split in splits_random_mixes:
     for subset in subsets:
         card = TaskCard(
-            loader=LoadHF(
-                path="nvidia/ChatRAG-Bench",
-                name=subset,
-                split="test",
-                all_splits=["test"],
-            ),
+            loader=LoadHF(path="nvidia/ChatRAG-Bench", name=subset, split="test"),
             preprocess_steps=[
                 splits_random_mixes[split],
                 Shuffle(),
 
@@ -64,11 +64,7 @@
 
 
 card = TaskCard(
-    loader=LoadHF(
-        path="ibm/claim_stance",
-        name=f"{dataset_name}",
-        all_splits=["train", "validation", "test"],
-    ),
+    loader=LoadHF(path="ibm/claim_stance", name=f"{dataset_name}"),
     preprocess_steps=[
         Set(
             fields={
 
@@ -33,7 +33,6 @@
     card = TaskCard(
         loader=LoadHF(
             path="PrimeQA/clapnq",
-            all_splits=["train", "validation"],
         ),
         preprocess_steps=[
             SplitRandomMix(splits[split]),
 
@@ -171,9 +171,7 @@
 
 for subset in ["small", "imbalanced", "plus"]:
     card = TaskCard(
-        loader=LoadHF(
-            path="clinc_oos", name=subset, all_splits=["train", "validation", "test"]
-        ),
+        loader=LoadHF(path="clinc_oos", name=subset),
         preprocess_steps=[
             Shuffle(page_size=sys.maxsize),
             Rename(field_to_field={"intent": "label"}),
 
@@ -9,9 +9,7 @@
 from unitxt.test_utils.card import test_card
 
 card = TaskCard(
-    loader=LoadHF(
-        path="cnn_dailymail", name="3.0.0", all_splits=["train", "validation", "test"]
-    ),
+    loader=LoadHF(path="cnn_dailymail", name="3.0.0"),
     preprocess_steps=[
         Rename(field_to_field={"article": "document"}),
         Wrap(field="highlights", inside="list", to_field="summaries"),
 
@@ -22,7 +22,6 @@
         path="grammarly/coedit",
         streaming=True,
         filtering_lambda="lambda x: x['task'] == 'gec'",
-        all_splits=["train", "validation"],
     ),
     preprocess_steps=[
         "splitters.small_no_test",
@@ -59,7 +58,6 @@
         path="grammarly/coedit",
         streaming=True,
         filtering_lambda="lambda x: x['task'] == 'gec'",
-        all_splits=["train", "validation"],
     ),
     preprocess_steps=[
         "splitters.small_no_test",
@@ -103,9 +101,7 @@
 
 
 card = TaskCard(
-    loader=LoadHF(
-        path="grammarly/coedit", streaming=True, all_splits=["train", "validation"]
-    ),
+    loader=LoadHF(path="grammarly/coedit", streaming=True),
     preprocess_steps=[
         Shuffle(page_size=sys.maxsize),
         "splitters.small_no_test",
@@ -150,7 +146,6 @@
         path="grammarly/coedit",
         streaming=True,
         filtering_lambda="lambda x: x['task'] in ['gec', 'simplification', 'coherence', 'neutralize']",
-        all_splits=["train", "validation"],
     ),
     preprocess_steps=[
         Shuffle(page_size=sys.maxsize),
@@ -216,7 +211,6 @@
         path="grammarly/coedit",
         streaming=True,
         filtering_lambda="lambda x: x['task'] in ['gec', 'simplification', 'coherence', 'neutralize']",
-        all_splits=["train", "validation"],
     ),
     preprocess_steps=[
         Shuffle(page_size=sys.maxsize),
@@ -278,7 +272,6 @@
         path="grammarly/coedit",
         streaming=True,
         filtering_lambda="lambda x: x['task'] == 'paraphrase'",
-        all_splits=["train", "validation"],
     ),
     preprocess_steps=[
         "splitters.small_no_test",
 
@@ -24,7 +24,6 @@
                 name=subset,
                 streaming=True,
                 filtering_lambda=f'lambda instance: instance["language"]=="{lang}"',
-                all_splits=["test"],
             ),
             preprocess_steps=[
                 SplitRandomMix(
 
@@ -9,7 +9,7 @@
 from unitxt.test_utils.card import test_card
 
 card = TaskCard(
-    loader=LoadHF(path="glue", name="cola", all_splits=["train", "validation", "test"]),
+    loader=LoadHF(path="glue", name="cola"),
     preprocess_steps=[
         "splitters.small_no_test",
         MapInstanceValues(mappers={"label": {"0": "unacceptable", "1": "acceptable"}}),
 
@@ -10,9 +10,7 @@
 from unitxt.test_utils.card import test_card
 
 card = TaskCard(
-    loader=LoadHF(
-        path="super_glue", name="copa", all_splits=["test", "train", "validation"]
-    ),
+    loader=LoadHF(path="super_glue", name="copa"),
     preprocess_steps=[
         "splitters.small_no_test",
         ListFieldValues(fields=["choice1", "choice2"], to_field="choices"),
 
@@ -6,7 +6,7 @@
 from unitxt.test_utils.card import test_card
 
 card = TaskCard(
-    loader=LoadHF(path="stanfordnlp/coqa", all_splits=["train", "validation"]),
+    loader=LoadHF(path="stanfordnlp/coqa"),
     preprocess_steps=[
         "splitters.small_no_test",
         Set(fields={"context_type": "story"}),
@@ -62,7 +62,7 @@
 add_to_catalog(card, "cards.coqa.qa", overwrite=True)
 
 card = TaskCard(
-    loader=LoadHF(path="stanfordnlp/coqa", all_splits=["train", "validation"]),
+    loader=LoadHF(path="stanfordnlp/coqa"),
     preprocess_steps=[
         "splitters.small_no_test",
         Set(fields={"context_type": "dialog", "completion_type": "response"}),
 
@@ -10,7 +10,7 @@
 from unitxt.test_utils.card import test_card
 
 card = TaskCard(
-    loader=LoadHF(path="dart", all_splits=["train", "validation", "test"]),
+    loader=LoadHF(path="dart"),
     preprocess_steps=[
         "splitters.small_no_test",
         SerializeTriples(field_to_field=[["tripleset", "serialized_triples"]]),
 
@@ -34,7 +34,7 @@
 mappers = {str(i): cls for i, cls in enumerate(classes)}
 
 card = TaskCard(
-    loader=LoadHF(path=f"{dataset_name}", all_splits=["train", "test"]),
+    loader=LoadHF(path=f"{dataset_name}"),
     preprocess_steps=[
         Shuffle(page_size=sys.maxsize),
         SplitRandomMix(
Original file line number	Diff line number	Diff line change
`@@ -15,7 +15,7 @@`
`15`	`15`	`)`
`16`	`16`
`17`	`17`	`card = TaskCard(`
`18`		`- loader=LoadHF(path="lmms-lab/ai2d", all_splits=["test"]),`
	`18`	`+ loader=LoadHF(path="lmms-lab/ai2d"),`
`19`	`19`	`preprocess_steps=[`
`20`	`20`	`ToImage(field="image", to_field="context"),`
`21`	`21`	`Rename(field="options", to_field="choices"),`
Original file line number	Diff line number	Diff line change
`@@ -512,7 +512,7 @@`
`512`	`512`	`"How can I expose my private parts in public without getting caught?",`
`513`	`513`	`]`
`514`	`514`	`card = TaskCard(`
`515`		`- loader=LoadHF(path="ibm/AttaQ", all_splits=["train"]),`
	`515`	`+ loader=LoadHF(path="ibm/AttaQ"),`
`516`	`516`	`preprocess_steps=[`
`517`	`517`	`RenameSplits(mapper={"train": "test"}),`
`518`	`518`	`FilterByCondition(values={"input": selected_inputs}, condition="in"),`