JohnSnowLabs
diff --git a/‎docs/en/transformer_entries/JanusForMultiModal.md‎
Lines changed: 2 additions & 0 deletions b/‎docs/en/transformer_entries/JanusForMultiModal.md‎
Lines changed: 2 additions & 0 deletions
diff --git a/‎docs/en/transformer_entries/SmolVLMTransformer.md‎
Lines changed: 2 additions & 0 deletions b/‎docs/en/transformer_entries/SmolVLMTransformer.md‎
Lines changed: 2 additions & 0 deletions
diff --git a/‎python/docs/conf.py‎
Lines changed: 1 addition & 0 deletions b/‎python/docs/conf.py‎
Lines changed: 1 addition & 0 deletions
diff --git a/‎python/sparknlp/annotator/cv/gemma3_for_multimodal.py‎
Lines changed: 5 additions & 10 deletions b/‎python/sparknlp/annotator/cv/gemma3_for_multimodal.py‎
Lines changed: 5 additions & 10 deletions
diff --git a/‎python/sparknlp/annotator/cv/internvl_for_multimodal.py‎
Lines changed: 7 additions & 11 deletions b/‎python/sparknlp/annotator/cv/internvl_for_multimodal.py‎
Lines changed: 7 additions & 11 deletions
diff --git a/‎python/sparknlp/annotator/cv/janus_for_multimodal.py‎
Lines changed: 8 additions & 13 deletions b/‎python/sparknlp/annotator/cv/janus_for_multimodal.py‎
Lines changed: 8 additions & 13 deletions
diff --git a/‎python/sparknlp/annotator/cv/llava_for_multimodal.py‎
Lines changed: 1 addition & 1 deletion b/‎python/sparknlp/annotator/cv/llava_for_multimodal.py‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎python/sparknlp/annotator/cv/paligemma_for_multimodal.py‎
Lines changed: 7 additions & 7 deletions b/‎python/sparknlp/annotator/cv/paligemma_for_multimodal.py‎
Lines changed: 7 additions & 7 deletions
diff --git a/‎python/sparknlp/annotator/cv/phi3_vision_for_multimodal.py‎
Lines changed: 1 addition & 1 deletion b/‎python/sparknlp/annotator/cv/phi3_vision_for_multimodal.py‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎python/sparknlp/annotator/cv/qwen2vl_transformer.py‎
Lines changed: 1 addition & 1 deletion b/‎python/sparknlp/annotator/cv/qwen2vl_transformer.py‎
Lines changed: 1 addition & 1 deletion
@@ -17,6 +17,8 @@ val visualQA = JanusForMultiModal.pretrained()
   .setInputCols("image_assembler")
   .setOutputCol("answer")
 ```
+{%- endcapture -%}
+
 {%- capture input_anno -%}
 IMAGE
 {%- endcapture -%}
 
@@ -16,6 +16,8 @@ val visualQA = SmolVLMTransformer.pretrained()
   .setInputCols("image_assembler")
   .setOutputCol("answer")
 ```
+{%- endcapture -%}
+
 {%- capture input_anno -%}
 IMAGE
 {%- endcapture -%}
 
@@ -99,6 +99,7 @@
 autoapi_options = [
     "members",
     "show-module-summary",
+    "undoc-members"
 ]
 autoapi_type = "python"
 autoapi_dirs = ["../sparknlp"]
 
@@ -83,23 +83,18 @@ class Gemma3ForMultiModal(AnnotatorModel,
     >>> from sparknlp.annotator import *
     >>> from pyspark.ml import Pipeline
     >>> from pyspark.sql.functions import lit
-    >>> 
     >>> imageDF = spark.read.format("image").load(images_path)
-    >>> testDF = imageDF.withColumn("text", lit("<bos><start_of_turn>user\nYou are a helpful assistant.\n\n<start_of_image>Describe this image in detail.<end_of_turn>\n<start_of_turn>model\n"))
-    >>> 
-    >>> imageAssembler = ImageAssembler() \
-    ...     .setInputCol("image") \
+    >>> testDF = imageDF.withColumn("text", lit("<bos><start_of_turn>user\\nYou are a helpful assistant.\\n\\n<start_of_image>Describe this image in detail.<end_of_turn>\\n<start_of_turn>model\\n"))
+    >>> imageAssembler = ImageAssembler() \\
+    ...     .setInputCol("image") \\
     ...     .setOutputCol("image_assembler")
-    >>> 
-    >>> visualQA = Gemma3ForMultiModal.pretrained() \
-    ...     .setInputCols("image_assembler") \
+    >>> visualQA = Gemma3ForMultiModal.pretrained() \\
+    ...     .setInputCols("image_assembler") \\
     ...     .setOutputCol("answer")
-    >>> 
     >>> pipeline = Pipeline().setStages([
     ...     imageAssembler,
     ...     visualQA
     ... ])
-    >>> 
     >>> result = pipeline.fit(testDF).transform(testDF)
     >>> result.select("image_assembler.origin", "answer.result").show(truncate=False)
     """
 
@@ -20,8 +20,8 @@ class InternVLForMultiModal(AnnotatorModel,
     - Optimized for deployment with int4 quantization
 
     Pretrained models can be loaded with :meth:`.pretrained` of the companion object:
-    >>> visualQA = InternVLForMultiModal.pretrained() \
-    ...     .setInputCols("image_assembler") \
+    >>> visualQA = InternVLForMultiModal.pretrained() \\
+    ...     .setInputCols("image_assembler") \\
     ...     .setOutputCol("answer")
 
     The default model is `"internvl2_5_1b_int4"`, if no name is provided.
@@ -49,21 +49,17 @@ class InternVLForMultiModal(AnnotatorModel,
     >>> from sparknlp.annotator import *
     >>> from pyspark.ml import Pipeline
     >>> from pyspark.sql.functions import lit
-
     >>> image_df = spark.read.format("image").load(path=images_path)
     >>> test_df = image_df.withColumn(
     ...     "text",
-    ...     lit("<|im_start|><image>\nDescribe this image in detail.<|im_end|><|im_start|>assistant\n")
+    ...     lit("<|im_start|><image>\\nDescribe this image in detail.<|im_end|><|im_start|>assistant\\n")
     ... )
-
-    >>> imageAssembler = ImageAssembler() \
-    ...     .setInputCol("image") \
+    >>> imageAssembler = ImageAssembler() \\
+    ...     .setInputCol("image") \\
     ...     .setOutputCol("image_assembler")
-
-    >>> visualQA = InternVLForMultiModal.pretrained() \
-    ...     .setInputCols("image_assembler") \
+    >>> visualQA = InternVLForMultiModal.pretrained() \\
+    ...     .setInputCols("image_assembler") \\
     ...     .setOutputCol("answer")
-
     >>> pipeline = Pipeline().setStages([
     ...     imageAssembler,
     ...     visualQA
 
@@ -36,8 +36,9 @@ class JanusForMultiModal(AnnotatorModel,
     and for image generation, it uses a tokenizer with a downsample rate of 16.
 
     Pretrained models can be loaded with :meth:`.pretrained` of the companion object:
-    >>> visualQAClassifier = JanusForMultiModal.pretrained() \
-    ...     .setInputCols(["image_assembler"]) \
+
+    >>> visualQAClassifier = JanusForMultiModal.pretrained() \\
+    ...     .setInputCols(["image_assembler"]) \\
     ...     .setOutputCol("answer")
 
     The default model is `"janus_1_3b_int4"`, if no name is provided.
@@ -73,29 +74,23 @@ class JanusForMultiModal(AnnotatorModel,
     >>> from sparknlp.annotator import *
     >>> from pyspark.ml import Pipeline
     >>> from pyspark.sql.functions import lit
-
     >>> image_df = SparkSessionForTest.spark.read.format("image").load(path=images_path)
     >>> test_df = image_df.withColumn(
     ...     "text",
-    ...     lit("User: <image_placeholder>Describe image in details\n\nAssistant:")
+    ...     lit("User: <image_placeholder>Describe image in details\\n\\nAssistant:")
     ... )
-
-    >>> imageAssembler = ImageAssembler() \
-    ...     .setInputCol("image") \
+    >>> imageAssembler = ImageAssembler() \\
+    ...     .setInputCol("image") \\
     ...     .setOutputCol("image_assembler")
-
-    >>> visualQAClassifier = JanusForMultiModal.pretrained() \
-    ...     .setInputCols("image_assembler") \
+    >>> visualQAClassifier = JanusForMultiModal.pretrained() \\
+    ...     .setInputCols("image_assembler") \\
     ...     .setOutputCol("answer")
-
     >>> pipeline = Pipeline().setStages([
     ...     imageAssembler,
     ...     visualQAClassifier
     ... ])
-
     >>> result = pipeline.fit(test_df).transform(test_df)
     >>> result.select("image_assembler.origin", "answer.result").show(truncate=False)
-
     +--------------------------------------+----------------------------------------------------------------------+
     |origin                                |result                                                                |
     +--------------------------------------+----------------------------------------------------------------------+
 
@@ -65,7 +65,7 @@ class LLAVAForMultiModal(AnnotatorModel,
     >>> from sparknlp.annotator import *
     >>> from pyspark.ml import Pipeline
     >>> image_df = SparkSessionForTest.spark.read.format("image").load(path=images_path)
-    >>> test_df = image_df.withColumn("text", lit("USER: \n <|image|> \n What's this picture about? \n ASSISTANT:\n"))
+    >>> test_df = image_df.withColumn("text", lit("USER: \\n <|image|> \\n What's this picture about? \\n ASSISTANT:\\n"))
     >>> imageAssembler = ImageAssembler() \\
     ...     .setInputCol("image") \\
     ...     .setOutputCol("image_assembler")
 
@@ -28,8 +28,8 @@ class PaliGemmaForMultiModal(AnnotatorModel,
     Pretrained models can be loaded with :meth:`.pretrained` of the companion
     object:
 
-    >>> visualQAClassifier = PaliGemmaForMultiModal.pretrained() \
-    ...     .setInputCols(["image_assembler"]) \
+    >>> visualQAClassifier = PaliGemmaForMultiModal.pretrained() \\
+    ...     .setInputCols(["image_assembler"]) \\
     ...     .setOutputCol("answer")
 
     The default model is ``"paligemma_3b_pt_224_int4"``, if no name is
@@ -59,12 +59,12 @@ class PaliGemmaForMultiModal(AnnotatorModel,
     >>> from sparknlp.annotator import *
     >>> from pyspark.ml import Pipeline
     >>> image_df = SparkSessionForTest.spark.read.format("image").load(path=images_path)
-    >>> test_df = image_df.withColumn("text", lit("USER: \n <image> \nDescribe this image. \nASSISTANT:\n"))
-    >>> imageAssembler = ImageAssembler() \
-    ...     .setInputCol("image") \
+    >>> test_df = image_df.withColumn("text", lit("USER: \\n <image> \\nDescribe this image. \\nASSISTANT:\\n"))
+    >>> imageAssembler = ImageAssembler() \\
+    ...     .setInputCol("image") \\
     ...     .setOutputCol("image_assembler")
-    >>> visualQAClassifier = PaliGemmaForMultiModal.pretrained() \
-    ...     .setInputCols("image_assembler") \
+    >>> visualQAClassifier = PaliGemmaForMultiModal.pretrained() \\
+    ...     .setInputCols("image_assembler") \\
     ...     .setOutputCol("answer")
     >>> pipeline = Pipeline().setStages([
     ...     imageAssembler,
 
@@ -65,7 +65,7 @@ class Phi3Vision(AnnotatorModel,
     >>> from sparknlp.annotator import *
     >>> from pyspark.ml import Pipeline
     >>> image_df = SparkSessionForTest.spark.read.format("image").load(path=images_path)
-    >>> test_df = image_df.withColumn("text", lit("<|user|> \n <|image_1|> \nWhat is unusual on this picture? <|end|>\n <|assistant|>\n"))
+    >>> test_df = image_df.withColumn("text", lit("<|user|> \\n <|image_1|> \\nWhat is unusual on this picture? <|end|>\\n <|assistant|>\\n"))
     >>> imageAssembler = ImageAssembler() \\
     ...     .setInputCol("image") \\
     ...     .setOutputCol("image_assembler")
 
@@ -68,7 +68,7 @@ class Qwen2VLTransformer(AnnotatorModel,
     >>> from sparknlp.annotator import *
     >>> from pyspark.ml import Pipeline
     >>> image_df = SparkSessionForTest.spark.read.format("image").load(path=images_path)
-    >>> test_df = image_df.withColumn("text", lit("<|im_start|>system\nYou are a helpful assistant.<|im_end|>\n<|im_start|>user\n<|vision_start|><|image_pad|><|vision_end|>Describe this image.<|im_end|>\n<|im_start|>assistant\n"))
+    >>> test_df = image_df.withColumn("text", lit("<|im_start|>system\\nYou are a helpful assistant.<|im_end|>\\n<|im_start|>user\\n<|vision_start|><|image_pad|><|vision_end|>Describe this image.<|im_end|>\\n<|im_start|>assistant\\n"))
     >>> imageAssembler = ImageAssembler() \\
     ...     .setInputCol("image") \\
     ...     .setOutputCol("image_assembler")
Original file line number	Diff line number	Diff line change
`@@ -99,6 +99,7 @@`
`99`	`99`	`autoapi_options = [`
`100`	`100`	`"members",`
`101`	`101`	`"show-module-summary",`
	`102`	`+ "undoc-members"`
`102`	`103`	`]`
`103`	`104`	`autoapi_type = "python"`
`104`	`105`	`autoapi_dirs = ["../sparknlp"]`