fix(voyageai): use nested inputs and drop unsupported chunk_size for contextualized embeddings

fzowl · fzowl · commit f5eff1882823 · 2026-06-25T18:03:23.000+02:00
The pinned voyageai SDK (&gt;=0.3.6,&lt;0.4.0) contextualized_embed expects
inputs as List[List[str]] and does not accept a chunk_size argument.
Restore the working voyage-context-3 call pattern for voyage-context-4.
diff --git a/llama-index-integrations/embeddings/llama-index-embeddings-voyageai/llama_index/embeddings/voyageai/base.py b/llama-index-integrations/embeddings/llama-index-embeddings-voyageai/llama_index/embeddings/voyageai/base.py
@@ -392,12 +392,11 @@ def _embed(self, texts: List[str], input_type: str) -> List[List[float]]:
         for batch, _ in self._build_batches(texts):
             if self.model_name in CONTEXT_MODELS:
                 r = self._client.contextualized_embed(
-                    inputs=batch,
+                    inputs=[batch],
                     model=self.model_name,
                     input_type=input_type,
                     output_dtype=self.output_dtype,
                     output_dimension=self.output_dimension,
-                    chunk_size=32000,
                 ).results
                 embeddings.extend(r[0].embeddings)
             elif self.model_name in MULTIMODAL_MODELS:
@@ -428,12 +427,11 @@ async def _aembed(self, texts: List[str], input_type: str) -> List[List[float]]:
         for batch, _ in self._build_batches(texts):
             if self.model_name in CONTEXT_MODELS:
                 ar = await self._aclient.contextualized_embed(
-                    inputs=batch,
+                    inputs=[batch],
                     model=self.model_name,
                     input_type=input_type,
                     output_dtype=self.output_dtype,
                     output_dimension=self.output_dimension,
-                    chunk_size=32000,
                 )
                 r = ar.results
                 embeddings.extend(r[0].embeddings)