Accenture
diff --git a/‎air/__init__.py‎
Lines changed: 8 additions & 2 deletions b/‎air/__init__.py‎
Lines changed: 8 additions & 2 deletions
diff --git a/‎air/client.py‎
Lines changed: 14 additions & 1 deletion b/‎air/client.py‎
Lines changed: 14 additions & 1 deletion
diff --git a/‎air/compression/__init__.py‎
Lines changed: 1 addition & 0 deletions b/‎air/compression/__init__.py‎
Lines changed: 1 addition & 0 deletions
diff --git a/‎air/compression/client.py‎
Lines changed: 200 additions & 0 deletions b/‎air/compression/client.py‎
Lines changed: 200 additions & 0 deletions
diff --git a/‎air/document_analysis/__init__.py‎
Lines changed: 8 additions & 0 deletions b/‎air/document_analysis/__init__.py‎
Lines changed: 8 additions & 0 deletions
@@ -26,7 +26,7 @@
 try:
     __version__: str = _metadata.version(__package__ or "airefinery-sdk")
 except _metadata.PackageNotFoundError:  # pragma: no cover
-    __version__ = "1.30.0"
+    __version__ = "1.31.1"
 
 # Decide the default base url
 # - Default: api.airefinery.accenture.com (production K8s cluster)
@@ -49,6 +49,10 @@
 from air.client import AIRefinery, AsyncAIRefinery  # noqa:  E402
 from air.distiller.client import AsyncDistillerClient  # noqa:  E402
 from air.distiller.realtime_client import AsyncRealtimeDistillerClient  # noqa:  E402
+from air.document_analysis import (  # noqa:  E402
+    AsyncDocumentAnalysisClient,
+    DocumentAnalysisClient,
+)
 from air.governance import AsyncGovernanceClient, GovernanceClient  # noqa:  E402
 
 # Backwards-compatibility alias
@@ -61,9 +65,11 @@
     "AsyncAIRefinery",
     "AsyncDistillerClient",
     "AsyncRealtimeDistillerClient",
+    "AsyncDocumentAnalysisClient",
     "AsyncGovernanceClient",
-    "GovernanceClient",
+    "DocumentAnalysisClient",
     "DistillerClient",
+    "GovernanceClient",
     # Constants
     "BASE_URL",
     "CACHE_DIR",
 
@@ -8,13 +8,14 @@
 from air.audio import AsyncAudio, Audio
 from air.auth import TokenProvider
 from air.chat import AsyncChatClient, ChatClient
+from air.compression import AsyncCompressionClient, CompressionClient
 from air.distiller import AsyncDistillerClient, AsyncRealtimeDistillerClient
 from air.embeddings import (
     AsyncEmbeddingsClient,
     EmbeddingsClient,
 )
-from air.governance import AsyncGovernanceClient, GovernanceClient
 from air.fine_tuning import AsyncFineTuningClient, FineTuningClient
+from air.governance import AsyncGovernanceClient, GovernanceClient
 from air.images import (
     AsyncImagesClient,
     ImagesClient,
@@ -161,6 +162,12 @@ def __init__(
             api_key=self.api_key,
             default_headers=self.default_headers,
         )
+        # Provides async compression functionalities
+        self.compression = AsyncCompressionClient(
+            base_url=self.base_url,
+            api_key=self.api_key,
+            default_headers=self.default_headers,
+        )
 
         # Provides async knowledge functionalities
         self.knowledge = AsyncKnowledgeClient(
@@ -315,6 +322,12 @@ def __init__(
             api_key=self.api_key,
             default_headers=self.default_headers,
         )
+        # Provides sync compression functionalities
+        self.compression = CompressionClient(
+            base_url=self.base_url,
+            api_key=self.api_key,
+            default_headers=self.default_headers,
+        )
 
         # Provides sync knowledge functionalities
         self.knowledge = KnowledgeClient(
 
@@ -0,0 +1 @@
+from air.compression.client import AsyncCompressionClient, CompressionClient
@@ -0,0 +1,200 @@
+"""
+Module providing clients for prompt compression operations.
+All responses are validated using Pydantic models.
+
+This module includes:
+  - `CompressionClient` for synchronous calls.
+  - `AsyncCompressionClient` for asynchronous calls.
+
+Both clients call the `/compress` endpoint.
+All responses are validated using Pydantic models (`CompressionResponse`).
+"""
+
+from typing import List, Optional, Union
+
+import aiohttp
+import requests
+
+from air import BASE_URL
+from air.auth.token_provider import TokenProvider
+from air.types.compression import CompressedPrompt, CompressionResponse
+from air.types.constants import DEFAULT_TIMEOUT
+from air.utils import get_base_headers, get_base_headers_async
+
+ENDPOINT_COMPRESS = "{base_url}/v1/compress"
+
+
+class CompressionClient:
+    """
+    A synchronous client for the prompt compression endpoint.
+
+    This class handles sending requests to the compression endpoint
+    and converts the responses into Pydantic models for type safety.
+    """
+
+    def __init__(
+        self,
+        api_key: str | TokenProvider,
+        *,
+        base_url: str = BASE_URL,
+        default_headers: dict[str, str] | None = None,
+    ):
+        self.base_url = base_url
+        self.api_key = api_key
+        self.default_headers = default_headers or {}
+
+    def compress(
+        self,
+        *,
+        context: Union[str, List[str]],
+        model: str,
+        rate: float = 0.5,
+        target_token: int = -1,
+        instruction: Optional[str] = None,
+        question: Optional[str] = None,
+        force_tokens: Optional[List[str]] = None,
+        timeout: float | None = None,
+        extra_headers: dict[str, str] | None = None,
+        **kwargs,
+    ) -> CompressionResponse:
+        """
+        Compresses a prompt synchronously.
+
+        Args:
+            context (str | List[str]): Text or list of texts to compress
+            model (str): The compression model name
+            rate (float): Target compression rate (0.0 to 1.0). Default 0.5
+            target_token (int): Explicit target token count (-1 for rate-based). Default -1
+            instruction (str | None): Optional instruction for compression context
+            question (str | None): Optional question for compression context
+            force_tokens (List[str] | None): Tokens to preserve in compressed output
+            timeout (float | None): Max time (in seconds) to wait for a response
+            extra_headers (dict[str, str] | None): Request-specific headers
+            **kwargs: Additional compression parameters
+
+        Returns:
+            CompressionResponse: The parsed response containing compressed prompts
+        """
+        effective_timeout = timeout if timeout is not None else DEFAULT_TIMEOUT
+
+        endpoint = ENDPOINT_COMPRESS.format(base_url=self.base_url)
+
+        payload: dict = {
+            "model": model,
+            "context": context,
+            "rate": rate,
+            "target_token": target_token,
+            **kwargs,
+        }
+        if instruction is not None:
+            payload["instruction"] = instruction
+        if question is not None:
+            payload["question"] = question
+        if force_tokens is not None:
+            payload["force_tokens"] = force_tokens
+
+        headers = get_base_headers(self.api_key)
+        headers.update(self.default_headers)
+        if extra_headers:
+            headers.update(extra_headers)
+
+        response = requests.post(
+            endpoint, json=payload, headers=headers, timeout=effective_timeout
+        )
+        response.raise_for_status()
+
+        results = response.json()
+        # Platform returns a single object; raw server returns a list
+        if isinstance(results, dict):
+            results = [results]
+        return CompressionResponse(
+            data=[CompressedPrompt.model_validate(r) for r in results]
+        )
+
+
+class AsyncCompressionClient:
+    """
+    An asynchronous client for the prompt compression endpoint.
+
+    This class handles sending requests to the compression endpoint
+    and converts the responses into Pydantic models for type safety.
+    """
+
+    def __init__(
+        self,
+        api_key: str | TokenProvider,
+        *,
+        base_url: str,
+        default_headers: dict[str, str] | None = None,
+    ):
+        self.base_url = base_url
+        self.api_key = api_key
+        self.default_headers = default_headers or {}
+
+    async def compress(
+        self,
+        *,
+        context: Union[str, List[str]],
+        model: str,
+        rate: float = 0.5,
+        target_token: int = -1,
+        instruction: Optional[str] = None,
+        question: Optional[str] = None,
+        force_tokens: Optional[List[str]] = None,
+        timeout: float | None = None,
+        extra_headers: dict[str, str] | None = None,
+        **kwargs,
+    ) -> CompressionResponse:
+        """
+        Compresses a prompt asynchronously.
+
+        Args:
+            context (str | List[str]): Text or list of texts to compress
+            model (str): The compression model name
+            rate (float): Target compression rate (0.0 to 1.0). Default 0.5
+            target_token (int): Explicit target token count (-1 for rate-based). Default -1
+            instruction (str | None): Optional instruction for compression context
+            question (str | None): Optional question for compression context
+            force_tokens (List[str] | None): Tokens to preserve in compressed output
+            timeout (float | None): Max time (in seconds) to wait for a response
+            extra_headers (dict[str, str] | None): Request-specific headers
+            **kwargs: Additional compression parameters
+
+        Returns:
+            CompressionResponse: The parsed response containing compressed prompts
+        """
+        effective_timeout = DEFAULT_TIMEOUT if timeout is None else timeout
+
+        endpoint = ENDPOINT_COMPRESS.format(base_url=self.base_url)
+
+        payload: dict = {
+            "model": model,
+            "context": context,
+            "rate": rate,
+            "target_token": target_token,
+            **kwargs,
+        }
+        if instruction is not None:
+            payload["instruction"] = instruction
+        if question is not None:
+            payload["question"] = question
+        if force_tokens is not None:
+            payload["force_tokens"] = force_tokens
+
+        headers = await get_base_headers_async(self.api_key)
+        headers.update(self.default_headers)
+        if extra_headers:
+            headers.update(extra_headers)
+
+        client_timeout = aiohttp.ClientTimeout(total=effective_timeout)
+        async with aiohttp.ClientSession(timeout=client_timeout) as session:
+            async with session.post(endpoint, json=payload, headers=headers) as resp:
+                resp.raise_for_status()
+                results = await resp.json()
+
+                # Platform returns a single object; raw server returns a list
+                if isinstance(results, dict):
+                    results = [results]
+                return CompressionResponse(
+                    data=[CompressedPrompt.model_validate(r) for r in results]
+                )
@@ -0,0 +1,8 @@
+"""Document analysis client for PaddleX-based OCR, layout detection, and text detection."""
+
+from air.document_analysis.client import (
+    AsyncDocumentAnalysisClient,
+    DocumentAnalysisClient,
+)
+
+__all__ = ["DocumentAnalysisClient", "AsyncDocumentAnalysisClient"]
Original file line number	Diff line number	Diff line change
`@@ -0,0 +1 @@`
	`1`	`+from air.compression.client import AsyncCompressionClient, CompressionClient`