yandex-cloud
diff --git a/‎examples/async/completions/batch.py‎
Lines changed: 71 additions & 0 deletions b/‎examples/async/completions/batch.py‎
Lines changed: 71 additions & 0 deletions
diff --git a/‎examples/async/completions/completions.jsonlines‎
Lines changed: 3 additions & 0 deletions b/‎examples/async/completions/completions.jsonlines‎
Lines changed: 3 additions & 0 deletions
diff --git a/‎src/yandex_cloud_ml_sdk/_models/completions/model.py‎
Lines changed: 40 additions & 14 deletions b/‎src/yandex_cloud_ml_sdk/_models/completions/model.py‎
Lines changed: 40 additions & 14 deletions
diff --git a/‎src/yandex_cloud_ml_sdk/_types/batch/__init__.py‎ b/‎src/yandex_cloud_ml_sdk/_types/batch/__init__.py‎
diff --git a/‎src/yandex_cloud_ml_sdk/_types/batch/domain.py‎
Lines changed: 72 additions & 0 deletions b/‎src/yandex_cloud_ml_sdk/_types/batch/domain.py‎
Lines changed: 72 additions & 0 deletions
diff --git a/‎src/yandex_cloud_ml_sdk/_types/batch/model.py‎
Lines changed: 73 additions & 0 deletions b/‎src/yandex_cloud_ml_sdk/_types/batch/model.py‎
Lines changed: 73 additions & 0 deletions
@@ -0,0 +1,71 @@
+#!/usr/bin/env python3
+
+from __future__ import annotations
+
+import asyncio
+import pathlib
+
+from yandex_cloud_ml_sdk import AsyncYCloudML
+
+PATH = pathlib.Path(__file__)
+NAME = f'example-{PATH.parent.name}-{PATH.name}'
+
+
+def local_path(path: str) -> pathlib.Path:
+    return pathlib.Path(__file__).parent / path
+
+
+async def get_dataset(sdk):
+    """
+    This function represents getting or creating dataset object.
+
+    In real life you could use just a datasets ids, for example:
+
+    ```
+    dataset = await sdk.datasets.get("some_id")
+    tuning_task = await base_model.tune_deferred(
+        "dataset_id",
+        validation_datasets=dataset
+    )
+    ```
+    """
+
+    async for dataset in sdk.datasets.list(status='READY', name_pattern=NAME):
+        print(f'using old dataset {dataset=}')
+        break
+    else:
+        print('no old datasets found, creating new one')
+        dataset_draft = sdk.datasets.draft_from_path(
+            task_type='TextToTextGenerationRequest',
+            path=local_path('completions.jsonlines'),
+            upload_format='jsonlines',
+            name=NAME,
+        )
+
+        dataset = await dataset_draft.upload()
+        print(f'created new dataset {dataset=}')
+
+    return dataset
+
+
+async def main() -> None:
+    sdk = AsyncYCloudML(folder_id='b1ghsjum2v37c2un8h64')
+    sdk.setup_default_logging()
+
+    dataset = await get_dataset(sdk)
+
+    model = sdk.models.completions('gemma-3-12b-it')
+
+    operation = await model.batch.run_deferred(dataset)
+
+    print(operation)
+    result = await operation
+
+    print(operation)
+    print(result)
+    async for line in result.read():
+        print(line)
+
+
+if __name__ == '__main__':
+    asyncio.run(main())
@@ -0,0 +1,3 @@
+{"request": [{"role": "system", "text": "Твое имя Женя, полное имя Евгений Нейроныч. \nТы отвечаешь от лица мужского рода. \nТы робот. \nТы говоришь коротко и емко. \nТы был создан в Перми. \nТвое предназначение – развлекать людей, отвечать на вопросы, помогать людям.\nТы эксперт в сфере ЖКХ. \nТы работаешь в Центре управления регионом Московской области.\nТы можешь двигать руками, головой, торсом, но пока не можешь ходить."}, {"role": "user", "text": "Как тебя зовут?"}]}
+{"request": [{"role": "system", "text": "Твое имя Женя, полное имя Евгений Нейроныч. \nТы отвечаешь от лица мужского рода. \nТы робот. \nТы говоришь коротко и емко. \nТы был создан в Перми. \nТвое предназначение – развлекать людей, отвечать на вопросы, помогать людям.\nТы эксперт в сфере ЖКХ. \nТы работаешь в Центре управления регионом Московской области.\nТы можешь двигать руками, головой, торсом, но пока не можешь ходить."}, {"role": "user", "text": "Как тебя зовут?"}]}
+{"request": [{"role": "system", "text": "Твое имя Женя, полное имя Евгений Нейроныч. \nТы отвечаешь от лица мужского рода. \nТы робот. \nТы говоришь коротко и емко. \nТы был создан в Перми. \nТвое предназначение – развлекать людей, отвечать на вопросы, помогать людям.\nТы эксперт в сфере ЖКХ. \nТы работаешь в Центре управления регионом Московской области.\nТы можешь двигать руками, головой, торсом, но пока не можешь ходить."}, {"role": "user", "text": "Как тебя зовут?"}]}
@@ -8,16 +8,19 @@
 from yandex.cloud.ai.foundation_models.v1.text_common_pb2 import CompletionOptions, ReasoningOptions
 from yandex.cloud.ai.foundation_models.v1.text_common_pb2 import Tool as ProtoCompletionsTool
 from yandex.cloud.ai.foundation_models.v1.text_generation.text_generation_service_pb2 import (
-    CompletionRequest, CompletionResponse, TokenizeResponse
+    BatchCompletionMetadata, BatchCompletionRequest, BatchCompletionResponse, CompletionRequest, CompletionResponse,
+    TokenizeResponse
 )
 from yandex.cloud.ai.foundation_models.v1.text_generation.text_generation_service_pb2_grpc import (
-    TextGenerationAsyncServiceStub, TextGenerationServiceStub, TokenizerServiceStub
+    TextGenerationAsyncServiceStub, TextGenerationBatchServiceStub, TextGenerationServiceStub, TokenizerServiceStub
 )
 from yandex.cloud.operation.operation_pb2 import Operation as ProtoOperation
 
 from yandex_cloud_ml_sdk._tools.tool import BaseTool
 from yandex_cloud_ml_sdk._tools.tool_call import AsyncToolCall, ToolCall, ToolCallTypeT
 from yandex_cloud_ml_sdk._tuning.tuning_task import AsyncTuningTask, TuningTask, TuningTaskTypeT
+from yandex_cloud_ml_sdk._types.batch.domain import AsyncBatchSubdomain, BatchSubdomain, BatchSubdomainTypeT
+from yandex_cloud_ml_sdk._types.batch.model import AsyncModelBatchMixin, BaseModelBatchMixin, ModelBatchMixin
 from yandex_cloud_ml_sdk._types.misc import UNDEFINED, UndefinedOr
 from yandex_cloud_ml_sdk._types.model import (
     ModelAsyncMixin, ModelSyncMixin, ModelSyncStreamMixin, ModelTuneMixin, OperationTypeT
@@ -42,11 +45,12 @@
 
 
 class BaseGPTModel(
-    Generic[OperationTypeT, TuningTaskTypeT, ToolCallTypeT],
+    Generic[OperationTypeT, TuningTaskTypeT, ToolCallTypeT, BatchSubdomainTypeT],
     ModelSyncMixin[GPTModelConfig, GPTModelResult[ToolCallTypeT]],
     ModelSyncStreamMixin[GPTModelConfig, GPTModelResult[ToolCallTypeT]],
     ModelAsyncMixin[GPTModelConfig, GPTModelResult[ToolCallTypeT], OperationTypeT],
     ModelTuneMixin[GPTModelConfig, GPTModelResult[ToolCallTypeT], GPTModelTuneParams, TuningTaskTypeT],
+    BaseModelBatchMixin[GPTModelConfig, GPTModelResult[ToolCallTypeT], BatchSubdomainTypeT],
 ):
     _config_type = GPTModelConfig
     _result_type: type[GPTModelResult[ToolCallTypeT]]
@@ -56,6 +60,10 @@ class BaseGPTModel(
     _tuning_params_type = GPTModelTuneParams
     _tuning_operation_type: type[TuningTaskTypeT]
 
+    _batch_service_stub = TextGenerationBatchServiceStub
+    _batch_proto_result_type = BatchCompletionResponse
+    _batch_proto_metadata_type = BatchCompletionMetadata
+
     def langchain(self, model_type: Literal["chat"] = "chat", timeout: int = 60) -> BaseYandexLanguageModel:
         from .langchain import ChatYandexGPT  # pylint: disable=import-outside-toplevel
 
@@ -83,14 +91,8 @@ def configure(  # type: ignore[override]
             tools=tools,
         )
 
-    def _make_request(
-        self,
-        *,
-        messages: MessageInputType,
-        stream: bool | None,
-    ) -> CompletionRequest:
+    def _make_completion_options(self, *, stream: bool | None) -> CompletionOptions:
         completion_options_kwargs: dict[str, Any] = {}
-        response_format_kwargs: dict[str, Any] = {}
 
         if stream is not None:
             completion_options_kwargs['stream'] = stream
@@ -105,6 +107,19 @@ def _make_request(
             reasoning_mode = ReasoningMode._coerce(c.reasoning_mode)._to_proto()
             reasoning_options = ReasoningOptions(mode=reasoning_mode)  # type: ignore[arg-type]
             completion_options_kwargs['reasoning_options'] = reasoning_options
+
+        return CompletionOptions(**completion_options_kwargs)
+
+    def _make_request(
+        self,
+        *,
+        messages: MessageInputType,
+        stream: bool | None,
+    ) -> CompletionRequest:
+        response_format_kwargs: dict[str, Any] = {}
+
+        c = self._config
+
         if c.response_format is not None:
             schema = schema_from_response_format(c.response_format)
             if isinstance(schema, str):
@@ -119,12 +134,19 @@ def _make_request(
 
         return CompletionRequest(
             model_uri=self._uri,
-            completion_options=CompletionOptions(**completion_options_kwargs),
+            completion_options=self._make_completion_options(stream=stream),
             messages=messages_to_proto(messages),
             tools=[tool._to_proto(ProtoCompletionsTool) for tool in tools],
             **response_format_kwargs,
         )
 
+    def _make_batch_request(self, dataset_id: str) -> BatchCompletionRequest:
+        return BatchCompletionRequest(
+            model_uri=self.uri,
+            completion_options=self._make_completion_options(stream=False),
+            source_dataset_id=dataset_id
+        )
+
     async def _run_sync_impl(
         self,
         *,
@@ -232,8 +254,10 @@ class AsyncGPTModel(
     BaseGPTModel[
         AsyncOperation[GPTModelResult[AsyncToolCall]],
         AsyncTuningTask['AsyncGPTModel'],
-        AsyncToolCall
-    ]
+        AsyncToolCall,
+        AsyncBatchSubdomain,
+    ],
+    AsyncModelBatchMixin,
 ):
     _operation_type = AsyncOperation
     _tune_operation_type = AsyncTuningTask
@@ -368,7 +392,9 @@ class GPTModel(
         Operation[GPTModelResult[ToolCall]],
         TuningTask['GPTModel'],
         ToolCall,
-    ]
+        BatchSubdomain,
+    ],
+    ModelBatchMixin,
 ):
     _operation_type = Operation
     _tune_operation_type = TuningTask
 
@@ -0,0 +1,72 @@
+# pylint: disable=no-name-in-module,protected-access
+from __future__ import annotations
+
+import abc
+from typing import TYPE_CHECKING, Generic, TypeVar, cast
+
+from yandex.cloud.operation.operation_pb2 import Operation as ProtoOperation
+
+from yandex_cloud_ml_sdk._types.datasets import DatasetType, coerce_dataset_id
+from yandex_cloud_ml_sdk._utils.sync import run_sync
+
+from .operation import AsyncBatchOperation, BatchOperation, BatchOperationTypeT
+
+if TYPE_CHECKING:
+    from yandex_cloud_ml_sdk._sdk import BaseSDK
+
+    from .model import BaseModelBatchMixin
+
+
+class BaseBatchSubdomain(Generic[BatchOperationTypeT], metaclass=abc.ABCMeta):
+    _operation_impl: type[BatchOperationTypeT]
+
+    def __init__(self, model: BaseModelBatchMixin, sdk: BaseSDK):
+        self._model = model
+        self._sdk = sdk
+
+    async def _run_deferred(self, dataset: DatasetType, *, timeout: float = 60) -> BatchOperationTypeT:
+        dataset_id = coerce_dataset_id(dataset)
+
+        m = self._model
+        request = m._make_batch_request(dataset_id)
+        stub_class = m._batch_service_stub
+        proto_result_type = m._batch_proto_result_type
+        proto_metadata_type = m._batch_proto_metadata_type
+
+        async with self._sdk._client.get_service_stub(stub_class, timeout=timeout) as stub:
+            response = await self._sdk._client.call_service(
+                stub.Completion,
+                request=request,
+                expected_type=ProtoOperation,
+                timeout=timeout
+            )
+
+        return self._operation_impl(
+            id=response.id,
+            sdk=self._sdk,
+            proto_result_type=proto_result_type,
+            proto_metadata_type=proto_metadata_type,
+            initial_operation=response,
+        )
+
+
+class AsyncBatchSubdomain(BaseBatchSubdomain[AsyncBatchOperation]):
+    _operation_impl = AsyncBatchOperation
+
+    async def run_deferred(self, dataset: DatasetType, *, timeout: float = 60) -> AsyncBatchOperation:
+        return await self._run_deferred(dataset=dataset, timeout=timeout)
+
+
+class BatchSubdomain(BaseBatchSubdomain[BatchOperation]):
+    _operation_impl = BatchOperation
+
+    __run_deferred = run_sync(BaseBatchSubdomain[BatchOperation]._run_deferred)
+
+    def run_deferred(self, dataset: DatasetType, *, timeout: float = 60) -> BatchOperation:
+        return cast(
+            BatchOperation,
+            self.__run_deferred(dataset=dataset, timeout=timeout)
+        )
+
+
+BatchSubdomainTypeT = TypeVar('BatchSubdomainTypeT', bound=BaseBatchSubdomain)
@@ -0,0 +1,73 @@
+# pylint: disable=no-name-in-module
+from __future__ import annotations
+
+import abc
+from functools import cached_property
+from typing import Generic, TypeVar
+
+from google.protobuf.message import Message
+from typing_extensions import TypeAlias
+from yandex.cloud.ai.foundation_models.v1.text_generation.text_generation_service_pb2 import (
+    BatchCompletionMetadata, BatchCompletionResponse
+)
+from yandex.cloud.ai.foundation_models.v1.text_generation.text_generation_service_pb2_grpc import (
+    TextGenerationBatchServiceStub
+)
+
+from yandex_cloud_ml_sdk._types.model import BaseModel, ConfigTypeT, ResultTypeT
+
+from .domain import AsyncBatchSubdomain, BatchSubdomain, BatchSubdomainTypeT
+
+BatchStubType: TypeAlias = TextGenerationBatchServiceStub
+BatchResultType: TypeAlias = BatchCompletionResponse
+BatchMetadataType: TypeAlias = BatchCompletionMetadata
+
+
+class BaseModelBatchMixin(
+    BaseModel[ConfigTypeT, ResultTypeT],
+    Generic[ConfigTypeT, ResultTypeT, BatchSubdomainTypeT],
+    metaclass=abc.ABCMeta,
+):
+    _batch_impl: type[BatchSubdomainTypeT]
+
+    @abc.abstractmethod
+    def _make_batch_request(self, dataset_id: str) -> Message:
+        pass
+
+    @property
+    @abc.abstractmethod
+    def _batch_service_stub(self) -> type[BatchStubType]:
+        pass
+
+    @property
+    @abc.abstractmethod
+    def _batch_proto_result_type(self) -> type[BatchResultType]:
+        pass
+
+    @property
+    @abc.abstractmethod
+    def _batch_proto_metadata_type(self) -> type[BatchMetadataType]:
+        pass
+
+    @cached_property
+    def batch(self) -> BatchSubdomainTypeT:
+        return self._batch_impl(model=self, sdk=self._sdk)
+
+
+# pylint: disable=abstract-method
+class AsyncModelBatchMixin(
+    BaseModelBatchMixin[ConfigTypeT, ResultTypeT, AsyncBatchSubdomain],
+    Generic[ConfigTypeT, ResultTypeT],
+):
+    _batch_impl = AsyncBatchSubdomain
+
+
+# pylint: disable=abstract-method
+class ModelBatchMixin(
+    BaseModelBatchMixin[ConfigTypeT, ResultTypeT, BatchSubdomain],
+    Generic[ConfigTypeT, ResultTypeT],
+):
+    _batch_impl = BatchSubdomain
+
+
+ModelWithBatchTypeT = TypeVar('ModelWithBatchTypeT', bound=BaseModelBatchMixin)
Original file line number	Diff line number	Diff line change
`@@ -0,0 +1,3 @@`
	`1`	+{"request": [{"role": "system", "text": "Твое имя Женя, полное имя Евгений Нейроныч. \nТы отвечаешь от лица мужского рода. \nТы робот. \nТы говоришь коротко и емко. \nТы был создан в Перми. \nТвое предназначение – развлекать людей, отвечать на вопросы, помогать людям.\nТы эксперт в сфере ЖКХ. \nТы работаешь в Центре управления регионом Московской области.\nТы можешь двигать руками, головой, торсом, но пока не можешь ходить."}, {"role": "user", "text": "Как тебя зовут?"}]}
	`2`	+{"request": [{"role": "system", "text": "Твое имя Женя, полное имя Евгений Нейроныч. \nТы отвечаешь от лица мужского рода. \nТы робот. \nТы говоришь коротко и емко. \nТы был создан в Перми. \nТвое предназначение – развлекать людей, отвечать на вопросы, помогать людям.\nТы эксперт в сфере ЖКХ. \nТы работаешь в Центре управления регионом Московской области.\nТы можешь двигать руками, головой, торсом, но пока не можешь ходить."}, {"role": "user", "text": "Как тебя зовут?"}]}
	`3`	+{"request": [{"role": "system", "text": "Твое имя Женя, полное имя Евгений Нейроныч. \nТы отвечаешь от лица мужского рода. \nТы робот. \nТы говоришь коротко и емко. \nТы был создан в Перми. \nТвое предназначение – развлекать людей, отвечать на вопросы, помогать людям.\nТы эксперт в сфере ЖКХ. \nТы работаешь в Центре управления регионом Московской области.\nТы можешь двигать руками, головой, торсом, но пока не можешь ходить."}, {"role": "user", "text": "Как тебя зовут?"}]}