refactor: Make base client concrete and usable

LukeAVanDrie · LukeAVanDrie · commit 8bbbd5273a64 · 2025-10-07T20:40:16.000Z
The openAIModelServerClient could not be instantiated directly as it
declared no supported APIs. While this may have been intended to
enforce it as a base class, making it concrete provides more
flexibility.

This change allows the client to be used with any generic
OpenAI-compatible endpoint. It also centralizes the API list so
redundant overrides can be removed from the vLLM, TGI, and SGLang
subclasses, improving maintainability.
diff --git a/inference_perf/client/modelserver/openai_client.py b/inference_perf/client/modelserver/openai_client.py
@@ -130,7 +130,7 @@ async def process_request(self, data: InferenceAPIData, stage_id: int, scheduled
                 )
 
     def get_supported_apis(self) -> List[APIType]:
-        return []
+        return [APIType.Completion, APIType.Chat]
 
     @abstractmethod
     def get_prometheus_metric_metadata(self) -> PrometheusMetricMetadata:
diff --git a/inference_perf/client/modelserver/sglang_client.py b/inference_perf/client/modelserver/sglang_client.py
@@ -48,8 +48,6 @@ def __init__(
         )
         self.metric_filters = [f"model_name='{model_name}'", *additional_filters]
 
-    def get_supported_apis(self) -> List[APIType]:
-        return [APIType.Completion, APIType.Chat]
 
     def get_prometheus_metric_metadata(self) -> PrometheusMetricMetadata:
         return PrometheusMetricMetadata(
diff --git a/inference_perf/client/modelserver/tgi_client.py b/inference_perf/client/modelserver/tgi_client.py
@@ -48,9 +48,6 @@ def __init__(
         )
         self.metric_filters = additional_filters
 
-    def get_supported_apis(self) -> List[APIType]:
-        return [APIType.Completion, APIType.Chat]
-
     def get_prometheus_metric_metadata(self) -> PrometheusMetricMetadata:
         return PrometheusMetricMetadata(
             avg_queue_length=ModelServerPrometheusMetric(
diff --git a/inference_perf/client/modelserver/vllm_client.py b/inference_perf/client/modelserver/vllm_client.py
@@ -48,9 +48,6 @@ def __init__(
         )
         self.metric_filters = [f"model_name='{model_name}'", *additional_filters]
 
-    def get_supported_apis(self) -> List[APIType]:
-        return [APIType.Completion, APIType.Chat]
-
     def get_prometheus_metric_metadata(self) -> PrometheusMetricMetadata:
         return PrometheusMetricMetadata(
             avg_queue_length=ModelServerPrometheusMetric(

Original file line number	Diff line number	Diff line change
`@@ -130,7 +130,7 @@ async def process_request(self, data: InferenceAPIData, stage_id: int, scheduled`
`130`	`130`	`)`
`131`	`131`
`132`	`132`	`def get_supported_apis(self) -> List[APIType]:`
`133`		`- return []`
	`133`	`+ return [APIType.Completion, APIType.Chat]`
`134`	`134`
`135`	`135`	`@abstractmethod`
`136`	`136`	`def get_prometheus_metric_metadata(self) -> PrometheusMetricMetadata:`
Original file line number	Diff line number	Diff line change
`@@ -48,8 +48,6 @@ def __init__(`
`48`	`48`	`)`
`49`	`49`	`self.metric_filters = [f"model_name='{model_name}'", *additional_filters]`
`50`	`50`
`51`		`- def get_supported_apis(self) -> List[APIType]:`
`52`		`- return [APIType.Completion, APIType.Chat]`
`53`	`51`
`54`	`52`	`def get_prometheus_metric_metadata(self) -> PrometheusMetricMetadata:`
`55`	`53`	`return PrometheusMetricMetadata(`
Original file line number	Diff line number	Diff line change
`@@ -48,9 +48,6 @@ def __init__(`
`48`	`48`	`)`
`49`	`49`	`self.metric_filters = additional_filters`
`50`	`50`
`51`		`- def get_supported_apis(self) -> List[APIType]:`
`52`		`- return [APIType.Completion, APIType.Chat]`
`53`		`-`
`54`	`51`	`def get_prometheus_metric_metadata(self) -> PrometheusMetricMetadata:`
`55`	`52`	`return PrometheusMetricMetadata(`
`56`	`53`	`avg_queue_length=ModelServerPrometheusMetric(`