fix: resolve timeout issue in OpenAI tests (#329)

rebel-eunji · web-flow · commit 020f32457784 · 2026-02-03T17:09:36.000+09:00
diff --git a/tests/entrypoints/openai/test_basic.py b/tests/entrypoints/openai/test_basic.py
@@ -14,12 +14,10 @@
 
 import asyncio
 import os
-from http import HTTPStatus
 
 import openai
 import pytest
 import pytest_asyncio
-import requests
 from utils import RemoteOpenAIServer
 
 MODEL_DIR = os.getenv("REBEL_VLLM_PRE_COMPILED_DIR")
@@ -139,51 +137,3 @@ async def test_request_wrong_content_type(server: RemoteOpenAIServer):
                                             "Content-Type":
                                             "application/x-www-form-urlencoded"
                                         })
-
-
-@pytest.mark.parametrize(
-    "server_args",
-    [
-        pytest.param(["--enable-server-load-tracking"],
-                     id="enable-server-load-tracking")
-    ],
-    indirect=True,
-)
-@pytest.mark.asyncio
-async def test_server_load(server: RemoteOpenAIServer):
-    # Check initial server load
-    response = requests.get(server.url_for("load"))
-    assert response.status_code == HTTPStatus.OK
-    assert response.json().get("server_load") == 0
-
-    def make_long_completion_request():
-        return requests.post(
-            server.url_for("v1/completions"),
-            headers={"Content-Type": "application/json"},
-            json={
-                "prompt": "Give me a long story",
-                "max_tokens": MAX_TOKENS,
-                "temperature": 0,
-            },
-        )
-
-    # Start the completion request in a background thread.
-    completion_future = asyncio.create_task(
-        asyncio.to_thread(make_long_completion_request))
-
-    # Give a short delay to ensure the request has started.
-    await asyncio.sleep(0.1)
-
-    # Check server load while the completion request is running.
-    response = requests.get(server.url_for("load"))
-    assert response.status_code == HTTPStatus.OK
-    assert response.json().get("server_load") == 1
-
-    # Wait for the completion request to finish.
-    await completion_future
-    await asyncio.sleep(0.1)
-
-    # Check server load after the completion request has finished.
-    response = requests.get(server.url_for("load"))
-    assert response.status_code == HTTPStatus.OK
-    assert response.json().get("server_load") == 0