fix: exclude valid openai packets with empty string data (#224)

ajcasagrande · web-flow · commit c31c41f0ad13 · 2025-08-21T09:24:43.000-07:00
diff --git a/aiperf/parsers/openai_parsers.py b/aiperf/parsers/openai_parsers.py
@@ -109,7 +109,7 @@ def _parse_text_response(self, response: TextResponse) -> ResponseData | None:
         """Parse a TextResponse into a ResponseData object."""
         raw = response.text
         parsed = self._parse_text(raw)
-        if parsed is None:
+        if not parsed:
             return None
 
         return ResponseData(
@@ -123,7 +123,7 @@ def _parse_sse_response(self, response: SSEMessage) -> ResponseData | None:
         """Parse a SSEMessage into a ResponseData object."""
         raw = response.extract_data_content()
         parsed = self._parse_sse(raw)
-        if parsed is None or len(parsed) == 0:
+        if not parsed:
             return None
 
         return ResponseData(
@@ -147,7 +147,7 @@ async def extract_response_data(
         results = []
         for response in record.responses:
             response_data = self._parse_response(response)
-            if response_data is None:
+            if not response_data:
                 continue
 
             if tokenizer is not None:
@@ -180,7 +180,9 @@ def _parse_text(self, raw_text: str) -> Any | None:
 
         for obj_type, extractor in type_to_extractor.items():
             if isinstance(obj, obj_type):
-                return extractor(obj)
+                content = extractor(obj)
+                # skip empty content
+                return content if content else None
 
         raise ValueError(f"Invalid OpenAI object: {raw_text}")
 
@@ -189,7 +191,7 @@ def _parse_sse(self, raw_sse: list[str]) -> list[Any]:
         result = []
         for sse in raw_sse:
             parsed = self._parse_text(sse)
-            if parsed is None:
+            if not parsed:
                 continue
             result.append(parsed)
         return result
diff --git a/tests/parsers/__init__.py b/tests/parsers/__init__.py
@@ -0,0 +1,2 @@
+# SPDX-FileCopyrightText: Copyright (c) 2025 NVIDIA CORPORATION & AFFILIATES. All rights reserved.
+# SPDX-License-Identifier: Apache-2.0
diff --git a/tests/parsers/test_openai_parsers.py b/tests/parsers/test_openai_parsers.py
@@ -0,0 +1,225 @@
+# SPDX-FileCopyrightText: Copyright (c) 2025 NVIDIA CORPORATION & AFFILIATES. All rights reserved.
+# SPDX-License-Identifier: Apache-2.0
+
+import json
+from unittest.mock import MagicMock
+
+import pytest
+
+from aiperf.clients.model_endpoint_info import ModelEndpointInfo
+from aiperf.common.models import RequestRecord, ResponseData, SSEMessage, TextResponse
+from aiperf.parsers.openai_parsers import OpenAIResponseExtractor
+
+
+class TestOpenAIResponseExtractor:
+    """Test cases for OpenAIResponseExtractor."""
+
+    @pytest.fixture
+    def extractor(self):
+        """Create an OpenAIResponseExtractor instance."""
+        mock_endpoint = MagicMock(spec=ModelEndpointInfo)
+        return OpenAIResponseExtractor(mock_endpoint)
+
+    def chat_completion_json(self, content) -> str:
+        """Generate chat completion JSON with specified content and finish reason."""
+        completion = {
+            "id": "test",
+            "object": "chat.completion",
+            "created": 1700000000,
+            "model": "test-model",
+            "choices": [
+                {
+                    "index": 0,
+                    "message": {"role": "assistant", "content": content},
+                    "finish_reason": "stop",
+                }
+            ],
+        }
+        assert completion["choices"][0]["message"]["content"] == content
+        return json.dumps(completion)
+
+    def chat_completion_chunk_json(self, content, stop=True) -> str:
+        """Generate chat completion chunk JSON with specified delta content and finish reason."""
+        chunk = {
+            "id": "test",
+            "object": "chat.completion.chunk",
+            "created": 1700000000,
+            "model": "test-model",
+            "choices": [
+                {
+                    "index": 0,
+                    "delta": {"content": content},
+                    "finish_reason": "stop" if stop else None,
+                }
+            ],
+        }
+        assert chunk["choices"][0]["delta"]["content"] == content
+        return json.dumps(chunk)
+
+    def create_raw_text_response(self, content, perf_ns=1000000) -> MagicMock:
+        """Create a mock TextResponse with specified content."""
+        text_response = MagicMock(spec=TextResponse)
+        text_response.text = content
+        text_response.perf_ns = perf_ns
+        return text_response
+
+    def create_text_response(self, content, perf_ns=1000000) -> MagicMock:
+        """Create a mock TextResponse with specified content."""
+        text_response = MagicMock(spec=TextResponse)
+        text_response.text = self.chat_completion_json(content)
+        text_response.perf_ns = perf_ns
+        return text_response
+
+    def create_sse_message(self, chunks, perf_ns=2000000) -> MagicMock:
+        """Create a mock SSEMessage with specified chunk contents."""
+        sse_message = MagicMock(spec=SSEMessage)
+        if isinstance(chunks, str):
+            # Single chunk
+            sse_message.extract_data_content.return_value = [
+                self.chat_completion_chunk_json(chunks)
+            ]
+        else:
+            # Multiple chunks
+            sse_message.extract_data_content.return_value = [
+                self.chat_completion_chunk_json(chunk) for chunk in chunks
+            ]
+        sse_message.perf_ns = perf_ns
+        return sse_message
+
+    def create_request_record(self, *responses) -> MagicMock:
+        """Create a mock RequestRecord with specified responses."""
+        record = MagicMock(spec=RequestRecord)
+        record.responses = list(responses)
+        return record
+
+    @pytest.mark.parametrize("text", ["[DONE]", "", None])
+    def test_parse_text_returns_none(self, extractor, text):
+        """Test that _parse_text returns None for '[DONE]' marker, empty string, and None."""
+        result = extractor._parse_text(text)
+        assert result is None
+
+    @pytest.mark.parametrize("content", ["", None])
+    def test_parse_text_with_empty_content_returns_none(self, extractor, content):
+        """Test that valid chat completion with empty/null content returns None."""
+        chat_completion_json = self.chat_completion_json(content)
+
+        result = extractor._parse_text(chat_completion_json)
+        assert result is None
+
+    @pytest.mark.parametrize("content", ["", None])
+    def test_parse_text_with_empty_chunk_content_returns_none(self, extractor, content):
+        """Test that valid chat completion chunk with empty/null delta content returns None."""
+        chunk_json = self.chat_completion_chunk_json(content)
+
+        result = extractor._parse_text(chunk_json)
+        assert result is None
+
+    def test_parse_text_with_valid_content_returns_content(self, extractor):
+        """Test that valid chat completion with actual content returns the content."""
+        test_content = "Hello, how can I help you?"
+        chat_completion_json = self.chat_completion_json(test_content)
+
+        result = extractor._parse_text(chat_completion_json)
+        assert result == test_content
+
+    def test_parse_text_with_valid_chunk_content_returns_content(self, extractor):
+        """Test that valid chat completion chunk with actual delta content returns the content."""
+        test_content = "Stream chunk content"
+        chunk_json = self.chat_completion_chunk_json(test_content)
+
+        result = extractor._parse_text(chunk_json)
+        assert result == test_content
+
+    def test_parse_text_response_with_empty_content_returns_none(self, extractor):
+        """Test that TextResponse with empty content is ignored."""
+        text_response = self.create_raw_text_response("")
+
+        result = extractor._parse_text_response(text_response)
+        assert result is None
+
+    def test_parse_text_response_with_valid_content_returns_response_data(
+        self, extractor
+    ):
+        """Test that TextResponse with valid content returns ResponseData."""
+        test_content = "Valid response"
+        text_response = self.create_text_response(test_content)
+
+        result = extractor._parse_text_response(text_response)
+
+        assert result is not None
+        assert isinstance(result, ResponseData)
+        assert result.parsed_text == [test_content]
+        assert result.perf_ns == 1000000
+
+    def test_parse_sse_response_with_empty_chunks_returns_none(self, extractor):
+        """Test that SSEMessage with empty chunks is ignored."""
+        sse_message = self.create_sse_message("")
+
+        result = extractor._parse_sse_response(sse_message)
+        assert result is None
+
+    def test_parse_sse_response_with_mixed_chunks_filters_empty(self, extractor):
+        """Test that SSEMessage filters out empty chunks but keeps valid ones."""
+        sse_message = self.create_sse_message(["", "Valid chunk"])
+
+        result = extractor._parse_sse_response(sse_message)
+
+        assert result is not None
+        assert isinstance(result, ResponseData)
+        assert result.parsed_text == ["Valid chunk"]
+        assert result.perf_ns == 2000000
+
+    @pytest.mark.asyncio
+    async def test_extract_response_data_filters_empty_responses(self, extractor):
+        """Test that extract_response_data filters out responses with empty content."""
+        request = self.create_request_record(
+            self.create_raw_text_response("", perf_ns=1000000),  # Raw empty text
+            self.create_text_response("Valid response", perf_ns=2000000),
+        )
+
+        results = await extractor.extract_response_data(request, None)
+
+        # Should only return the valid response, empty one should be filtered out
+        assert len(results) == 1
+        assert results[0].parsed_text == ["Valid response"]
+        assert results[0].perf_ns == 2000000
+
+    @pytest.mark.asyncio
+    async def test_extract_response_data_handles_mixed_response_types(self, extractor):
+        """Test that extract_response_data handles mixed TextResponse and SSEMessage types."""
+        request = self.create_request_record(
+            self.create_text_response("Text response", perf_ns=1000000),
+            self.create_sse_message("SSE chunk", perf_ns=2000000),
+        )
+
+        results = await extractor.extract_response_data(request, None)
+
+        # Should return both responses
+        assert len(results) == 2
+        assert results[0].parsed_text == ["Text response"]
+        assert results[0].perf_ns == 1000000
+        assert results[1].parsed_text == ["SSE chunk"]
+        assert results[1].perf_ns == 2000000
+
+    @pytest.mark.asyncio
+    async def test_extract_response_data_with_complex_sse_filtering(self, extractor):
+        """Test extract_response_data with complex SSE message filtering."""
+        request = self.create_request_record(
+            self.create_text_response("Valid text response", perf_ns=1000000),
+            self.create_sse_message(
+                ["", "Valid chunk 1", "", "Valid chunk 2"], perf_ns=3000000
+            ),
+            self.create_raw_text_response("", perf_ns=4000000),  # Should be filtered
+        )
+
+        results = await extractor.extract_response_data(request, None)
+
+        # Should return text response + filtered SSE response (empty raw_text filtered out)
+        assert len(results) == 2
+        assert results[0].parsed_text == ["Valid text response"]
+        assert results[0].perf_ns == 1000000
+        assert results[1].parsed_text == [
+            "Valid chunk 1",
+            "Valid chunk 2",
+        ]  # Empty chunks filtered
+        assert results[1].perf_ns == 3000000

Original file line number	Diff line number	Diff line change
`@@ -0,0 +1,2 @@`
	`1`	`+# SPDX-FileCopyrightText: Copyright (c) 2025 NVIDIA CORPORATION & AFFILIATES. All rights reserved.`
	`2`	`+# SPDX-License-Identifier: Apache-2.0`