Fix responses (#5546)

colegottdank · web-flow · commit 946e09931ea5 · 2026-01-26T14:23:31.000-08:00
diff --git a/packages/__tests__/cost/providers/helicone.test.ts b/packages/__tests__/cost/providers/helicone.test.ts
@@ -0,0 +1,126 @@
+import { describe, it, expect } from "@jest/globals";
+import { registry } from "../../../cost/models/registry";
+import { buildRequestBody } from "../../../cost/models/provider-helpers";
+import { toChatCompletions } from "@helicone-package/llm-mapper/transform/providers/responses/request/toChatCompletions";
+
+describe("Helicone provider", () => {
+  describe("GPT 4.1 models with RESPONSES bodyMapping", () => {
+    const gpt41Models = ["gpt-4.1", "gpt-4.1-mini", "gpt-4.1-nano"];
+
+    gpt41Models.forEach((modelName) => {
+      it(`should preserve 'input' parameter for ${modelName} (not convert to 'messages')`, async () => {
+        const configResult = registry.getModelProviderConfig(
+          modelName,
+          "helicone"
+        );
+        expect(configResult.data).toBeDefined();
+
+        const endpointResult = registry.buildEndpoint(configResult.data!, {});
+        expect(endpointResult.data).toBeDefined();
+
+        // Responses API format uses 'input', not 'messages'
+        const responsesApiBody = {
+          model: modelName,
+          input: "Hello, world!",
+          max_output_tokens: 100,
+        };
+
+        const result = await buildRequestBody(endpointResult.data!, {
+          parsedBody: responsesApiBody,
+          bodyMapping: "RESPONSES",
+          toAnthropic: (body: any) => body,
+          toChatCompletions: (body: any) => toChatCompletions(body),
+        });
+
+        expect(result.data).toBeDefined();
+        const parsedResult = JSON.parse(result.data!);
+
+        // Should preserve 'input' and NOT have 'messages'
+        expect(parsedResult.input).toBe("Hello, world!");
+        expect(parsedResult.messages).toBeUndefined();
+      });
+    });
+  });
+
+  describe("GPT 4o models with RESPONSES bodyMapping", () => {
+    const gpt4oModels = ["gpt-4o", "gpt-4o-mini"];
+
+    gpt4oModels.forEach((modelName) => {
+      it(`should preserve 'input' parameter for ${modelName} (not convert to 'messages')`, async () => {
+        const configResult = registry.getModelProviderConfig(
+          modelName,
+          "helicone"
+        );
+
+        // Skip if model doesn't have helicone endpoint
+        if (!configResult.data) {
+          return;
+        }
+
+        const endpointResult = registry.buildEndpoint(configResult.data!, {});
+        expect(endpointResult.data).toBeDefined();
+
+        const responsesApiBody = {
+          model: modelName,
+          input: "Hello, world!",
+          max_output_tokens: 100,
+        };
+
+        const result = await buildRequestBody(endpointResult.data!, {
+          parsedBody: responsesApiBody,
+          bodyMapping: "RESPONSES",
+          toAnthropic: (body: any) => body,
+          toChatCompletions: (body: any) => toChatCompletions(body),
+        });
+
+        expect(result.data).toBeDefined();
+        const parsedResult = JSON.parse(result.data!);
+
+        // Should preserve 'input' and NOT have 'messages'
+        expect(parsedResult.input).toBe("Hello, world!");
+        expect(parsedResult.messages).toBeUndefined();
+      });
+    });
+  });
+
+  describe("Anthropic models with RESPONSES bodyMapping", () => {
+    it("should convert 'input' to 'messages' for Claude models", async () => {
+      const configResult = registry.getModelProviderConfig(
+        "claude-sonnet-4",
+        "helicone"
+      );
+
+      // Skip if model doesn't have helicone endpoint
+      if (!configResult.data) {
+        return;
+      }
+
+      const endpointResult = registry.buildEndpoint(configResult.data!, {});
+      expect(endpointResult.data).toBeDefined();
+
+      const responsesApiBody = {
+        model: "claude-sonnet-4",
+        input: "Hello, world!",
+        max_output_tokens: 100,
+      };
+
+      const result = await buildRequestBody(endpointResult.data!, {
+        parsedBody: responsesApiBody,
+        bodyMapping: "RESPONSES",
+        toAnthropic: (body: any, modelId: string) => ({
+          ...body,
+          model: modelId,
+        }),
+        toChatCompletions: (body: any) => toChatCompletions(body),
+      });
+
+      expect(result.data).toBeDefined();
+      const parsedResult = JSON.parse(result.data!);
+
+      // Should have 'messages' (converted from 'input') for Anthropic
+      // The body goes through toChatCompletions then toAnthropic
+      expect(parsedResult.messages).toBeDefined();
+      expect(parsedResult.input).toBeUndefined();
+    });
+  });
+});
diff --git a/packages/cost/models/providers/helicone.ts b/packages/cost/models/providers/helicone.ts
@@ -1,4 +1,5 @@
 import { BaseProvider } from "./base";
+import { nativelySupportsResponsesAPI } from "./utils";
 import type {
   AuthContext,
   AuthResult,
@@ -66,9 +67,9 @@ export class HeliconeProvider extends BaseProvider {
       });
     }
 
-    // Convert responses API format to chat completions format first
-    // This supports both OpenAI and Anthropic models with the responses API
-    if (context.bodyMapping === "RESPONSES" && !endpoint.providerModelId.includes("gpt")) {
+    // Convert responses API format to chat completions format for models that don't natively support it
+    if (context.bodyMapping === "RESPONSES" &&
+        !nativelySupportsResponsesAPI("helicone", endpoint.providerModelId)) {
       updatedBody = context.toChatCompletions(updatedBody);
     }
 
diff --git a/packages/cost/models/providers/index.ts b/packages/cost/models/providers/index.ts
@@ -97,3 +97,6 @@ export const ResponsesAPIEnabledProviders: ModelProviderName[] = [
 
 // Re-export base for extending
 export { BaseProvider } from "./base";
+
+// Re-export utilities
+export { nativelySupportsResponsesAPI } from "./utils";
diff --git a/packages/cost/models/providers/utils.ts b/packages/cost/models/providers/utils.ts
@@ -0,0 +1,24 @@
+/**
+ * Check if a provider/model combination natively supports the Responses API format.
+ * Models that natively support Responses API should NOT have their request/response
+ * converted to/from Chat Completions format.
+ *
+ * Currently supported:
+ * - OpenAI provider (all models)
+ * - Helicone provider with GPT models (providerModelId contains "gpt" or "/gt")
+ *   Note: Helicone uses obfuscated model IDs like "pa/gt-4.1-m" for GPT 4.1 models
+ *
+ * @param provider - The provider name
+ * @param providerModelId - The provider-specific model ID
+ * @returns true if the model natively supports Responses API format
+ */
+export function nativelySupportsResponsesAPI(
+  provider: string,
+  providerModelId: string
+): boolean {
+  return (
+    provider === "openai" ||
+    (provider === "helicone" &&
+      (providerModelId.includes("gpt") || providerModelId.includes("/gt")))
+  );
+}
diff --git a/packages/llm-mapper/transform/providers/normalizeResponse.ts b/packages/llm-mapper/transform/providers/normalizeResponse.ts
@@ -1,6 +1,6 @@
 import { getUsageProcessor } from "@helicone-package/cost/usage/getUsageProcessor";
 import { mapModelUsageToOpenAI } from "@helicone-package/cost/usage/mapModelUsageToOpenAI";
-import { ModelProviderName } from "@helicone-package/cost/models/providers";
+import { ModelProviderName, nativelySupportsResponsesAPI } from "@helicone-package/cost/models/providers";
 import {
   ResponseFormat,
   BodyMappingType,
@@ -522,8 +522,7 @@ export async function normalizeAIGatewayResponse(params: {
 
       // by this line, normalizedOpenAIText is now in Chat Completions format
 
-      const nativelySupportsResponsesAPI = provider === "openai" || (provider === "helicone" && providerModelId.includes("gpt"));
-      if (bodyMapping === "RESPONSES" && !nativelySupportsResponsesAPI) {
+      if (bodyMapping === "RESPONSES" && !nativelySupportsResponsesAPI(provider, providerModelId)) {
         return convertOpenAIStreamToResponses(normalizedOpenAIText);
       }
 
@@ -557,8 +556,7 @@ export async function normalizeAIGatewayResponse(params: {
         }
       }
 
-      const nativelySupportsResponsesAPI = provider === "openai" || (provider === "helicone" && providerModelId.includes("gpt"));
-      if (bodyMapping === "RESPONSES" && !nativelySupportsResponsesAPI) {
+      if (bodyMapping === "RESPONSES" && !nativelySupportsResponsesAPI(provider, providerModelId)) {
         const responsesBody = toResponses(openAIBody);
         return JSON.stringify(responsesBody);
       }
diff --git a/worker/src/lib/ai-gateway/SimpleAIGateway.ts b/worker/src/lib/ai-gateway/SimpleAIGateway.ts
@@ -35,6 +35,7 @@ import { DataDogTracer, TraceContext } from "../monitoring/DataDogTracer";
 import {
   ResponsesAPIEnabledProviders,
   ContextEditingEnabledProviders,
+  nativelySupportsResponsesAPI,
 } from "@helicone-package/cost/models/providers";
 import { oaiChat2responsesResponse } from "../clients/llmmapper/router/oaiChat2responses/nonStream";
 import { oaiChat2responsesStreamResponse } from "../clients/llmmapper/router/oaiChat2responses/stream";
@@ -657,10 +658,7 @@ export class SimpleAIGateway {
       }
 
       // Output now is in Chat Completions format
-      const nativelySupportsResponsesAPI =
-        provider === "openai" ||
-        (provider === "helicone" && providerModelId.includes("gpt"));
-      if (bodyMapping === "RESPONSES" && !nativelySupportsResponsesAPI) {
+      if (bodyMapping === "RESPONSES" && !nativelySupportsResponsesAPI(provider, providerModelId)) {
         if (isStream) {
           finalMappedResponse =
             oaiChat2responsesStreamResponse(finalMappedResponse);

Original file line number	Diff line number	Diff line change
`@@ -1,6 +1,6 @@`
`1`	`1`	`import { getUsageProcessor } from "@helicone-package/cost/usage/getUsageProcessor";`
`2`	`2`	`import { mapModelUsageToOpenAI } from "@helicone-package/cost/usage/mapModelUsageToOpenAI";`
`3`		`-import { ModelProviderName } from "@helicone-package/cost/models/providers";`
	`3`	`+import { ModelProviderName, nativelySupportsResponsesAPI } from "@helicone-package/cost/models/providers";`
`4`	`4`	`import {`
`5`	`5`	`ResponseFormat,`
`6`	`6`	`BodyMappingType,`
`@@ -522,8 +522,7 @@ export async function normalizeAIGatewayResponse(params: {`
`522`	`522`
`523`	`523`	`// by this line, normalizedOpenAIText is now in Chat Completions format`
`524`	`524`
`525`		`- const nativelySupportsResponsesAPI = provider === "openai" \|\| (provider === "helicone" && providerModelId.includes("gpt"));`
`526`		`- if (bodyMapping === "RESPONSES" && !nativelySupportsResponsesAPI) {`
	`525`	`+ if (bodyMapping === "RESPONSES" && !nativelySupportsResponsesAPI(provider, providerModelId)) {`
`527`	`526`	`return convertOpenAIStreamToResponses(normalizedOpenAIText);`
`528`	`527`	`}`
`529`	`528`
`@@ -557,8 +556,7 @@ export async function normalizeAIGatewayResponse(params: {`
`557`	`556`	`}`
`558`	`557`	`}`
`559`	`558`
`560`		`- const nativelySupportsResponsesAPI = provider === "openai" \|\| (provider === "helicone" && providerModelId.includes("gpt"));`
`561`		`- if (bodyMapping === "RESPONSES" && !nativelySupportsResponsesAPI) {`
	`559`	`+ if (bodyMapping === "RESPONSES" && !nativelySupportsResponsesAPI(provider, providerModelId)) {`
`562`	`560`	`const responsesBody = toResponses(openAIBody);`
`563`	`561`	`return JSON.stringify(responsesBody);`
`564`	`562`	`}`