refactor: integrate telemetry configuration for AI processing across categorization, deduplication, and document parsing

mikr13 · mikr13 · commit 36cc9f9b893b · 2026-03-14T13:27:29.000+05:30
diff --git a/.env.example b/.env.example
@@ -19,8 +19,11 @@ WXT_SUPABASE_PUBLISHABLE_KEY=your-supabase-publishable-key
 # Set this to 'true' to enable debug logs in production builds
 # WXT_DEBUG=true
 
-# Langfuse Observability (optional)
-# Get these from https://us.cloud.langfuse.com
+# Langfuse Observability (dev-only, optional)
+# AI telemetry is automatically enabled in dev mode (console logging).
+# To also send traces to Langfuse, set these keys.
+# Get them from https://us.cloud.langfuse.com (free tier available).
+# These are NEVER included in production builds.
 # WXT_LANGFUSE_PUBLIC_KEY=pk-lf-...
 # WXT_LANGFUSE_SECRET_KEY=sk-lf-...
 # WXT_LANGFUSE_BASEURL=https://us.cloud.langfuse.com
diff --git a/src/lib/ai/bulk-categorizer.ts b/src/lib/ai/bulk-categorizer.ts
@@ -1,5 +1,6 @@
 import { generateText, Output } from "ai";
 import { z } from "zod";
+import { getTelemetryConfig } from "@/lib/ai/telemetry";
 import { allowedCategories } from "@/lib/copies";
 import { createLogger } from "@/lib/logger";
 import { getAIModel, getProviderOptions } from "@/lib/providers/model-factory";
@@ -92,6 +93,7 @@ export class BulkCategorizer {
         system: systemPrompt,
         prompt: userPrompt,
         providerOptions: getProviderOptions(provider),
+        ...getTelemetryConfig("bulk-categorization"),
       });
 
       const categorized = this.mapResultsToFields(result, fields);
diff --git a/src/lib/ai/categorization.ts b/src/lib/ai/categorization.ts
@@ -1,5 +1,6 @@
 import { generateText, Output } from "ai";
 import { z } from "zod";
+import { getTelemetryConfig } from "@/lib/ai/telemetry";
 import { createLogger } from "@/lib/logger";
 import { getAIModel, getProviderOptions } from "@/lib/providers/model-factory";
 import type { AIProvider } from "@/lib/providers/registry";
@@ -152,6 +153,7 @@ Be precise and consider context. For example:
       prompt: userPrompt,
       temperature: 0.3,
       providerOptions: getProviderOptions(provider),
+      ...getTelemetryConfig("categorization"),
     });
 
     return result.output;
@@ -243,6 +245,7 @@ Rephrase the following answer based on the provided context.
       prompt: userPrompt,
       temperature: 0.4,
       providerOptions: getProviderOptions(provider),
+      ...getTelemetryConfig("rephrase-context"),
     });
 
     return output.rephrasedAnswer;
@@ -284,6 +287,7 @@ export const rephraseAgent = async (
       prompt: userPrompt,
       temperature: 0.5,
       providerOptions: getProviderOptions(provider),
+      ...getTelemetryConfig("rephrase"),
     });
 
     return output;
diff --git a/src/lib/ai/deduplication-categorizer.ts b/src/lib/ai/deduplication-categorizer.ts
@@ -1,6 +1,7 @@
 import { generateText, Output } from "ai";
 import { z } from "zod";
 import { CategoryEnum, TagSchema } from "@/lib/ai/categorization";
+import { getTelemetryConfig } from "@/lib/ai/telemetry";
 import { createLogger } from "@/lib/logger";
 import type { AIProvider } from "@/lib/providers/registry";
 import { storage } from "@/lib/storage";
@@ -141,6 +142,7 @@ export class DeduplicationCategorizer {
         prompt: userPrompt,
         temperature: 0.3,
         providerOptions: getProviderOptions(provider),
+        ...getTelemetryConfig("deduplication"),
       });
 
       logger.info("Deduplication + Categorization result:", {
diff --git a/src/lib/ai/matcher.ts b/src/lib/ai/matcher.ts
@@ -1,5 +1,6 @@
 import { generateText, Output } from "ai";
 import { z } from "zod";
+import { getTelemetryConfig } from "@/lib/ai/telemetry";
 import { getAuthService } from "@/lib/auth/auth-service";
 import { FallbackMatcher } from "@/lib/autofill/fallback-matcher";
 import {
@@ -222,6 +223,7 @@ export class AIMatcher {
         prompt: userPrompt,
         temperature: 0.3,
         providerOptions: getProviderOptions(provider),
+        ...getTelemetryConfig("field-matching"),
       });
 
       return result.output;
diff --git a/src/lib/ai/telemetry.ts b/src/lib/ai/telemetry.ts
@@ -0,0 +1,171 @@
+import type { TelemetryIntegration } from "ai";
+import { bindTelemetryIntegration } from "ai";
+import { createLogger } from "@/lib/logger";
+
+const logger = createLogger("ai:telemetry");
+
+const LANGFUSE_PUBLIC_KEY = import.meta.env.WXT_LANGFUSE_PUBLIC_KEY as
+  | string
+  | undefined;
+const LANGFUSE_SECRET_KEY = import.meta.env.WXT_LANGFUSE_SECRET_KEY as
+  | string
+  | undefined;
+const LANGFUSE_BASEURL =
+  (import.meta.env.WXT_LANGFUSE_BASEURL as string | undefined) ||
+  "https://us.cloud.langfuse.com";
+
+const langfuseEnabled = !!(LANGFUSE_PUBLIC_KEY && LANGFUSE_SECRET_KEY);
+
+class DevTelemetryIntegration implements TelemetryIntegration {
+  private startTime = 0;
+  private startTimestamp = "";
+  private inputData: unknown = undefined;
+
+  async onStart(event: {
+    model: { provider: string; modelId: string };
+    system: unknown;
+    prompt: unknown;
+    messages: unknown;
+  }) {
+    this.startTime = performance.now();
+    this.startTimestamp = new Date().toISOString();
+    this.inputData = event.messages ?? event.prompt ?? event.system;
+    logger.info(
+      `AI call started | provider: ${event.model.provider} | model: ${event.model.modelId}`,
+    );
+  }
+
+  async onFinish(event: {
+    model: { provider: string; modelId: string };
+    totalUsage: {
+      inputTokens: number | undefined;
+      outputTokens: number | undefined;
+    };
+    finishReason: string;
+    functionId: string | undefined;
+    text: string;
+  }) {
+    const duration = performance.now() - this.startTime;
+    const inputTokens = event.totalUsage.inputTokens ?? 0;
+    const outputTokens = event.totalUsage.outputTokens ?? 0;
+
+    logger.info(
+      `AI call completed | fn: ${event.functionId ?? "unknown"} | model: ${event.model.modelId} | tokens: ${inputTokens}+${outputTokens}=${inputTokens + outputTokens} | duration: ${(duration / 1000).toFixed(2)}s | finish: ${event.finishReason}`,
+    );
+
+    if (langfuseEnabled) {
+      this.sendToLangfuse(event, duration).catch((err) =>
+        logger.debug("Langfuse send failed:", err),
+      );
+    }
+  }
+
+  private async sendToLangfuse(
+    event: {
+      model: { provider: string; modelId: string };
+      totalUsage: {
+        inputTokens: number | undefined;
+        outputTokens: number | undefined;
+      };
+      finishReason: string;
+      functionId: string | undefined;
+      text: string;
+    },
+    durationMs: number,
+  ) {
+    const traceId = crypto.randomUUID();
+    const generationId = crypto.randomUUID();
+    const endTime = new Date().toISOString();
+    const startTime = this.startTimestamp || endTime;
+    const input = this.inputData;
+    const output = event.text;
+
+    const batch = [
+      {
+        id: crypto.randomUUID(),
+        type: "trace-create" as const,
+        timestamp: startTime,
+        body: {
+          id: traceId,
+          name: event.functionId ?? "ai-call",
+          input,
+          output,
+          metadata: {
+            provider: event.model.provider,
+            model: event.model.modelId,
+            source: "superfill-extension-dev",
+          },
+        },
+      },
+      {
+        id: crypto.randomUUID(),
+        type: "generation-create" as const,
+        timestamp: startTime,
+        body: {
+          id: generationId,
+          traceId,
+          name: event.functionId ?? "ai-call",
+          model: event.model.modelId,
+          input,
+          output,
+          startTime,
+          endTime,
+          modelParameters: {
+            provider: event.model.provider,
+          },
+          usage: {
+            input: event.totalUsage.inputTokens ?? 0,
+            output: event.totalUsage.outputTokens ?? 0,
+            unit: "TOKENS",
+          },
+          metadata: {
+            durationMs: Math.round(durationMs),
+            finishReason: event.finishReason,
+          },
+        },
+      },
+    ];
+
+    const credentials = btoa(`${LANGFUSE_PUBLIC_KEY}:${LANGFUSE_SECRET_KEY}`);
+
+    await fetch(`${LANGFUSE_BASEURL}/api/public/ingestion`, {
+      method: "POST",
+      headers: {
+        "Content-Type": "application/json",
+        Authorization: `Basic ${credentials}`,
+      },
+      body: JSON.stringify({ batch }),
+    });
+
+    logger.debug(`Langfuse trace sent: ${traceId}`);
+  }
+}
+
+function devTelemetryIntegration(): TelemetryIntegration {
+  return bindTelemetryIntegration(new DevTelemetryIntegration());
+}
+
+/**
+ * Returns telemetry config to spread into generateText/streamText calls.
+ * In production, returns an empty object (no-op when spread).
+ * In dev, enables telemetry with console logging + optional Langfuse.
+ */
+export function getTelemetryConfig(functionId: string): {
+  experimental_telemetry?: {
+    isEnabled: boolean;
+    functionId: string;
+    integrations: TelemetryIntegration[];
+  };
+} {
+  if (!import.meta.env.DEV) {
+    return {};
+  }
+
+  return {
+    experimental_telemetry: {
+      isEnabled: true,
+      functionId,
+      integrations: [devTelemetryIntegration()],
+    },
+  };
+}
diff --git a/src/lib/document/document-parser.ts b/src/lib/document/document-parser.ts
@@ -1,5 +1,6 @@
 import { generateText, Output } from "ai";
 import { z } from "zod";
+import { getTelemetryConfig } from "@/lib/ai/telemetry";
 import { createLogger } from "@/lib/logger";
 import { getAIModel, getProviderOptions } from "@/lib/providers/model-factory";
 import { getKeyVaultService } from "@/lib/security/key-vault-service";
@@ -209,6 +210,7 @@ async function parseDocumentWithAI(text: string): Promise<ExtractedItem[]> {
     prompt: `Extract all useful personal and professional information from this document:\n\n${text}`,
     temperature: 0.1,
     providerOptions: getProviderOptions(selectedProvider),
+    ...getTelemetryConfig("document-parsing"),
   });
 
   logger.debug("AI extracted items:", output.items.length);