fix(telemetry): emit OTel-standard gen_ai.usage.cache_read.input_tokens across providers (0xPlaygrounds#1666)

alwayys-afk · web-flow · commit 3a07cb4c64ec · 2026-04-28T22:30:29.000Z
* fix: emit OTel-standard cache_read.input_tokens across providers

Provider spans declared `gen_ai.usage.cached_tokens` (non-OTel) but the
shared telemetry helpers (`SpanCombinator::record_token_usage`,
`openai_chat_completions_compatible::record_usage`) write the OTel-
standard `gen_ai.usage.cache_read.input_tokens`. Because `tracing`
silently drops `.record()` for fields not declared on the span, cached-
token values were being computed and thrown away on every provider whose
span did not declare the OTel name.

Declare `gen_ai.usage.cache_read.input_tokens` on every affected span
across OpenAI, Azure, Cohere, Gemini (incl. interactions_api), Groq,
DeepSeek, HuggingFace, Mistral, OpenRouter, Together, xAI, Copilot,
and llamafile. Emit `cache_read.input_tokens` from the OpenAI chat-
completions compatible helper and the OpenAI Responses API record
sites. Do not emit `cache_creation.input_tokens` on OpenAI-family spans
— those APIs have no cache-creation concept and a hardcoded 0 would be
misleading rather than informative. Anthropic, which does report cache
creation, is unchanged.

Remove the non-OTel `gen_ai.usage.cached_tokens` attribute from every
path this change touches: drop the span declaration and, on paths whose
only recording sites are modified here, drop the record calls too. Only
the OTel-standard attribute is emitted from these paths.

Spans that record cache tokens entirely through their own inline
`span.record("gen_ai.usage.cached_tokens", ...)` calls (e.g. non-
streaming paths of Groq, DeepSeek, Copilot; standalone files like
Galadriel, Hyperbolic, Mira, Moonshot, Ollama, Perplexity, ChatGPT;
non-streaming Together and xAI) are out of scope for this change and
continue to emit only `cached_tokens`.

* fix: emit cache_read.input_tokens on 5 providers missed by prior commit

Galadriel, Hyperbolic, Mira, Moonshot, and Perplexity all route their
streaming paths through `send_compatible_streaming_request`, whose
shared `record_usage` helper was updated in the prior commit to write
the OTel-standard `gen_ai.usage.cache_read.input_tokens`. These five
provider spans still declared `gen_ai.usage.cached_tokens`, so the
newly-recorded value was silently dropped by `tracing` — and since
none of these files inline-records `cached_tokens` either, their
streaming paths were emitting no cache-read metric at all after the
prior commit landed.

Rename the declaration to `gen_ai.usage.cache_read.input_tokens` on
both the non-streaming and streaming span in each file, matching the
pattern the prior commit already applied across the other providers.
The non-streaming rename is a no-op (no recorder targets the field on
that path) but keeps both spans in each file consistent.

* fix: complete cache_read.input_tokens rename across remaining providers

Prior two commits partially renamed gen_ai.usage.cached_tokens to the
canonical OTel GenAI attribute gen_ai.usage.cache_read.input_tokens but
left several providers (and some streaming-vs-non-streaming paths within
a provider) emitting the old name. Finish the rename in chatgpt,
copilot, deepseek (non-streaming), groq (non-streaming), ollama,
together/completion, and xai/completion so every span consistently
emits cache_read.input_tokens.
diff --git a/rig/rig-core/src/providers/azure.rs b/rig/rig-core/src/providers/azure.rs
@@ -709,7 +709,7 @@ where
                 gen_ai.response.model = tracing::field::Empty,
                 gen_ai.usage.output_tokens = tracing::field::Empty,
                 gen_ai.usage.input_tokens = tracing::field::Empty,
-                gen_ai.usage.cached_tokens = tracing::field::Empty,
+                gen_ai.usage.cache_read.input_tokens = tracing::field::Empty,
             )
         } else {
             tracing::Span::current()
@@ -809,7 +809,7 @@ where
                 gen_ai.response.model = tracing::field::Empty,
                 gen_ai.usage.output_tokens = tracing::field::Empty,
                 gen_ai.usage.input_tokens = tracing::field::Empty,
-                gen_ai.usage.cached_tokens = tracing::field::Empty,
+                gen_ai.usage.cache_read.input_tokens = tracing::field::Empty,
             )
         } else {
             tracing::Span::current()
diff --git a/rig/rig-core/src/providers/chatgpt/mod.rs b/rig/rig-core/src/providers/chatgpt/mod.rs
@@ -493,7 +493,7 @@ where
                 gen_ai.response.model = tracing::field::Empty,
                 gen_ai.usage.output_tokens = tracing::field::Empty,
                 gen_ai.usage.input_tokens = tracing::field::Empty,
-                gen_ai.usage.cached_tokens = tracing::field::Empty,
+                gen_ai.usage.cache_read.input_tokens = tracing::field::Empty,
                 gen_ai.input.messages = tracing::field::Empty,
                 gen_ai.output.messages = tracing::field::Empty,
             )
@@ -510,7 +510,7 @@ where
                 span.record("gen_ai.usage.output_tokens", response.usage.output_tokens);
                 span.record("gen_ai.usage.input_tokens", response.usage.input_tokens);
                 span.record(
-                    "gen_ai.usage.cached_tokens",
+                    "gen_ai.usage.cache_read.input_tokens",
                     response.usage.cached_input_tokens,
                 );
                 Ok(response)
@@ -575,7 +575,7 @@ where
                 gen_ai.response.model = tracing::field::Empty,
                 gen_ai.usage.output_tokens = tracing::field::Empty,
                 gen_ai.usage.input_tokens = tracing::field::Empty,
-                gen_ai.usage.cached_tokens = tracing::field::Empty,
+                gen_ai.usage.cache_read.input_tokens = tracing::field::Empty,
             )
         } else {
             tracing::Span::current()
diff --git a/rig/rig-core/src/providers/cohere/completion.rs b/rig/rig-core/src/providers/cohere/completion.rs
@@ -643,7 +643,7 @@ where
             gen_ai.response.model = self.model,
             gen_ai.usage.output_tokens = tracing::field::Empty,
             gen_ai.usage.input_tokens = tracing::field::Empty,
-            gen_ai.usage.cached_tokens = tracing::field::Empty,
+            gen_ai.usage.cache_read.input_tokens = tracing::field::Empty,
             )
         } else {
             tracing::Span::current()
diff --git a/rig/rig-core/src/providers/cohere/streaming.rs b/rig/rig-core/src/providers/cohere/streaming.rs
@@ -111,7 +111,7 @@ where
                 gen_ai.response.model = self.model,
                 gen_ai.usage.output_tokens = tracing::field::Empty,
                 gen_ai.usage.input_tokens = tracing::field::Empty,
-                gen_ai.usage.cached_tokens = tracing::field::Empty,
+                gen_ai.usage.cache_read.input_tokens = tracing::field::Empty,
             )
         } else {
             tracing::Span::current()
diff --git a/rig/rig-core/src/providers/copilot/mod.rs b/rig/rig-core/src/providers/copilot/mod.rs
@@ -681,7 +681,7 @@ where
                 gen_ai.response.model = tracing::field::Empty,
                 gen_ai.usage.output_tokens = tracing::field::Empty,
                 gen_ai.usage.input_tokens = tracing::field::Empty,
-                gen_ai.usage.cached_tokens = tracing::field::Empty,
+                gen_ai.usage.cache_read.input_tokens = tracing::field::Empty,
             )
         } else {
             tracing::Span::current()
@@ -705,7 +705,7 @@ where
                                 usage.total_tokens - usage.prompt_tokens,
                             );
                             span.record(
-                                "gen_ai.usage.cached_tokens",
+                                "gen_ai.usage.cache_read.input_tokens",
                                 usage
                                     .prompt_tokens_details
                                     .as_ref()
@@ -762,7 +762,7 @@ where
                 gen_ai.response.model = tracing::field::Empty,
                 gen_ai.usage.output_tokens = tracing::field::Empty,
                 gen_ai.usage.input_tokens = tracing::field::Empty,
-                gen_ai.usage.cached_tokens = tracing::field::Empty,
+                gen_ai.usage.cache_read.input_tokens = tracing::field::Empty,
             )
         } else {
             tracing::Span::current()
@@ -782,7 +782,7 @@ where
                     span.record("gen_ai.usage.input_tokens", usage.input_tokens);
                     span.record("gen_ai.usage.output_tokens", usage.output_tokens);
                     span.record(
-                        "gen_ai.usage.cached_tokens",
+                        "gen_ai.usage.cache_read.input_tokens",
                         usage
                             .input_tokens_details
                             .as_ref()
@@ -843,7 +843,7 @@ where
                 gen_ai.response.model = tracing::field::Empty,
                 gen_ai.usage.output_tokens = tracing::field::Empty,
                 gen_ai.usage.input_tokens = tracing::field::Empty,
-                gen_ai.usage.cached_tokens = tracing::field::Empty,
+                gen_ai.usage.cache_read.input_tokens = tracing::field::Empty,
             )
         } else {
             tracing::Span::current()
@@ -885,7 +885,7 @@ where
                 gen_ai.response.model = tracing::field::Empty,
                 gen_ai.usage.output_tokens = tracing::field::Empty,
                 gen_ai.usage.input_tokens = tracing::field::Empty,
-                gen_ai.usage.cached_tokens = tracing::field::Empty,
+                gen_ai.usage.cache_read.input_tokens = tracing::field::Empty,
             )
         } else {
             tracing::Span::current()
@@ -1042,7 +1042,7 @@ where
                 span.record("gen_ai.usage.input_tokens", final_usage.input_tokens);
                 span.record("gen_ai.usage.output_tokens", final_usage.output_tokens);
                 span.record(
-                    "gen_ai.usage.cached_tokens",
+                    "gen_ai.usage.cache_read.input_tokens",
                     final_usage
                         .input_tokens_details
                         .as_ref()
diff --git a/rig/rig-core/src/providers/deepseek.rs b/rig/rig-core/src/providers/deepseek.rs
@@ -560,7 +560,7 @@ where
                 gen_ai.response.model = tracing::field::Empty,
                 gen_ai.usage.output_tokens = tracing::field::Empty,
                 gen_ai.usage.input_tokens = tracing::field::Empty,
-                gen_ai.usage.cached_tokens = tracing::field::Empty,
+                gen_ai.usage.cache_read.input_tokens = tracing::field::Empty,
             )
         } else {
             tracing::Span::current()
@@ -600,7 +600,7 @@ where
                             response.usage.completion_tokens,
                         );
                         span.record(
-                            "gen_ai.usage.cached_tokens",
+                            "gen_ai.usage.cache_read.input_tokens",
                             response
                                 .usage
                                 .prompt_tokens_details
@@ -673,7 +673,7 @@ where
                 gen_ai.response.model = tracing::field::Empty,
                 gen_ai.usage.output_tokens = tracing::field::Empty,
                 gen_ai.usage.input_tokens = tracing::field::Empty,
-                gen_ai.usage.cached_tokens = tracing::field::Empty,
+                gen_ai.usage.cache_read.input_tokens = tracing::field::Empty,
             )
         } else {
             tracing::Span::current()
diff --git a/rig/rig-core/src/providers/galadriel.rs b/rig/rig-core/src/providers/galadriel.rs
@@ -553,7 +553,7 @@ where
                 gen_ai.response.model = tracing::field::Empty,
                 gen_ai.usage.output_tokens = tracing::field::Empty,
                 gen_ai.usage.input_tokens = tracing::field::Empty,
-                gen_ai.usage.cached_tokens = tracing::field::Empty,
+                gen_ai.usage.cache_read.input_tokens = tracing::field::Empty,
             )
         } else {
             tracing::Span::current()
@@ -653,7 +653,7 @@ where
                 gen_ai.response.model = tracing::field::Empty,
                 gen_ai.usage.output_tokens = tracing::field::Empty,
                 gen_ai.usage.input_tokens = tracing::field::Empty,
-                gen_ai.usage.cached_tokens = tracing::field::Empty,
+                gen_ai.usage.cache_read.input_tokens = tracing::field::Empty,
                 gen_ai.input.messages = serde_json::to_string(&request.messages)?,
                 gen_ai.output.messages = tracing::field::Empty,
             )
diff --git a/rig/rig-core/src/providers/gemini/completion.rs b/rig/rig-core/src/providers/gemini/completion.rs
@@ -102,7 +102,7 @@ where
                 gen_ai.response.model = tracing::field::Empty,
                 gen_ai.usage.output_tokens = tracing::field::Empty,
                 gen_ai.usage.input_tokens = tracing::field::Empty,
-                gen_ai.usage.cached_tokens = tracing::field::Empty,
+                gen_ai.usage.cache_read.input_tokens = tracing::field::Empty,
             )
         } else {
             tracing::Span::current()
diff --git a/rig/rig-core/src/providers/gemini/interactions_api/mod.rs b/rig/rig-core/src/providers/gemini/interactions_api/mod.rs
@@ -132,6 +132,7 @@ where
                 gen_ai.response.model = tracing::field::Empty,
                 gen_ai.usage.output_tokens = tracing::field::Empty,
                 gen_ai.usage.input_tokens = tracing::field::Empty,
+                gen_ai.usage.cache_read.input_tokens = tracing::field::Empty,
             )
         } else {
             tracing::Span::current()
diff --git a/rig/rig-core/src/providers/gemini/interactions_api/streaming.rs b/rig/rig-core/src/providers/gemini/interactions_api/streaming.rs
@@ -62,6 +62,7 @@ where
                 gen_ai.response.model = tracing::field::Empty,
                 gen_ai.usage.output_tokens = tracing::field::Empty,
                 gen_ai.usage.input_tokens = tracing::field::Empty,
+                gen_ai.usage.cache_read.input_tokens = tracing::field::Empty,
             )
         } else {
             tracing::Span::current()
diff --git a/rig/rig-core/src/providers/gemini/streaming.rs b/rig/rig-core/src/providers/gemini/streaming.rs
@@ -93,7 +93,7 @@ where
                 gen_ai.response.model = &request_model,
                 gen_ai.usage.output_tokens = tracing::field::Empty,
                 gen_ai.usage.input_tokens = tracing::field::Empty,
-                gen_ai.usage.cached_tokens = tracing::field::Empty,
+                gen_ai.usage.cache_read.input_tokens = tracing::field::Empty,
             )
         } else {
             tracing::Span::current()
diff --git a/rig/rig-core/src/providers/groq.rs b/rig/rig-core/src/providers/groq.rs
@@ -373,7 +373,7 @@ where
                 gen_ai.response.model = tracing::field::Empty,
                 gen_ai.usage.output_tokens = tracing::field::Empty,
                 gen_ai.usage.input_tokens = tracing::field::Empty,
-                gen_ai.usage.cached_tokens = tracing::field::Empty,
+                gen_ai.usage.cache_read.input_tokens = tracing::field::Empty,
             )
         } else {
             tracing::Span::current()
@@ -415,7 +415,7 @@ where
                                 usage.total_tokens - usage.prompt_tokens,
                             );
                             span.record(
-                                "gen_ai.usage.cached_tokens",
+                                "gen_ai.usage.cache_read.input_tokens",
                                 usage
                                     .prompt_tokens_details
                                     .as_ref()
@@ -464,7 +464,7 @@ where
                 gen_ai.response.model = tracing::field::Empty,
                 gen_ai.usage.output_tokens = tracing::field::Empty,
                 gen_ai.usage.input_tokens = tracing::field::Empty,
-                gen_ai.usage.cached_tokens = tracing::field::Empty,
+                gen_ai.usage.cache_read.input_tokens = tracing::field::Empty,
             )
         } else {
             tracing::Span::current()
diff --git a/rig/rig-core/src/providers/huggingface/completion.rs b/rig/rig-core/src/providers/huggingface/completion.rs
@@ -740,7 +740,7 @@ where
                 gen_ai.response.model = tracing::field::Empty,
                 gen_ai.usage.output_tokens = tracing::field::Empty,
                 gen_ai.usage.input_tokens = tracing::field::Empty,
-                gen_ai.usage.cached_tokens = tracing::field::Empty,
+                gen_ai.usage.cache_read.input_tokens = tracing::field::Empty,
             )
         } else {
             tracing::Span::current()
diff --git a/rig/rig-core/src/providers/huggingface/streaming.rs b/rig/rig-core/src/providers/huggingface/streaming.rs
@@ -65,7 +65,7 @@ where
             gen_ai.response.model = &request_model,
             gen_ai.usage.output_tokens = tracing::field::Empty,
             gen_ai.usage.input_tokens = tracing::field::Empty,
-            gen_ai.usage.cached_tokens = tracing::field::Empty,
+            gen_ai.usage.cache_read.input_tokens = tracing::field::Empty,
             )
         } else {
             tracing::Span::current()
diff --git a/rig/rig-core/src/providers/hyperbolic.rs b/rig/rig-core/src/providers/hyperbolic.rs
@@ -362,7 +362,7 @@ where
                 gen_ai.response.model = tracing::field::Empty,
                 gen_ai.usage.output_tokens = tracing::field::Empty,
                 gen_ai.usage.input_tokens = tracing::field::Empty,
-                gen_ai.usage.cached_tokens = tracing::field::Empty,
+                gen_ai.usage.cache_read.input_tokens = tracing::field::Empty,
             )
         } else {
             tracing::Span::current()
@@ -433,7 +433,7 @@ where
                 gen_ai.response.model = tracing::field::Empty,
                 gen_ai.usage.output_tokens = tracing::field::Empty,
                 gen_ai.usage.input_tokens = tracing::field::Empty,
-                gen_ai.usage.cached_tokens = tracing::field::Empty,
+                gen_ai.usage.cache_read.input_tokens = tracing::field::Empty,
             )
         } else {
             tracing::Span::current()
diff --git a/rig/rig-core/src/providers/internal/openai_chat_completions_compatible.rs b/rig/rig-core/src/providers/internal/openai_chat_completions_compatible.rs
@@ -384,7 +384,10 @@ where
 
     span.record("gen_ai.usage.input_tokens", usage.input_tokens);
     span.record("gen_ai.usage.output_tokens", usage.output_tokens);
-    span.record("gen_ai.usage.cached_tokens", usage.cached_input_tokens);
+    span.record(
+        "gen_ai.usage.cache_read.input_tokens",
+        usage.cached_input_tokens,
+    );
 }
 
 fn record_response_metadata(
diff --git a/rig/rig-core/src/providers/llamafile.rs b/rig/rig-core/src/providers/llamafile.rs
@@ -387,7 +387,7 @@ where
                 gen_ai.response.model = tracing::field::Empty,
                 gen_ai.usage.output_tokens = tracing::field::Empty,
                 gen_ai.usage.input_tokens = tracing::field::Empty,
-                gen_ai.usage.cached_tokens = tracing::field::Empty,
+                gen_ai.usage.cache_read.input_tokens = tracing::field::Empty,
             )
         } else {
             tracing::Span::current()
diff --git a/rig/rig-core/src/providers/mira.rs b/rig/rig-core/src/providers/mira.rs
@@ -347,7 +347,7 @@ where
                 gen_ai.response.model = tracing::field::Empty,
                 gen_ai.usage.output_tokens = tracing::field::Empty,
                 gen_ai.usage.input_tokens = tracing::field::Empty,
-                gen_ai.usage.cached_tokens = tracing::field::Empty,
+                gen_ai.usage.cache_read.input_tokens = tracing::field::Empty,
             )
         } else {
             tracing::Span::current()
@@ -452,7 +452,7 @@ where
                 gen_ai.response.model = tracing::field::Empty,
                 gen_ai.usage.output_tokens = tracing::field::Empty,
                 gen_ai.usage.input_tokens = tracing::field::Empty,
-                gen_ai.usage.cached_tokens = tracing::field::Empty,
+                gen_ai.usage.cache_read.input_tokens = tracing::field::Empty,
             )
         } else {
             tracing::Span::current()
diff --git a/rig/rig-core/src/providers/mistral/completion.rs b/rig/rig-core/src/providers/mistral/completion.rs
@@ -608,7 +608,7 @@ where
                 gen_ai.response.model = tracing::field::Empty,
                 gen_ai.usage.output_tokens = tracing::field::Empty,
                 gen_ai.usage.input_tokens = tracing::field::Empty,
-                gen_ai.usage.cached_tokens = tracing::field::Empty,
+                gen_ai.usage.cache_read.input_tokens = tracing::field::Empty,
             )
         } else {
             tracing::Span::current()
diff --git a/rig/rig-core/src/providers/moonshot.rs b/rig/rig-core/src/providers/moonshot.rs
@@ -511,7 +511,7 @@ where
                 gen_ai.response.model = tracing::field::Empty,
                 gen_ai.usage.output_tokens = tracing::field::Empty,
                 gen_ai.usage.input_tokens = tracing::field::Empty,
-                gen_ai.usage.cached_tokens = tracing::field::Empty,
+                gen_ai.usage.cache_read.input_tokens = tracing::field::Empty,
             )
         } else {
             tracing::Span::current()
@@ -593,7 +593,7 @@ where
                 gen_ai.response.model = tracing::field::Empty,
                 gen_ai.usage.output_tokens = tracing::field::Empty,
                 gen_ai.usage.input_tokens = tracing::field::Empty,
-                gen_ai.usage.cached_tokens = tracing::field::Empty,
+                gen_ai.usage.cache_read.input_tokens = tracing::field::Empty,
             )
         } else {
             tracing::Span::current()
diff --git a/rig/rig-core/src/providers/ollama.rs b/rig/rig-core/src/providers/ollama.rs
@@ -591,7 +591,7 @@ where
                 gen_ai.response.model = tracing::field::Empty,
                 gen_ai.usage.output_tokens = tracing::field::Empty,
                 gen_ai.usage.input_tokens = tracing::field::Empty,
-                gen_ai.usage.cached_tokens = tracing::field::Empty,
+                gen_ai.usage.cache_read.input_tokens = tracing::field::Empty,
             )
         } else {
             tracing::Span::current()
@@ -671,7 +671,7 @@ where
                 gen_ai.response.model = self.model,
                 gen_ai.usage.output_tokens = tracing::field::Empty,
                 gen_ai.usage.input_tokens = tracing::field::Empty,
-                gen_ai.usage.cached_tokens = tracing::field::Empty,
+                gen_ai.usage.cache_read.input_tokens = tracing::field::Empty,
             )
         } else {
             tracing::Span::current()
diff --git a/rig/rig-core/src/providers/openai/completion/mod.rs b/rig/rig-core/src/providers/openai/completion/mod.rs
@@ -1326,7 +1326,7 @@ where
                 gen_ai.response.model = tracing::field::Empty,
                 gen_ai.usage.output_tokens = tracing::field::Empty,
                 gen_ai.usage.input_tokens = tracing::field::Empty,
-                gen_ai.usage.cached_tokens = tracing::field::Empty,
+                gen_ai.usage.cache_read.input_tokens = tracing::field::Empty,
             )
         } else {
             tracing::Span::current()
diff --git a/rig/rig-core/src/providers/openai/completion/streaming.rs b/rig/rig-core/src/providers/openai/completion/streaming.rs
@@ -137,7 +137,7 @@ where
                 gen_ai.response.model = tracing::field::Empty,
                 gen_ai.usage.output_tokens = tracing::field::Empty,
                 gen_ai.usage.input_tokens = tracing::field::Empty,
-                gen_ai.usage.cached_tokens = tracing::field::Empty,
+                gen_ai.usage.cache_read.input_tokens = tracing::field::Empty,
                 gen_ai.input.messages = request_messages,
                 gen_ai.output.messages = tracing::field::Empty,
             )
diff --git a/rig/rig-core/src/providers/openai/responses_api/mod.rs b/rig/rig-core/src/providers/openai/responses_api/mod.rs
@@ -1367,7 +1367,7 @@ where
                 gen_ai.response.model = tracing::field::Empty,
                 gen_ai.usage.output_tokens = tracing::field::Empty,
                 gen_ai.usage.input_tokens = tracing::field::Empty,
-                gen_ai.usage.cached_tokens = tracing::field::Empty,
+                gen_ai.usage.cache_read.input_tokens = tracing::field::Empty,
                 gen_ai.input.messages = tracing::field::Empty,
                 gen_ai.output.messages = tracing::field::Empty,
             )
@@ -1406,14 +1406,12 @@ where
                 if let Some(ref usage) = response.usage {
                     span.record("gen_ai.usage.output_tokens", usage.output_tokens);
                     span.record("gen_ai.usage.input_tokens", usage.input_tokens);
-                    span.record(
-                        "gen_ai.usage.cached_tokens",
-                        usage
-                            .input_tokens_details
-                            .as_ref()
-                            .map(|d| d.cached_tokens)
-                            .unwrap_or(0),
-                    );
+                    let cached_tokens = usage
+                        .input_tokens_details
+                        .as_ref()
+                        .map(|d| d.cached_tokens)
+                        .unwrap_or(0);
+                    span.record("gen_ai.usage.cache_read.input_tokens", cached_tokens);
                 }
                 if enabled!(Level::TRACE) {
                     tracing::trace!(
diff --git a/rig/rig-core/src/providers/openai/responses_api/streaming.rs b/rig/rig-core/src/providers/openai/responses_api/streaming.rs
diff --git a/rig/rig-core/src/providers/openrouter/completion.rs b/rig/rig-core/src/providers/openrouter/completion.rs
diff --git a/rig/rig-core/src/providers/openrouter/streaming.rs b/rig/rig-core/src/providers/openrouter/streaming.rs
diff --git a/rig/rig-core/src/providers/perplexity.rs b/rig/rig-core/src/providers/perplexity.rs
diff --git a/rig/rig-core/src/providers/together/completion.rs b/rig/rig-core/src/providers/together/completion.rs
diff --git a/rig/rig-core/src/providers/together/streaming.rs b/rig/rig-core/src/providers/together/streaming.rs
diff --git a/rig/rig-core/src/providers/xai/completion.rs b/rig/rig-core/src/providers/xai/completion.rs
diff --git a/rig/rig-core/src/providers/xai/streaming.rs b/rig/rig-core/src/providers/xai/streaming.rs

Original file line number	Diff line number	Diff line change
`@@ -643,7 +643,7 @@ where`
`643`	`643`	`gen_ai.response.model = self.model,`
`644`	`644`	`gen_ai.usage.output_tokens = tracing::field::Empty,`
`645`	`645`	`gen_ai.usage.input_tokens = tracing::field::Empty,`
`646`		`- gen_ai.usage.cached_tokens = tracing::field::Empty,`
	`646`	`+ gen_ai.usage.cache_read.input_tokens = tracing::field::Empty,`
`647`	`647`	`)`
`648`	`648`	`} else {`
`649`	`649`	`tracing::Span::current()`
Original file line number	Diff line number	Diff line change
`@@ -111,7 +111,7 @@ where`
`111`	`111`	`gen_ai.response.model = self.model,`
`112`	`112`	`gen_ai.usage.output_tokens = tracing::field::Empty,`
`113`	`113`	`gen_ai.usage.input_tokens = tracing::field::Empty,`
`114`		`- gen_ai.usage.cached_tokens = tracing::field::Empty,`
	`114`	`+ gen_ai.usage.cache_read.input_tokens = tracing::field::Empty,`
`115`	`115`	`)`
`116`	`116`	`} else {`
`117`	`117`	`tracing::Span::current()`
Original file line number	Diff line number	Diff line change
`@@ -102,7 +102,7 @@ where`
`102`	`102`	`gen_ai.response.model = tracing::field::Empty,`
`103`	`103`	`gen_ai.usage.output_tokens = tracing::field::Empty,`
`104`	`104`	`gen_ai.usage.input_tokens = tracing::field::Empty,`
`105`		`- gen_ai.usage.cached_tokens = tracing::field::Empty,`
	`105`	`+ gen_ai.usage.cache_read.input_tokens = tracing::field::Empty,`
`106`	`106`	`)`
`107`	`107`	`} else {`
`108`	`108`	`tracing::Span::current()`
Original file line number	Diff line number	Diff line change
`@@ -132,6 +132,7 @@ where`
`132`	`132`	`gen_ai.response.model = tracing::field::Empty,`
`133`	`133`	`gen_ai.usage.output_tokens = tracing::field::Empty,`
`134`	`134`	`gen_ai.usage.input_tokens = tracing::field::Empty,`
	`135`	`+ gen_ai.usage.cache_read.input_tokens = tracing::field::Empty,`
`135`	`136`	`)`
`136`	`137`	`} else {`
`137`	`138`	`tracing::Span::current()`
Original file line number	Diff line number	Diff line change
`@@ -62,6 +62,7 @@ where`
`62`	`62`	`gen_ai.response.model = tracing::field::Empty,`
`63`	`63`	`gen_ai.usage.output_tokens = tracing::field::Empty,`
`64`	`64`	`gen_ai.usage.input_tokens = tracing::field::Empty,`
	`65`	`+ gen_ai.usage.cache_read.input_tokens = tracing::field::Empty,`
`65`	`66`	`)`
`66`	`67`	`} else {`
`67`	`68`	`tracing::Span::current()`