test(gemini): add streaming metadata cassettes (0xPlaygrounds#1777)

gold-silver-copper · web-flow · commit f77a5819ec2a · 2026-05-16T07:52:56.000Z
diff --git a/tests/cassettes/gemini/interactions_api/streaming_final_metadata_exposes_model_version.yaml b/tests/cassettes/gemini/interactions_api/streaming_final_metadata_exposes_model_version.yaml
@@ -0,0 +1,48 @@
+when:
+  path: /v1beta/interactions
+  method: POST
+  query_param:
+  - name: alt
+    value: sse
+  header:
+  - name: accept
+    value: text/event-stream
+  - name: content-type
+    value: application/json
+  body: '{"generation_config":{"temperature":0.0},"input":[{"content":[{"text":"Reply with exactly: interaction metadata ok","type":"text"}],"role":"user"}],"model":"gemini-3-flash-preview","stream":true}'
+then:
+  status: 200
+  header:
+  - name: content-type
+    value: text/event-stream
+  body: |+
+    event: interaction.start
+    data: {"event_type":"interaction.start","interaction":{"id":"v1_REDACTED_1","model":"gemini-3-flash-preview","object":"interaction","status":"in_progress"}}
+
+    event: interaction.status_update
+    data: {"event_type":"interaction.status_update","interaction_id":"v1_REDACTED_1","status":"in_progress"}
+
+    event: content.start
+    data: {"content":{"type":"thought"},"event_type":"content.start","index":0}
+
+    event: content.delta
+    data: {"delta":{"signature":"signature_REDACTED_1","type":"thought_signature"},"event_type":"content.delta","index":0}
+
+    event: content.stop
+    data: {"event_type":"content.stop","index":0}
+
+    event: content.start
+    data: {"content":{"type":"text"},"event_type":"content.start","index":1}
+
+    event: content.delta
+    data: {"delta":{"text":"interaction metadata ok","type":"text"},"event_type":"content.delta","index":1}
+
+    event: content.stop
+    data: {"event_type":"content.stop","index":1}
+
+    event: interaction.complete
+    data: {"event_type":"interaction.complete","interaction":{"created":"1970-01-01T00:00:00Z","id":"v1_REDACTED_1","model":"gemini-3-flash-preview","object":"interaction","role":"model","service_tier":"standard","status":"completed","updated":"1970-01-01T00:00:00Z","usage":{"input_tokens_by_modality":[{"modality":"text","tokens":8}],"total_cached_tokens":0,"total_input_tokens":8,"total_output_tokens":3,"total_thought_tokens":41,"total_tokens":52,"total_tool_use_tokens":0}}}
+
+    event: done
+    data: [DONE]
+
diff --git a/tests/cassettes/gemini/streaming/final_metadata_exposes_finish_reason_and_model_version.yaml b/tests/cassettes/gemini/streaming/final_metadata_exposes_finish_reason_and_model_version.yaml
@@ -0,0 +1,20 @@
+when:
+  path: /v1beta/models/gemini-2.5-flash:streamGenerateContent
+  method: POST
+  query_param:
+  - name: alt
+    value: sse
+  - name: key
+    value: '[REDACTED]'
+  header:
+  - name: accept
+    value: text/event-stream
+  - name: content-type
+    value: application/json
+  body: '{"contents":[{"parts":[{"text":"Reply with exactly: final metadata ok","thought":false}],"role":"user"}],"generationConfig":null,"safetySettings":null,"systemInstruction":null,"toolConfig":null}'
+then:
+  status: 200
+  header:
+  - name: content-type
+    value: text/event-stream
+  body: "data: {\"candidates\":[{\"content\":{\"parts\":[{\"text\":\"final metadata ok\"}],\"role\":\"model\"},\"finishReason\":\"STOP\",\"index\":0}],\"modelVersion\":\"gemini-2.5-flash\",\"responseId\":\"id_REDACTED_1\",\"usageMetadata\":{\"candidatesTokenCount\":3,\"promptTokenCount\":8,\"promptTokensDetails\":[{\"modality\":\"TEXT\",\"tokenCount\":8}],\"serviceTier\":\"standard\",\"thoughtsTokenCount\":32,\"totalTokenCount\":43}}\r\n\r\n"
diff --git a/tests/cassettes/gemini/streaming/final_metadata_handles_terminal_finish_reason_chunk.yaml b/tests/cassettes/gemini/streaming/final_metadata_handles_terminal_finish_reason_chunk.yaml
@@ -0,0 +1,20 @@
+when:
+  path: /v1beta/models/gemini-2.5-flash:streamGenerateContent
+  method: POST
+  query_param:
+  - name: alt
+    value: sse
+  - name: key
+    value: '[REDACTED]'
+  header:
+  - name: accept
+    value: text/event-stream
+  - name: content-type
+    value: application/json
+  body: '{"contents":[{"parts":[{"text":"Reply with exactly: contentless final metadata ok","thought":false}],"role":"user"}],"generationConfig":null,"safetySettings":null,"systemInstruction":null,"toolConfig":null}'
+then:
+  status: 200
+  header:
+  - name: content-type
+    value: text/event-stream
+  body: "data: {\"candidates\":[{\"content\":{\"parts\":[{\"text\":\"contentless final metadata ok\"}],\"role\":\"model\"},\"finishReason\":\"STOP\",\"index\":0}],\"modelVersion\":\"gemini-2.5-flash\",\"responseId\":\"id_REDACTED_1\",\"usageMetadata\":{\"candidatesTokenCount\":5,\"promptTokenCount\":10,\"promptTokensDetails\":[{\"modality\":\"TEXT\",\"tokenCount\":10}],\"serviceTier\":\"standard\",\"thoughtsTokenCount\":27,\"totalTokenCount\":42}}\r\n\r\n"
diff --git a/tests/providers/gemini/cassette/interactions_api.rs b/tests/providers/gemini/cassette/interactions_api.rs
@@ -240,3 +240,50 @@ async fn streaming_interaction() {
     )
     .await;
 }
+
+#[tokio::test]
+async fn streaming_final_metadata_exposes_model_version() {
+    super::super::support::with_gemini_interactions_cassette(
+        "interactions_api/streaming_final_metadata_exposes_model_version",
+        |client| async move {
+            let model = client.completion_model("gemini-3-flash-preview");
+            let request = model
+                .completion_request("Reply with exactly: interaction metadata ok")
+                .temperature(0.0)
+                .build();
+            let mut stream = model.stream(request).await.expect("stream should start");
+
+            let mut text = String::new();
+            let mut final_model_version = None;
+            let mut final_response_count = 0;
+            let mut saw_usage = false;
+            while let Some(chunk) = stream.next().await {
+                match chunk.expect("stream chunk should succeed") {
+                    StreamedAssistantContent::Text(delta) => text.push_str(&delta.text),
+                    StreamedAssistantContent::Final(response) => {
+                        final_response_count += 1;
+                        saw_usage = response.token_usage().is_some();
+                        final_model_version = response.model_version.clone();
+                    }
+                    _ => {}
+                }
+            }
+
+            assert_nonempty_response(&text);
+            assert_eq!(
+                final_response_count, 1,
+                "stream should yield exactly one final response"
+            );
+            assert_eq!(
+                final_model_version.as_deref(),
+                Some("gemini-3-flash-preview"),
+                "expected Interactions stream final response to expose Interaction.model"
+            );
+            assert!(
+                saw_usage,
+                "expected final response to expose Interactions token usage"
+            );
+        },
+    )
+    .await;
+}
diff --git a/tests/providers/gemini/cassette/streaming.rs b/tests/providers/gemini/cassette/streaming.rs
@@ -1,11 +1,13 @@
 //! Gemini streaming coverage, including the migrated example path.
 
+use futures::StreamExt;
 use rig::client::CompletionClient;
+use rig::completion::{CompletionModel, GetTokenUsage};
 use rig::providers::gemini;
 use rig::providers::gemini::completion::gemini_api_types::{
-    AdditionalParameters, GenerationConfig, ThinkingConfig, ThinkingLevel,
+    AdditionalParameters, FinishReason, GenerationConfig, ThinkingConfig, ThinkingLevel,
 };
-use rig::streaming::StreamingPrompt;
+use rig::streaming::{StreamedAssistantContent, StreamingPrompt};
 
 use crate::support::{
     STREAMING_PREAMBLE, STREAMING_PROMPT, assert_nonempty_response, collect_stream_final_response,
@@ -76,3 +78,116 @@ async fn example_streaming_prompt() {
     )
     .await;
 }
+
+#[tokio::test]
+async fn final_metadata_exposes_finish_reason_and_model_version() {
+    super::super::support::with_gemini_cassette(
+        "streaming/final_metadata_exposes_finish_reason_and_model_version",
+        |client| async move {
+            let model = client.completion_model(gemini::completion::GEMINI_2_5_FLASH);
+            let request = model
+                .completion_request("Reply with exactly: final metadata ok")
+                .temperature(0.0)
+                .build();
+            let mut stream = model.stream(request).await.expect("stream should start");
+
+            let mut text = String::new();
+            let mut final_response = None;
+            let mut final_response_count = 0;
+            while let Some(chunk) = stream.next().await {
+                match chunk.expect("stream chunk should succeed") {
+                    StreamedAssistantContent::Text(delta) => text.push_str(&delta.text),
+                    StreamedAssistantContent::Final(response) => {
+                        final_response_count += 1;
+                        final_response = Some(response);
+                    }
+                    _ => {}
+                }
+            }
+
+            assert_nonempty_response(&text);
+            assert_eq!(
+                final_response_count, 1,
+                "stream should yield exactly one final response"
+            );
+            let final_response = final_response.expect("stream should yield final metadata");
+            assert!(
+                matches!(final_response.finish_reason, Some(FinishReason::Stop)),
+                "expected STOP finish reason, got {:?}",
+                final_response.finish_reason
+            );
+            assert_eq!(
+                final_response.model_version.as_deref(),
+                Some(gemini::completion::GEMINI_2_5_FLASH),
+                "expected resolved Gemini model version to be surfaced"
+            );
+            assert!(
+                final_response.token_usage().is_some(),
+                "expected final response to expose token usage"
+            );
+        },
+    )
+    .await;
+}
+
+#[tokio::test]
+async fn final_metadata_handles_terminal_finish_reason_chunk() {
+    super::super::support::with_gemini_cassette(
+        "streaming/final_metadata_handles_terminal_finish_reason_chunk",
+        |client| async move {
+            let model = client.completion_model(gemini::completion::GEMINI_2_5_FLASH);
+            let request = model
+                .completion_request("Reply with exactly: contentless final metadata ok")
+                .temperature(0.0)
+                .build();
+            let mut stream = model.stream(request).await.expect("stream should start");
+
+            let mut text = String::new();
+            let mut final_response = None;
+            let mut final_response_count = 0;
+            while let Some(chunk) = stream.next().await {
+                match chunk.expect("stream chunk should succeed") {
+                    StreamedAssistantContent::Text(delta) => text.push_str(&delta.text),
+                    StreamedAssistantContent::Final(response) => {
+                        final_response_count += 1;
+                        final_response = Some(response);
+                    }
+                    _ => {}
+                }
+            }
+
+            assert_eq!(text.trim(), "contentless final metadata ok");
+            assert_eq!(
+                final_response_count, 1,
+                "terminal finish chunk should yield exactly one final response"
+            );
+            let final_response = final_response.expect("stream should yield final metadata");
+            assert!(
+                matches!(final_response.finish_reason, Some(FinishReason::Stop)),
+                "expected STOP finish reason from contentless terminal chunk, got {:?}",
+                final_response.finish_reason
+            );
+            assert_eq!(
+                final_response.model_version.as_deref(),
+                Some(gemini::completion::GEMINI_2_5_FLASH),
+                "expected modelVersion from terminal chunks to be retained"
+            );
+            let usage = final_response
+                .token_usage()
+                .expect("expected final response to expose token usage");
+            assert!(
+                usage.input_tokens > 0,
+                "expected positive input token usage, got {usage:?}"
+            );
+            assert!(
+                usage.output_tokens > 0,
+                "expected positive output token usage, got {usage:?}"
+            );
+            assert!(
+                usage.total_tokens >= usage.input_tokens + usage.output_tokens,
+                "expected total token usage to include input and output tokens, got {usage:?}"
+            );
+        },
+    )
+    .await;
+}