feat(google-vertex): update model YAMLs [bot] (#1298)

models-bot[bot] · Truefoundry Models Bot · web-flow · commit ad6629a05e3b · 2026-06-05T18:06:11.000+05:30
Co-authored-by: Truefoundry Models Bot &lt;truefoundry-models-bot@users.noreply.github.com&gt;
diff --git a/providers/google-vertex/google/gemini-3.1-flash-lite.yaml b/providers/google-vertex/google/gemini-3.1-flash-lite.yaml
@@ -1,19 +1,22 @@
 costs:
-    - cache_read_input_token_cost: 2.75e-8
+    - cache_read_input_audio_token_cost: 5.5e-8
+      cache_read_input_token_cost: 2.75e-8
       input_cost_per_audio_token: 5.5e-7
       input_cost_per_token: 2.75e-7
       input_cost_per_token_batches: 1.375e-7
       output_cost_per_token: 0.00000165
       output_cost_per_token_batches: 8.25e-7
       region: us
-    - cache_read_input_token_cost: 2.5e-8
+    - cache_read_input_audio_token_cost: 5e-8
+      cache_read_input_token_cost: 2.5e-8
       input_cost_per_audio_token: 5e-7
       input_cost_per_token: 2.5e-7
       input_cost_per_token_batches: 1.25e-7
       output_cost_per_token: 0.0000015
       output_cost_per_token_batches: 7.5e-7
       region: global
-    - cache_read_input_token_cost: 2.75e-8
+    - cache_read_input_audio_token_cost: 5.5e-8
+      cache_read_input_token_cost: 2.75e-8
       input_cost_per_audio_token: 5.5e-7
       input_cost_per_token: 2.75e-7
       input_cost_per_token_batches: 1.375e-7
@@ -48,8 +51,8 @@ model: google/gemini-3.1-flash-lite
 provisioning: serverless
 sources:
     - https://docs.cloud.google.com/vertex-ai/generative-ai/docs/models/gemini/3-1-flash-lite
-    - https://ai.google.dev/gemini-api/docs/models/gemini-3.1-flash-lite-preview
-status: preview
+    - https://ai.google.dev/gemini-api/docs/models/gemini-3.1-flash-lite
+status: active
 supportedModes:
     - chat
 thinking: true