All i do is fix model cost issues now

olearycrew · olearycrew · commit 2d0691974ef4 · 2025-09-03T22:25:42.000-04:00
diff --git a/src/commands/models.py b/src/commands/models.py
@@ -104,9 +104,21 @@ async def list_models_async():
                 input_cost_per_token = pricing.get('input_cost_per_1m_tokens', 0)
                 output_cost_per_token = pricing.get('output_cost_per_1m_tokens', 0)
                 
-                # Convert from per-token to per-million-tokens for display
-                input_cost_per_million = input_cost_per_token * 1_000_000
-                output_cost_per_million = output_cost_per_token * 1_000_000
+                # The cached values can be either per-token or per-million-tokens
+                # Very small values (< 0.01) are per-token, larger values are per-million-tokens
+                if input_cost_per_token > 0 and input_cost_per_token < 0.01:
+                    # Values are per-token, convert to per-million-tokens
+                    input_cost_per_million = input_cost_per_token * 1_000_000
+                else:
+                    # Values are already per-million-tokens
+                    input_cost_per_million = input_cost_per_token
+                    
+                if output_cost_per_token > 0 and output_cost_per_token < 0.01:
+                    # Values are per-token, convert to per-million-tokens
+                    output_cost_per_million = output_cost_per_token * 1_000_000
+                else:
+                    # Values are already per-million-tokens
+                    output_cost_per_million = output_cost_per_token
                 
                 # Format costs
                 def format_list_cost(cost):
@@ -194,8 +206,20 @@ async def search_models_async():
             
             for model in matching_models:
                 pricing = model.get('pricing', {})
-                input_cost = pricing.get('input_cost_per_1m_tokens', 0)
-                output_cost = pricing.get('output_cost_per_1m_tokens', 0)
+                input_cost_per_token = pricing.get('input_cost_per_1m_tokens', 0)
+                output_cost_per_token = pricing.get('output_cost_per_1m_tokens', 0)
+                
+                # Convert per-token costs to per-million-tokens for display
+                # Very small values (< 0.01) are per-token, larger values are per-million-tokens
+                if input_cost_per_token > 0 and input_cost_per_token < 0.01:
+                    input_cost = input_cost_per_token * 1_000_000
+                else:
+                    input_cost = input_cost_per_token
+                    
+                if output_cost_per_token > 0 and output_cost_per_token < 0.01:
+                    output_cost = output_cost_per_token * 1_000_000
+                else:
+                    output_cost = output_cost_per_token
                 
                 table.add_row(
                     (model.get('provider', 'Unknown')).title(),
diff --git a/src/models/openrouter.py b/src/models/openrouter.py
@@ -418,9 +418,21 @@ def _parse_model_data(self, model_data: Dict[str, Any]) -> Optional[Dict[str, An
             output_cost = 0.0
             
             if pricing_info:
-                # OpenRouter pricing is typically in the format per 1M tokens
+                # OpenRouter pricing can come in different formats - handle both
+                # Format 1: Direct per-1M-token pricing
                 input_cost = float(pricing_info.get('prompt', 0))
                 output_cost = float(pricing_info.get('completion', 0))
+                
+                # Format 2: Already converted per-1M-token pricing
+                if input_cost == 0 and output_cost == 0:
+                    input_cost = float(pricing_info.get('input_cost_per_1m_tokens', 0))
+                    output_cost = float(pricing_info.get('output_cost_per_1m_tokens', 0))
+                
+                # Convert from per-token to per-1M-tokens if values are very small (likely per-token)
+                if input_cost > 0 and input_cost < 0.01:
+                    input_cost = input_cost * 1_000_000
+                if output_cost > 0 and output_cost < 0.01:
+                    output_cost = output_cost * 1_000_000
             
             # Extract capabilities and features
             capabilities = []