feat(llm): add LiteLLM as AI gateway provider (#1593)

RheagalFire · itomek · Tomasz Iniewicz · web-flow · commit 881ebcfbdedd · 2026-06-12T13:37:53.000Z
## Summary

Adds LiteLLM as a fourth LLM provider alongside Lemonade, OpenAI, and
Claude, giving GAIA users access to 100+ cloud providers (Bedrock,
Vertex AI, Groq, DeepSeek, Azure OpenAI, etc.) through a single
`create_client("litellm")` call.

## Why

GAIA's `LLMClient` abstraction covers local inference (Lemonade) and two
cloud providers (OpenAI, Claude). Adding providers individually doesn't
scale; LiteLLM is one dependency that covers 100+ providers with
`drop_params=True` for cross-provider kwarg compatibility.


## Changes

- `src/gaia/llm/providers/litellm.py` -- new
`LiteLLMProvider(LLMClient)` with `generate()`, `chat()`, `embed()`,
streaming, and `drop_params=True` default
- `src/gaia/llm/factory.py` -- registered `"litellm"` in `_PROVIDERS`
- `src/gaia/llm/providers/__init__.py` -- export `LiteLLMProvider`
- `setup.py` -- added `[litellm]` optional extra
(`litellm&gt;=1.35.0,&lt;2.0`)
- `tests/unit/test_litellm_provider.py` -- 10 unit tests

## Test plan

- [x] `python -m pytest tests/unit/test_litellm_provider.py -v` -- 10/10
pass
- [x] `python -m pytest tests/unit/test_llm_client_factory.py
tests/unit/test_openai_provider.py -v` -- existing LLM tests still pass
(76 passed)
- [x] `python util/lint.py --all --fix` -- clean
- [x] Live E2E: `create_client("litellm")` -&gt; LiteLLM proxy -&gt; Azure
Foundry (Claude Sonnet 4.6):

```
Provider: LiteLLM
Generate response: '4'
Chat response: 'OK'
Stream chunks: 2 chunks, text: 'Hello! ...'
=== E2E PASSED ===
```

## Checklist

- [x] I have linked a GitHub issue above (`Closes #N` / `Fixes #N` /
`Refs #N`).
- [x] I have described **why** this change is being made, not just what
changed.
- [x] I have run linting and tests locally (`python util/lint.py --all`,
`pytest tests/unit/`).
- [ ] I have updated documentation if user-visible behavior changed (see
[CONTRIBUTING.md](../CONTRIBUTING.md)).

---------

Co-authored-by: Tomasz Iniewicz &lt;itomek@users.noreply.github.com&gt;
Co-authored-by: Tomasz Iniewicz &lt;heaters-nays0p@icloud.com&gt;
diff --git a/setup.py b/setup.py
@@ -170,6 +170,9 @@
         "telegram": [
             "python-telegram-bot>=20.3",
         ],
+        "litellm": [
+            "litellm>=1.35.0,<2.0",
+        ],
         "dev": [
             "pytest",
             "pytest-cov",
diff --git a/src/gaia/llm/factory.py b/src/gaia/llm/factory.py
@@ -10,6 +10,7 @@
     "lemonade": "gaia.llm.providers.lemonade.LemonadeProvider",
     "openai": "gaia.llm.providers.openai_provider.OpenAIProvider",
     "claude": "gaia.llm.providers.claude.ClaudeProvider",
+    "litellm": "gaia.llm.providers.litellm.LiteLLMProvider",
 }
 
 
diff --git a/src/gaia/llm/providers/__init__.py b/src/gaia/llm/providers/__init__.py
@@ -4,6 +4,7 @@
 
 from .claude import ClaudeProvider
 from .lemonade import LemonadeProvider
+from .litellm import LiteLLMProvider
 from .openai_provider import OpenAIProvider
 
-__all__ = ["ClaudeProvider", "LemonadeProvider", "OpenAIProvider"]
+__all__ = ["ClaudeProvider", "LemonadeProvider", "LiteLLMProvider", "OpenAIProvider"]
diff --git a/src/gaia/llm/providers/litellm.py b/src/gaia/llm/providers/litellm.py
@@ -0,0 +1,94 @@
+# Copyright(C) 2025-2026 Advanced Micro Devices, Inc. All rights reserved.
+# SPDX-License-Identifier: MIT
+"""LiteLLM provider - unified gateway for 100+ LLM providers."""
+
+from typing import Iterator, Optional, Union
+
+from ..base_client import LLMClient
+
+
+class LiteLLMProvider(LLMClient):
+    """LiteLLM AI gateway provider."""
+
+    def __init__(
+        self,
+        api_key: Optional[str] = None,
+        model: str = "gpt-4o",
+        system_prompt: Optional[str] = None,
+        **kwargs,
+    ):
+        import litellm
+
+        self._model = model
+        self._system_prompt = system_prompt
+        self._api_key = api_key
+        self._extra_kwargs = kwargs
+
+        litellm.drop_params = True
+
+    @property
+    def provider_name(self) -> str:
+        return "LiteLLM"
+
+    def generate(
+        self,
+        prompt: str,
+        model: str | None = None,
+        stream: bool = False,
+        **kwargs,
+    ) -> Union[str, Iterator[str]]:
+        return self.chat(
+            [{"role": "user", "content": prompt}],
+            model=model,
+            stream=stream,
+            **kwargs,
+        )
+
+    def chat(
+        self,
+        messages: list[dict],
+        model: str | None = None,
+        stream: bool = False,
+        **kwargs,
+    ) -> Union[str, Iterator[str]]:
+        import litellm
+
+        if self._system_prompt:
+            messages = [{"role": "system", "content": self._system_prompt}] + list(
+                messages
+            )
+
+        call_kwargs = {**self._extra_kwargs, **kwargs}
+        if self._api_key:
+            call_kwargs["api_key"] = self._api_key
+
+        response = litellm.completion(
+            model=model or self._model,
+            messages=messages,
+            stream=stream,
+            drop_params=True,
+            **call_kwargs,
+        )
+        if stream:
+            return self._handle_stream(response)
+        return response.choices[0].message.content
+
+    def embed(self, texts: list[str], **kwargs) -> list[list[float]]:
+        import litellm
+
+        call_kwargs = {**self._extra_kwargs, **kwargs}
+        if self._api_key:
+            call_kwargs["api_key"] = self._api_key
+
+        response = litellm.embedding(
+            model=kwargs.pop("model", self._model),
+            input=texts,
+            drop_params=True,
+            **call_kwargs,
+        )
+        return [item["embedding"] for item in response.data]
+
+    def _handle_stream(self, response) -> Iterator[str]:
+        for chunk in response:
+            if chunk.choices and chunk.choices[0].delta.content:
+                yield chunk.choices[0].delta.content
diff --git a/tests/unit/test_litellm_provider.py b/tests/unit/test_litellm_provider.py
@@ -0,0 +1,155 @@
+# Copyright(C) 2025-2026 Advanced Micro Devices, Inc. All rights reserved.
+# SPDX-License-Identifier: MIT
+"""Tests for LiteLLM provider."""
+
+import sys
+import types
+from unittest.mock import MagicMock
+
+import pytest
+
+
+def _stub_litellm():
+    """Install a stub litellm module so tests run without the real package."""
+    fake = types.ModuleType("litellm")
+    fake.completion = MagicMock(name="litellm.completion")
+    fake.embedding = MagicMock(name="litellm.embedding")
+    fake.drop_params = False
+    sys.modules["litellm"] = fake
+    return fake
+
+
+class TestLiteLLMProviderName:
+    def test_provider_name(self):
+        fake = _stub_litellm()
+        from gaia.llm.providers.litellm import LiteLLMProvider
+
+        provider = LiteLLMProvider(api_key="test-key", model="gpt-4o")
+        assert provider.provider_name == "LiteLLM"
+        del sys.modules["litellm"]
+
+
+class TestLiteLLMFactory:
+    def test_create_client_litellm(self):
+        _stub_litellm()
+        from gaia.llm import create_client
+
+        client = create_client("litellm", api_key="test-key")
+        assert client.provider_name == "LiteLLM"
+        del sys.modules["litellm"]
+
+    def test_create_client_litellm_case_insensitive(self):
+        _stub_litellm()
+        from gaia.llm import create_client
+
+        client = create_client("LITELLM", api_key="test-key")
+        assert client.provider_name == "LiteLLM"
+        del sys.modules["litellm"]
+
+
+class TestLiteLLMChat:
+    def test_chat_calls_litellm_completion(self):
+        fake = _stub_litellm()
+        fake.completion.return_value = MagicMock(
+            choices=[MagicMock(message=MagicMock(content="Hello!"))]
+        )
+        from gaia.llm.providers.litellm import LiteLLMProvider
+
+        provider = LiteLLMProvider(api_key="sk-test", model="gpt-4o")
+        result = provider.chat([{"role": "user", "content": "Hi"}])
+
+        assert result == "Hello!"
+        fake.completion.assert_called_once()
+        call_kwargs = fake.completion.call_args
+        assert call_kwargs.kwargs["model"] == "gpt-4o"
+        assert call_kwargs.kwargs["drop_params"] is True
+        assert call_kwargs.kwargs["api_key"] == "sk-test"
+        del sys.modules["litellm"]
+
+    def test_chat_prepends_system_prompt(self):
+        fake = _stub_litellm()
+        fake.completion.return_value = MagicMock(
+            choices=[MagicMock(message=MagicMock(content="OK"))]
+        )
+        from gaia.llm.providers.litellm import LiteLLMProvider
+
+        provider = LiteLLMProvider(
+            api_key="sk-test", model="gpt-4o", system_prompt="You are helpful."
+        )
+        provider.chat([{"role": "user", "content": "Hi"}])
+
+        messages = fake.completion.call_args.kwargs["messages"]
+        assert messages[0]["role"] == "system"
+        assert messages[0]["content"] == "You are helpful."
+        del sys.modules["litellm"]
+
+    def test_chat_omits_api_key_when_not_set(self):
+        fake = _stub_litellm()
+        fake.completion.return_value = MagicMock(
+            choices=[MagicMock(message=MagicMock(content="OK"))]
+        )
+        from gaia.llm.providers.litellm import LiteLLMProvider
+
+        provider = LiteLLMProvider(model="gpt-4o")
+        provider.chat([{"role": "user", "content": "Hi"}])
+
+        assert "api_key" not in fake.completion.call_args.kwargs
+        del sys.modules["litellm"]
+
+    def test_chat_uses_override_model(self):
+        fake = _stub_litellm()
+        fake.completion.return_value = MagicMock(
+            choices=[MagicMock(message=MagicMock(content="OK"))]
+        )
+        from gaia.llm.providers.litellm import LiteLLMProvider
+
+        provider = LiteLLMProvider(model="gpt-4o")
+        provider.chat(
+            [{"role": "user", "content": "Hi"}],
+            model="anthropic/claude-sonnet-4-6",
+        )
+
+        assert (
+            fake.completion.call_args.kwargs["model"] == "anthropic/claude-sonnet-4-6"
+        )
+        del sys.modules["litellm"]
+
+
+class TestLiteLLMGenerate:
+    def test_generate_delegates_to_chat(self):
+        fake = _stub_litellm()
+        fake.completion.return_value = MagicMock(
+            choices=[MagicMock(message=MagicMock(content="4"))]
+        )
+        from gaia.llm.providers.litellm import LiteLLMProvider
+
+        provider = LiteLLMProvider(model="gpt-4o")
+        result = provider.generate("What is 2+2?")
+
+        assert result == "4"
+        messages = fake.completion.call_args.kwargs["messages"]
+        assert messages[0] == {"role": "user", "content": "What is 2+2?"}
+        del sys.modules["litellm"]
+
+
+class TestLiteLLMNotSupported:
+    def test_vision_raises_not_supported(self):
+        _stub_litellm()
+        from gaia.llm import NotSupportedError
+        from gaia.llm.providers.litellm import LiteLLMProvider
+
+        provider = LiteLLMProvider(model="gpt-4o")
+        with pytest.raises(NotSupportedError) as exc:
+            provider.vision([b"image"], "describe this")
+        assert "LiteLLM" in str(exc.value)
+        del sys.modules["litellm"]
+
+    def test_load_model_raises_not_supported(self):
+        _stub_litellm()
+        from gaia.llm import NotSupportedError
+        from gaia.llm.providers.litellm import LiteLLMProvider
+
+        provider = LiteLLMProvider(model="gpt-4o")
+        with pytest.raises(NotSupportedError):
+            provider.load_model("some-model")
+        del sys.modules["litellm"]

Original file line number	Diff line number	Diff line change
`@@ -10,6 +10,7 @@`
`10`	`10`	`"lemonade": "gaia.llm.providers.lemonade.LemonadeProvider",`
`11`	`11`	`"openai": "gaia.llm.providers.openai_provider.OpenAIProvider",`
`12`	`12`	`"claude": "gaia.llm.providers.claude.ClaudeProvider",`
	`13`	`+ "litellm": "gaia.llm.providers.litellm.LiteLLMProvider",`
`13`	`14`	`}`
`14`	`15`
`15`	`16`