started to add support for getting json responses from LLMs calls : Prompt_To_Json__Open_AI

DinisCruz · DinisCruz · commit cebf82471cf1 · 2024-11-15T16:35:50.000Z
diff --git a/osbot_llms/fast_api/routes/Routes__Chat.py b/osbot_llms/fast_api/routes/Routes__Chat.py
@@ -85,7 +85,7 @@ async def completion(self, request: Request, llm_chat_completion: LLMs__Chat_Com
         request_id       = self.request_id(request)
         chat_save_result = self.chats_storage_s3_minio.save_user_request(llm_chat_completion, request_id)
 
-        routes_open_ai   = Routes__OpenAI()
+        routes_open_ai   = Routes__OpenAI()                                         # todo: fix this mess of having to use a new instance of Routes__OpenAI
         user_data        = llm_chat_completion.user_data
         if user_data is None:
             user_data = dict(selected_platform = llm_chat_completion.llm_platform ,
diff --git a/osbot_llms/llms/API_Open_AI.py b/osbot_llms/llms/API_Open_AI.py
@@ -35,6 +35,9 @@ def api_key(self):
         load_dotenv()
         return getenv(OPEN_AI__API_KEY)
 
+    def client(self):
+        return OpenAI(api_key=self.api_key())
+
     def embeddings(self, input, model='text-embedding-3-small', dimensions=None):
         url       = 'https://api.openai.com/v1/embeddings'
         headers   = { "Content-Type" : "application/json"        ,
@@ -53,6 +56,7 @@ def embeddings(self, input, model='text-embedding-3-small', dimensions=None):
                                total_tokens     = total_tokens  )
         return result
 
+
     def open_ai_available(self):
         if self.api_key():
             #if is_url_online(URL_OPEN_AI_BASE):            # todo, find a better way (or url) to do this
diff --git a/osbot_llms/llms/prompt_to_json/Prompt_To_Json__Open_AI.py b/osbot_llms/llms/prompt_to_json/Prompt_To_Json__Open_AI.py
@@ -0,0 +1,85 @@
+from typing import List, Dict
+
+import openai
+from pydantic import BaseModel
+from pydantic._internal._model_construction import ModelMetaclass
+
+from osbot_llms.llms.API_Open_AI import API_Open_AI
+from osbot_utils.base_classes.Type_Safe import Type_Safe
+from osbot_utils.utils.Json import str_to_json
+
+
+class Prompt_To_Json__Open_AI(Type_Safe):
+    response_format : ModelMetaclass
+    messages        : List[Dict[str, str]]
+    model           : str
+    temperature     : float
+    seed            : int
+
+    def add_message__assistant(self, message):
+        return self.add_message("assistant", message)
+
+    def add_message__user(self, message):
+        return self.add_message("user", message)
+
+    def add_message__system(self, message):
+        return self.add_message("system", message)
+
+    def add_message(self,role, content):
+        self.messages.append(dict(role= role, content= content))
+        return self
+
+    def invoke(self):
+        response        = self.invoke__raw()
+        response_parsed = self.parse_response(response)
+        return response_parsed
+
+    def invoke__raw(self):
+        client = API_Open_AI().client()
+
+        try:
+            completion = client.beta.chat.completions.parse(**self.invoke_kwargs())
+            return completion
+        except Exception as exception:                  # todo: figure out the exceptions to handle here
+            raise exception
+            # # Handle edge cases
+            # if type(e) == openai.LengthFinishReasonError:
+            #     # Retry with a higher max tokens
+            #     print("Too many tokens: ", e)
+            #     pass
+            # else:
+            #     # Handle other exceptions
+            #     print(e)
+            #     pass
+
+    def invoke_kwargs(self):
+        return dict(model           = self.model          ,
+                    messages        = self.messages       ,
+                    response_format = self.response_format,
+                    seed            = self.seed           ,
+                    temperature     =self.temperature     )
+
+    def set_model(self, model):
+        self.model = model
+        return self
+
+    def set_model__gpt_4o(self):
+        return self.set_model("gpt-4o")
+
+    def set_model__gpt_4o_mini(self):
+        return self.set_model("gpt-4o-mini")
+
+    def set_response_format(self, response_format):
+        self.response_format = response_format
+        return self
+
+    def parse_response(self, response):
+        choice  = response.choices[0]
+        message = choice.message
+        usage   = response.usage
+        content = str_to_json(message.content)
+        model   = message.parsed
+        tokens  = usage.total_tokens
+        return dict(content = content,
+                    model   = model  ,
+                    tokens  = tokens )
diff --git a/osbot_llms/llms/prompt_to_json/__init__.py b/osbot_llms/llms/prompt_to_json/__init__.py
diff --git a/tests/integration/llms/prompt_to_json/test_Prompt_To_Json__Open_AI.py b/tests/integration/llms/prompt_to_json/test_Prompt_To_Json__Open_AI.py
@@ -0,0 +1,34 @@
+from unittest                                               import TestCase
+from pydantic                                               import BaseModel
+from osbot_llms.llms.prompt_to_json.Prompt_To_Json__Open_AI import Prompt_To_Json__Open_AI
+
+
+
+class test_Prompt_To_Json__Open_AI(TestCase):
+
+    @classmethod
+    def setUpClass(cls) -> None:
+        cls.prompt_to_json = Prompt_To_Json__Open_AI()
+
+    def test_invoke(self):
+        class CalendarEvent(BaseModel):
+            name: str
+            date: str
+            participants: list[str]
+            action: str
+
+        with self.prompt_to_json  as _:
+            _.set_model__gpt_4o_mini()
+            _.set_response_format(CalendarEvent)
+            _.add_message__system("Extract the event information."                      )
+            _.add_message__user  ("Alice and Bob are going to a science fair on Friday.")
+
+            response = _.invoke()
+
+            expected_content = { 'action'      : 'Attend'      ,
+                                 'date'        : 'Friday'      ,
+                                 'name'        : 'Science Fair',
+                                 'participants': ['Alice', 'Bob']}
+            assert response == dict(content  = expected_content                 ,
+                                    model    = CalendarEvent(**expected_content),
+                                    tokens   = 124                              )
diff --git a/tests/integration/testing/test_TestCase__S3_Minio__Temp_Chat_Threads.py b/tests/integration/testing/test_TestCase__S3_Minio__Temp_Chat_Threads.py
@@ -1,5 +1,6 @@
 from osbot_aws.AWS_Config                                     import aws_config
 from osbot_aws.aws.s3.S3__DB_Base                             import S3_DB_BASE__BUCKET_NAME__PREFIX
+from osbot_utils.utils.Env                                    import in_github_action
 from osbot_utils.utils.Misc                                   import list_set
 from osbot_llms.backend.s3_minio.S3_DB__Chat_Threads          import S3_DB__Chat_Threads
 from osbot_llms.testing.TestCase__S3_Minio__Temp_Chat_Threads import TestCase__S3_Minio__Temp_Chat_Threads
@@ -16,16 +17,17 @@ def tearDownClass(cls):
         assert cls.s3_db_chat_threads.bucket_exists()    is False
 
     def test__setUpClass(self):
-        assert list_set(self.extra_env_vars)             == [ 'AWS_ACCESS_KEY_ID'           ,
-                                                              'AWS_ACCOUNT_ID'              ,
-                                                              'AWS_DEFAULT_REGION'          ,
-                                                              'AWS_SECRET_ACCESS_KEY'       ,
-                                                              'USE_MINIO_AS_S3'             ]
-        assert self.random_aws_creds.original_env_vars   == { 'AWS_ACCESS_KEY_ID'    : None ,
-                                                              'AWS_ACCOUNT_ID'       : None ,
-                                                              'AWS_DEFAULT_REGION'   : None ,
-                                                              'AWS_SECRET_ACCESS_KEY': None ,
-                                                              'USE_MINIO_AS_S3'      : None }
+        if in_github_action():
+            assert list_set(self.extra_env_vars)             == [ 'AWS_ACCESS_KEY_ID'           ,
+                                                                  'AWS_ACCOUNT_ID'              ,
+                                                                  'AWS_DEFAULT_REGION'          ,
+                                                                  'AWS_SECRET_ACCESS_KEY'       ,
+                                                                  'USE_MINIO_AS_S3'             ]
+            assert self.random_aws_creds.original_env_vars   == { 'AWS_ACCESS_KEY_ID'    : None ,
+                                                                  'AWS_ACCOUNT_ID'       : None ,
+                                                                  'AWS_DEFAULT_REGION'   : None ,
+                                                                  'AWS_SECRET_ACCESS_KEY': None ,
+                                                                  'USE_MINIO_AS_S3'      : None }
         assert self.server_name                          == 'osbot-llms'
         assert type(self.s3_db_chat_threads)             is S3_DB__Chat_Threads
         assert self.s3_db_chat_threads.bucket_exists()   is True
diff --git a/tests/integration/testing/test_TestCase__S3_Minio__Temp_S3_Bucket.py b/tests/integration/testing/test_TestCase__S3_Minio__Temp_S3_Bucket.py
@@ -1,7 +1,10 @@
+import pytest
+
 from osbot_aws.AWS_Config                                       import aws_config
-from osbot_aws.aws.s3.S3__DB_Base import S3__DB_Base, S3_DB_BASE__BUCKET_NAME__PREFIX, S3_DB_BASE__SERVER_NAME, \
+from osbot_aws.aws.s3.S3__DB_Base                               import S3__DB_Base, S3_DB_BASE__BUCKET_NAME__PREFIX, S3_DB_BASE__SERVER_NAME, \
     S3_DB_BASE__BUCKET_NAME__SUFFIX
 from osbot_aws.testing.TestCase__S3_Minio__Temp_S3_Bucket       import TestCase__S3_Minio__Temp_S3_Bucket
+from osbot_utils.utils.Env                                      import in_github_action
 from osbot_utils.utils.Misc                                     import list_set
 
 from osbot_llms.OSBot_LLMs__Server_Config import DEFAULT__SERVER_CONFIG__SERVER_NAME
@@ -19,16 +22,17 @@ def tearDownClass(cls):
         assert cls.s3_db_base.bucket_exists()    is False
 
     def test__setUpClass(self):
-        assert list_set(self.extra_env_vars)             == [ 'AWS_ACCESS_KEY_ID'           ,
-                                                              'AWS_ACCOUNT_ID'              ,
-                                                              'AWS_DEFAULT_REGION'          ,
-                                                              'AWS_SECRET_ACCESS_KEY'       ,
-                                                              'USE_MINIO_AS_S3'             ]
-        assert self.random_aws_creds.original_env_vars   == { 'AWS_ACCESS_KEY_ID'    : None ,
-                                                              'AWS_ACCOUNT_ID'       : None ,
-                                                              'AWS_DEFAULT_REGION'   : None ,
-                                                              'AWS_SECRET_ACCESS_KEY': None ,
-                                                              'USE_MINIO_AS_S3'      : None }
+        if in_github_action():
+            assert list_set(self.extra_env_vars)             == [ 'AWS_ACCESS_KEY_ID'           ,
+                                                                  'AWS_ACCOUNT_ID'              ,
+                                                                  'AWS_DEFAULT_REGION'          ,
+                                                                  'AWS_SECRET_ACCESS_KEY'       ,
+                                                                  'USE_MINIO_AS_S3'             ]
+            assert self.random_aws_creds.original_env_vars   == { 'AWS_ACCESS_KEY_ID'    : None ,
+                                                                  'AWS_ACCOUNT_ID'       : None ,
+                                                                  'AWS_DEFAULT_REGION'   : None ,
+                                                                  'AWS_SECRET_ACCESS_KEY': None ,
+                                                                  'USE_MINIO_AS_S3'      : None }
         assert type(self.s3_db_base)             is S3__DB_Base
         assert self.s3_db_base.bucket_exists()   is True
         assert aws_config.account_id()           == self.random_aws_creds.env_vars['AWS_ACCOUNT_ID']