chat-inteligencia-artificial/main.py at main · PacocaOficial/chat-inteligencia-artificial · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
import base64
import json
import os
from fastapi import Body, Depends, FastAPI, HTTPException, Request
import ollama
from pydantic import BaseModel, ValidationError
from fastapi.responses import RedirectResponse, StreamingResponse
from dotenv import load_dotenv
from read_file import read_file
from type_datas import ChatRequest, ChatRequestImage, PostRequest, ChatRequestV2
from vars import DEFAULT_TEXT, GUIDELINES, USE_OF_TERMS
from fastapi.middleware.cors import CORSMiddleware
from starlette.exceptions import HTTPException as StarletteHTTPException
from fastapi.responses import JSONResponse
from fastapi.exceptions import HTTPException
from fastapi import status
import logging
from datetime import datetime, timedelta
import asyncio
import requests
import re
import httpx

logger = logging.getLogger("uvicorn")
load_dotenv()
app = FastAPI()

ALLOWED_ORIGINS = os.getenv("CORS_ORIGINS", "*").split(",")
app.add_middleware(
    CORSMiddleware,
    allow_origins=ALLOWED_ORIGINS,
    allow_credentials=True,
    allow_methods=["*"],
    allow_headers=["*"],
)
last_chat_request = datetime.utcnow()

async def verify_origin(request: Request):
    return True
    try:
        origin = request.headers.get("origin") or request.headers.get("referer")
        if origin:
            if not any(origin.startswith(o) for o in ALLOWED_ORIGINS):
                return False
            return True
        else:
            return False
    except HTTPException as e:
        return False

@app.get("/")
async def home():
    return "Ola Mundo"

@app.get("/hello-world")
async def hello_world():
    try:
        messages=[
            {"role": "user", "content": "Olá, como vai?"},
        ]

        def stream_response():
            try:
                for chunk in ollama.chat(model="gemma", messages=messages, stream=True):
                    content = chunk["message"]["content"]
                    yield content
            except Exception as e:
                logger.error(f"Erro no stream_response: {str(e)}")
                yield f"[ERRO]: {str(e)}"
            yield ""  # Forçar fim do stream

        return StreamingResponse(stream_response(), media_type="text/event-stream")

    except Exception as e:
        raise HTTPException(status_code=500, detail=f"Erro na resposta da ia: {str(e)}")


@app.post("/analyse/image")
async def analyse_image(request: Request, body: ChatRequestImage = Body(...)):
    try:
        if await verify_origin(request=request) == False:
            return JSONResponse(status_code=403, content={"detail": "Origem desconhecida."})

        DEFAULT_TEXT = (
            "Você é um especialista em moderação de imagens. Sua tarefa é identificar e sinalizar imagens que violem as diretrizes de conteúdo. "
            "Conteúdos contendo armas, violência explícita, nudez ou qualquer forma de material inapropriado **não são permitidos** e devem ser classificados como inadequados."
        )

        # Primeiro tenta obter a imagem a partir de uma URL
        if body.image_path and (body.image_path.startswith("http://") or body.image_path.startswith("https://")):
            async with httpx.AsyncClient() as client:
                response = await client.get(body.image_path)

            if response.status_code != 200:
                return JSONResponse(status_code=404, content={"detail": "Imagem não encontrada na URL fornecida."})

            image_data_base64 = base64.b64encode(response.content).decode("utf-8")

        # Se não for URL, verifica se já veio como base64
        elif body.image_base64:
            image_data_base64 = body.image_base64

        else:
            return JSONResponse(status_code=400, content={"detail": "Nenhuma imagem fornecida. Informe uma URL ou imagem em base64."})

        # Prepara as mensagens para o modelo multimodal
        messages = [
            {
                "role": "system",
                "content": (
                    "Você é um moderador altamente rigoroso. Sua missão é identificar e sinalizar IMEDIATAMENTE qualquer imagem que viole as regras de conteúdo a seguir. "
                    "Atenção: mesmo que a imagem não seja sexualizada ou explícita, qualquer pessoa desnuda, nudez total ou parcial — incluindo pessoas com o tórax ou seios visíveis, ainda que parcialmente cobertos ou com iluminação desfocada — deve ser considerada como *removido*. Não interessa a intenção da imagem. Se houver dúvida, classifique como REMOVIDO."
                    "Conteúdos proibidos incluem:\n"
                    "- Armas ou violência explícita\n"
                    "- Nudez (mesmo parcial)\n"
                    "- Seios visíveis (mesmo parcialmente)\n"
                    "- Tronco nu em qualquer gênero\n"
                    "- Posição sugestiva com ausência de roupas\n"
                    "Formato da resposta: um JSON simples com status e motivo.\n"
                    "Exemplo:\n"
                    "{ \"status\": \"removido\", \"reason\": \"A imagem contém nudez parcial com o tronco da mulher exposto.\" }"
                )
            },
            {
                "role": "user",
                "content": "Aqui está a imagem para análise.",
                "images": [image_data_base64]
            },
        ]

        response = await asyncio.to_thread(ollama.chat, model="llava", messages=messages, format="json")

        ai_message_content = response["message"]["content"].strip()
        ai_message_content = re.sub(r"^```(?:json)?\s*", "", ai_message_content)  # remove início do bloco
        ai_message_content = re.sub(r"\s*```$", "", ai_message_content)           # remove final do bloco

        try:
            parsed_response = json.loads(ai_message_content)
            status = parsed_response.get("status")
            reason = parsed_response.get("reason")

            return {
                "status": status if status else "indefinido",
                "reason": reason,
                "analysis": parsed_response
            }

        except json.JSONDecodeError:
            print(f"Resposta inválida: {ai_message_content}")
            return JSONResponse(status_code=500, content={"detail": "Resposta do modelo não é um JSON válido.", "raw_response": ai_message_content})

    except Exception as e:
        logger.error(f"Erro geral no endpoint /analyse/image: {str(e)}")
        return JSONResponse(status_code=500, content={"detail": "Erro interno no servidor.", "error": str(e)})


@app.post("/analyze")
async def analyze_post(request: PostRequest):
    if await verify_origin(request=request) == False:
       return JSONResponse(status_code=403, content={"detail": "Origem desconhecida."})

    DEFAULT_TEXT = "Você é um especialista em moderação de conteúdo."

    try:
        response = ollama.chat(
            model="mistral",
            messages=[
                {
                    "role": "system",
                    "content": (
                        DEFAULT_TEXT +
                        f"Analise o seguinte post com base em nossas diretrizes de uso e moderação. Diretrizes em: {GUIDELINES}. Termos de uso em: {USE_OF_TERMS}. "
                        "Sua resposta DEVE ser um objeto JSON válido com as seguintes chaves: "
                        "{ \"status\": \"permitido\" | \"   \", \"reason\": \"<motivo_se_removido_ou_null>\" }. "
                        "Se o post for permitido ou não houver informações suficientes para removê-lo, o status deve ser \"permitido\" e o motivo null. "
                        "Se o post não for permitido, o status deve ser \"removido\" e o motivo deve ser uma breve e objetiva descrição da razão da remoção. "
                        "Posts contendo opiniões, linguagem informal ou gírias comuns NÃO devem ser removidos. "
                    )
                },
                {"role": "user", "content": request.content},
            ]
        )

        ai_message_content = response["message"]["content"].strip().lower()

        try:
            # Tentar parsear a resposta como JSON
            parsed_response = json.loads(ai_message_content)

            # Validar os campos esperados no JSON
            status = parsed_response.get("status")
            reason = parsed_response.get("reason")

            if status == "permitido":
                return {"status": "permitido", "analysis": ai_message_content, "reason": None}
            elif status == "removido":
                return {"status": "removido", "analysis": ai_message_content, "reason": reason}
            else:
                # Caso o JSON não siga o formato esperado, trate como erro ou como permitido por padrão
                return {"status": "indefinido", "analysis": ai_message_content, "reason": "Formato JSON inesperado do Ollama"}

        except json.JSONDecodeError:
            # Se o Ollama não retornar um JSON válido, trate aqui.
            # Você pode logar o erro e retornar um status padrão ou uma mensagem de erro.
            print(f"Ollama não retornou um JSON válido: {ai_message_content}")
            return JSONResponse(status_code=500, content={"detail": "Erro ao processar resposta do Ollama: formato inválido."})

        # if "Post Não Permitido" not in ai_message:
        #     return {"status": "permitido", "analysis": ai_message, "reason": None}
        # else:
        #     return {"status": "removido", "analysis": ai_message, "reason": ai_message}

    except ValidationError as ve:
        return JSONResponse(status_code=200, content={"detail": "Erro de validação nos dados enviados.", "errors": ve.errors()})
    except Exception as e:
        raise HTTPException(status_code=500, detail=f"Erro na análise do post: {str(e)}")

@app.post("/chat")
async def chat_stream(request: Request, body: ChatRequest = Body(...)):
    global last_chat_request

    try:
        last_chat_request = datetime.utcnow()

        if await verify_origin(request=request) == False:
            return JSONResponse(status_code=403, content={"detail": "Origem desconhecida."})


        messages = [
            {
                "role": "system",
                "content": DEFAULT_TEXT + f"\n Responda com educação e se for o caso com humor. A mensagem do {body.user.name} é: {body.content}"
            },
            {"role": "user", "content": body.content},
        ]

        def stream_response():
            try:
                for chunk in ollama.chat(model="gemma", messages=messages, stream=True):
                    content = chunk["message"]["content"]
                    yield content
            except Exception as e:
                logger.error(f"Erro no stream_response: {str(e)}")
                yield f"[ERRO]: {str(e)}"
            yield ""  # Forçar fim do stream

        return StreamingResponse(stream_response(), media_type="text/event-stream")

    except ValidationError as ve:
        return JSONResponse(status_code=200, content={"detail": "Erro de validação nos dados enviados.", "errors": ve.errors()})
    except Exception as e:
        return JSONResponse(status_code=200, content={"detail": "Erro interno no servidor.", "error": str(e)})

@app.post("/v2/chat")
async def chat_stream(request: Request, body: ChatRequestV2 = Body(...)):
    global last_chat_request

    try:
        last_chat_request = datetime.utcnow()

        if await verify_origin(request=request) == False:
            return JSONResponse(status_code=403, content={"detail": "Origem desconhecida."})

        # pega histórico completo vindo do frontend
        messages = [m.dict() if hasattr(m, "dict") else m for m in (body.messages or [])]

        if not messages or messages[0].get("role") != "system":
            messages.insert(0, {
                "role": "system",
                "content": DEFAULT_TEXT + f"usuário: {body.user.name}"
            })


        def stream_response():
            try:
                for chunk in ollama.chat(model="gemma3", messages=messages, stream=True):
                    content = chunk["message"]["content"]
                    yield content
            except Exception as e:
                logger.error(f"Erro no stream_response: {str(e)}")
                yield f"[ERRO]: {str(e)}"
            yield ""  # Forçar fim do stream

        return StreamingResponse(stream_response(), media_type="text/event-stream")

    except ValidationError as ve:
        return JSONResponse(status_code=200, content={
            "detail": "Erro de validação nos dados enviados.",
            "errors": ve.errors()
        })
    except Exception as e:
        return JSONResponse(status_code=200, content={
            "detail": "Erro interno no servidor.",
            "error": str(e)
        })


# a IA dorme a cada x tempo, envia uma mensagem a cada x tempo para ela não formir
@app.on_event("startup")
async def start_monitoring():
    async def monitor_inactivity():
        global last_chat_request
        while True:
            now = datetime.utcnow()
            inactive_by = (now - last_chat_request).total_seconds()
            # logger.info(f"Inativo por {inactive_by}")

            # se tiver inativo por x tempo, envia mensagem para acordar
            if inactive_by > 60:
                # logger.info("Mais de 1 minuto sem requisição. Enviando 'olá' pra IA.")
                await send_hello_chat()
                last_chat_request = datetime.utcnow()
            await asyncio.sleep(1)  # checar a cada 1s
    asyncio.create_task(monitor_inactivity())

async def send_hello_chat():
    # Aqui você evita resposta longa
    messages = [
        {"role": "user", "content": "olá"}
    ]
    try:
        for chunk in ollama.chat(model="gemma", messages=messages, stream=True):
            break  # basta iniciar o stream, já "acorda"
        # logger.info("IA acordada com sucesso.")
    except Exception as e:
        logger.error(f"Erro ao acordar IA: {e}")

# rotas 404 retorna link do site
@app.exception_handler(StarletteHTTPException)
async def redirect_404(request: Request, exc: StarletteHTTPException):
    if exc.status_code == 404:
        return RedirectResponse(url=os.getenv("LINK"), status_code=status.HTTP_302_FOUND)
    raise exc

@app.exception_handler(Exception)
async def general_exception_handler(request: Request, exc: Exception):
    logger.error(f"Erro inesperado: {str(exc)}")
    return JSONResponse(
        status_code=500,
        content={"detail": f"Erro interno do servidor: {str(exc)}"},
    )