2-RAG/rag_chatbot.py at 2bea03819b24902a9c2bbcce33b2dcbfb83dc65d · HateSlop/2-RAG · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
import os
from openai import OpenAI
from build_vector_db import embedder
from chromadb import Client
import chromadb
from chromadb.config import Settings
from dotenv import load_dotenv
load_dotenv()
dbclient = chromadb.PersistentClient(path="./chroma_db")
collection = dbclient.get_or_create_collection("rag_collection")

# query를 임베딩해 chroma에서 가장 유사도가 높은 top-k개의 문서 가져오는 함수
def retrieve(query, top_k=3):
    query_embedding = embedder.embed_query(query) # qeury에 대한 임베딩 생성
    # collection.query 함수로 저장된 문서 임베딩들 중에서
    # query임베딩과 가장 유사한 항목들 검색
    results = collection.query(
        query_embeddings=[query_embedding],
        n_results=top_k
    )
    # 이때 results에는 해당 query 임베딩에 대한 텍스트, 메타데이터, id등이 전부 포함됨
    return results


# 1) query에 대해 벡터 DB에서 top_k개 문서 retrieval
# 2) 그 문서들을 context로 묶어 GPT에 prompt
#3) 최종 답변 반환 하는 함수

def generate_answer_with_context(query, top_k=3):
    # retrieve 함수로 결과 얻고
    # top_k에 대한 documents와 metadatas 리스트로 추출
    results = retrieve(query, top_k)
    found_docs = results["documents"][0]
    found_metadatas = results["metadatas"][0]

    # context 구성
    context_texts = []
    # zip을 이용해 두 리스트의 같은 인덱스에 있는 값들을 한 쌍으로 묶음
    for doc_text, meta in zip(found_docs, found_metadatas):
        context_texts.append(f"<<filename: {meta['filename']}>>\n{doc_text}")
    # context_texts 리스트에 있는 모든 문자열이 \n\n으로 이어 붙여짐
    context_str = "\n\n".join(context_texts)

    # 프롬프트 작성
    system_prompt = """
    당신은 주어진 문서 정보를 바탕으로 사용자 질문에 답변하는
    지능형 어시스턴트입니다. 다음 원칙을 엄격히 지키세요:

    1. 반드시 제공된 문서 내용에 근거해서만 답변을 작성하세요.
    2. 문서에 언급되지 않은 내용이라면, 함부로 추측하거나 만들어내지 마세요.
    - 예를 들어, 문서에 특정 인물, 사건이 전혀 언급되지 않았다면
    “관련 문서를 찾지 못했습니다” 또는 “정보가 없습니다”라고 답변하세요.
    3. 사실 관계를 명확히 기술하고, 불확실한 부분은 “정확한 정보를 찾지 못했습니다”라고 말하세요.
    4. 지나치게 장황하지 않게, 간결하고 알기 쉽게 설명하세요.
    5. 사용자가 질문을 한국어로 한다면, 한국어로 답변하고,
    다른 언어로 질문한다면 해당 언어로 답변하도록 노력하세요.
    6. 문서 출처나 연도가 중요하다면, 가능한 정확하게 전달하세요.

    당신은 전문적인 지식을 갖춘 듯 정확하고, 동시에 친절하고 이해하기 쉬운 어투를 구사합니다.
    """

    user_prompt =f"""아래는 검색된 문서들의 내용입니다:
    {context_str}
    질문: {query}"""

    # ChatGPT 호출
    api_key = os.getenv("OPENAI_API_KEY")
    client = OpenAI(api_key=api_key)

    response = client.chat.completions.create(
        model="gpt-4o-mini",
        messages = [{"role":"system", "content": system_prompt},
        {"role":"user", "content": user_prompt}]
    )

    answer = response.choices[0].message.content
    return answer

# RAG 없이 응답하는 함수
# def generate_answer_without_context(query):
#     api_key = os.getenv("OPENAI_API_KEY")
#     client = OpenAI(api_key=api_key)

#     response = client.chat.completions.create(
#         model = "gpt-4o-mini",
#         messages=[{"role":"system", "content":"you are helpful assistant"},
#                   {"role":"user", "content": query}]
#     )

#     answer = response.choices[0].message.content
#     return answer

if __name__ == "__main__":
    while True:
        user_query = input("질문을 입력하세요(종료: quit): ")
        if user_query.lower() == "quit":
            break
        answer = generate_answer_with_context(user_query, top_k=3)
        # answer = generate_answer_without_context(user_query)
        print("===답변===")
        print(answer)
        print("==========\n")