KoMT MT-Bench들이 2턴으로만 이루어져서 턴을 증가해서 측정할 수 있도록 수정하였습니다. 추론은 vllm으로 진행되고, 평가는 openai API를 사용합니다. 데이터 참조 https://huggingface.co/datasets/LGAI-EXAONE/KoMT-Bench