AI 서비스 고도화-1
Youtube API를 활용:
이미지를 기반으로 AI가 분석한 상황 OR 사용자가 입력한 상황을 유튜브 검색 쿼리로 활용하여, 유사도가 가장 높은 K개(예시로, 3개)를 뽑아서, 이 영상들에 대한 자막 정보를 추출하여 LLM에게 레퍼런스 정보로 넘기는 방법
문제점
- 영상 길이가 길어지면 자막 텍스트 길이가 길어질 가능성이 높음 → LLM의 Max token을 초과하게될 수 있음
- 사용자의 상황에 대한 해석은 (사용자가 일일이 입력하지 않은 이상)LLM에 의한 것임 → LLM의 상황 해석이 이상해지면, 덩달아서 레퍼런스 또한 이상해질 수 있음
- 단순히 상황을 분석해서, 이를 기반으로 유튜브 검색을 한다? 이건 그냥 사용자가 유튜브에 검색하는거랑 차별성이 없음. 따라서 차별화된 포인트를 적어도 하나는 만들어야함.
각 문제점마다 생각한 해결방안
- 일단 영상 길이가 일정 길이 이하인 영상만을 선택하도록 하는 방법, 추출된 자막 텍스트에 대해, 일정 크기 이상의 단위(문장 단위 정도?)로 유사도를 측정해서, 유사도가 낮은 문장은 필터링하는 파이프라인을 한번 더 태운다. (상황과 관계없는 텍스트 정보를 제외시키기 위함) 아니면 자막 텍스트를 요약해서 LLM에 전달하는 방식도 있음.(이게 제일 나을것같음)
- LLM이 사용자의 상황을 최대한 잘 파악할 수 있도록 일단 프롬프트 최적화부터 잘 한다.
- 메타 데이터를 추가적으로 활용한다(좋아요 수, 조회수, 댓글, 최신성.. 등)
AI 서비스 고도화-1
Youtube API를 활용:
이미지를 기반으로 AI가 분석한 상황OR사용자가 입력한 상황을 유튜브 검색 쿼리로 활용하여, 유사도가 가장 높은 K개(예시로, 3개)를 뽑아서, 이 영상들에 대한 자막 정보를 추출하여 LLM에게 레퍼런스 정보로 넘기는 방법문제점
각 문제점마다 생각한 해결방안