Skip to content

AI서비스 고도화-1 #1

@koreannn

Description

@koreannn

AI 서비스 고도화-1

Youtube API를 활용:

이미지를 기반으로 AI가 분석한 상황 OR 사용자가 입력한 상황을 유튜브 검색 쿼리로 활용하여, 유사도가 가장 높은 K개(예시로, 3개)를 뽑아서, 이 영상들에 대한 자막 정보를 추출하여 LLM에게 레퍼런스 정보로 넘기는 방법

문제점

  1. 영상 길이가 길어지면 자막 텍스트 길이가 길어질 가능성이 높음 → LLM의 Max token을 초과하게될 수 있음
  2. 사용자의 상황에 대한 해석은 (사용자가 일일이 입력하지 않은 이상)LLM에 의한 것임 → LLM의 상황 해석이 이상해지면, 덩달아서 레퍼런스 또한 이상해질 수 있음
  3. 단순히 상황을 분석해서, 이를 기반으로 유튜브 검색을 한다? 이건 그냥 사용자가 유튜브에 검색하는거랑 차별성이 없음. 따라서 차별화된 포인트를 적어도 하나는 만들어야함.

각 문제점마다 생각한 해결방안

  1. 일단 영상 길이가 일정 길이 이하인 영상만을 선택하도록 하는 방법, 추출된 자막 텍스트에 대해, 일정 크기 이상의 단위(문장 단위 정도?)로 유사도를 측정해서, 유사도가 낮은 문장은 필터링하는 파이프라인을 한번 더 태운다. (상황과 관계없는 텍스트 정보를 제외시키기 위함) 아니면 자막 텍스트를 요약해서 LLM에 전달하는 방식도 있음.(이게 제일 나을것같음)
  2. LLM이 사용자의 상황을 최대한 잘 파악할 수 있도록 일단 프롬프트 최적화부터 잘 한다.
  3. 메타 데이터를 추가적으로 활용한다(좋아요 수, 조회수, 댓글, 최신성.. 등)

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions