Skip to content

Token 결과값 정리 관련 #81

@dawnlog

Description

@dawnlog

안녕하세요.

Kiwipiepy 넘 잘 쓰고 있습니다.

다름이 아니고 analyze하면 Token값이 나오는데, 결과값을 저장/활용할 때 불편한 점이 있어서요.

긴 문장을 분석하고 나면 다중 리스트의 형태로 나와 하나의 단어를 확인하려면 불필요한 작업이 필요하더라고요.

예를 들면

res = kiwi.analyze("샘플 문장입니다. 샘플 문장이에요. 샘플입니다")
print(res[0][0][0])
Token(form="샘플", tag="NNG", start=0, end=2)

이렇게 3중리스트까지 활용해야 접근이 가능합니다. --- (1번)
아마 여러 결과값을 함께 반환하는 것 때문인 것 같은데 이 점수를 활용하지 않는 경우(예: top_n=1)에는 따로 표기가 안되면 어떨까요.

그리고 결과값을 저장하고 싶은데 Token 클래스가 계속 함께 나오는 문제가 있더라고요.
한 sentence의 결과값을 저장할 때에는 불필요한 loop를 사용해서 tuple로 변환해주는 작업을 해야합니다.
-- (2번)

결과적으로 제안드리는거는
(1번) 단순 리스트의 형태로 결과값을 반환하면 어떨까요?
(2번) Token 클래스 말고 단순 튜플형태로 결과값이 나오도록 하는 옵션을 추가하면 어떨까요? (혹은 이미 있는데 제가 API에서 못찾은 것인지..ㅎㅎ)
(추가) 결과값을 Token 클래스말고 딕셔너리 형태로 반환하는 것도 있으면 어떨까요?

바쁘실텐데 항상 감사합니다.

Metadata

Metadata

Assignees

No one assigned

    Labels

    enhancementNew feature or request

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions