Skip to content

데이터 편향 처리 #9

@5y1ee

Description

@5y1ee

개선 내용

백테스팅 및 예측 시 발생할 수 있는 문제 중에, 편향에 대한 이슈가 있음.
그 중, 가장 시급한 문제로는

  1. 생존 편향 : 편의 또는 데이터 수집의 한계를 위해 현재 존재하는 기업의 주가 데이터만 구하는 경우 (현재 상폐된 기업의 주가 정보는 받아오지 않음)
  2. 미래 참조 편향 : 해당 시점에 알 수 없는 정보를 학습, 입력 데이터로 넣는 경우 -> 공시 정보의 발표 혹은 재무제표의 수정안 등... CPI 또한 전 달의 수치를 이번 달의 중순에 발표함.

이 외에도 수 많은 편향 문제를 어떻게 처리할지 고안할 필요가 있다.
다만, MVP 단계의 구현에서는 빠르게 처리할 수 있는 방법을 선택한다.

  1. 소제목
    • 생존 편향 : 상폐된 데이터를 구하기
    • 생존 편향 : 해당 시점에 S&P500에 속하는 데이터만 구하기
    • 미래 참조 편향 : 회계 데이터는 3개월의 lag 반영

Metadata

Metadata

Assignees

Labels

No labels
No labels

Projects

No projects

Milestone

No milestone

Relationships

None yet

Development

No branches or pull requests

Issue actions