본 프로젝트는 다양한 원룸 매물 특성(보증금, 방 크기, 옵션, 위치 등)을 활용해 월세 가격을 예측하는 데이터 기반 웹서비스를 개발하는 것을 목표로 합니다. 전체 과정을 데이터 수집에서부터 모델링‧웹 구현까지 자동화된 파이프라인으로 설계하였으며, 누구나 온라인에서 원하는 조건의 예상 월세를 쉽게 확인할 수 있도록 지원합니다.
목표:
- 보증금, 방 크기(면적), 옵션(가전, 빌트인, 엘리베이터, 방향 등)과 기타 요인(층수, 관리비 등) 데이터를 활용한 다중 선형 회귀(MLR) 모델 학습
- 새로운 매물 조건 입력 시 적정 월세를 예측하는 웹 기반 시스템 구축
- 부동산 정보 사이트(예: 직방, 다방 등)에서 실제 원룸 매물 데이터 자동 수집
- 보증금, 월세, 전용면적, 방 옵션, 위치, 편의시설 등 주요 항목 추출 및 정제
- 결측치·이상치·중복 데이터 처리
- 범주형 특성(옵션, 지역 등) 더미/원-핫 인코딩 처리
- 면적 단위 변환, 특성 스케일링, 상관관계 점검 등 기초 분석
- 독립변수: 보증금, 방 크기, 옵션 등
- 종속변수: 월세
- 학습/검증 데이터 분할 및 교차검증 (R², RMSE 등의 지표로 평가)
- 회귀계수 해석을 통한 영향 요인 분석
- 데이터 입력 폼: 사용자가 매물 특성(입력) 지정
- 실시간 예측 결과 확인 및 시각화(그래프/표 등)
- 분석 리포트 및 여러 조건 간 비교 제공
- 아키텍처: Web Crawler → AI 예측(MLR) → Web Interface의 풀파이프라인 자동화 설계
- GitHub 기반 코드/데이터 관리 및 문서화