- dataset.csv: 개발 시점 수집한 데이터
- emart데이터수집.ipynb: 데이터 수집코드
- main.py: streamlit 웹 시각화 코드
- top_20_df.csv: dataset.csv에서 분류한 데이터
신세계그룹은 2015년부터 이마트 사업에서 '노브랜드'와 '피코크'와 같은 자체 브랜드 즉, PB 마케팅의 성공으로 매출성장을 이루어냈습니다.
pb 상품은 브랜드 로열티를 증가시키고, 높은 마진을 유지하는 동시에 소비자들에게 가격 경쟁력 있는 제품을 제공함으로써 매출 성장을 이루어낼 수 있는 중요한 전략적 요소로 작용했습니다.
따라서 저는 이마트몰에서 가장 많은 상품을 다루는 새벽배송 영역의 상품 정보를 수집해 카테고리별로 가장 많이 판매되는 상위 20% 상품을 모았습니다. 그리고 신세계 PB 상품과 타 브랜드 상품 간의 비교 분석을 진행했고, 이를 통해 이마트의 현재 입지와 방향성에 대해 탐구해보았습니다.
//[브라우저 버튼] 페이지 URL을 보면 맨 끝에 sort=sale을 부여해 판매량순으로 상품을 수집할 수 있는 구조를 띄고 있습니다. 그리고, 그 바로 앞에 부여된 숫자열은 카테고리를 나타내는 숫자입니다. 이 url의 숫자열을 이용해 카테고리를 수집했고, 상품에 대한 정보를 수집할 땐 sort=sale을 부여해 판매량 순으로 정렬했습니다. //밑에는 하나의 상품을 나타내는 정보가 보이는 데, 여기서 브랜드명, 상품명, 할인율, 링크를 크롤링해 수집하였고, 상품의 특징을 나타내는 해시태그가 붙어있는 것이 이 서비스만의 차별점이기 때문에 태그들도 함께 수집해 분석을 진행했습니다. //전체 데이터를 얻은 후 카테고리별로 상위 20%의 판매량을 기록한 상품만을 저장했고, 새벽배송에서 취급하는 8개의 PB 브랜드에 해당하면 PB, 아니면 NotPB라는 값을 부여하는 컬럼을 추가했습니다. //상위 20%의 3210(삼천이백열)개의 상품 중 PB상품의 개수는 355(삼백쉰다섯)개로 11.1%의 낮은 점유율을 보여주었습니다. 이러한 결과에 제공하는 혜택의 차이가 영향을 주었는 지 알기 위해 pb상품과 타 브랜드 상품이 제공하는 할인율의 boxplot을 도출해보았습니다.
- streamlit 실행 시 마다 크롤링하기때문에 데이터 달라질 수 있음!
//위 두 그래프는 각각 PB상품과 타사 상품의 BOXPLOT을 나타낸 것이고, 세 번째 그래프로 두 그래프를 합쳐서 나타내 보았습니다.
PB 상품을 보면 타 브랜드 상품에 비해 한정된 할인 카테고리와 낮은 할인율로 소비자에게 제한적인 혜택을 제공함을 알 수 있습니다.
원래 PB 상품이 중간 유통을 줄여 저렴한 가격에 판매한다는 메리트를 가지고 있기 때문에, 할인율 자체를 증가시키기보다는 더 다양한 카테고리에서 할인 혜택을 제공한다면 pb 브랜드 점유율이 상승할 수 있다고 해석할 수 있습니다.
//또한 이 사이트는 상품별로 특장점을 표기한 태그를 달아놓았기 때문에, 태그가 나타난 빈도수에 따라 상위 10개의 태그를 막대 그래프로 도출해 주력으로 판매되는 분야의 차이가 있는 지 알아 보았습니다.
둘 다 공통적으로 '간식용', '간식'이라는 특성이 상위에 있으므로 소비자들이 간편하게 즐길 수 있는 가벼운 식품에 대한 수요를 잘 예측했다고 볼 수 있습니다.
다만 타브랜드 상품에서 달달한 맛의 태그가 달린 상품이 많이 팔린 반면 PB 브랜드에서는 해당 태그가 상위에 랭크되지 못했습니다.
따라서 PB브랜드에서 달달한 맛이 특징인 간식 제품을 선보인다면 자체 제공 서비스에서의 점유율을 높이는 데 도움이 될 것이라는 방향성을 제시할 수 있습니다.