본 대회는 예선, 본선(1차 심사, 2차 심사)로 이루어져 있다. 총 세 번의 심사를 통해 최종적으로 순위가 정해진다.
예선에서는 샘플 데이터를 통해 주제명, 주제 선정 배경, 분석 계획, 기대효과를 작성해서 제출해야 한다.
분석기획서 - 예선
[주제명]
고객들의 소비 패턴 파악을 통한 차별화된 편의점 제안
[주제 선정 배경]
우리는 차세대 소비시장의 중심이 될 것으로 전망되는 MZ 세대의 소비에 주목하여야 한다. 개인의 행복을 우선시하고 가성비보다는 가심비를 우선시하는 MZ 세대를 중심으로 플렉스(Flex) 문화가 일반화되며 그들이 미치는 영향력도 상당하다. 각종 SNS 통해 소비 시장에서 강력한 영향력을 발휘하고 있는 소비 집단으로 자신의 개성과 취향을 중시하고 그에 부합하는 대상에는 아낌없이 지출을 결정한다. MZ 세대가 주도할 소비 시장의 변화에 주목해야할 필요성이 높다고 판단하여 ‘MZ세대 소비 트렌드 지표’를 활용하기로 결정했다. 또한, 50~60대 베이비붐 세대의 오프라인 정보망이 무너지고 온라인 플랫폼들이 속속히 등장한 점은 MZ 세대의 영향력이 다른 연령층의 소비에도 크게 끼치고 있음을 보여주고 있다. 이를 바탕으로 분석 타깃을 MZ 세대로 한정 짓기보다는 모든 연령층 소비 패턴 및 성향을 통해 소비 트렌드를 파악하기로 결정했다. 소비 트렌드 분석 결과를 토대로 정형화된 이미지를 깨고 차별화된 편의점을 만드는 것으로 비즈니스 아이디어를 창출할 계획이다. 편의점은 데이터기반 비즈니스이다. 따라서, 빅데이터를 통해 빠르게 트렌드를 파악하고 반영할 수 있다. 또한, 편의점은 ‘슬세권(슬리퍼를 신고 다닐 수 있을 정도로 근처에 위치)’이라고도 불릴 만큼 어느 지역/공간에서도 가까운 거리 내에 위치하고 있어 강력한 힘을 지니고 있어 앞으로의 성장성도 높게 평가한다. 최근, CU 편의점에서는 오전에 주문한 회를 당일 오후에 집 근처 편의점에서 받을 수 있도록 활어회 픽업 서비스도 개시하였다. 편의점과 은행이 한 점포에 있는 곳도 증가하고 있으며 주류 특화 플래그십 스토어 등 다양한 방면으로 진화하고 있다. 전국 곳곳에서 입지 선정을 하고 있는 만큼 편의점의 영향력은 커질 것이라고 생각된다. 그만큼 편의점 간의 치열한 생존 경쟁 속에서 차별화에 대한 필요성이 존재한다. 이에 소비 트렌드 파악을 통해 고객층의 구매 욕구 증대와 흥미를 돋울 아이디어를 제시할 예정이다.
[분석계획]
분석 시 사용할 프로그래밍 언어: Python
분석 시 ‘비씨카드-CU편의점 소비 데이터’와 ‘신한은행 MZ세대 트렌드지표 데이터’를 주로 활용할 계획이다. 가장 먼저, ‘비씨카드-CU편의점 소비 데이터’를 활용해 EDA를 진행할 것이다. 데이터의 전체적인 흐름 파악을 위해 광역시도단위별, 입지별 편의점 매출을 파악하고 분석 이후에는 태블로를 활용하여 대시보드를 제작할 계획이다. 소비 트렌드를 분석하기 위해 ‘신한은행 MZ세대 트렌드지표 데이터’를 통해 연령대별 소비 분석을 통해 인사이트를 추출할 것이다. 변수들 내부에 존재하는 구조를 파악하고 ‘소비 트렌드’라는 개념을 측정하려고 하는 변수들이 동일한 요인으로 묶이는지 확인하고자 요인분석을 시행할 것이다. 전체 데이터의 구조를 파악한 후, 주성분분석 혹은 공통요인분석 중 선택할 계획이다. 해당 데이터는 변수의 개수가 많아서 PCA(주성분분석) 혹은 t-SNE를 통해 2차원으로 차원 축소를 하거나 파생변수 생성을 통해 K-Means Clustering 혹은 DBSCAN와 같은 군집분석을 진행해 소비를 분석할 계획이다. Elbow method를 활용하여 최적의 k값을 구한 후 K-Means Clustering을 진행해 군집화가 잘되는 k를 찾아 군집분석을 진행하고자 한다. 군집화 이후에 군집의 개수가 비교적 많이 나타난다면 데이터마이닝 기법인 계보적 군집방법을 통해 활용이 용이한 수준의 구조로 군집을 재편할 것이다. 이는 덴드로그램을 통해 군집이 형성되는 모습을 시각화할 것이다. 군집방법에 의해서 고객 세분화가 도출되면 군집별 특성을 찾아내어 인사이트를 도출하고자 한다. 군집별 고객의 수, 매출 금액 등을 파악하고 고객 수 상위 군집과 하위 군집으로 나누어서 특징을 살펴볼 것이다. 또한 분산분석 및 다중비교를 통해서 군집간의 차이도 살펴볼 계획이다. 더불어 MZ세대 소비 특징인 가치소비를 파악하기 위해 명품 소비와 외제차를 보유한 고객을 그룹화하여 상대적으로 저렴한 제품을 많이 판매하는 다이소 및 편의점을 이용하는 비율이 어느 정도인지 파악할 것이다. 또한, 연령대별/성별/지역별 고객들의 편의점과 다이소를 모두 이용하는 비율 파악을 통해 편의점과 다이소의 콜라보를 진행하기 좋은 타겟층도 선정해 나갈 계획이다. 추가적으로 ‘롯데카드 유통업종 카드소비 트렌드(2021)’, ‘롯데카드 음식업종 카드소비 트렌드(2021)’ 데이터를 통해 업종별, 성별, 연령대별 소비건수 및 소비금액 파악을 통해 활성화된 업종을 선정할 것이다. 모든 분석을 끝낸 후, 인사이트를 도출한 결과들을 종합하여 차별화된 편의점 차별화된 편의점 개선방향을 제안하고자 한다.
[기대효과]
“고객들의 소비 패턴 파악을 통한 차별화된 편의점 제안”을 통해 다음과 같이 3가지를 기대할 수 있다.
- 선행 실험 매장을 통해 증명된 매출 증대
- 경험마케팅 기대 가능
- 타 카드사 자료를 추가적으로 활용함으로써 높은 대표성 기대
먼저, 고객의 소비 욕구 충족 및 흥미를 돋우는 차별화된 편의점은 일반 편의점보다 매출액이 높은 사례가 존재한다. 첫 번째 사례로, 빅데이터에 기반한 GS25의 플래그십 스토어 전략이다. 합정동 카페 거리에 입점한 GS25 합정프리미엄점은 카페, 주류, 간편식품 강화형 매장 콘셉트로 꾸몄다. 2021년 11월 오픈 이후 2022년 2월말까지 일반 GS25 편의점 대비 와인 8배, 원두커피 4배, 아이스크림 4배, 화장품 3배 등으로 매출이 뛰었다고 한다. GS25 전주본점 역시 ‘와인25플러스’에서 서울을 제외한 기타 지역 주류 구매 비중이 70%를 넘어선 수요를 확인하고, 이 지역에 주류 특화형 플래그십 스토어를 선보여 오픈 일주일 간 와인 및 위스키 매출이 전체 매출의 60%에 달하는 등의 성공을 거두었다. 이처럼, 특정 편의점을 이용하는 주 고객층 및 제품을 파악해 소비자의 구매 욕구를 상승시킬 새로운 전략을 시도해 일반 편의점과 차별성을 주는 점은 매출 상승의 기대효과로 이어진다. 두 번째 사례로, 일본에서 다이소 코너를 만든 세븐일레븐 편의점 매출은 전년 대비 20% 증가하였으며 세븐일레븐과 다이소 결합 매장은 성공적이었다. 도시락, 음료수 등을 사러 왔던 고객들이 각종 생활용품을 동시에 구매하는 경우가 많았기 때문이다. 자사 제품만으로는 소비자 욕구를 충족시키기 어렵다고 판단하여 다이소 제품을 들여 놓는 결단을 내린 것이며 주로 편의점에서 자체브랜드 상품을, 다이소에서 생활 잡화를 사는 점을 공략한 것이다. 이처럼, 편의점을 찾는 고객들은 늘 새롭고 재미있는 경험을 원하며 아무리 좋은 상품이라도 쉽게 싫증을 느끼는 만큼 늘 새로운 서비스를 선보여야 한다. 소비 트렌드 분석을 바탕으로 소비자들의 구매 욕구 및 호기심을 자극할 요인을 찾아내어 제안된 차별화된 편의점은 높은 매출액 증가율과 생존율이 기대된다.
다음으로, 차별화된 편의점 점포를 통해 고객들에게 새롭고 재미있는 경험을 제공할 수 있다. 소비자의 경험에 집중한 경험마케팅을 통해 이성적이고 감성적인 소비를 모두 자극해서 소비자와 브랜드간의 유대감을 형성할 수 있고 이는 브랜드 인식 개선에도 효과적이다.
마지막으로, 신한은행의 MZ세대 트렌드 지표 외에 타 카드회사의 데이터도 추가적으로 활용해 소비 분석의 대표성을 높일 수 있다. ‘롯데카드 유통업종 카드소비 트렌드(2021)’, ‘롯데카드 음식업종 카드소비 트렌드(2021)’ 데이터도 마찬가지로 연령대별, 유통업종별로 구분되어 있어 MZ세대의 소비 분석이 가능하다. 또한 타 카드사의 데이터에는 10대부터 70대 이상까지 다양한 연령대로 나눠져 있어서 MZ세대 뿐만이 아닌 5060세대의 소비 특성 파악도 가능하다.
이처럼 분석과정에서 다양한 소비 데이터를 활용해 고객들의 소비 패턴 분석 및 파악을 통한 차별화된 편의점을 제시할 수 있다. 차별화된 편의점으로 소비자들에게 새로운 경험을 제공하며 편의점의 매출 증대도 기대할 수 있다.
예선 통과 후 가상환경에서 분석이 이루어졌다. 가상환경에서 이루어져서 작성한 코드는 소유할 수 없고 1차 심사를 통과해야만 가상환경에서 작성한 분석보고서를 받을 수 있었다.
분석결과물 - 본선(1차 심사)
분석결과물 - 본선(2차 심사)
2차 심사는 심사위원 분들 앞에서 발표로 이루어진다. 발표 시간 10분, 질의 응답 시간 5분으로 이루어졌다.
마지막 심사에서 불합격하여 수상을 못 해서 많이 아쉬웠다. 하지만, 본선까지 올라간 걸로 만족한다. 내년에는 더 좋은 분석과 아이디어로 수상까지 갔으면 좋겠다!!
'Project > 2022' 카테고리의 다른 글
동계통계학회 포스터 제작 - Graph Convolution Neural Network (0) | 2022.11.12 |
---|---|
2022 제 10회 빅콘테스트 - 퓨처스 (0) | 2022.11.12 |
[Lab Presentation #2] : Graph Convolutional Network (0) | 2022.09.13 |
[Lab Presentation #1] - Bayesian Neural Network (0) | 2022.08.29 |
[Contest] 제7회 롯데멤버스 빅데이터 경진대회 (0) | 2022.08.28 |