1. Support (지지도)
정의:
Support는 특정 상품 또는 상품 조합이 전체 거래에서 얼마나 자주 발생하는지를 나타냅니다. 수학적으로는 다음과 같이 정의됩니다:
중요성:
Support는 특정 상품이나 상품 조합의 빈도를 측정하여, 이들이 얼마나 중요한지 평가할 수 있게 합니다. Support가 높다는 것은 해당 규칙이 전체 데이터에서 빈번하게 발생함을 의미하며, 비즈니스 전략을 세우는 데 있어 중요한 고려 요소입니다.
예시:
만약 전체 1,000건의 거래 중 150건에서 빵(A)이 포함되었다면, 빵의 Support는 0.15(15%)입니다. 이 지표는 빵이 고객들에게 얼마나 인기 있는 상품인지를 알려줍니다.
2. Confidence (신뢰도)
정의:
Confidence는 특정 상품을 구매한 고객이 다른 특정 상품도 함께 구매할 확률을 나타냅니다. 이는 다음과 같이 계산됩니다:
중요성:
Confidence는 연관 규칙의 신뢰성을 나타내는 지표입니다. 예를 들어, 빵(A)을 구매한 사람이 버터(B)도 구매할 확률을 나타내며, 이는 상품 간의 연관성을 평가하는 데 매우 중요합니다.
예시:
만약 100건의 거래에서 빵(A)이 포함되었고, 이 중 40건에서 버터(B)도 함께 구매되었다면, 빵 → 버터의 Confidence는 0.4(40%)입니다. 이는 빵을 구매한 고객 중 40%가 버터도 구매했음을 의미합니다.
3. Lift (향상도)
정의:
Lift는 두 상품 간의 연관성이 우연이 아닌지를 평가하는 지표입니다. 이는 다음과 같이 계산됩니다:
중요성:
Lift는 두 상품 간의 관계가 단순히 우연인지, 아니면 실제로 의미 있는 연관성이 있는지를 보여줍니다. Lift 값이 1보다 크면, 두 상품이 서로 양의 상관관계를 가진다는 의미입니다. Lift가 1보다 작으면 두 상품은 서로 음의 상관관계를 가지며, 1이면 두 상품 간의 상관관계가 없다는 뜻입니다.
예시:
위의 예에서 버터(B)의 Support가 0.2(20%)라고 가정해 봅시다. 이때, 빵 → 버터의 Lift는 다음과 같이 계산됩니다:
Lift가 2라는 것은 빵을 구매한 사람이 버터를 구매할 확률이 일반적으로 버터를 구매할 확률의 2배가 된다는 의미입니다. 이는 두 상품 간에 강한 연관성이 있음을 시사합니다.
해석 및 적용 예시
예시 상황:
한 슈퍼마켓에서 고객들이 자주 빵(A)과 버터(B)를 함께 구매하는 것을 발견했다고 가정해 봅시다.
- Support: 빵과 버터가 함께 구매된 거래의 비율이 5%라고 한다면, Support는 0.05입니다. 이는 100건의 거래 중 5건에서 빵과 버터가 함께 구매된다는 것을 의미합니다.
- Confidence: 빵을 구매한 100명 중 50명이 버터도 구매했다면, Confidence는 0.5입니다. 즉, 빵을 구매한 사람 중 50%는 버터도 함께 구매합니다.
- Lift: 만약 버터 자체의 Support가 20%(0.2)라면, Lift는 2.5입니다. 이는 빵을 구매한 사람이 버터를 구매할 확률이 일반적인 경우보다 2.5배 더 높다는 것을 의미합니다.
비즈니스 적용:
이러한 분석을 바탕으로 슈퍼마켓은 빵과 버터를 근접하게 배치하거나, 두 상품을 함께 할인하는 프로모션을 기획할 수 있습니다. 이를 통해 고객의 충동 구매를 유도하고, 매출을 증가시킬 수 있습니다.
'코드잇 데이터 애널리스트 위클리 페이퍼' 카테고리의 다른 글
코호트와 세그먼트의 차이점은 무엇인가요? (0) | 2024.08.22 |
---|---|
AARRR 프레임워크와 리텐션 개념 및 Funnel 분석과의 연관성은? (0) | 2024.08.22 |
장바구니 분석의 다양한 활용 사례는 뭐가 있을까? (0) | 2024.08.16 |
히스토그램의 주요 단점과 이를 극복하기 위한 대안적인 시각화 방법은? (0) | 2024.08.06 |
고유값(eigenvalue)과 고유벡터(eigenvector)란? (0) | 2024.08.06 |