단골을 숫자로 보는 법: RFM 분석 완전 정복

단골을 숫자로 보는 법: RFM 분석 완전 정복

단골을 숫자로 보는 법: RFM 분석 완전 정복

고객을 감이 아닌 숫자로 나누는 RFM 분석의 모든 것. 최근성·빈도·금액 3축으로 VIP와 이탈 위험 고객을 구분하는 법과 RFM의 한계까지 짚어봅니다.

단골을 숫자로 보는 법: RFM 분석 완전 정복

📚 고객을 이해하는 4단계
이커머스 고객 분석이 어떻게 진화해 왔는지 따라가는 4부작 시리즈입니다.
① RFM → ② 확률 기반 CLV → ③ AI 예측 → ④ 데이터·SSOT
지금 보시는 글은 그 첫 번째인 RFM 편입니다.

당신의 쇼핑몰에서 "우리 VIP 고객은 누구인가요?"라고 물으면, 직감에 의존하여 답을 하는 경우가 있습니다. "그 단골 분, 자주 사시는 것 같던데요." 하지만 '자주'는 한 달에 몇 번일까요? '많이'는 얼마부터일까요? 감(感)으로 세그먼트를 분류하면 마케팅 캠페인으로 쉽게 옮길 수 없습니다. 측정할 수 없는 것은 관리할 수 없으니까요.

이 글은 고객을 숫자로 나누는 가장 오래되고, 가장 널리 쓰이는 방법인 RFM 분석을 처음부터 끝까지 다룹니다. 이번 글은 "고객을 이해하는 4단계" 시리즈의 1편으로, RFM이 무엇이고 왜 지금도 사랑받는지, 그리고 어디서 한계를 드러내는지까지 살펴봅니다.

왜 고객을 '나눠야' 하는가

마케팅의 가장 큰 낭비는 모든 고객을 똑같이 대하는 것입니다. 어제 처음 가입한 사람과 3년째 매달 구매하는 사람에게 같은 할인 쿠폰을 보낸다면 VIP 고객은 상대적 박탈감을 느끼고 이탈할 확률이 높아질 수 있습니다. 우리 자사몰의 핵심 고객이 누구인지를 명확히 분류해서 장기 기여를 할 수 있는 고객의 리텐션(재방문율, 재구매율)을 높이는 것이 핵심입니다. 비슷한 행동을 보이는 고객끼리 묶어, 각 묶음에 맞는 메시지와 혜택을 설계하는 것이죠. 문제는 '무엇을 기준으로 묶느냐'입니다. 연령, 성별 같은 인구통계는 구하기 쉽지만 정작 구매 행동과의 연결이 약합니다. 30대 여성이라고 다 같은 고객은 아니니까요.

여기서 RFM의 통찰이 빛납니다. 고객이 누구인지(who)가 아니라, 무엇을 했는지(what they did)로 나누자는 것. 그리고 그 행동은 딱 세 가지 질문으로 압축됩니다.

RFM이란 무엇인가 — R·F·M 세 개의 축

RFM은 고객의 거래 이력을 세 가지 축으로 점수화하는 기법입니다.

영문

핵심 질문

마케팅적 의미

R

Recency (최근성)

마지막으로 산 게 언제인가?

지금 우리와 관계가 살아있는가

F

Frequency (빈도)

일정 기간 몇 번 샀는가?

우리 브랜드에 얼마나 익숙·충성하는가

M

Monetary (구매금액)

누적/평균 얼마를 썼는가?

우리에게 얼마나 가치 있는 고객인가

세 축은 서로 다른 이야기를 합니다. Recency는 관계의 '온도'입니다. 아무리 과거에 많이 샀어도 1년간 발길이 끊겼다면 식어가는 관계죠. Frequency는 습관의 '깊이'입니다. 우리 몰이 그 사람의 구매 루틴에 들어와 있는지를 보여줍니다. Monetary는 가치의 '크기'입니다. 같은 충성 고객이라도 객단가가 다르면 사업 기여도가 다릅니다.

세 축을 함께 보는 이유는, 어느 하나만으로는 고객을 오해하기 때문입니다. 금액(M)만 높은 고객은 한 번 큰 선물을 산 뒤 떠난 사람일 수 있고, 빈도(F)만 높은 고객은 소액만 자주 사는 사람일 수 있습니다. 세 축이 만나는 지점에서 비로소 고객의 윤곽이 또렷해집니다.

점수화와 세그먼트 만들기

개념을 실제 세그먼트로 바꾸는 과정은 의외로 단순합니다.

1단계 — 각 축을 점수로. 가장 흔한 방식은 전체 고객을 각 축 기준으로 5등분(분위, quintile)해 1~5점을 주는 것입니다. 예를 들어 Recency는 가장 최근에 산 상위 20%에게 5점, 가장 오래된 하위 20%에게 1점을 줍니다. Frequency와 Monetary는 반대로 많을수록 높은 점수입니다.

2단계 — 세 점수를 조합. 그러면 한 고객은 R5 F5 M5처럼 세 자리 코드를 갖게 됩니다. 이론적으로 5×5×5 = 125가지 조합이 나옵니다.

3단계 — 의미 있는 묶음으로. 125개를 다 쓰진 않습니다. 비슷한 성격끼리 묶어 다룰 수 있는 세그먼트로 정리합니다.

세그먼트

점수 패턴(예시)

특징

액션

충성 우량(VIP)

R5 F5 M5

최근, 자주, 많이

멤버십/우대, 이탈 방지

이탈 위험 우량

R1 F5 M5

과거 우량, 발길 끊김

윈백, 리마인드

신규

R5 F1 M1

최근 첫 구매

두 번째 구매 유도(온보딩)

휴면

R1 F1 M1

오래전 소액 1회

저비용 재활성화 또는 정리

여기서 RFM의 가장 큰 매력이 드러납니다. 별도의 데이터 인프라 없이, 주문 테이블 하나만 있으면 SQL이나 스프레드시트로도 당장 계산할 수 있다는 점입니다. 분석가가 아니어도 시작할 수 있고, 결과가 직관적이라 팀 전체가 같은 언어로 고객을 이야기하게 됩니다. "이번엔 이탈 위험 우량 세그먼트를 공략하자"처럼요.

RFM이 사랑받는 이유 — 그리고 첫 번째 균열

RFM이 30년 넘게 살아남은 데는 분명한 이유가 있습니다. 진입장벽이 낮고, 해석이 명확하며, 즉시 행동으로 옮길 수 있습니다. 작은 쇼핑몰이 데이터 기반 마케팅에 첫발을 뗄 때 이만한 도구가 없습니다. 그래서 가장 먼저 권하는 출발점이기도 합니다.

하지만 RFM을 실제로 운영하다 보면, 조용히 균열이 보이기 시작합니다.

가장 근본적인 한계는 이것입니다. RFM은 '과거에 어땠는가'만 말합니다. 어떤 고객이 R1(오래 안 삼)으로 떨어졌을 때, 우리는 그제야 "아, 이 사람 떠나려나 보다" 짐작합니다. 그런데 그 시점은 이미 늦었습니다. 고객은 마지막 구매 이후 한참 전부터 신호를 보내고 있었을 텐데, RFM은 그 신호를 보지 못한 채 '구매가 멈춘 결과'만 사후에 알려줍니다. 진단이지 예보가 아닌 것이죠.

게다가 점수 구간을 5등분하는 기준은 통계적 근거 없이 임의적이고, 한 번 계산한 세그먼트는 다음 분석 때까지 멈춰 있는 정적인 스냅샷입니다. 고객은 매일 움직이는데 말이죠.

그렇다면 질문이 자연스럽게 따라옵니다. 과거를 요약하는 것을 넘어, 이 고객이 앞으로 얼마나 더 살 것이고 떠날 확률은 얼마인지를 '예측'할 수는 없을까요?

이 질문에 답하기 위해 마케팅 분석은 한 단계 진화합니다. 고객의 행동을 '확률 과정'으로 바라보는 모델들이 등장하죠. 다음 글에서는 RFM의 입력을 그대로 쓰면서도 미래를 확률로 내다보는 BG/NBD, Pareto/NBD 같은 확률 기반 CLV 모델을 다룹니다.

정리하며

RFM은 고객을 감이 아니라 숫자로 보게 해주는, 가장 신뢰할 수 있는 첫걸음입니다. 최근성, 빈도, 금액이라는 세 개의 단순한 질문만으로도 우리는 VIP와 이탈 위험 고객, 막 들어온 신규를 구분하고 각각에 맞는 대화를 시작할 수 있습니다.

다만 RFM은 백미러입니다. 지나온 길은 또렷이 보여주지만, 앞으로 펼쳐질 길은 비춰주지 못합니다. 고객의 '미래'를 알고 싶다면, 우리는 백미러를 넘어 앞 유리가 필요합니다. 그 이야기를 다음 편에서 이어가겠습니다.

더 정교한 고객 세그멘테이션과 예측을 고민하고 계신가요? 흩어진 고객 데이터를 하나로 모으는 일부터가 시작입니다. 시리즈를 따라오시면 그 이유가 분명해질 것입니다.

Join our newsletter for the latest insights and updates

Subscribe to our Newsletter

Subscribe to our Newsletter

Subscribe to our Newsletter