본문내용
1. 고객관계관리 족보
1.1. 데이터마이닝의 개념과 특징
데이터마이닝이란 수집된 데이터로부터 발견되지 않은 유용한 지식을 찾기 위한 일련의 기술이다. CRM 시스템의 기능적 요구사항을 충족시키기 위해 응용 기술, 기술적인 인프라스트럭처와 같은 요소를 활용한다.
데이터마이닝의 특징은 다음과 같다. 첫째, 개발된 예측 모형이 새로운 데이터에서도 잘 적용되는지에 초점을 둔다. 둘째, 통계학, 인공지능, 전산학 등의 공학 기반 지식을 토대로 만들어지고 검증되어 왔다. 셋째, 데이터를 잘 정의하고 수집하는 것이 매우 중요하다. 넷째, 대용량의 자료를 실시간으로 다룰 수 있다.
데이터마이닝은 CRM을 수행하기 위한 핵심 기술 중 하나이다. 운영 시스템에서 수집된 데이터를 분석하여 구체적인 비즈니스 규칙을 만들어내는 과정이다. CRM에서 활용할 수 있는 데이터마이닝 기법에는 연관 규칙, 분류 규칙, 군집화 규칙, 순차패턴 분석 등이 있다.
1.2. 데이터마이닝 프로세스
데이터마이닝 프로세스는 수집된 데이터로부터 발견되지 않은 유용한 지식을 찾기 위한 일련의 기술이다. 데이터마이닝 프로세스는 크게 표본 추출, 데이터 탐색, 데이터 변환, 데이터 모델링, 모형 평가의 단계로 구성된다.
첫 번째, 표본 추출 단계에서는 학습 데이터 표본, 평가 데이터 표본, 검증 데이터 표본 등으로 구분하여 표본을 추출한다. 이때 단순임의 추출이나 층화 추출 등의 샘플링 방법론을 적용한다.
두 번째, 데이터 탐색 단계에서는 데이터에 포함된 변수들의 분포와 변수들 간의 관계를 파악한다.
세 번째, 데이터 변환 및 변수선정 단계에서는 분석 목적에 맞게 데이터를 변환하고, 수치형, 이산형, 서열척도, 명목척도 등 변수의 형태를 구분한다.
네 번째, 데이터 모델링 단계에서는 분석 목적에 적합한 모형을 개발하며, 모형 개발을 위해 투입되는 변수에 대한 고려 사항을 확인한다.
마지막으로, 모형 평가 단계에서는 여러 종류의 모형을 평가하여 가장 적합한 모형을 선정하며, 신뢰성, 타당성, 정확성, 유용성 등의 평가 지표를 고려한다.
이와 같은 데이터마이닝 프로세스를 통해 고객관계관리 분야에서 유용한 정보와 지식을 발견할 수 있다.
1.3. 연관규칙분석
연관규칙분석은 대규모의 데이터 항목들 중에서 유용한 연관성과 상관관계를 찾는 기법이다. 상품 또는 서비스 간의 관계를 살펴보고, 이로부터 유용한 규칙을 찾아내고자 할 때 이용된다.
상품 거래 데이터로부터 상품간의 연관성 정도를 측정하여 연관성이 많은 상품들을 파악한다. 상품 A가 구매되는 경우 상품 C도 구매된다는 식의 연관성을 찾을 수 있다. 이때 고려되는 세 가지 판단 기준은 지지도, 신뢰도, 향상도이다. 지지도는 전체 거래 중 A와 C가 함께 포함된 거래의 비율이며, 신뢰도는 A가 구매된 경우 C가 구매될 확률(조건부확률)이다. 향상도는 A와 C의 구매 패턴이 독립적인지 상관관계가 있는지를 나타내는 지표이다.
연관규칙분석은 사전에 고객 그룹 구분에 대한 정보가 없는 경우 활용도가 높다. 고객 군집화 과정에서 차별적인 속성을 바탕으로 몇 가지 패턴을 발견할 수 있다. 예를 들어 카드사에서 VIP 고객들의 특징을 파악하거나, 프렌차이즈 매장들의 유사 성향을 파악하는 데 활용할 수 있다.
다만 사용자가 그룹의 수를 사전에 결정해야 하는 K-means 기법의 경우 결과 해석이 어려워질 수 있다는 단점이 있다. 따라서 다른 데이터마이닝 기법이나 통계 분석과 병행하여 사용되는 것이 일반적이다.
1.4. 의사결정나무
의사결정나무는 의사결정규칙을 나무구조로 도표화하여 분류를 수행하는 분석방법이다. 제일 먼저 나무구조가 시작되는 마디로써 전체 자료로 이루어져 있는 뿌리마디로부터 시작하며, 뿌리마디 이후의 노드들은 상대적인 관점으로 자식마디와 부모마디로 구성된다. 끝 마디 또는 잎이라고 불리는 노드는 각 나무줄기의 끝에 위치하고 있는 마디를 의미한다.
의사결정나무는 보험사기, 돈세탁 등 범죄사건에 대해 범죄자와 일반 사람들의 분리기준을 찾는 데 활용되며, 카드사에서 VIP의 카드 사용실태를 분류하여 사용 패턴을 정의하고 상품 설계 시 활용하기도 한다. 또한 백화점 우수고객에 영향을 주는 변수들을 선별하고, 각 변수들로 구성된 규칙을 발견하여 효과적인 전략 수립에 활용할 수 있다.
의사결정나무의 장점은 분석 결과가 실용적이며 가독성이 높아 실제 비즈니스 현장에서 활용하기 좋다는 것이다. 또한 새로운 자료에 모형을 적합시키기가 쉽고, 어떤 입력 변수가 목표 변수를 설명하기 위해서 더 중요한지를 쉽게 파악할 수 있다. 단점으로는 분석에 사용된 변수의 수가 많아질수록 복잡한 규칙이 도출될 가능성이 커지며, 연속형 변수를 비연속적인 값으로 취급하기 때문에 분리 기준 근방에서 예측오류가 생길 가능성이 크다. 나무의 깊이가 깊어질수록 과잉적합 문제가 발생하여 일반화가 어려워질 수도 있다.
따라서 의사결정나무는 실용적이고 유용한 분석기법이지만, 복잡한 규칙 도출, 과잉적합 문제 등의 단점을 보완하기 위해 분석 과정에서 충분한 주의를 기울일 필요가 있다. 이를 통해 비즈니스 현장에서 효과적으로 활용할 수 있을 것이다.
1.5. 인공신경망
인공신경망은 인간 두뇌구조와 유사한 지도학습 방법을 수행하는 기법이다. 입력 층, 은닉 층, 출력 층으로 구성되며, 은닉 노드는 전 단계에서 전달받은 값 또는 함수 값을 선형 결합하여 하나의 대표 값으로 변환시킨다. 이를 다시 활성함수를 통해 -1(또는 0)에서 1 사이로 변환하여 출력 값이 생성된다.
인공신경망의 분석과정은 입력 데이터의 변환, 신경망 구조 선정, 은닉 층의 추가 등으로 이루어진다. 은닉 층이 증가할수록 모형의 설명력이 강화되나 과적합 문제가 발생할 수 있다.
인공신경망은 고객의 매출에 영향을 주는 독립변수들을 도출하고, 주택이나 자동차 가격을 결정하는 모형을 개발하며, 고객에 대한 대출금액을 산출하거나 파산 위험을 분석하는 등 다양한 분야에 활용된다.
장점으로는 주어진 데이터에 대해 최적화된 결과를 제공하고 더욱 복잡한 수준의 규칙을 찾아 높은 예측력을 발휘한다. 단점으로는 설명변수들이 종속변수에 구체적으로 어떤 영향을 주는지 해석하기 어려우며, 과잉적합의 위험이 존재한다.
1.6. 모형의 평가
모형 개발 과정에서 여러 종류의 모형을 평가하여 가장 적합한 모형을 선정하는 단계이다. 신뢰성, 타당성, 정확성, 유용성 등의 지표로 모형을 평가하며, 학습 데이터 표본과 검증 데이터를 활용한다. 예측 모형의 성능을 객관적으로 판단하고 실제 새로운 데이터에 적용했을 때 얼마나 잘 작동하는지를 확인한다. 이를 통해 최종적으로 모형을 선정함으로써 분석 목적에 가장 부합하는 데이터마이닝 기법을 선택할 수 있다. 모형 평가의 중요성은 데이터마이닝 프로세스에서 필수적인 단계이며, 최적의 모형을 도출하기 위해 다양한 평가 기준을 고려해야 한다.
2. 전사적 CRM 전략
2.1. 고객전략으로서의 CRM
고객전략으로서의 CRM은 기업의 비전과 목표를 달성하기 위해 고객과의 관계를 전사적으로 관리하는 전략이다. CRM 전략은 조직성과, 고객, 프로세스, 그리고 인프라라는 네 가지 관점에서 종합적으로 고려되어야 한다.
조직성과 관점에서 CRM 전략은 전통적인 성과지표와 더불어 고객관리 역량에 의해 직접적으로 영향을 받는 고객가치 측정지표들을 유기적으로 연계시켜야 한다. 고객 관점에서는 고객의 가치, 만족도, 그리고 로열티를 효과적으로 파악하고 분석하여 이들 간의 유기적인 관계성을 파악해야 한다. 프로세스 관점에서는 단기적인 매출보다는 고객과의 관계 형성과 유지...