Segmentación por comportamiento de compra

La segmentación de la base de datos se realiza básicamente por el comportamiento histórico de compra; esto es, se valora la capacidad de compra futura dependiendo de cuánto y cuándo se nos ha comprado, dónde, cómo y por qué.

El comportamiento de los clientes se puede valorar de forma afinada con la extendida fórmula de RFIP, que recoge las iniciales de los tres factores: Recencia, Frecuencia, Importe (M en su versión inglesa de Monetary value) y Producto. Esta fórmula se aplica desde que la utilizó Sears Roebuck en los años treinta.

Recencia de compra indica el tiempo transcurrido desde que el cliente realizó la última compra, indicada en períodos mensuales, trimestrales, semestrales o anuales, en función del ciclo de la actividad.

Sears separaba de su fichero de clientes a aquellos que llevan tres años sin comprar, mientras que una cadena de supermercados en habitual que maneje sólo los clientes del último año en cuanto a sus transacciones, aunque evidentemente mantiene los elementos identificadores para una posible activación futura de su tarjeta de cliente.

Frecuencia puede adoptar varias fórmulas de cálculo. La más útil es normalmente el número de periodos en los que el cliente compra, pero a veces se usa en la forma del número de compras que el cliente realiza en un período determinado. Una forma muy raramente utilizada es como relación entre las compras y el número de envíos recibidos que no recomiendo.

Importe o Valor monetario de la compra, es el total de las compras realizadas por periodo considerado. A veces se utiliza el valor promedio de las compras para realizar la corrección de que es mejor comprador una persona con dos compras de veinte mil pesetas, que otro, con cinco compras de ocho mil pesetas Producto. Aquí producto indica una categoría específica del producto comprado, no por la pura descripción física, como podría ser camisa o falda, sino por su asociación a su tipología de consumo, estilo de vida o preferencias que hacen válido a un cliente para recibir una oferta determinada.El peso relativo de las variables se ha establecido habitualmente de forma errónea por decilas con orden por cada uno de estos factores. Ello está significando una pérdida muy importante del potencial de aplicación de este modelo por cuanto lleva implícito que el valor de las variables tiene el mismo peso cuando en la realidad son muy distintos y evolucionan de forma diferenciada en el tiempo.

Si consideramos la regresión de la compra del ejercicio comparada con los datos históricos de compra a través de la siguiente ecuación:

y = a + bx1 + cx2 + dx3 + eX4

obtendremos el peso de cada una de las variables y, al mismo tiempo, el valor de compra esperado para el próximo ejercicio de los compradores con cada perfil histórico de compra.

Gráfico 1
Gráfico 1. Ajuste de la predicción RFIP al comportamiento real de los clientes en un caso de distribución con una de las variables exponencial que permite el ajuste en los casos extremos de los mejores clientes.

En este ejemplo real se puede comprobar que el modelo sólo  se “equivoca” en aquellos clientes que se activaron en una temporada donde la compañía realizó una promoción demasiado agresiva generando clientes de menor calidad.Además de las ya mencionadas, otras variables que determinan el comportamiento de compra son:

  • Fuente de procedencia: a veces va ligada con la respuesta al porqué. El comportamiento es distinto según entre por anuncio en prensa, promoción agresiva, descuento, cadena de amistad o una lista externa utilizada.
  • Canal de compra: por correo, por teléfono, a través de tienda o por visita de representante. Posteriormente se utiliza para adecuar el plan de activación del cliente a la forma en que hace uso de nuestros servicios.
  • Modalidad de pago: contado, pago con tarjeta, a plazos. Se ha comprobado que los que utilizan la tarjeta tienen un mayor volumen de compra.

Otro modelo de análisis del comportamiento de respuesta y compra utilizado habitualmente para mejorar las segmentación y realizar una combinación de factores es el método CHAID, CHi- squared Automatic Interaction Detector. Es especialmente útil por poder trabajar con reglas categóricas (frente a la preferencia en regresión de variables continuas) y recoger la interacción de factores típica de clusters que recogen a clientes con características afines que los hacen realmente diferentes en su comportamiento.

Una vez seleccionadas las variables discriminantes por el modelo identifica de forma habitualmente jerárquica las variables que mejor explican las diferencias en respuesta y obtiene las diferencias en respuesta significativas entre los diferentes grupos obtenidos. Las diferencias entre los diferentes nodos se traducen en los que se denomina cuadro de ganancias entre los resultados obtenidos en cada celda respecto a la media global de la población.


Categoría/s del artículo:
BBDD 4    Segmentación 7   
Top