Los Superpoderes de la DATA: #3 Clustering

En esta serie de artículos intentaremos explicar, de forma amena y sencilla, los superpoderes de la data science y del análisis de los datos en el universo de la publicidad con el objetivo de mejorar nuestro conocimiento sobre clientes y prospectos. En este tercer capítulo nos centraremos en el concepto de #clustering.


En un mundo cada vez más incierto y volátil, el conocimiento del consumidor es un pilar fundamental a la hora de fidelizar al cliente y poder anticiparnos a sus movimientos para reaccionar a tiempo. Como todos sabemos, la fidelización es mucho más rentable que la captación de nuevos clientes, pero ¿cómo conseguimos este activo tan valioso para el negocio? La receta es simple, necesitamos una base de datos de clientes (CRM) en la que tendremos que incorporar un ingrediente especial para dar valor a los datos: el Clustering, una técnica utilizada en marketing para crear tipologías de cliente.

Como veremos a continuación, este superpoder agrupa a los clientes según su similitud, con el condicionante de que cada individuo puede pertenecer solamente a un grupo. En el siguiente gráfico, lo ejemplificamos reuniendo a los superhéroes en función del color de su disfraz.

 
 

No obstante, el ejercicio se complica cuando existen no solo una, sino varias características que definen al individuo, pero para ello podemos contar con la ayuda del Machine Learning. Esta rama de la Inteligencia Artificial automatiza el aprendizaje del modelo, siendo capaz de descubrir por sí mismo patrones de comportamiento en los datos. 

Existen 2 tipos de aprendizaje:

  • El aprendizaje no supervisado. Es el más autónomo puesto que tiene la capacidad de aprender sin conocimiento previo. El modelo de clustering pertenece a esta primera categoría.

  • El aprendizaje supervisado. Necesita que le enseñemos ejemplos para poder aprender, pero eso lo descubriremos en un próximo capítulo 😉

 
 

Es el momento de ejemplificar cómo adquirir este nuevo superpoder mediante un caso práctico. Para ello necesitamos acceder a algunos datos de nuestros clientes, como la fecha de las últimas compras (recency), la frecuencia de compra (frecuency) y el gasto realizado durante todo el período (monetary). Una vez tengamos estos datos, los masticamos para convertirlos en un formato comestible para el modelo, quitando por ejemplo los valores atípicos o corrigiendo las anomalías. Cuando la materia esté lista, aplicamos el modelo de clustering llamado K-Means para buscar la manera óptima de agrupar a los clientes. Este proceso es iterativo, es decir, se repite hasta que el modelo llega a maximizar la distancia entre los distintos clústeres y minimizarla entre los usuarios de un mismo clúster.

 
 

Como podemos ver, el modelo anterior dibuja varios tipos de clientes. Vamos a destacar los siguientes: 

  • Clientes con riesgo de fuga (clúster verde claro). Tienen muchos días de inactividad. Para que la fuga no se produzca, debemos diseñar estrategias de retención proporcionándoles algún descuento o servicio adicional.

  • Clientes más rentables (clúster morado). Consumidores con una mayor frecuencia de compra y un gasto más elevado. Una estrategia interesante sería atraerlos hacia otras categorías de producto mediante técnicas de cross selling.

  • Nuevos Clientes (clúster verde oscuro). Aquellos con una frecuencia de compra baja y un gasto escaso. Podríamos estudiar las categorías de productos que suelen comprar para ofertarles artículos de categoría similar (upsell) con el objetivo de aumentar su ticket medio. Las posibilidades son infinitas…

En resumen, el clustering es un superpoder que nos permite personalizar nuestras comunicaciones de una forma exponencial en función de la naturaleza de nuestros clientes. Además, si monitoreamos la evolución de estos clústeres a lo largo del tiempo, tendremos una herramienta muy interesante a la hora de medir la eficiencia de nuestras acciones de marketing. Así que, con poco material, podremos obtener un gran valor de los datos. Sólo necesitamos conocer el ingrediente especial para que los datos nos hablen.

En el próximo capítulo, continuaremos con el mundo del aprendizaje no supervisado. Y, ya que se acerca la Navidad, analizaremos de una forma precisa los carritos de la compra…


Sophie Algarte 

DATA Director de Avante Evolumedia