ML para clusterizar con precisión al cliente bancario poco conocido

Ofrecer productos lo más ajustado a las necesidades del cliente es uno de los retos más importantes de cualquier empresa. Pero para ello se hace indispensable conocer en profundidad las necesidad de los clientes. Solo entendiendo sus demandas, sus hábitos y otras características personales es posible ofrecer productos y servicios que le satisfagan.

Sin embargo, no siempre disponemos de toda esa información. En la mayoría de las ocasiones involucra datos personales y sensibles, sobre todo en sectores como el sanitario o bancario. En una de las principales entidades bancarias españolas se plantearon cómo podían mejorar el uso de sus bases de datos para ofrecer productos y servicios más ajustados al perfil de sus clientes. Y quisieron ir más allá ¿cómo realizar la misma acción con aquellos de los que apenas tenían información?

La solución para afrontar este desafío se encontraba en la implementación de soluciones basadas en Data Intelligence y Machine Learning. Por eso acudieron a eºmergya, partner especialista ML de Google Cloud y que ya había dado solución a otros retos planteados con anterioridad en relación a la Inteligencia de Negocio y la Inteligencia Conversacional.

clusterizacion bancaria con machine learning emergya

Mejorar la clusterización del cliente conocido 

El reto planteado requería la consecución de varios objetivos. Primeramente era necesario desarrollar un modelo analítico avanzado para mejorar la clusterización y segmentación de la cartera de cliente conocido, es decir, de aquellos de los que el banco poseía bastante información en su base de datos.

Hasta ahora la clusterización se ejecutaba mediante el CRM utilizado por la entidad. Sin embargo, la agrupación de clientes no era lo suficientemente precisa y, como consecuencia, tampoco lo eran las acciones de venta que se realizaban a partir de dicha segmentación. 

La mejora de la clusterización no solo era imprescindible para afinar las acciones de venta en la cartera de cliente conocido; el modelo aplicado se exportaría posteriormente a la cartera de infancia y de cliente poco conocido. Es decir, no solo se trataba de mejorar la agrupación de segmentos de clientes en los que sí se tenía mucha información, sino de establecer un modelo que pudiera determinar patrones y coincidencias en aquellas otras carteras de las que apenas existían datos.

El siguiente reto que había que abordar estaba relacionado con el volumen de los datos. Para que los modelos de Machine Learning sean eficaces es necesario alimentarlos con grandes cantidades de información. Sin embargo, como hemos comentado, el modelo desarrollado iba a aplicarse a un segmento de clientes de los que apenas se tenían datos. Por ello, se investigó el uso de fuentes externas con las que se cubriría esa falta de información.

De forma paralela se trabajaría en maximizar el uso de la nube pública, aprovechando las herramientas más avanzadas de Inteligencia Artificial de Google Cloud.

La importancia del volumen y la calidad de los datos 

Antes de desarrollar el modelo, el equipo necesitaba conocer los datos disponibles y cómo se estructuraban. También era imprescindible llevar a cabo una limpieza y normalización de los diferentes datos para poder trabajar por ellos.

Igualmente se contempló un sistema de exportación de datos desde los sistemas internos a la nube, asegurando un tratamiento seguro de los datos anonimizados. Es decir, el modelo de ML trabajaría con datos totalmente anónimos, de forma que no se pudieran identificar personas concretas, sino conjuntos de clientes agrupados por características similares. En total se exportaron casi 1.200.000 registros de usuarios, provenientes del histórico de la entidad.

Con la infraestructura definida y los datos exportados, la siguiente tarea fue abordar la clusterización de cliente conocido. Se comenzó analizando unas 25 variables de usuario, para encontrar aquellas más óptimas de cara a la clusterización. Asimismo se estudiaron distintos modelos de clusterización con el fin de encontrar aquel que ofreciera un mejor retorno en coste vs. resultados. Con ello se obtuvieron los grupos de cliente con los que poder desarrollar campañas comerciales bien dirigidas.  

Implementar el modelo ML al cliente poco conocido 

Uno de los principales desafíos del proyecto era el de obtener más datos para poder aplicar la solución desarrollada en la cartera de infancia y cliente no conocido. Por ejemplo, una información vital para llevar a cabo campañas de comercialización de productos bancarios es el del poder adquisitivo. Sin embargo, en dicha cartera de clientes era un dato que se desconocía. 

Así, para poder determinar el nivel de renta, se recurrió al uso de fuentes públicas de información, valorándose hasta un total de 10 herramientas del Instituto Nacional de Estadística (INE). 

Gracias a los datos obtenidos de las diferentes fuentes de información, que se procesaron con el modelo de ML desarrollado, se obtuvo, con una alta fiabilidad, el nivel de renta del 96,1% de los clientes poco conocidos. Es decir, gracias a la implementación del Machine Learning conseguimos extraer, de datos de libre acceso, conocimiento de gran valor para el core de negocio de nuestro cliente.

Una solución escalable con gran proyección 

El principal éxito obtenido con el desarrollo del modelo de Machine Learning ha sido la posibilidad de llevar a cabo la clusterización de la cartera de infancia y cliente poco conocido asociándola a la de cliente conocido, lo que resulta en un alto potencial de uso para campañas reales. Máxime cuando, gracias al uso de fuentes externas y la incorporación de herramientas de Inteligencia Artificial, se ha podido obtener una proyección de datos del cliente poco conocido. 

La arquitectura se ha construido sobre la nube de Google Cloud, elegida por su eficiencia, y se ha creado un sistema de exportación segura desde los sistemas de Big Data de la entidad bancaria.

Los modelos de ML implementados, que también han conseguido mejorar la clusterización de cliente conocido, no necesitan nuevos entrenamientos, de forma que pueden ser productivizados a un coste relativamente bajo.
 

¿Quieres transformar tu empresa con tecnologías de futuro?

fondo-footer
base pixel px
Convert
Enter PX px
or
Enter EM em
Result