UEM

AKIBANA

Informática, Análisis de Datos, Gadgets y Nuevas Tecnologías

MINERÍA DE DATOS PARA PREDECIR LEADS DE CALIDAD (QUE COMPRARÁN TU PRODUCTO)

Enrique Puertas Director del Master Universitario en Big Data Analytics Blog AKIBANA Publicado 21 Diciembre 2016

"LEAD" es el nombre que se le da en marketing a la persona que ha manifestado su interés por algún producto o servicio de una empresa y que, en los casos ideales, ha facilitado sus datos de contacto pasando a ser parte de la base de datos de potenciales clientes. 
El Lead Scoring es la categorización que hacemos de los leads de la empresa, y sirve para medir el grado de interés que tiene para nosotros cada  usuario: es el proceso que mide, de manera cualitativa, el nivel de interés de un lead por nuestros productos o servicios, y nuestro grado de interés como empresa por ese cliente potencial.
El Lead Scoring es vital para una empresa mediana-grande, porque cuando la cantidad de leads que se generan es muy elevada no se pueden tratar todos de la misma forma, ya que no todos tienen el mismo grado de interés para la empresa, y dedicar recursos para gestionar a todos los leads por igual no es eficiente. Conocer el Lead Scoring nos permite identificar que usuario tienen una mayor probabilidad de convertir y pasar a ser clientes nuestros.

Tradicionalmente se han utilizado herramientas de Marketing para gestionar los leads, pero este blog no trata de marketing, y lo que voy a presentar es un enfoque diferente, que ya están aplicando muchas empresas y que está suponiendo un aumento muy significativo de la conversión de número de clientes: Uso de Minería de Datos y Big Data para prdecir el score de un lead.

Predicción de Lead Scoring mediante técnicas de Minería de Datos 

Lo que vamos a ver a continuación es cómo podemos entrenar un Sistema Inteligente, que aprenda a detectar los patrones que distinguen los leads “buenos” de los “malos”, construyendo un clasificador automático de leads que luego podemos utilizar para retroalimentar nuestro CRM (nosotros usaremos Salesforce).

PROCESO DE MINERÍA DE DATOS PARA LA CLASIFICACIÓN AUTOMÁTICA DE LEADS DE CALIDAD

Para ello vamos a usar como ejemplo los datos de la empresa Rapidminer, que gracias a esta estrategia consiguió aumentar hasta un 40% el número de ventas de su producto (precisamente un software de minería de datos).

Para crear el clasificador automático lo primero que debemos hacer es construir un proceso que carga, limpia y transforma los datos que tenemos. En un sistema de este tipo típicamente se utilizan las siguientes fuentes de datos:

  • Datos de Salesforce (u otro CRM).
  • Fuentes de datos propias (seminarios, ferias, campañas,etc).
  • Datos de clientes. 

Podemos añadir otras fuentes de datos y variables que consideremos, ya que como veremos más adelante, vamos a utilizar un algoritmo genético de selección de atributos para separar las variables relevantes de las que sólo meten ruido. En la parte de limpieza gestionaremos qué hacer cuando algún campo está vacío, y normalizaremos los valores numéricos.
En la siguiente imagen podemos un ejemplo del proceso de carga y limpieza de datos de leads desde SALESFORCE usando la herramienta RAPIDMINER

Predicción de lead scoring. ETL

Una vez que tenemos cargados los datos, vamos a realizar un proceso que se conoce como “Reducción de la dimensionalidad” y que consiste en reducir el número de columnas con las que vamos a trabajar. 
El número de variables (atributos) que podemos tener en un proceso de predicción de Lead scoring puede ser varios cientos (en ocasiones miles), pero lo normal es que no todas esas variables sirvan para predecir la “calidad” de los leads, y lo que hacen es introducir ruido en nuestro sistema de predicción. Por este motivo, para que todo funcione bien utilizamos el algoritmo “Multi-objective feature selection” (MOFS) para separar el grano de la paja en el conjunto total de variables. La salida de este algoritmo es un conjunto reducido de atributos (25 en el ejemplo) con los que vamos a construir el sistema de predicción automática. El proceso sería el siguiente:

Predicción de lead scoring. Selección de atributos

La última parte del proceso sería utilizar un algoritmo de Aprendizaje Automático para que genere un modelo de predicción capaz de asignar un score a los nuevos leads que entren en nuestro sistema. En el siguiente ejemplo hemos utilizado el algoritmo “Generalized Linear Model”, obteniendo una precisión del 77% a la hora de clasificar los leads de forma correcta.

Predicción de lead scoring. Aprendizaje Automático

Una vez que tenemos construido el clasificador automático, podemos utilizarlo para ayudar al equipo de ventas a gestionar de manera eficiente los nuevos leads. Además, todo este proceso se puede utilizar para retroalimentar Salesforce y tener la información de la clasificación de leads en nuestro sistema.

Como comentaba al principio, el ejemplo y los datos que he utilizado para ilustrar el proceso están sacados de una caso de éxito real, y podéis ver los detalles de implementación en este link

Compartir en Twitter Compartir en Facebook Share in LinkedIn
Comentarios
Deja un comentario
Posts relacionados
20Diciembre
Leer más

¿Qué es innovar? Cinco consejos aplicables a entornos sociales

Andrés Pina Media Relations and CSR Manager

Blog El blog del experto

El pasado viernes celebrábamos en el Campus de Alcobendas el “I Encuentro de Ganadores de los Leer más

lotería de Navidad
21Diciembre
Leer más

¿Qué probabilidades tengo de que me toque la lotería de Navidad?

Universidad Europea administrador

Blog El blog del experto

Como todos los años llega la Navidad y con ella la esperada lotería de Navidad, y es que en estas fechas se celebra el sorteo...

Leer más
22Diciembre
Leer más

Consumo responsable en Navidad

Universidad Europea administrador

Blog El blog del experto

Las Navidades se celebran en compañía, pero la cuesta de Enero se tiene que superar en solitario, o al menos esto es lo que nos sucede a la...

Leer más