Analítica web
Reflexiones sobre madurez digital, datos y tecnología

Modelos de atribución y la importancia de los datos

Se lee en 6 minutos

La importancia de los modelos de atribución

La atribución en marketing es el proceso de medición de la efectividad de las acciones de marketing, cuantificando el crédito que estas acciones han tenido para alcanzar un objetivo específico. Los modelos de atribución nos ayudan a entender qué secuencia de puntos de contacto (touchpoints) y tipos de contenido han generado mayor tasa de conversión para los objetivos marcados, de manera que los anunciantes pueden optimizar la inversión que realizan en los canales de marketing, así como determinar qué tipo de contenido es el que mejor funciona.

La llegada de la revolución digital ha supuesto un cambio de paradigma en la manera en que las personas interactúan con las marcas y llevan a cabo su decisión de compra. Expuestos a multitud de mensajes a través de un creciente panorama de touchpoints, el camino hasta la conversión ha dejado de ser unívoco y lineal, dando paso a una realidad en la que potencialmente, cada persona podría llegar a representar un tipo de customer journey.

La nueva era digital ha traído consigo también el desarrollo tecnológico necesario para poder recolectar una cantidad inmensa de información de los consumidores en forma de datos, así como las herramientas necesarias para analizar la aportación de cada touchpoint a la consecución de los objetivos. Ahora bien, ¿qué modelo de atribución es el más adecuado? No existe una respuesta única y todos suponen un reto en sí mismos. Cada anunciante, en función del nivel de madurez de su infraestructura de datos, encontrará en un tipo de modelo de atribución la mejor manera de asignar el crédito.

A lo largo del post, veremos qué tipos de modelos de atribución existen, entrando en detalle en los que van un paso más allá en el uso de los datos disponibles, utilizando modelos estadísticos más avanzados.

Las reglas fueron hechas para romperse (o al menos, ponerlas en duda)

Tradicionalmente, los modelos de atribución han sido heurísticos: por naturaleza, una simplificación del análisis del customer journey, basándose en una metodología según reglas que atribuyen el crédito a los touchpoints atendiendo a una fórmula predefinida: última o primera interacción, lineal o según la posición. Si bien estos modelos son una buena primera aproximación para entender la contribución de cada touchpoint a los objetivos de conversión, en esencia reducen la complejidad del análisis limitando el uso del amplio abanico de fuentes de datos disponible. Al final del análisis, quien más quien menos, se queda con la duda de si realmente esa regla, que se ha aplicado para la atribución, es la correcta para evaluar su estrategia de marketing.
La otra vía de análisis consiste en utilizar los modelos de atribución basados en datos, o atribución algorítmica. Estos modelos hacen uso de la estadística y la probabilidad para determinar la posible distribución de conversiones entre los touchpoints. Los más conocidos y aceptados son los basados en el valor de Shapley y el modelo de Markov.

Atribución basada en datos – Shapley

El modelo de atribución basado en el valor de Shapley, se fundamenta en el uso de la teoría de juegos para resolver el problema de la equidad a la hora de asignar crédito a cada touchpoint, teniendo en cuenta la contribución marginal realizada por cada uno hasta alcanzar la conversión, así como su orden de aparición. El modelo de atribución basado en datos que ofrece Google Analytics, utiliza el valor de Shapley como metodología: compara la probabilidad de conversión de usuarios parecidos que han sido expuestos a esos puntos de contacto, con la probabilidad de conversión que existe cuando uno de los puntos de contacto no se produce en la ruta.

Este tipo de análisis ofrece mayor precisión a la hora de asignar el crédito en comparación con los ya predefinidos basados en reglas. Sin embargo, como todo modelo de atribución, tiene sus puntos débiles; entre ellos, el propio hecho de que a los puntos de contacto se les atribuye el valor sin tener en cuenta que, a medida que el usuario avanza hacia la conversión, la probabilidad de convertir varía en el tiempo a medida que a las distintas acciones de marketing influyen en su decisión de compra.

Atribución basada en datos – Markov

Las cadenas de Markov son modelos estadísticos que permiten representar todos los posibles caminos que pueden tomar los usuarios a través de los puntos de contacto. En esencia, el modelo de atribución de Markov considera cada canal o touchpoint como un estado dentro de una secuencia. De este modo, si un usuario visita una web a través de una búsqueda de pago, entran a formar parte del estado “búsqueda de pago”, el cual tiene, a su vez, una mayor probabilidad de conversión en comparación con otro usuario que no haya estado expuesto a ningún punto de contacto o canal de marketing. Así, el modelo hará predicciones probabilísticas de transición de un estado a otro, en base a los posibles movimientos entre los estados en los que entren los usuarios a lo largo del tiempo. De este modo, la influencia que los estados van teniendo sobre los usuarios, se tiene en cuenta, ya que su propensión a convertir irá variando a medida que entran en un estado u otro (entendido como punto de contacto o touchpoint), y servirá para realizar una medición más certera de la contribución que ha tenido cada uno a la conversión final. Veámoslo con un ejemplo en el que la probabilidad de pasar de un estado a otro depende sólo del paso anteriormente visitado, conocido como gráfico de Markov de primer orden:

Partimos de tres touchpoints: Display, Social y Paid Search. Además, hay que considerar tres estados adicionales dentro del customer journey: Inicio, Conversión y No-Conversión. Imaginemos que existen tres customer journeys:

  • Display -> Social -> Paid Search -> Compra
  • Display -> No Compra
  • Social -> Paid Search -> No Compra

Añadiendo los estados adicionales del customer journey (Inicio, Conversión y No-Conversión) según la columna 2, y dividiendo según los pasos entre estados, columna 3:

Markov-Tabla1

Seguidamente, se calcula la probabilidad de pasar de un estado a otro:

Markov - Tabla 2

Ya disponemos de toda la información para trazar el gráfico:

Markov - Gráfico

La probabilidad de conversión del modelo expresado en el gráfico será de: 33,3%(0,667*0,5*1*0,5*+0,333*1*0,5)

El siguiente paso es definir qué importancia tiene cada touchpoint en la conversión, teniendo en cuenta la relación entre los estados representados en el gráfico. La importancia de cada uno se calculará en base al cambio que se produzca en la tasa de conversión final en caso de que se suprimiera ese touchpoint. Este cálculo (removal effect) irá suprimiendo consecutivamente cada touchpoint del gráfico y medirá cuántas conversiones se podrían llegar a producir sin contar con el mismo. De este modo, no habrá usuarios que comiencen ni transiten por él en su camino. Siguiendo el gráfico de ejemplo, si se eliminase Display, la probabilidad de conversión sería de 16,7% (0,333*1*0,5%); si no se hubiera contemplado Display en el customer journey, se habrían perdido el 50% de las conversiones (1-0,167/0,333).

Por último, es necesario ponderar este coste de la pérdida del touchpoint a la conversión, y multiplicarlo por el número total de conversiones (según nuestro ejemplo, 1):

  • Display: 0,5 / (0,5+1+1) = 0,2*1 conversión = 0,2
  • Social: 1 / (0,5+1+1) = 0,4*1 conversión = 0,4
  • Paid Search: 1 / (0,5+1+1) = 0,4*1 conversión = 0,4

Y de este modo, siguiendo el modelo de atribución de Markov, se estaría distribuyendo el mérito a esta única conversión para los tres touchpoints considerados.

Cada modelo de atribución tiene sus limitaciones, ventajas e inconvenientes. La elección de uno u otro dependerá de aquellos supuestos con los que cada estrategia de marketing se sienta más cómoda. En el caso de los modelos de Shapley y Markov, el primero: tiene una mayor adopción en el mercado y se utiliza tanto para realizar atribuciones como pujas automáticas; su enfoque al problema de la atribución es más directo ya que las secuencias de estados no se tienen en cuenta, haciéndolo más práctico y fácil de implementar. Por su parte, el modelo de Markov mejora el de Shapley considerando la secuencia como una parte fundamental del algoritmo, siendo así más fidedigno con la realidad del customer journey; y tiene potencial de ser escalado a un número de canales o touchpoints considerablemente mayor que en el caso del valor de Shapley.


*Fuentes de referencia:

*Fuente imagen destacada: Pexels

Escribe tu comentario

diecinueve + 5 =

Navegar