Analítica web
Reflexiones desde el mercado español de Analítica Web

El comportamiento fractal

Se lee en 4 minutos

“Bienvenidos al mundo de lo real”, como diría Morfeo en Matrix.

En este post, y después de esta forzada alusión a una de mis películas de ciencia ficción favoritas, vamos a intentar realizar un pequeño ejercicio de abstracción, buceando en el dato y buscando patrones en base al comportamiento de los usuarios. Pero antes hay que introducir un poco la teoría.

1. Teoría fractal: el conjunto de Mandelbrot

Un fractal es un objeto geométrico cuya estructura básica, fragmentada o aparentemente irregular o caótica, se repite a diferentes escalas. Se trata de un término relativamente nuevo, propuesto por Gaston Julia y desarrollado por el matemático Benoît Mandelbrot en 1975 y que deriva del latín fractus (roto o fracturado).

Este término aparece en primer lugar para describir algunas formaciones naturales, y tardó muy poco en desarrollar una sólida base matemática, en la que una de las representaciones más clásicas de estas estructuras es la conocida como Conjunto de Mandelbrot y que representa, sin entrar en detalle y explicándolo de la forma más sencilla posible, aquellos valores de una función matemática compleja que no escapan al infinito, utilizando para los que sí lo hacen una escala de colores.

Conjunto de Mandelbrot (escala de grises)

Este conjunto tiene una peculiaridad, y es que los patrones y formas se repiten al reducir la escala. Os invito a buscar algún vídeo en Internet como este, donde al hacer zoom en el conjunto se obtienen formas y figuras realmente espectaculares.

Bien, en este punto del post ya hemos llegado a la pregunta que seguramente te estés haciendo desde el principio: ¿qué tiene esto que ver con la analítica web?

Para poder llegar a entender la relación, vamos a continuar con una pregunta que escenifica perfectamente el problema, sobre la cual se ha escrito mucho y que después extrapolaremos al mundo de la analítica digital.

2. ¿Cuánto mide la costa de Gran Bretaña?

Este simple problema encierra una cuestión mucho más profunda, que se plantea en cuanto se comienza a medir. ¿Cuántos puntos o vértices de medida utilizamos? Vamos a ejemplificarlo en primera instancia con 8 vértices. Después de medir, obtendremos un valor concreto y, como somos analistas y nos encantan los datos, vamos a repetir el proceso utilizando cada vez más puntos: 16, 32, 64, 128, etc. Sorprendentemente, cada vez obtendremos un valor diferente. Se observa que, al aumentar el número de vértices, aumenta el valor obtenido hasta llegar a un punto en que nos damos cuenta de que el valor siempre cambia. En efecto, la costa de Inglaterra parece que no tiene un valor exacto, lo cual no tiene sentido, por lo que al final nos hacemos una pregunta clave: ¿qué está pasando aquí?

Evolución del ajuste al aumentar los vértices utilizados

Nota: Este problema no asegura que ninguna línea costera o borde geográfico sea realmente fractal (lo que sería físicamente imposible). Simplemente, declara que la distancia medida de una costa o frontera puede comportarse empíricamente como un fractal a lo largo de un conjunto de escalas de medida. Esa es la clave y sentido de este post.

3. Explotación fractal del dato

Si lo extrapolamos al mundo de la analítica digital, podemos observar patrones fractales todos los días en los informes de comportamiento de los usuarios pero, probablemente, no somos realmente conscientes de ello. Como ejemplo, en la siguiente imagen se pueden ver las páginas vistas de una landing durante todo el año 2016.

Si tomamos las vistas de página por mes, o por semana, los datos no parecen tener ningún tipo de estructura. Pero, ¿qué ocurre si extraemos los datos mediante periodos de tiempo concretos?, ¿cuál es el patrón temporal cíclico mínimo aplicable?

Si realizamos esto, se revela un patrón que se repite al reducir la escala hasta llegar a un intervalo de tiempo mínimo, a partir del cual la estructura fractal se rompe. En el ejemplo se utilizan los días de la semana, y dos tipos de visualizaciones: total (a la derecha) y porcentual (a la izquierda).

Para poder compararlas, se observa que el patrón, difícilmente observable en valores absolutos, es muy parecido en la representación porcentual:

Visualización porcentual y en valores absolutos.

Lo mismo nos sucede al utilizar como medida la hora del día de la visualización de página. En los datos recogidos se vuelve a observar un patrón de comportamiento que sugiere una estructura fractal, en la cual se puede extraer información valiosa sobre el comportamiento de los usuarios a lo largo del periodo de tiempo elegido. ¿Significa esto que podemos basarnos en estos patrones observados para optimizar nuestras campañas? ¡Seguramente ya lo estamos haciendo!

Por último, si utilizamos periodos de tiempo más pequeños, como minutos o segundos, se pierde toda estructura en los datos, lo que nos confirma que se ha cruzado el umbral y que las escalas utilizadas no sirven para poder extraer conclusiones.

En definitiva, y para no extender demasiado este post –el cual dejo abierto para una posible segunda parte–, sea analizado o no, el comportamiento fractal está muy presente dentro de la analítica digital. Ya no como ciencia exacta (estos comportamientos tienen unos límites que ya hemos visto que, si se cruzan o no se eligen bien, pierden la estructura), sino como una forma de interrelacionar los datos macro y micro, permitiéndonos extraer unas conclusiones que se revelan de gran utilidad para el cliente.

Para terminar, planteamos las siguientes cuestiones: ¿existen más ciclos de tiempo concretos que revelen patrones específicos?, ¿se puede aplicar a la interacción asíncrona del usuario?, ¿y a los mapas de calor o a los flujos de navegación?, ¿puede la recientemente aplicada IA, buscar y analizar estos patrones?

Seguro que sí, pero queda de vuestra mano. Siempre está bien recordar, y más dentro del océano abrumador de datos en el que diariamente nos movemos, que donde parece reinar el caos, el orden subyace, pero no a la vista de todos.

*Fuente de las imágenes: Xataka Ciencia, Tilde.Club y Adobe Analytics.

Escribe tu comentario

4 + veinte =

Navegar