Analítica web
Reflexiones sobre madurez digital, datos y tecnología

Dataviz o visualización de datos: Primeros pasos

Se lee en 5 minutos

¿Cuántas veces nos hemos enfrentado a una presentación o informe en blanco, buscando el gráfico preciso?.
Seguramente varias a lo largo del tiempo, y es que la visualización de datos es un paso para ayudar al análisis, sin duda, van de la mano. Pero en ningún caso es el sustituto del mismo y no debemos quedarnos únicamente ni con la estadística en sí, ni con la representación del mismo, ya que detrás de él hay un trasfondo en el que valorar las diferencias, correlaciones que nos servirán como punto de partida de nuestro análisis.

Es una realidad, los datos nos inundan. Tal es el volumen generado, que nuevas disciplinas como el “Big data” e incluso los “científicos de datos” son necesarios y ponen de manifiesto cómo la visualización y la representación de datos van más allá y conjugan tanto arte como ciencia. Y es que en definitiva, los datos son “feos” y una imagen vale más que mil palabras, con lo cuál hay que tratar de que nuestros interlocutores consuman los datos de una manera eficiente y rápida. Además de ofrecerles, insights de valor.

A pesar de ello, en el post de hoy, nos acercamos a los primeros pasos de la visualización dejando de momento, a un lado propuestas más elaboradas como los grafos, gráfico jerárquicos o clusterizados…

Como todo punto de partida en la elección del gráfico apropiado, deberemos hacernos 3 preguntas:

1. ¿Cuál es nuestro objetivo?

En relación a la primera pregunta, tendremos que hacer una introspección y conocer nuestro core del negocio o empresa para la que trabajamos. Ir más allá de un simple “vender más” y analizar realmente qué queremos medir.

2. ¿Qué queremos mostrar con el gráfico?

Si pasamos a la segunda pregunta, lo tendremos más fácil, gracias a ésta ilustrativa rueda gráfica creada por Carolina Cristanchi, que resume perfectamente las posibilidades a mostrar. O incluso a ésta otra versión conceptualizada de los tipos de gráficos que elegir.

gráfico-tarta-tipologíaPara ello, partiremos de la funcionalidad base de cada tipo de gráfico dónde se podrá desde establecer: comparación, distribución, composición, relación, evolución y desde la categoría geografía. Y específicamente, dentro de cada funcionalidad, haremos foco en algunos de los gráficos más representativos para cada funcionalidad.

COMPARACIÓN

Gráficos de barras: a pesar de considerarse en ocasiones como muy básicos, son perfectos para comparar magnitudes de varias categorías.

gráfico barras ejemploAsí, como para mostrar la evolución en el tiempo de una magnitud específica y de tendencias tanto crecientes como decrecientes.

En cuanto a la representación de los mismos, pueden ser gráficos sencillos (una única serie de datos), agrupados o apilados (varias series de datos). En estos últimos, lo que cambiaría sería la visualización apilada de las barras.
Así como gráficos bidireccionales, como éstos que nos encontramos en Youtube Analytics:

grafico-youtube-analytics

DISTRIBUCIÓN

Histograma: se usan para representación de una variable cuantitativa continua donde la superficie de cada barra es proporcional a la frecuencia de los valores representados, ya sea en forma diferencial o acumulada.

histograma-ejemploEs muy útil, para de un vistazo, ofrecer una visión en grupo en base a una preferencia o una muestra.

COMPOSICIÓN

Muestran de forma efectiva la magnitud de distintas partes que conforman un todo.

Circulares, de sectores o tarta: se muestra dividido en varios sectores, para establecer una proporción numérica respecto al total. Lo cierto, es que este tipo de gráficos es algo criticado y limitado ya que resulta complicado en ocasiones comparar diferentes secciones de un todo, así como comparar datos de diferentes gráficos circulares.

gráfico-circular-ejemplo-ga-google-analyticsPor otro lado, son útiles cuando las categorías son pocas si no pueden llegar a ser confusos e initeligibles.

Treemap o mapa de árbol: son perfectos para mostrar las categorías jerárquicas. Este tipo de gráfico, es “relativamente nuevo” ya que fue creado a comienzos de los 90 por el profesor de la Universidad de Maryland, Ben Shneiderman.

En dicha representación, podrá verse la división entre áreas proporcionales a los datos y con una jerarquía tanto por tamaños por código de color. Y en el ejemplo que incluimos del MIT, además con porcentajes y una leyenda de cada representación.
Son muy útiles cuando tenemos un volumen elevado de valores que no se pueden mostrar de forma eficiente en un gráfico de barras por ejemplo.

treemap-ejemplo-grafico

RELACIÓN

Burbujas: representan la densidad variable de los datos al comparar combinaciones de variables o bien, de matrices.
Además, nos dan información en varios ejes: x, y y “z” junto con el tamaño de la burbuja e incluso el color elegido.

grafico-burbujas-ejemplo

Radar: en éste caso, con este tipo de gráfico obtendremos la dirección o la tendencia al comparar diversas variables. Para ello nos quedamos con esta infografía de StatsChat.org que utiliza precisamente, este tipo de gráfico para representar “El secreto del éxito”.

grafico-radar-ejemplo

EVOLUCIÓN
Líneas/tendencias: son de los más útiles, visualmente eficientes para mostrar cambios y nos muestran la relación que existe entre dos variables.

grafico-tendencia-ejemploPara representar dicho gráfico, echamos un vistazo a las estadísticas de Pinterest, dónde se representan las impresiones y el alcance de un determinado período.

GEOGRAFÍA
Cartogramas: muestran datos estadísticos por regiones.

grafico-cartograma-ejemplo

Y una vez, con todas las posibles representaciones visuales, deberemos hacernos una última pregunta…

3. ¿Qué tenemos que tener en cuenta a la hora de utilizar un gráfico?

Además, hay algunos consejos que debemos tener en cuenta a la hora de enfrentarnos a la representación visual de cualquier gráfico:

  • KISS (Keep it simple, stupid!): menos es más. Sin duda, debe representar la información de forma clara y precisa.
  • – Proporcionar el contexto adecuado a los datos representados.

– Orienta el texto de las leyendas de forma horizontal. Ya que cuanto más legible sea, mejor.

– Lleva a cabo un correcto uso del color, simplificando en la medida de lo posible el espectro de colores elegidos, eligiendo un color acorde al tema que se está representando o incluso suavizando los tonos o resaltándolos, en función de las necesidades. Sobre todo para tener en cuenta en el momento de una posible proyección y la falta de visualizado del mismo.

– Utiliza leyendas y textos sencillos.

Lo cierto, es que en la visualización de datos no hay límites, ésta aproximación de gráficos que poder utilizar, es la punta del iceberg. Ya que hay todo un mundo de herramientas de procesado de datos como: Google Refine, Gephi o bien, algunas de representación que nos harán la vida más fácil como Tableau, Sweetspot, QlikView, Weave, R Studio, Google Chart. Así como librerías como Dygraphs, Vega o D3 (Data Driven Documents), sobre las que profundizaremos más adelante.

De todas formas, para finalizar, nos quedamos con esta curiosa interpretación creada por Russian Sphinx a punto de cruz, en la que se representa la evolución del volumen total de usuarios con acceso a internet desde 1994. Dónde como ella misma comenta, (aunque los datos son de 2012) al comienzo 5 personas de cada 1.000 tenían acceso a internet, en 2012 el ratio aumenta a 36 de cada 100. Justamente, ha hecho una representación en la que muestra a la persona con jersey rosa como 1 de cada tres. ¡Curioso cuanto menos, y artesanal sin duda!.

internet_users_cross_stitching_

2 Comentarios

Escribe tu comentario

10 − siete =

Navegar