Analítica web
Reflexiones sobre madurez digital, datos y tecnología

Analítica predictiva: Funcionalidad de Excel – Previsión

Se lee en 5 minutos

Aunque hay más formas de extraer los datos para realizar predicciones, como podéis ver en este otro post, hoy vamos a hablar sobre una de las funcionalidades de Excel que aporta mucho y que se usa poco ya que ayuda en la analítica predictiva: la opción de previsión.

Con esta opción podremos hacernos una idea sobre los datos que se obtendrán próximamente y así adelantarnos y tomar decisiones para poder alcanzarlos o mejorarlos y hacernos una idea sobre que valores nos situáremos.

Para poder entender mejor de lo que hablamos, hay que tener claro un concepto estadístico como los que añadimos a continuación:

Intervalo de confianza

Según la definición, el intervalo de confianza sería “un par o varios pares de números entre los cuales se estima que estará cierto valor desconocido con una determinada probabilidad de acierto. Estos números determinan un intervalo, que se calcula a partir de datos de una muestra, y el valor desconocido es un parámetro poblacional. La probabilidad de éxito en la estimación se representa con 1 – α y se denomina nivel de confianza. En estas circunstancias, α es el llamado error aleatorio o nivel de significación, esto es, una medida de las posibilidades de fallar en la estimación mediante tal intervalo.”

El nivel de confianza y la amplitud del intervalo varían a la par, de forma que cuanto más amplio sea el intervalo, mayor probabilidad de acierto tendrá, lo que supone que tendrá un mayor nivel de confianza, mientras que, para un intervalo más pequeño, que ofrece una estimación más precisa, aumenta su probabilidad de error.

Conociendo el concepto anterior podremos entender mejor los datos que aporta la funcionalidad de previsión de Excel. Esta funcionalidad se realiza de la siguiente manera:

Teniendo un histórico de datos:

Ejemplo datos para calcular una previsión
Ejemplo datos para calcular una previsión

Seleccionamos en la opción del menú superior DATOS> PREVISIÓN

Selección de la opción de previsión
Selección de la opción de previsión

Se abrirá la siguiente ventana donde escogeríamos el período para hacer la previsión y donde podríamos personalizarlo en base de las necesidades de cada uno, desde elegir hasta cuando calcular el pronóstico, cuando empieza, seleccionar el porcentaje del intervalo de confianza y la estacionalidad. En la esquina superior derecha se puede elegir entre gráfico lineal o de barras:

Ventana para configurar la previsión del pronóstico
Ventana para configurar la previsión del pronóstico

Tras ello en otra hoja se abrirá una tabla como la siguiente:

Ejemplo datos de la previsión
Ejemplo datos de la previsión

Además de una gráfica:

Ejemplo gráfica de la previsión
Ejemplo gráfica de la previsión

Si desglosamos cada una de las columnas que da esta funcionalidad, se puede ver que emplea las siguientes fórmulas:

=PRONOSTICO.ETS(fecha_destino, valores, línea de tiempo [estacionalidad], [llenado_datos], [agregación])

Ejemplo previsión

Ejemplo previsión

Desglosando la fórmula de cada una de las partes que la componen:

  • Fecha_destino
    Es un campo obligatorio. Es la fecha que se quiere predecir Es el punto de datos cuyo valor se desea predecir. Puede producirse un error si la fecha de destino es cronológicamente antes del final de la línea de tiempo histórica, y aparecerá el error #NUM!.
  • Valores
    Es otro de los campos obligatorios. Los valores son los valores históricos para los que desea pronosticar los puntos siguientes.
  • Línea de tiempo
    Es obligatorio. Es la matriz o el rango de datos numéricos que se conocen. Las fechas de la línea de tiempo deben tener un paso coherente entre ellas y no pueden ser cero. No hace falta ordenar la línea de tiempo, ya que la fórmula lo ordena automáticamente. Si no se puede identificar un paso constante en la línea de tiempo proporcionada, mostrará el error #NUM!. Si la línea de tiempo contiene valores duplicados, se dará el error #¡VALOR! #NUM!. Si los rangos de la línea de tiempo y los valores no son del mismo tamaño, aparecerá el error #N/A.
  • Estacionalidad
    Opcional. Es un valor numérico. El valor predeterminado de 1 significa que Excel detecta la estacionalidad de forma automática para el pronóstico y usa números enteros positivos para la longitud del patrón estacional. 0 Indica que no hay estacionalidad, lo que significa que el pronóstico será lineal. Los números enteros positivos indicarán al algoritmo que use patrones de esta longitud, como la estacionalidad.
  • Llenado de datos
    Opcional. Aunque la línea de tiempo requiere un paso constante entre los puntos de datos, se admite hasta un 30% de datos faltantes, y se ajustará automáticamente para ello. 0 Indicará al algoritmo que corrija los puntos faltantes como ceros. El valor predeterminado de 1 corregirá los puntos faltantes convirtiéndolos en el promedio de los puntos adyacentes.
  • Agregación
    Opcional. Aunque la línea de tiempo requiere un paso constante entre los puntos de datos, agregará varios puntos con la misma marca de tiempo. Es un valor numérico que indica cómo se agregarán los valores. El valor predeterminado de 0 usará PROMEDIO, mientras que las demás opciones son SUMA, CONTAR, CONTARA, MIN, MAX, MEDIANA.

=PRONOSTICO.ETS.CONFINT(fecha_destino, valores, línea de tiempo [nivel_confianza], [estacionalidad], [llenado_datos], [agregación])

Ejemplo intervalos de confianza
Ejemplo intervalos de confianza

Los componentes que forman la siguiente fórmula serían:

  • Nivel_confianza
    Opcional. Un valor numérico entre 0 y 1 (exclusivo), que indica un nivel de confianza para el intervalo de confianza calculado. Por ejemplo, para un intervalo con 90% de confianza, se calculará un nivel de confianza de 90% (el 90% de los puntos futuros caerán dentro de este radio de predicción). El valor predeterminado es 95%. Para los números que se encuentren fuera de este rango (0,1), se mostrará el error #NUM!.

Otros valores estadísticos

Esta opción solo aparece cuando se selecciona a la hora de crear la previsión, la opción de incluir estadísticas de previsión. Aparecería junto al modelo una tabla cuya fórmula sería la siguiente:

=PRONOSTICO.ETS.ESTADISTICA(valores, línea de tiempo,tipo_estadístico, [estacionalidad], [llenado_de_datos], [agregación])

Ejemplo Estadísticas de previsión
Ejemplo Estadísticas de previsión

Compuesto por:

  • Tipo_estadístico
    Es un dato obligatorio. Un valor numérico entre 1 y 8, que indica qué estadística se devolverá para la previsión calculada.

Cada uno de los siguientes números indican que tipo estadístico es cada uno:

  1. Parámetro alfa del algoritmo de ETS
    Devuelve el parámetro de valor base (un valor más alto otorga más peso a los puntos de datos recientes).
  2. Parámetro beta del algoritmo de ETS
    Devuelve el parámetro de valor de tendencia (un valor más alto otorga más peso a la tendencia reciente).
  3. Parámetro gamma del algoritmo de ETS
    Devuelve el parámetro de valor de estacionalidad (un valor más alto otorga más peso al período estacional reciente).
  4. Métrica MASE
    Devuelve la métrica de errores elevados absolutos medios (es una medición de la precisión de los pronósticos).
  5. Métrica SMAPE
    Devuelve la métrica simétrica de errores porcentuales absolutos medios (es una medición de precisión basada en errores de porcentaje).
  6. Métrica MAE
    Devuelve la métrica simétrica de errores absolutos medios.
  7. Métrica ECM
    Devuelve la métrica raíz de errores cuadráticos medios (es una medición de las diferencias entre los valores pronosticados y los valores observados.
  8. Tamaño de paso detectado
    Devuelve el tamaño de paso detectado en la línea de tiempo histórica.

Más adelante hablaremos sobre la otra funcionalidad de análisis de hipótesis que es también bastante potente también, pero mientras tanto. A pesar de ser una funcionalidad y haber herramientas como R que ayudan bastante más en la creación de modelos predictivos es bastante útil y más fácil de usar.¿Qué otros usos les dais hoy en día?

 

Fuentes:

  • https://es.wikipedia.org/wiki/Intervalo_de_confianza
  • https://support.office.com/

Fuente de la imágen principal: Freepik.es

2 Comentarios

  1. Amadeus Miranda Responder

    Excelente articulo. ¿Esto sería lo equivalente a un forecaste verdad?

    • Pedro Rubio Responder

      Muchas gracias por tu comentario Amadeus, sí sería un modelo de previsión forecast explicando cada uno de los campos que lo componen.

Escribe tu comentario

Doce + 5 =

Navegar