Entradas

Creando variables dummy en R

- 1.1. Crear variables dummy  Las variables dummy o vectores lógicos corresponden a variables que asumen, al menos en su versión más elemental, valores 0 y 1, siendo el valor de 1 el asumido por la variable en casos donde que el valor lógico sea positivo (es decir, se cumpla la condición que estamos imponiendo) y 0 en el caso contrario. Para el siguiente ejemplo vamos a simular una base de datos hipotética:   provincia <- c("Ocoa", "Azua", "Bani", "Ocoa") edad <- c(12,21,16,33) my_data <- data.frame(provincia,edad) attach(my_data)   my_data provincia edad 1      Ocoa   12 2      Azua   21 3      Bani   16 4      Ocoa   33   La manera más sencilla de generar una variable dummy (al menos para mí), es utilizando los operadores lógicos y relacionales. Note que al verificar si la edad de un grupo de individuos de mis datos supera los 18 años, vamos a obtener un vector lógico de valores TRUE y FALSE, correspondiente a

Usar la función auto.arima en R

Imagen
La presente entrada intenta explicar como usar la función auto.arima de R, disponible en el paquete forecast, esta permite identificar de forma automática el modelo arima “que mejor ajuste” a las características de las series temporales. Es importante que siempre de manera preliminar es importante estudiar las características de las series temporales, datos atípicos, componentes estacionales, tendencias y otros elementos característicos del análisis exploratorio de series. La función utiliza el algoritmo Hyndman-Khandakar (2008) , desarrollado en R en el paquete “ forecast ” (Hyndman, et al., 2020) La función auto.ariama permite utilizarse en su versión más sencilla (aunque particularmente no recomendada) solo requiere utilizar la serie temporal como argumento de la función. Note que en el siguiente ejemplo se utiliza la función para identificar el modelo arima asociado a la serie AirPassengers, disponible en R:   library(forecast) auto.arima(AirPassengers) Series: AirPassengers ARIMA