Entradas

Mostrando entradas de agosto, 2019

Valores perdidos (NA) en R: identificación y tratamiento (I)

Missing Values (NA) in R. En la siguiente entrada se muestran algunas operaciones básicas para la identificación y tratamiento de valores perdidos en R. Dado el siguiente vector de valores, se verifica que los valores NA son utilizados en R para señalar valore perdidos:
x<-c(24, 14, 17, 25, 12, NA, 11, NA)
Aunque en este ejemplo es fácil de identificar donde se encuentran los NA, en la mayoría de los casos prácticos el volumen de datos no permitirá se identifique con facilidad la presencia de algún valor perdido en el vector de datos. Sin embargo, en R la función is.na permite obtener un vector lógico con TRUE en los casos de valores perdidos. Al anidar la función any con la función is.na se verifica si un vector determinado tiene algún valor perdido, la función which permite identificar la posición de estos valores, mean el porcentaje de NA y sum la cantidad de NA:
> is.na(x)        # Vector lógico con T==NA [1] FALSE FALSE FALSE FALSE FALSE  TRUE FALSE  TRUE
> any(is.na(x))   # …