Entradas

Mostrando entradas de diciembre, 2020

Curso de Análisis estadístico en R

Imagen
La siguiente entrada contiene un curso de Métodos Estadístico de Investigación en R , usando los fundamentos del tidyverso para la manipulación y comunicación de datos.  Parte I. Análisis exploratorio en R Clase 1.0.  pdf . video . Introducción a R Clase 1.1. pdf . video . Estructura de datos (tomado del curso de Derek Corcoran) Clase 2.1. pdf . video .  Análisis exploratorio: posición central y dispersión Clase 2.2.  pdf . video .  Análisis exploratorio: posición (quintiles), distribuciones y asociación Clase 2.3.  pdf . video .  Análisis exploratorio: datos perdidos y valores atípicos Clase 2.4. pdf . video. Tablas en R Parte II. Manipulación y comunicación de datos en R Clase 3.1. pdf . video . Manipulando datos usando dplyr I (select, filter, mutate) Clase 3.2. pdf . video . Manipulando datos usando dplyr I (summarize, by_group, accros, if, at) Clase 3.3. pdf . video. Ejercicios usando dplyr Clase 4.1. pdf . video . Comunicación de datos con ggplot2 y rmakdowm Clase 4.2. pdf . vide

Test de independencia estadística en R

Imagen
  1. Análisis preliminar En la siguiente entrada se muestran algunos ejemplos de cómo realizar test de independencia estadística en R, para responder a uno de los ejercicios de la asignatura de Seminario de Investigación ( clase 6 de la parte de R ). Los ejercicios se realizan con la base utown del libro Principles of Econometrics 4e, by Carter Hill, William Griffiths, and Guay Lim. Los mismos se encuentran disponibles en el paquete PoEdata. library (PoEdata) library (tidyverse)               data (utown)         head (utown, 5 )          ##     price  sqft age utown pool fplace ## 1 205.452 23.46   6     0    0      1 ## 2 185.328 20.03   5     0    0      1 ## 3 248.422 27.77   6     0    0      0 ## 4 154.690 20.17   1     0    0      0 ## 5 221.801 26.45   0     0    0      1 1. Análisis de independencia 1.1. Usando ggplo2, presente un histograma de precios y muestre un summary (min, max,median, q1, q5) condicionado a si la casa tiene o no piscina (pool).   theme_set

Trabajar datos diarios agrupados por semanas en R: collapse y pronósticos

  En el siguiente ejemplo se utilizan datos diarios de ventas, simulados para presentar algunos ejemplos de con trabajar con series temporales utilizando el tidyverso [ datos ]. Puntualmente, se muestra como convertir una data en frecuencia diaria a semanal, y como realizar pronósticos con modelos arima usando la data en frecuencia diaria y en frecuencia semanal (vea dplyr como prerrequisito).   library(readxl) library(tidyverse) library(tseries) library(forecast)   data_simulada_venta <- read_excel("data_simulada_venta.xlsx") data_simulada_venta # A tibble: 1,356 x 2    fecha               ventas     <dttm>                 <dbl> 1 2016-01-01 00:00:00   0.343 2 2016-01-02 00:00:00   1.28  3 2016-01-04 00:00:00   1.59  4 2016-01-05 00:00:00   1.83  5 2016-01-06 00:00:00   2.29 Convertir la data diaria en datos semanales El collapse de la data es una operación usada para agregar data, por ejemplo, pasar de una data a nivel de individuos a datos a niv