21 ago 2014

¿Cómo hacer una pirámide de población en Excel?



1.                  Paso previo. Organizar los datos

Generalmente las bases de hogares tan grandes como los censos no se trabaja en Excel, no obstante usando tablas dinámicas se puede resumir la información de población categorizándola según edad. De la base del censo 2010[1] se puede obtener un recuento de la cantidad de personas según edad. Luego de entrar al portal (dirección en nota de pie 1) se eligen la opción “sobre población” de tablas cruzadas. Luego de colocar las opciones que se ven en la próxima imagen, se presiona “ejecutar”.[2]



Una vez se ejecuta la tabla ir a Descargar en formato Excel, y se obtenida una tabla con por sexo según edad. El portal permite descargar las edades agrupadas en grupo de 5 o 10 años aunque aquí lo obtuvimos a nivel para explicar cómo hacerlo en Excel (2010).

Pasos en Excel para agrupar datos usando tabla dinámica:
1.       Sombrear la matriz de datos
2.       Ir a insertar//tabla dinámica//aceptar
3.       Arrastrar los valores de las variables hasta donde correspondan en la tabla
4.       Clic derecho sobre la columna principal de la TD//agrupar
5.       Se completa la ventana emergente, según se quieran agrupar los datos
6.       Por ultimo convertimos los valores del cuerpo de la tabla dinámica en porcentaje. Clic derecho sobre el campo//configuración del valor de campo//mostrar valores como//porcentaje de la columna

Ilustración 2. Opciones para agrupar datos en una tabla dinámica
Al final se obtendrán datos organizados tal como se muestra en la próxima tabla y ahora si están organizados para crear la pirámide. En este ejemplo agrupamos además en un solo grupo la población mayor a 80 años.

Tabla 1. República Dominicana: Porcentaje de la población por sexo según edad, 2010
Etiquetas de fila
Suma de Hombres
Suma de Mujeres
0-4
9.63%
9.36%
5-9
10.05%
9.82%
10-14
10.40%
10.22%
15-19
10.36%
10.46%
20-24
9.30%
9.27%
25-29
8.12%
8.11%
30-34
7.56%
7.53%
35-39
6.71%
6.78%
40-44
6.16%
6.13%
45-49
5.27%
5.30%
50-54
4.30%
4.25%
55-59
3.37%
3.43%
60-64
2.81%
2.87%
65-69
1.95%
2.00%
70-74
1.62%
1.71%
75-79
1.04%
1.15%
80-84
0.76%
0.86%
85-89
0.33%
0.41%
90-94
0.17%
0.22%
95-99
0.06%
0.09%
100-104
0.02%
0.03%
105-110
0.02%
0.02%
Total general
100.00%
100.00%
Fuente: Elaboración propia con Datos del Censo 2010 (ONE)

Por último es necesario cambiar el signo (de positivo a negativo a un de las columna), en nuestro caso lo hicimos con los hombres, pues aparecerán en el lado izquierdo de la población. Una forma sencilla es escribir -1 en una de las celdas de Excel//sombrear la columna que queremos cambiar signo//clic derecho//pegado especial//multiplicar. Ahora la columna de hombre debe aparecer con un signo negativo.

Tabla 2. República Dominicana: Porcentaje de la población por sexo, 
según grupos de edad, 2010
Hombres
Mujeres
0-4
-9.6%
9.36%
5-9
-10.1%
9.82%
10-14
-10.4%
10.22%
15-19
-10.4%
10.46%
20-24
-9.3%
9.27%
25-29
-8.1%
8.11%
30-34
-7.6%
7.53%
35-39
-6.7%
6.78%
40-44
-6.2%
6.13%
45-49
-5.3%
5.30%
50-54
-4.3%
4.25%
55-59
-3.4%
3.43%
60-64
-2.8%
2.87%
65-69
-1.9%
2.00%
70 o más
-4.0%
4.48%
Fuente: Elaboración propia con Datos del Censo 2010 (ONE)

1.                  Crear el gráfico de pirámide

Ahora si contamos con todas las herramientas para crear el gráfico, siguiendo:
1.       Insertar un gráfico de barra (aparece un gráfico raro que se necesita ajustar)
2.       Se cambian las opciones del eje para que no aparezca dentro del gráfico. Clic derecho sobre el eje horizontal//se cambian las marcas de graduación primaria y secundaras  (se coloca ningunas)//etiqueta de eje (bajo). Note que ahora los valores aparecen fuera del gráfico y no dentro, lo que facilita la lectura.
3.       Es necesario graduar el espaciado entre las barras del gráfico. En tal sentido se da clic derecho sobre las barra del gráfico//dar formato a la serie de datos//opciones de serie, de aquí la superposición de series se lleva al 100%y el ancho a 3%, esta última opción dependerá mucho de los gustos de la persona que esté trabajando el gráfico.
4.       El último ajuste obligatorio es que al organizar los datos multiplicamos por -1, por ende estos porcentajes aparecen con signo negativo en el gráfico, para corregirlo se cambia el formato a esta columna. Sombrear dato//formato de celdas//personalizada//tecleas #.##0;0,0%

Ilustración 3. Crear pirámide de población 


Ya a este nivel se pueden cambiar colores, agregar etiquetas, mover la leyenda… para hacer más entendible el gráfico . Haciendo los ajustes necesarios se obtendría un gráfico como el siguiente.

Por último, en la mayoría de los casos se desea hacer comparaciones de las pirámides de dos zonas geográficas, su evolución en el tiempo o comparación entre grupos de población, esta tarea también se puede hacer en Excel aunque necesita un poco de ingenio.  En el siguiente ejemplo comparamos la pirámide nacional con la Santiago Rodríguez (una provincia de RD). Todos los pasos se repiten y organizamos los datos como aparecen en la próxima tabla.

Tabla 3. República Dominicana: Porcentaje de la población por sexo y zona geográfica, 
según grupos de edad, 2010
Nacional
Santiago Rodríguez
Hombres
Mujeres
Hombres
Mujeres
0-4
-9.63%
9.36%
-7.9%
8.4%
5-9
-10.05%
9.82%
-8.9%
9.4%
10-14
-10.40%
10.22%
-9.9%
10.2%
15-19
-10.36%
10.46%
-10.4%
10.2%
20-24
-9.30%
9.27%
-8.9%
8.3%
25-29
-8.12%
8.11%
-7.7%
7.1%
30-34
-7.56%
7.53%
-6.3%
6.5%
35-39
-6.71%
6.78%
-5.7%
6.0%
40-44
-6.16%
6.13%
-5.9%
6.0%
45-49
-5.27%
5.30%
-5.4%
5.5%
50-54
-4.30%
4.25%
-4.8%
4.4%
55-59
-3.37%
3.43%
-4.1%
4.0%
60-64
-2.81%
2.87%
-3.6%
3.6%
65-69
-1.95%
2.00%
-3.0%
3.0%
70-74
-1.62%
1.71%
-2.6%
2.7%
75-79
-1.04%
1.15%
-2.0%
1.7%
80 o más
02.0%
1.62%
-1.5%
1.5%
 Fuente: Elaboración propia con Datos del Censo 2010 (ONE)


De aquí ya se puede operar con el mismo tipo de gráfico (YA NO ES NECESARIO CREAR EL GRÁFICO DE NUEVO Y REPETIR TODO EL PROCEDIMIENTO PORQUE ESTA HECHA LA PLANTILLA). Luego solo se modifica el formato de las barrar para poder distinguir a que zona corresponde cada barra. SIEMPRE LA FORMA EN COMO ORGANIZA LOS DATOS LE PERMITIRÁ TRABAJAR VARIOS ANOS, SIMPLIFICAR LEYENDAS ETC.


No se explicó cómo hacer ya el gráfico anterior porque se entiende trivial, pero si necesitas algunas pautas tal vez estas puedan ayudar:

Agregar series al gráfico: Clic sobre el gráfico 1//ir a la opción diseño//seleccionar datos//agregar… ya aquí aparecen dos recuadro uno para colocar el nombre de la serie y otra para sombrear el área donde aparece la serie de datos.

Cambiar formato a las barras de datos: Esto es necesario para no confundirnos al analizar el gráfico, para esto damos clic sobre la barra que deseamos modificar//  y en herramientas del gráfico damos clic en formato… aquí aparecen todas las opciones.

Si se desea poner la barra trasparente damos clic encima de la barra// en herramientas del gráfico damos clic en formato//relleno de forma//degradado//más degradados//transparencia (en el ejemplo anterior puse 50%).




[2] En caso de tener una base de hogares, se puede obtener la tabla de forma muy sencilla cuyo algoritmo dependerá del lenguaje de programación que use el programa.

Recodificación de variables usando dplyr en R

Una base de datos suele tener diversos tipos de variables del tipo cualitativo y cuantitativo. En función del tipo de variables aplicamos di...