El índice global de felicidad es una publicación anual de la Red de Soluciones para el Desarrollo Sostenible de las Naciones Unidas (UN SDSN). Contiene articulos y rankings de felicidad nacional basado en las respuestas de personas encuestadas sobre sus vidas. Cada reporte se publicó en Marzo del año en cuestión.

Obtención de los datos

El conjunto de datos fue obtenido de Kaggle world happiness report

Limpieza

El conjunto de datos estaba dividido en 6 archivos diferentes uno para año, desde el 2015 al 2020. Se cambiarán los nombres de las columnas para que concuerden con respecto al resto. También se eliminarán las columnas que no estén presentes en los demás archivos. Las regiones de algunas tablas tienen diferentes nombres, por lo que se utilizará un diccionario para darles un valor concordante.

Una vez que los 6 archivos estén unidos, cambiaremos los nombres de los países que están escritos de forma diferente en cada tabla. La esperanza de vida del reporte del 2020 está en un formato de 0-100 mientras que en el resto de reportes está en un formato de 0-1, por lo que se modificará. Para rellenar los datos vacíos se utilizará la media de los datos agrupados por país, si no hay datos sobre ese país, entonces se utilizará la media de la región.

Ahora miremos los estadísticos descriptivos de los datos

Happiness Rank Happiness Score Economy (GDP per Capita) Family Health (Life Expectancy) Freedom Trust (Government Corruption) Generosity Dystopia Residual Social support
count 935.000000 935.000000 935.000000 935.000000 935.000000 935.000000 935.000000 935.000000 935.000000 935.000000
mean 78.420321 5.394436 0.908311 0.989542 0.617658 0.472008 0.148801 0.180425 2.060878 1.080953
std 45.021905 1.124935 0.402023 0.297888 0.229147 0.201962 0.130846 0.153977 0.539708 0.279657
min 1.000000 2.566900 0.000000 0.000000 0.000000 0.000000 0.000000 -0.300907 0.257241 0.000000
25% 39.500000 4.540000 0.600264 0.812920 0.500955 0.337772 0.061079 0.098152 1.739470 0.874162
50% 78.000000 5.353500 0.974380 1.032809 0.653133 0.465820 0.106285 0.183000 2.071238 1.105000
75% 117.000000 6.198500 1.228785 1.221453 0.779015 0.585785 0.187788 0.262000 2.399977 1.298576
max 158.000000 7.808700 2.096000 1.610574 1.141000 0.974998 0.890216 0.838075 3.837720 1.644000

Análisis exploratorio

Confianza en el gobierno

La información de la columna de confianza en el gobierno fue recopilada por la pregunta: ¿La corrupción está distribuida en todo el gobierno o no?

png

Podemos apreciar que en la región “Australia y nueva Zelanda” es donde los resultados apuntaron a una percepción de corrupción menor, mientras que en “Europa Central y del este” fueron los más altos seguido muy de cerca por “Lationamerica y el Caribe”

Economía (PIB per cápita)

El PIB está en terminos de Paridad de poder adquisitivo (PPP) ajustado al valor de los dolares internacionales del 2011, tomados de los Indicadores de Desarrollo Mundial (WDI) publicado por el banco mundial.

png

Podemos apreciar que en la región “Norte America” es donde el PIB per cápita es más alto, seguido de “Europa Oriental” y “Australia y nueva Zelanda”. Mientras que “África subsahariana” tiene los niveles más bajos”

Libertad de tomar decisiones

La información de esta columna fue obtenida por los resultados de la pregunta: ¿Estás satisfecho con tu libertad para escoger lo que quieres con tu vida?

png

La percepción de libertad en “Australia y Nueva Zelanda” tienen los valores más altos. Mientras que “África subsahariana” tiene los niveles más bajos.

Generosidad

Es la regresión residual de las respuestas a la pregunta: ¿Has donado dinero a la caridad en el último mes?

png

La generosidad en “Australia y Nueva Zelanda” es la mayor, mientras que en “Europa Central y del este” son los niveles más bajos

Familia

Familia es el promedio nacional de la pregunta: Si estuvieras en problemas, ¿Tienes parientes con los que puedas contar para que te ayuden cuando los necesites?

png

Soporte Social

El soporte social es el promedio nacional de la pregunta: Si estuvieras en problemas, ¿Tienes amigos con los que puedas contar para que te ayuden cuando los necesites?

png

Esperanza de vida

png

Distopía residual

Distopía es un país hipotético, llamado así porque tiene los valores iguales a los promedios nacionales más bajos del mundo, para cada una de las variables. Se usó Distopía como un punto de referencia para comparar las contribuciones para cada uno de los factores. Cada país fue comparado con este país ficticio.

png

Felicidad

png

png

png

png

png

png

México con respecto al mundo

Para obtener los resultados de esta gráficas se escalaron los valores del 0 al 10 donde 0 sería en valor mínimo encontrado en cada columna mientras que 10 sería el máximo encontrado, de esta forma los resultados se apreciarían mejor al tener una escala constante.

png

png

Correlación

Para calcular el siguiente mapa se utilizó Coeficiente de correlación de Pearson donde un valor igual a 1 significa que las variables tienen una correlación positiva perfecta (Si una variable crece, la otra también), pero si tiene un valor -1 implica que las variables tienen una correlación negativa perfecta (Si una variable crece, la otra decrece), además si el valor es 0 nos dice que no existe una correlación entre las variables.

png

Ahora mostramos solo las correlaciones de la columna felicidad con el resto de variables.

png

Para ver el repositorio completo ¡Click Aquí!