Índice mundial de la felicidad
El índice global de felicidad es una publicación anual de la Red de Soluciones para el Desarrollo Sostenible de las Naciones Unidas (UN SDSN). Contiene articulos y rankings de felicidad nacional basado en las respuestas de personas encuestadas sobre sus vidas. Cada reporte se publicó en Marzo del año en cuestión.
Obtención de los datos
El conjunto de datos fue obtenido de Kaggle world happiness report
Limpieza
El conjunto de datos estaba dividido en 6 archivos diferentes uno para año, desde el 2015 al 2020. Se cambiarán los nombres de las columnas para que concuerden con respecto al resto. También se eliminarán las columnas que no estén presentes en los demás archivos. Las regiones de algunas tablas tienen diferentes nombres, por lo que se utilizará un diccionario para darles un valor concordante.
Una vez que los 6 archivos estén unidos, cambiaremos los nombres de los países que están escritos de forma diferente en cada tabla. La esperanza de vida del reporte del 2020 está en un formato de 0-100 mientras que en el resto de reportes está en un formato de 0-1, por lo que se modificará. Para rellenar los datos vacíos se utilizará la media de los datos agrupados por país, si no hay datos sobre ese país, entonces se utilizará la media de la región.
Ahora miremos los estadísticos descriptivos de los datos
Happiness Rank | Happiness Score | Economy (GDP per Capita) | Family | Health (Life Expectancy) | Freedom | Trust (Government Corruption) | Generosity | Dystopia Residual | Social support | |
---|---|---|---|---|---|---|---|---|---|---|
count | 935.000000 | 935.000000 | 935.000000 | 935.000000 | 935.000000 | 935.000000 | 935.000000 | 935.000000 | 935.000000 | 935.000000 |
mean | 78.420321 | 5.394436 | 0.908311 | 0.989542 | 0.617658 | 0.472008 | 0.148801 | 0.180425 | 2.060878 | 1.080953 |
std | 45.021905 | 1.124935 | 0.402023 | 0.297888 | 0.229147 | 0.201962 | 0.130846 | 0.153977 | 0.539708 | 0.279657 |
min | 1.000000 | 2.566900 | 0.000000 | 0.000000 | 0.000000 | 0.000000 | 0.000000 | -0.300907 | 0.257241 | 0.000000 |
25% | 39.500000 | 4.540000 | 0.600264 | 0.812920 | 0.500955 | 0.337772 | 0.061079 | 0.098152 | 1.739470 | 0.874162 |
50% | 78.000000 | 5.353500 | 0.974380 | 1.032809 | 0.653133 | 0.465820 | 0.106285 | 0.183000 | 2.071238 | 1.105000 |
75% | 117.000000 | 6.198500 | 1.228785 | 1.221453 | 0.779015 | 0.585785 | 0.187788 | 0.262000 | 2.399977 | 1.298576 |
max | 158.000000 | 7.808700 | 2.096000 | 1.610574 | 1.141000 | 0.974998 | 0.890216 | 0.838075 | 3.837720 | 1.644000 |
Análisis exploratorio
Confianza en el gobierno
La información de la columna de confianza en el gobierno fue recopilada por la pregunta: ¿La corrupción está distribuida en todo el gobierno o no?
Podemos apreciar que en la región “Australia y nueva Zelanda” es donde los resultados apuntaron a una percepción de corrupción menor, mientras que en “Europa Central y del este” fueron los más altos seguido muy de cerca por “Lationamerica y el Caribe”
Economía (PIB per cápita)
El PIB está en terminos de Paridad de poder adquisitivo (PPP) ajustado al valor de los dolares internacionales del 2011, tomados de los Indicadores de Desarrollo Mundial (WDI) publicado por el banco mundial.
Podemos apreciar que en la región “Norte America” es donde el PIB per cápita es más alto, seguido de “Europa Oriental” y “Australia y nueva Zelanda”. Mientras que “África subsahariana” tiene los niveles más bajos”
Libertad de tomar decisiones
La información de esta columna fue obtenida por los resultados de la pregunta: ¿Estás satisfecho con tu libertad para escoger lo que quieres con tu vida?
La percepción de libertad en “Australia y Nueva Zelanda” tienen los valores más altos. Mientras que “África subsahariana” tiene los niveles más bajos.
Generosidad
Es la regresión residual de las respuestas a la pregunta: ¿Has donado dinero a la caridad en el último mes?
La generosidad en “Australia y Nueva Zelanda” es la mayor, mientras que en “Europa Central y del este” son los niveles más bajos
Familia
Familia es el promedio nacional de la pregunta: Si estuvieras en problemas, ¿Tienes parientes con los que puedas contar para que te ayuden cuando los necesites?
Soporte Social
El soporte social es el promedio nacional de la pregunta: Si estuvieras en problemas, ¿Tienes amigos con los que puedas contar para que te ayuden cuando los necesites?
Esperanza de vida
Distopía residual
Distopía es un país hipotético, llamado así porque tiene los valores iguales a los promedios nacionales más bajos del mundo, para cada una de las variables. Se usó Distopía como un punto de referencia para comparar las contribuciones para cada uno de los factores. Cada país fue comparado con este país ficticio.
Felicidad
México con respecto al mundo
Para obtener los resultados de esta gráficas se escalaron los valores del 0 al 10 donde 0 sería en valor mínimo encontrado en cada columna mientras que 10 sería el máximo encontrado, de esta forma los resultados se apreciarían mejor al tener una escala constante.
Correlación
Para calcular el siguiente mapa se utilizó Coeficiente de correlación de Pearson donde un valor igual a 1 significa que las variables tienen una correlación positiva perfecta (Si una variable crece, la otra también), pero si tiene un valor -1 implica que las variables tienen una correlación negativa perfecta (Si una variable crece, la otra decrece), además si el valor es 0 nos dice que no existe una correlación entre las variables.
Ahora mostramos solo las correlaciones de la columna felicidad con el resto de variables.
Para ver el repositorio completo ¡Click Aquí!