Rojas Taller1 DS
Rojas Taller1 DS
Rojas Taller1 DS
Febrero 2024
Punto 1
c) Explique la diferencia entre el comando merge y append en Stata, provea un
ejemplo de cada uno implementado en el punto b.
En Stata, tanto el comando merge como el comando append se utilizan para combinar
conjuntos de datos, pero tienen diferentes propósitos y funcionalidades:
Merge: El comando merge se utiliza para combinar dos conjuntos de datos en función de
una variable común, una variable que permita identificar y relacionar los datos. Este
comando es útil cuando se tienen dos conjuntos de datos que contienen información sobre
las mismas entidades, pero almacenadas en diferentes variables. El comando merge se
utiliza para combinar estos dos conjuntos de datos en función de una(s) variable(s) de
identificación.
En los pegues realizados en el taller, al descargar los 8 insumos de cada mes, partimos
inicialmente de la base Características Generales, seguridad social en salud y educación. A
partir de tres variables: directorio, secuencia_p y orden, se crea la relación entre esta base
inicial o base maestra y los otros insumos para lograr cruzar los datos. Es importante
mencionar que la relación que se crea para el pegue entre la base maestra y los otros
insumos es 1:1.
Append: El comando append, por otro lado, se utiliza para agregar nuevas observaciones a
un conjunto de datos existente. Es útil cuando se tienen conjuntos de datos que contienen
las mismas variables, pero diferentes observaciones. El comando append simplemente pega
los nuevos datos al final del conjunto de datos existente sin realizar ningún tipo de
combinación basada en variables clave como lo hace el comando merge.
Para el caso de la encuesta GEIH, usamos el comando append para, posterior a consolidar
los 8 insumos en una sola base mensual, unificar los diferentes meses y obtener como
resultado un solo archivo con la base trimestral. Esto es posible hacerlo, ya que la estructura
de la base de datos para todos los meses contiene las mismas variables.
Data Science & Analytics para AP
Febrero 2024
Punto 2
c) Analice los resultados que obtuvo en su reporte. ¿Qué diferencias ve en los
indicadores de empleo entre los grupos analizados?
Género
Hombres 80.9% 73.5% 9.2% 43.1% 1,559,952
Mujeres 55.0% 46.7% 15.0% 25.2% 1,456,852
Grupos de edad
18-28 68.3% 55.2% 19.2% 32.3% 1,193,960
29-44 83.8% 74.4% 11.3% 37.6% 1,656,388
45-64 76.5% 70.1% 8.4% 39.1% 1,682,457
65+ 33.0% 30.9% 6.3% 22.7% 1,241,250
Zona
Urbano 67.9% 59.5% 12.5% 29.8% 1,687,120
Rural 64.7% 59.3% 8.4% 49.7% 815,282
Nacionalidad
Colombianos(as) 66.8% 59.0% 11.7% 32.6% 1,533,687
Venezolanos(as) 80.2% 70.4% 12.3% 58.7% 1,071,423
Fuente: elaboración propia con base en datos del primer trimestre de la GEIH 2023.
Nota: Los ingresos mostrados son de la ocupación principal
Género:
Participación laboral: La brecha de género en la participación laboral es evidente,
con una participación mucho más baja entre las mujeres (55.0%) en comparación
con los hombres (80.9%). Esto puede reflejar desafíos adicionales que enfrentan las
mujeres para ingresar o permanecer en el mercado laboral, como responsabilidades
familiares, discriminación laboral o acceso limitado a oportunidades educativas y de
empleo.
Tasa de ocupación: Aunque la tasa de ocupación es más baja entre las mujeres
(46.7%) que entre los hombres (73.5%), ambos grupos muestran una proporción
significativa de personas empleadas en relación con su participación laboral.
Tasa de desempleo: La tasa de desempleo es más alta entre las mujeres (15.0%) en
comparación con los hombres (9.2%), lo que indica que las mujeres enfrentan
mayores dificultades para encontrar empleo en comparación con los hombres.
Data Science & Analytics para AP
Febrero 2024
Grupos de edad:
Participación laboral: La participación laboral es más alta entre los adultos de 29-44
años (83.8%), lo que sugiere que este grupo de edad está más activamente
involucrado en la fuerza laboral. Sin embargo, la participación laboral disminuye
significativamente entre los adultos mayores de 65 años (33.0%), lo que puede
indicar tasas de jubilación más altas o dificultades para la reinserción laboral en este
grupo.
Tasa de desempleo: Aunque la tasa de desempleo es más baja entre los adultos
mayores de 65 años (6.3%), es importante tener en cuenta que la baja participación
laboral en este grupo puede influir en esta cifra. La alta tasa de desempleo entre los
jóvenes de 18-28 años (19.2%) destaca la necesidad de políticas dirigidas a mejorar
las oportunidades de empleo para este grupo demográfico.
Zona:
Tasa de informalidad: Aunque la tasa de informalidad es relativamente alta en
ambos entornos, es más baja en las zonas urbanas (29.8%) en comparación con las
rurales (49.7%). Esto puede sugerir diferencias en la estructura del empleo y la
presencia de sectores formales más desarrollados en áreas urbanas.
Nacionalidad:
La población venezolana presenta indicadores de empleo más favorables en
comparación con la población colombiana en términos de participación laboral, tasa
de ocupación y tasa de desempleo. Sin embargo, la tasa de informalidad es
considerablemente más alta entre los venezolanos(as) (58.7%) en comparación con
los colombianos(as) (32.6%), lo que puede reflejar desafíos adicionales relacionados
con la inserción en el mercado laboral formal y la precariedad laboral.
Data Science & Analytics para AP
Febrero 2024
Al analizar la tabla que muestra la tasa de desempleo para hombres y mujeres durante el
primer semestre de 2023, podemos extraer varias conclusiones sobre el comportamiento
del desempleo entre estos grupos en ese período:
Tendencias generales:
En general, tanto para hombres como para mujeres, se observa una disminución gradual en
la tasa de desempleo a lo largo del semestre. Esto sugiere una mejora en las condiciones del
mercado laboral durante ese período.
Brecha de género:
En cada mes del semestre, la tasa de desempleo entre las mujeres es consistentemente más
alta que entre los hombres. Esta brecha persistente indica que las mujeres enfrentan
mayores dificultades para encontrar empleo en comparación con los hombres durante este
período.
Variaciones mensuales:
Se observan fluctuaciones mensuales en las tasas de desempleo tanto para hombres como
para mujeres. Por ejemplo, enero registra las tasas de desempleo más altas para ambos
grupos, mientras que junio muestra las tasas de desempleo más bajas. Estas variaciones
pueden estar influenciadas por factores estacionales, cambios en la economía o políticas
específicas implementadas durante ese período.
Data Science & Analytics para AP
Febrero 2024
En general, la tasa de desempleo parece disminuir a un ritmo ligeramente más rápido entre
las mujeres que entre los hombres. Esto puede indicar que las medidas o programas
específicos dirigidos a mejorar las oportunidades de empleo para las mujeres podrían haber
tenido un impacto positivo durante el primer semestre de 2023.