Estad U2 T3
Estad U2 T3
Estad U2 T3
Desarrollo de la Actividad
ESTADISTICA
UNIDAD 2: TAREA 3
a) Cambiar los datos de formato ancho a formato largo, el nuevo conjunto de datos
debe llamarse RESERVAS0818 L las variables del conjunto de datos deben ser
ANO, MES ˜ y RESERVA.
library(data.table)
setDT(RESERVAS0818)
RESERVAS0818_L <- melt(RESERVAS0818, id.vars = "AÑO",
variable.name = "MES",
value.name = "RESERVA",
variable.factor = FALSE)
kable(RESERVAS0818_L)
b) Usando convenientemente la función arrange muestre los tres años y meses con
las reservas más altas.
head(arrange(RESERVAS0818_L,desc(RESERVA)),3)
c) Usando convenientemente la función arrange muestre los tres años y meses con
las reservas más bajas.
head(arrange(RESERVAS0818_L,(RESERVA)),3)
Universidad Politécnica Salesiana
Year=as.Date(bvg$Fecha,origin="1899-12-30")
Year
Mes=as.Date(bvg$Fecha,origin="1899-12-30")
months(Mes)
media=mean(bvg$BBOL)
media
Mediana=median(bvg$BBOL)
Mediana
library(modeest)
moda=mlv(bvg$BBOL, method = "mfv")
moda
rango=(max(bvg$BBOL)-min(bvg$BBOL))
rango
Desviacion=sd(bvg$BBOL)
Desviacion
Varianza=var(bvg$BBOL)
Varianza
#Coeficiente de Variacion
CoefVar=(Desviacion/media)*100
CoefVar
#Rango Intercuatilico
RI=IQR(bvg$BBOL)
RI
quantile(bvg$BBOL)
Mediana=median(bvg$BGYE)
Mediana
library(modeest)
moda=mlv(bvg$BGYE, method = "mfv")
moda
rango=(max(bvg$BGYE)-min(bvg$BGYE))
rango
Desviacion=sd(bvg$BGYE)
Desviacion
Varianza=var(bvg$BGYE)
Varianza
#Coeficiente de Variacion
CoefVar=(Desviacion/media)*100
CoefVar
#Rango Intercuatilico
RI=IQR(bvg$BGYE)
RI
quantile(bvg$BGYE)
Mediana=median(bvg$BPIN)
Mediana
library(modeest)
moda=mlv(bvg$BPIN, method = "mfv")
moda
rango=(max(bvg$BPIN)-min(bvg$BPIN))
rango
Desviacion=sd(bvg$BPIN)
Desviacion
Varianza=var(bvg$BPIN)
Varianza
#Coeficiente de Variacion
CoefVar=(Desviacion/media)*100
CoefVar
#Rango Intercuatilico
RI=IQR(bvg$BPIN)
RI
quantile(bvg$BPIN)
Mediana=median(bvg$CN)
Mediana
library(modeest)
moda=mlv(bvg$CN, method = "mfv")
moda
rango=(max(bvg$CN)-min(bvg$CN))
rango
Desviacion=sd(bvg$CN)
Desviacion
Varianza=var(bvg$CN)
Varianza
#Coeficiente de Variacion
CoefVar=(Desviacion/media)*100
CoefVar
#Rango Intercuatilico
RI=IQR(bvg$CN)
RI
quantile(bvg$CN)
Mediana=median(bvg$CF)
Mediana
library(modeest)
moda=mlv(bvg$CF, method = "mfv")
moda
rango=(max(bvg$CF)-min(bvg$CF))
rango
Desviacion=sd(bvg$CF)
Desviacion
Varianza=var(bvg$CF)
Varianza
#Coeficiente de Variacion
CoefVar=(Desviacion/media)*100
CoefVar
#Rango Intercuatilico
RI=IQR(bvg$CF)
RI
quantile(bvg$CF)
Mediana=median(bvg$HE)
Mediana
library(modeest)
moda=mlv(bvg$HE, method = "mfv")
moda
rango=(max(bvg$HE)-min(bvg$HE))
rango
Desviacion=sd(bvg$HE)
Desviacion
Varianza=var(bvg$HE)
Varianza
#Coeficiente de Variacion
CoefVar=(Desviacion/media)*100
CoefVar
#Rango Intercuatilico
RI=IQR(bvg$HE)
RI
quantile(bvg$HE)
Mediana=median(bvg$ISC)
Mediana
library(modeest)
moda=mlv(bvg$ISC, method = "mfv")
moda
rango=(max(bvg$ISC)-min(bvg$ISC))
rango
Desviacion=sd(bvg$ISC)
Desviacion
Varianza=var(bvg$ISC)
Varianza
#Coeficiente de Variacion
CoefVar=(Desviacion/media)*100
CoefVar
#Rango Intercuatilico
RI=IQR(bvg$ISC)
RI
quantile(bvg$ISC)
Mediana=median(bvg$SASC)
Mediana
library(modeest)
moda=mlv(bvg$SASC, method = "mfv")
moda
rango=(max(bvg$SASC)-min(bvg$SASC))
rango
Desviacion=sd(bvg$SASC)
Desviacion
Varianza=var(bvg$SASC)
Varianza
#Coeficiente de Variacion
CoefVar=(Desviacion/media)*100
CoefVar
#Rango Intercuatilico
RI=IQR(bvg$SASC)
RI
quantile(bvg$SASC)
3. El archivo ranking1920.csv contiene el ranking del sector comercio de los años 2019 y
2020, las variables presentes son:
a) Año e) REGION: Región geográfica
b) POSICION: Posición en el en la que se ubica la empresa
ranking general del año. f) f ) PROVINCIA
g) CIUDAD
c) EXPEDIENTE: Número de
h) TAMANO: GRANDE,
expediente en la PEQUENA, MEDIANA,
Superintendencia de MICROEMPRESA
Compañías i) SECTOR
d) TIPO: Tipo de empresa j) EMPLEADOS
k) ACTIVO
Se pide
a) Elimine las observaciones que no tengan registrado el tamaño de la empresa.
b) Utilizando la función as.factor convierta en cualitativas las variables que deban ser
cualitativas.
c) Cree un conjunto de datos llamado PYMESCOMERCIO en el que se encuentren
únicamente las empresas que son pequeñas o medianas empresas tanto en el 2019
como en el 2020.
d) Con el conjunto de datos PYMESCOMERCIO, resuelva las siguientes cuestiones.
1) Determine la media y la desviación estándar de los ingresos por ventas por año.
2) Determine la media y la desviación estándar de los ingresos por ventas de acuerdo con el
tipo de empresa por año.
3) Determine la media y la desviación estándar de los ingresos por ventas de acuerdo con el
tamaño de empresa por año.
4) Determine los cuartiles de la utilidad neta por año, interprete sus resultados.
5) Determine los cuartiles de la utilidad neta de acuerdo con el tipo de empresa por año.
6) Determine los cuartiles de la utilidad neta de acuerdo con el tamaño de la empresa por
año.
7) Elabore un histograma de la utilidad neta por año
8) Elabore un histograma de la utilidad neta por región por año.
9) Utilizando diagramas de caja compare los ingresos por ventas de acuerdo con el tamaño
de la empresa por año.
10) Utilizando diagramas de caja compare los ingresos por ventas de acuerdo con la región
de la empresa por año.
11) Utilizando diagramas de caja compare los ingresos por ventas por año.
Media=aggregate(PYMESCOMERCIO$INGRESOS_VTAS,by=list(PYMESCOMERCIO$AÑO,
PYMESCOMERCIO$TIPO),mean)
Media
Desviacion=aggregate(PYMESCOMERCIO$INGRESOS_VTAS,by=list(PYMESCOMERCIO
$AÑO,PYMESCOMERCIO$TIPO),sd)
Desviacion
Media=aggregate(PYMESCOMERCIO$INGRESOS_VTAS,by=list(PYMESCOMERCIO$AÑO,
PYMESCOMERCIO$TAMAÑO),mean)
Media
Desviacion=aggregate(PYMESCOMERCIO$INGRESOS_VTAS,by=list(PYMESCOMERCIO
$AÑO,PYMESCOMERCIO$TAMAÑO),sd)
Desviacion
Cuartil_año=aggregate(PYMESCOMERCIO$UTILIDAD_NETA,by=list(PYMESCOMERCI
O$AÑO),quantile)
Cuartil_año
Cuartil=aggregate(PYMESCOMERCIO$UTILIDAD_NETA,by=list(PYMESCOMERCIO$AÑ
O,PYMESCOMERCIO$TIPO),quantile)
Cuartil
Cuartil=aggregate(PYMESCOMERCIO$UTILIDAD_NETA,by=list(PYMESCOMERCIO$AÑ
O,PYMESCOMERCIO$TAMAÑO),quantile)
Cuartil
hist_año=aggregate(PYMESCOMERCIO$UTILIDAD_NETA,by=list(PYMESCOMERCIO$A
ÑO),hist)
hist_año
hist_reg=aggregate(PYMESCOMERCIO$UTILIDAD_NETA,by=list(PYMESCOMERCIO$R
EGIÓN, PYMESCOMERCIO$AÑO),hist)
hist_reg
caja_tamaño=aggregate(PYMESCOMERCIO$INGRESOS_VTAS,by=list(PYMESCOMERCI
O$TAMAÑO,PYMESCOMERCIO$AÑO),boxplot,horizontal=T)
caja_tamaño
caja_region=aggregate(PYMESCOMERCIO$INGRESOS_VTAS,by=list(PYMESCOMERCI
O$REGIÓN,PYMESCOMERCIO$AÑO),boxplot,horizontal=T)
caja_region
boxplot(PYMESCOMERCIO$INGRESOS_VTA ~ PYMESCOMERCIO$AÑO)
Bibliografía
Universida Politécnica Salesiana. (06 de 2024). Estadística. Obtenido de AVAC - PRESENCIAL 64: Iniciar
sesión en el sitio (s. f.):
https://avac.ups.edu.ec/presencial64/pluginfile.php/46442/mod_resource/content/2/UNIDAD%
202.pdf