Estad U2 T3

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 10

Datos del alumno Fecha

Nombres: Amy Sarahí 10/ 06/ 2024

Apellidos: Aguaguiña López

Desarrollo de la Actividad
ESTADISTICA
UNIDAD 2: TAREA 3

1. El conjunto RESERVAS0818.csv contiene los valores de las reservas monetarias desde


enero del 2008 hasta diciembre del 2018. El conjunto de datos tiene 11 observaciones y
13 variables, la primera variable es el año y las otras 12 corresponden a los meses del año.
Los datos tienen un formato largo (Para entender en detalle el concepto de formato largo
se recomienda revisar el libro “Estadística para Contadores y Auditores con R”,
disponible en la sección de Bibliografía).

a) Cambiar los datos de formato ancho a formato largo, el nuevo conjunto de datos
debe llamarse RESERVAS0818 L las variables del conjunto de datos deben ser
ANO, MES ˜ y RESERVA.
library(data.table)
setDT(RESERVAS0818)
RESERVAS0818_L <- melt(RESERVAS0818, id.vars = "AÑO",
variable.name = "MES",
value.name = "RESERVA",
variable.factor = FALSE)
kable(RESERVAS0818_L)

b) Usando convenientemente la función arrange muestre los tres años y meses con
las reservas más altas.
head(arrange(RESERVAS0818_L,desc(RESERVA)),3)

c) Usando convenientemente la función arrange muestre los tres años y meses con
las reservas más bajas.
head(arrange(RESERVAS0818_L,(RESERVA)),3)
Universidad Politécnica Salesiana

d) Determine el promedio, mediana y desviación muestral de las reservas por año.


# MEDIA PARA CADA AÑO
aggregate(RESERVAS0818_L$RESERVA,by=list(RESERVAS0818_L$AÑO)
,mean)
# MEDIANA PARA CADA AÑO
aggregate(RESERVAS0818_L$RESERVA,by=list(RESERVAS0818_L$AÑO)
,median)
# DESVIACIÓN MUESTRAL PARA CADA AÑO
aggregate(RESERVAS0818_L$RESERVA,by=list(RESERVAS0818_L$AÑO)
,sd)

2. El conjunto de datos bvg3.csv contiene los precios de las acciones mensuales de 8


empresas que cotizan en la Bolsa de Valores de Guayaquil. El conjunto de datos tiene
nueve variables, la primera variable es la fecha. Las otras variables son las 8 empresas. La
variable Fecha contiene un valor numérico, esto se debe a que los datos fueron procesados
en Excel y al momento de guardar el Datos del alumno Fecha Nombres: FABIA
SAMANTHA 21/07/2022 Apellidos: SARABIA ALVARADO archivo como csv las
fechas se convirtieron a números. Cargue los datos a R y almacenelos en un conjunto de
datos llamado bvg.
a) Para convertir los números a fechas se puede usar la función ‘as.Date‘ cuyo uso
básico es ‘as.Date(variable, origin =”1899-12-30”)‘. Convierta la variable fecha de
número a una fecha valida. Investigue ¿por qué se utiliza como origen el 30 de
diciembre de 1899?
b) Cree una variable llamada Año extrayendo el año de la variable Fecha. Esto se
puede realizar con el código bvg$Año = as.numeric(format(bvg$Fecha, "%Y"))‘
c) Cree una variable llamada Mes extrayendo el mes de la variable Fecha. Note que
cuando extrae el mes el resultado es un número. Investigue como cambiar ese
número al mes correspondiente.
d) Determine las medidas de tendencia central y dispersión de los precios de las
acciones por empresa.

Year=as.Date(bvg$Fecha,origin="1899-12-30")
Year

bvg$Año = as.numeric(format(Year, "%Y"))


bvg$Año

Mes=as.Date(bvg$Fecha,origin="1899-12-30")
months(Mes)

#MEDIDAS DE TENDENCIA CENTRÁL, DISPERSIÓN PARA BBOL

Universidad Politécnica Salesiana


2
Universidad Politécnica Salesiana

media=mean(bvg$BBOL)
media

Mediana=median(bvg$BBOL)
Mediana

library(modeest)
moda=mlv(bvg$BBOL, method = "mfv")
moda

rango=(max(bvg$BBOL)-min(bvg$BBOL))
rango

Desviacion=sd(bvg$BBOL)
Desviacion

Varianza=var(bvg$BBOL)
Varianza

#Coeficiente de Variacion
CoefVar=(Desviacion/media)*100
CoefVar

#Rango Intercuatilico
RI=IQR(bvg$BBOL)
RI

quantile(bvg$BBOL)

#MEDIDAS DE TENDENCIA CENTRÁL, DISPERSIÓN PARA BGYE


media=mean(bvg$BGYE)
media

Mediana=median(bvg$BGYE)
Mediana

library(modeest)
moda=mlv(bvg$BGYE, method = "mfv")
moda

rango=(max(bvg$BGYE)-min(bvg$BGYE))
rango

Desviacion=sd(bvg$BGYE)
Desviacion

Varianza=var(bvg$BGYE)
Varianza

#Coeficiente de Variacion
CoefVar=(Desviacion/media)*100
CoefVar

Universidad Politécnica Salesiana


3
Universidad Politécnica Salesiana

#Rango Intercuatilico
RI=IQR(bvg$BGYE)
RI

quantile(bvg$BGYE)

#MEDIDAS DE TENDENCIA CENTRÁL, DISPERSIÓN PARA BPIN


media=mean(bvg$BPIN)
media

Mediana=median(bvg$BPIN)
Mediana

library(modeest)
moda=mlv(bvg$BPIN, method = "mfv")
moda

rango=(max(bvg$BPIN)-min(bvg$BPIN))
rango

Desviacion=sd(bvg$BPIN)
Desviacion

Varianza=var(bvg$BPIN)
Varianza

#Coeficiente de Variacion
CoefVar=(Desviacion/media)*100
CoefVar

#Rango Intercuatilico
RI=IQR(bvg$BPIN)
RI

quantile(bvg$BPIN)

#MEDIDAS DE TENDENCIA CENTRÁL, DISPERSIÓN PARA CN


media=mean(bvg$CN)
media

Mediana=median(bvg$CN)
Mediana

library(modeest)
moda=mlv(bvg$CN, method = "mfv")
moda

rango=(max(bvg$CN)-min(bvg$CN))
rango

Universidad Politécnica Salesiana


4
Universidad Politécnica Salesiana

Desviacion=sd(bvg$CN)
Desviacion

Varianza=var(bvg$CN)
Varianza

#Coeficiente de Variacion
CoefVar=(Desviacion/media)*100
CoefVar

#Rango Intercuatilico
RI=IQR(bvg$CN)
RI

quantile(bvg$CN)

#MEDIDAS DE TENDENCIA CENTRÁL, DISPERSIÓN PARA CF


media=mean(bvg$CF)
media

Mediana=median(bvg$CF)
Mediana

library(modeest)
moda=mlv(bvg$CF, method = "mfv")
moda

rango=(max(bvg$CF)-min(bvg$CF))
rango

Desviacion=sd(bvg$CF)
Desviacion

Varianza=var(bvg$CF)
Varianza

#Coeficiente de Variacion
CoefVar=(Desviacion/media)*100
CoefVar

#Rango Intercuatilico
RI=IQR(bvg$CF)
RI

quantile(bvg$CF)

#MEDIDAS DE TENDENCIA CENTRÁL, DISPERSIÓN PARA HE


media=mean(bvg$HE)
media

Universidad Politécnica Salesiana


5
Universidad Politécnica Salesiana

Mediana=median(bvg$HE)
Mediana

library(modeest)
moda=mlv(bvg$HE, method = "mfv")
moda

rango=(max(bvg$HE)-min(bvg$HE))
rango

Desviacion=sd(bvg$HE)
Desviacion

Varianza=var(bvg$HE)
Varianza

#Coeficiente de Variacion
CoefVar=(Desviacion/media)*100
CoefVar

#Rango Intercuatilico
RI=IQR(bvg$HE)
RI

quantile(bvg$HE)

#MEDIDAS DE TENDENCIA CENTRÁL, DISPERSIÓN PARA ISC


media=mean(bvg$ISC)
media

Mediana=median(bvg$ISC)
Mediana

library(modeest)
moda=mlv(bvg$ISC, method = "mfv")
moda

rango=(max(bvg$ISC)-min(bvg$ISC))
rango

Desviacion=sd(bvg$ISC)
Desviacion

Varianza=var(bvg$ISC)
Varianza

#Coeficiente de Variacion
CoefVar=(Desviacion/media)*100
CoefVar

Universidad Politécnica Salesiana


6
Universidad Politécnica Salesiana

#Rango Intercuatilico
RI=IQR(bvg$ISC)
RI

quantile(bvg$ISC)

#MEDIDAS DE TENDENCIA CENTRÁL, DISPERSIÓN PARA HE


media=mean(bvg$SASC)
media

Mediana=median(bvg$SASC)
Mediana

library(modeest)
moda=mlv(bvg$SASC, method = "mfv")
moda

rango=(max(bvg$SASC)-min(bvg$SASC))
rango

Desviacion=sd(bvg$SASC)
Desviacion

Varianza=var(bvg$SASC)
Varianza

#Coeficiente de Variacion
CoefVar=(Desviacion/media)*100
CoefVar

#Rango Intercuatilico
RI=IQR(bvg$SASC)
RI

quantile(bvg$SASC)

3. El archivo ranking1920.csv contiene el ranking del sector comercio de los años 2019 y
2020, las variables presentes son:
a) Año e) REGION: Región geográfica
b) POSICION: Posición en el en la que se ubica la empresa
ranking general del año. f) f ) PROVINCIA
g) CIUDAD
c) EXPEDIENTE: Número de
h) TAMANO: GRANDE,
expediente en la PEQUENA, MEDIANA,
Superintendencia de MICROEMPRESA
Compañías i) SECTOR
d) TIPO: Tipo de empresa j) EMPLEADOS
k) ACTIVO

Universidad Politécnica Salesiana


7
Universidad Politécnica Salesiana

l) PATRIMONIO p) UTILIDAD NETA


m) INGRESOS VTAS q) IR
n) EBIT r) TOTALINGRESOS
o) UTILIDAD

Se pide
a) Elimine las observaciones que no tengan registrado el tamaño de la empresa.
b) Utilizando la función as.factor convierta en cualitativas las variables que deban ser
cualitativas.
c) Cree un conjunto de datos llamado PYMESCOMERCIO en el que se encuentren
únicamente las empresas que son pequeñas o medianas empresas tanto en el 2019
como en el 2020.
d) Con el conjunto de datos PYMESCOMERCIO, resuelva las siguientes cuestiones.
1) Determine la media y la desviación estándar de los ingresos por ventas por año.
2) Determine la media y la desviación estándar de los ingresos por ventas de acuerdo con el
tipo de empresa por año.
3) Determine la media y la desviación estándar de los ingresos por ventas de acuerdo con el
tamaño de empresa por año.
4) Determine los cuartiles de la utilidad neta por año, interprete sus resultados.
5) Determine los cuartiles de la utilidad neta de acuerdo con el tipo de empresa por año.
6) Determine los cuartiles de la utilidad neta de acuerdo con el tamaño de la empresa por
año.
7) Elabore un histograma de la utilidad neta por año
8) Elabore un histograma de la utilidad neta por región por año.
9) Utilizando diagramas de caja compare los ingresos por ventas de acuerdo con el tamaño
de la empresa por año.
10) Utilizando diagramas de caja compare los ingresos por ventas de acuerdo con la región
de la empresa por año.
11) Utilizando diagramas de caja compare los ingresos por ventas por año.

ranking <- ranking1920[-which(ranking1920$TAMAÑO == ""), ]

Año <- factor(ranking$AÑO,levels=c(2019:2020),labels=c("AÑO1","AÑO2"))


Año

PYMESCOMERCIO1 <- ranking[-which(ranking$TAMAÑO == "GRANDE"), ]


PYMESCOMERCIO <- PYMESCOMERCIO1[-which(PYMESCOMERCIO1$TAMAÑO ==
"MICROEMPRESA"), ]
View(PYMESCOMERCIO)
Media_Año=aggregate(PYMESCOMERCIO$INGRESOS_VTAS,by=list(PYMESCOMERCIO$
AÑO),mean)
Media_Año
Desviacion_Año=aggregate(PYMESCOMERCIO$INGRESOS_VTAS,by=list(PYMESCOME
RCIO$AÑO),sd)
Desviacion_Año

Media=aggregate(PYMESCOMERCIO$INGRESOS_VTAS,by=list(PYMESCOMERCIO$AÑO,
PYMESCOMERCIO$TIPO),mean)

Universidad Politécnica Salesiana


8
Universidad Politécnica Salesiana

Media
Desviacion=aggregate(PYMESCOMERCIO$INGRESOS_VTAS,by=list(PYMESCOMERCIO
$AÑO,PYMESCOMERCIO$TIPO),sd)
Desviacion

Media=aggregate(PYMESCOMERCIO$INGRESOS_VTAS,by=list(PYMESCOMERCIO$AÑO,
PYMESCOMERCIO$TAMAÑO),mean)
Media
Desviacion=aggregate(PYMESCOMERCIO$INGRESOS_VTAS,by=list(PYMESCOMERCIO
$AÑO,PYMESCOMERCIO$TAMAÑO),sd)
Desviacion

Cuartil_año=aggregate(PYMESCOMERCIO$UTILIDAD_NETA,by=list(PYMESCOMERCI
O$AÑO),quantile)
Cuartil_año

Cuartil=aggregate(PYMESCOMERCIO$UTILIDAD_NETA,by=list(PYMESCOMERCIO$AÑ
O,PYMESCOMERCIO$TIPO),quantile)
Cuartil

Cuartil=aggregate(PYMESCOMERCIO$UTILIDAD_NETA,by=list(PYMESCOMERCIO$AÑ
O,PYMESCOMERCIO$TAMAÑO),quantile)
Cuartil

hist_año=aggregate(PYMESCOMERCIO$UTILIDAD_NETA,by=list(PYMESCOMERCIO$A
ÑO),hist)
hist_año

hist_reg=aggregate(PYMESCOMERCIO$UTILIDAD_NETA,by=list(PYMESCOMERCIO$R
EGIÓN, PYMESCOMERCIO$AÑO),hist)
hist_reg
caja_tamaño=aggregate(PYMESCOMERCIO$INGRESOS_VTAS,by=list(PYMESCOMERCI
O$TAMAÑO,PYMESCOMERCIO$AÑO),boxplot,horizontal=T)
caja_tamaño

caja_region=aggregate(PYMESCOMERCIO$INGRESOS_VTAS,by=list(PYMESCOMERCI
O$REGIÓN,PYMESCOMERCIO$AÑO),boxplot,horizontal=T)
caja_region

boxplot(PYMESCOMERCIO$INGRESOS_VTA ~ PYMESCOMERCIO$AÑO)

(Universida Politécnica Salesiana, 2024)

Bibliografía
Universida Politécnica Salesiana. (06 de 2024). Estadística. Obtenido de AVAC - PRESENCIAL 64: Iniciar
sesión en el sitio (s. f.):
https://avac.ups.edu.ec/presencial64/pluginfile.php/46442/mod_resource/content/2/UNIDAD%
202.pdf

Universidad Politécnica Salesiana


9
Universidad Politécnica Salesiana

Universidad Politécnica Salesiana


10

También podría gustarte