Fase5 Ejercicio Final Grupo - 16
Fase5 Ejercicio Final Grupo - 16
Fase5 Ejercicio Final Grupo - 16
FASE 5
PRESENTADO POR:
PARA:
CAMILO ANDRÉS CÁRDENAS
15
10
5
0
4 5 6 7 8 9 10
• Gráfico de Frecuencias Relativas
0.15
0.10
0.05
0.00
4 5 6 7 8 9 10
• Gráfico de Frecuencias Relativas Acumuladas
0.6
0.4
0.2
0.0
4 5 6 7 8 9 10
10
5
0
10
5
0
Class limits
0.10
0.05
0.00
60
40
20
0
Variable continua
• "DISTRIBUCIÓN EMPÍRICA"
PERIODO 951 - DISTRIBUCIÓN EMPÍRICA
1.0
0.8
Distribución empirica
0.6
0.4
0.2
0.0
VARIABLE CONTINUA
CONCLUSIONES
Logre analizar y colocar en práctica las competencias desarrolladas en las
unidades 1 2 3 del curso
REFERENCIAS BIBLIOGRAFICAS
Primera web conferencia curso periodo 611. Recuperado de
http://conferencia2.unad.edu.co/pmyu3wmxau8d/?proto=true
>
> # Si el programa logró leer la hoja de cálculo Final.csv, con el siguiente comando
le debe aparecer:
>
> View(PROBA)
> # Ciérrela y continúe ejecutando el código
>
> # El grupo debe escoger entre los tres tipos de variables discretas existentes:
> # Para los estudiantes de zootecnia, la variable "Zoo_discreta", que es el
número de lechones por cerda.
> # Para los estudiantes de agronomía, la variable "Agri_discreta", que es el
número de ácaros por hoja.
> # Para los estudiantes de ambiental, la variable "Amb_discreta", que
corresponde al número de hogares que reciclan en 100 barrios
> # Si en el grupo hay estudiantes de distintos programas, deben ponerse de
acuerdo para escoger una sola variable con la que van a trabajar
>
> CONTEO=Zoo_discreta # En esta linea reemplaze la palabra "Zoo_discreta" por
la variable seleccionada por el grupo
> # Si el grupo seleccionó "Agri_discreta" entonces la línea previa deberá quedar
así: CONTEO=Agri_discreta
> # No debe reemplazar nada más, porque de lo contrario puede aparecerle algún
error
>
> min(CONTEO)
[1] 4
> max(CONTEO)
[1] 10
> table(CONTEO) # Tabla de frecuencias absolutas
CONTEO
4 5 6 7 8 9 10
9 15 24 18 13 15 6
> fabs=table(CONTEO) # Tabla de frecuencias absolutas
> fabs
CONTEO
4 5 6 7 8 9 10
9 15 24 18 13 15 6
> fabsacum<-as.table(cumsum(fabs)) # Frecuencias absolutas acumuladas
> fabsacum
4 5 6 7 8 9 10
9 24 48 66 79 94 100
> frel=prop.table(table(CONTEO)) # Tabla de frecuencias relativas
> frel
CONTEO
4 5 6 7 8 9 10
0.09 0.15 0.24 0.18 0.13 0.15 0.06
> frelacum<-as.table(cumsum(frel)) # Frecuencias relativas acumuladas
> frelacum
4 5 6 7 8 9 10
0.09 0.24 0.48 0.66 0.79 0.94 1.00
>
> # GRAFICOS PARA VARIABLES DISCRETAS
> barplot(fabs,ylab="Frecuencias absolutas",main="PERIODO 951 -
FRECUENCIAS ABSOLUTAS - DISCRETA") # Frecuencias absolutas
> barplot(frel,ylab="Frecuencias relativas",main="PERIODO 951 - FRECUENCIAS
RELATIVAS - DISCRETA") # Frecuencias relativas
> barplot(frelacum,ylab="Frecuencias relativas",main="PERIODO 951 -
FRECUENCIAS RELATIVAS ACUMULADAS - DISCRETA") #Frecuencias
relativas acumuladas
>
>
># VARIABLE CUANTITATIVA CONTINUA
>
> PROBA=read.table("Final.csv",header=T,sep=";",dec=",")
> attach(PROBA) # Muestra el nombre de las variables sobre los que el
programa R va a hacer los cálculos
The following objects are masked from PROBA (pos = 3):
> attach(PROBA)
The following objects are masked from PROBA (pos = 3):
>
> # Instalación del paquete "fdth"
> # Cuando aparezca el listado, elegir: "0-cloud [https]" y después: "fdth". hacer
clic en "OK"
> # Esperar hasta que instale el paquete de comandos, puede tardar varios
minutos
> # Esperar hasta que el cursor se vea de nuevo de color rojo en la parte de abajo
de la Consola R
>
> utils:::menuInstallPkgs() # seleccionar: "0-cloud [https]" y después: "fdth"
--- Please select a CRAN mirror for use in this session ---
Warning in install.packages(lib = .libPaths()[1L], dependencies = NA, type = type) :
'lib = "C:/Program Files/R/R-4.0.2/library"' is not writable
also installing the dependency ‘xtable’
sd, var
Warning message:
package ‘fdth’ was built under R version 4.0.5
>
> # El grupo debe escoger entre los tres tipos de variables continuas existentes:
> # Para los estudiantes de zootecnia, la variable "Zoo_continua", que es el peso
de conejos.
> # Para los estudiantes de agronomía, la variable "Agri_continua", que es el
potencial de hidrógeno del suelo.
> # Para los estudiantes de ambiental, la variable "Amb_continua", que
corresponde al material particulado de 2.5
> # Si en el grupo hay estudiantes de distintos programas, deben ponerse de
acuerdo para escoger una sola variable con la que van a trabajar
>
> VARIABLECONTINUA=Zoo_continua # En esta linea reemplaze la palabra
"Zoo_continua" por la variable seleccionada por el grupo
>
> # Si el grupo seleccionó "Agri_continua" entonces la línea previa deberá quedar
así: VARIABLECONTINUA=Agri_continua
>
> summary(VARIABLECONTINUA)
Min. 1st Qu. Median Mean 3rd Qu. Max.
2010 2445 2791 2758 3069 3473
> minimos=min(VARIABLECONTINUA)
> minimos
[1] 2010
> maximos=max(VARIABLECONTINUA)
> maximos
[1] 3473
> median(VARIABLECONTINUA)
[1] 2791
> VARIANZA=var(VARIABLECONTINUA)
> VARIANZA
[1] 151503.1
> sd(VARIABLECONTINUA)
[1] 389.234
> SIGMA=sqrt(VARIANZA)
> SIGMA
[1] 389.234
> length(VARIABLECONTINUA)
[1] 100
>
># TABLA DE FRECUENCIAS
>
> dist <- fdt(VARIABLECONTINUA)
> dist# Esta tabla presenta el intervalo inferior y superior, la frecuencia absoluta (f),
frecuencia relativa (rf), frecuencia relativa en porcenaje (rf(%)), frecuencia
acumulada (cf) y frecuencia acumulada en porcentaje (cf(%))
Class limits f rf rf(%) cf cf(%)
[1989.9,2179.629) 10 0.10 10 10 10
[2179.629,2369.358) 11 0.11 11 21 21
[2369.358,2559.086) 12 0.12 12 33 33
[2559.086,2748.815) 14 0.14 14 47 47
[2748.815,2938.544) 14 0.14 14 61 61
[2938.544,3128.273) 21 0.21 21 82 82
[3128.273,3318.001) 9 0.09 9 91 91
[3318.001,3507.73) 9 0.09 9 100 100
> dist# Esta tabla presenta el intervalo inferior y superior, la frecuencia absoluta (f),
frecuencia relativa (rf), frecuencia relativa en porcenaje (rf(%)), frecuencia
acumulada (cf) y frecuencia acumulada en porcentaje (cf(%))
Class limits f rf rf(%) cf cf(%)
[1989.9,2179.629) 10 0.10 10 10 10
[2179.629,2369.358) 11 0.11 11 21 21
[2369.358,2559.086) 12 0.12 12 33 33
[2559.086,2748.815) 14 0.14 14 47 47
[2748.815,2938.544) 14 0.14 14 61 61
[2938.544,3128.273) 21 0.21 21 82 82
[3128.273,3318.001) 9 0.09 9 91 91
[3318.001,3507.73) 9 0.09 9 100 100
>
># GRÁFICOS DE VARIABLES CONTINUAS
>
> plot(dist, type="fh",col="blue",xlab="Intervalo de la variable
continua",main="PERIODO 951 - HISTOGRAMA FRECUENCIAS ABSOLUTAS")
# HISTOGRAMA DE FRECUENCIAS ABSOLUTAS
> plot(dist, type="fp",col="blue",main="PERIODO 951 - POLIGONO
FRECUENCIAS ABSOLUTAS VARIABLE CONTINUA") #POLIGONO DE
FRECUENCIAS ABSOLUTAS
> plot(dist, type="rfh",col="blue",xlab="Intervalo variable
conitnua",main="PERIODO 951 - HISTOGRAMA FRECUENCIAS
RELATIVAS")#HISTOGRAMA DE FRECUENCIAS RELATIVAS
> # Cuando ejecute el siguiente comando y le aparezca la gráfica de "POLIGONO
DE FRECUENCIAS RELATIVAS ACUMULADAS EN PORCENTAJE", por favor
NO LA CIERRE
> # Vuelva al código ubicando el cursor en el marco azul de este (donde aparece
el nombre del código), para que no pierda el orden que lleva en la ejecución de los
comandos
> # Los siguientes comandos que inician con la palabra "abline", crearán líneas
sobre la gráfica que muestran información adicional sobre ella.
> # Error in int_abline(a = a, b = b, h = h, v = v, untf = untf, ...) :
> # plot.new has not been called yet
>
> # plot.new has not been called yet
> # plot.new has not been called yet
>
>
> plot(dist, type="cfp",ylim=c(0,100), col="red",ylab="Frecuencia
(%)",xlab="Variable continua",main="PERIODO 951 - POLÍGONO FRECUENCIAS
RELATIVAS ACUMULADAS (%)") #POLIGONO DE FRECUENCIAS RELATIVAS
ACUMULADAS EN PORCENTAJE
> abline(h=25, col="black") # frecuencia = 25%
> abline(h=50, col="red") # frecuencia = 50%
> abline(h=75, col="blue") # frecuencia = 75%
> abline(h=100, col="green") # frecuencia = 100%
> abline(v=median(VARIABLECONTINUA), col="red") # mediana
> abline(v=quantile(VARIABLECONTINUA, 0.25), col="black")# Cuantil Q1
> abline(v=quantile(VARIABLECONTINUA, 0.5),col="red")# Cuantil Q2 (es la
misma mediana)
> abline(v=quantile(VARIABLECONTINUA, 0.75),col="blue")# Cuantil Q3
> abline(v=max(VARIABLECONTINUA), col="brown") # valor máximo
>
> # Donde se unen las líneas rojas es la mediana, lo cual indica que hay una
probabilidad del 50% de que los datos sean iguales o inferiores a esta.
> #Distribución emprica
> ECDF=ecdf(VARIABLECONTINUA)
> ECDF
Empirical CDF
Call: ecdf(VARIABLECONTINUA)
x[1:96] = 2010, 2030, 2060, ..., 3449, 3473
> minimos
[1] 2010
> maximos
[1] 3473
> ECDF
Empirical CDF
Call: ecdf(VARIABLECONTINUA)
x[1:96] = 2010, 2030, 2060, ..., 3449, 3473
> minimos
[1] 2010
> maximos
[1] 3473
>
> # Al igual que con la gráfica anterior, cuando ejecute el próximo comando y le
aparezca la gráfica "Distribución empírica", por favor NO LA CIERRE
> # Vuelva al código ubicando el cursor en el marco azul de este (donde aparece
el nombre del código), para que no pierda el orden que lleva en la ejecución de los
comandos
> ECDF
Empirical CDF
Call: ecdf(VARIABLECONTINUA)
x[1:96] = 2010, 2030, 2060, ..., 3449, 3473
> minimos
[1] 2010
> maximos
[1] 3473
>
> # Al igual que con la gráfica anterior, cuando ejecute el próximo comando y le
aparezca la gráfica "Distribución empírica", por favor NO LA CIERRE
> # Vuelva al código ubicando el cursor en el marco azul de este (donde aparece
el nombre del código), para que no pierda el orden que lleva en la ejecución de los
comandos
> # Los siguientes comandos que inician con la palabra "abline", crearán líneas
sobre la gráfica que muestran información adicional sobre ella.
> # Si cierra la gráfica,cuando ejecute los comandos que inician con "abline" le
aparecerá un error.
>
> # Gráfico de Distribución empírica:
> plot(ECDF,col="red",lwd=3,xlab="VARIABLE CONTINUA",ylab="Distribución
empirica",ylim=c(0,1),xlim=c(minimos,maximos),main="PERIODO 951 -
DISTRIBUCIÓN EMPÍRICA")
> abline(h=0.5, col="red") # la línea horizontal de color rojo, indica el 50% de
la frecuencia de la variable
> abline(v=median(VARIABLECONTINUA), col="red", ) # la línea vertical de color
rojo indica la mediana de la variable
> median(VARIABLECONTINUA) # valor de la mediana en la variable elegida
[1] 2791
> abline(v=mean(VARIABLECONTINUA), col="blue", ) # la línea vertical de color
azul indica la media de la variable
> mean(VARIABLECONTINUA) # valor de la media en la variable elegida
[1] 2758.13
> # ¿es igual o distinto el valor de la media y la mediana en la variable elegida?
> # ¿cómo se puede interpretar esta similitud o diferencia?
>
> # CÁLCULO DE PROBABILIDADES
> # En el siguiente comando, indique el valor de la media de la variable elegida:
> media= 2758.13
> # Ahora indique el valor de la varianza de la variable elegida:
> varianza= 151503.1
> sigma=sqrt(varianza)
>
> # Dentro del rango de valores de la variable elegida, indique aquel del que
quiere conocer su probabilidad.
> # Reemplace el valor de 2700 por uno que se encuentre dentro del rango de
datos en el que se encuentra la variable que eligió:
>
> valor=2700
> varianza= 151503.1
> sigma=sqrt(varianza)
>
> # Dentro del rango de valores de la variable elegida, indique aquel del que
quiere conocer su probabilidad.
> # Reemplace el valor de 2700 por uno que se encuentre dentro del rango de
datos en el que se encuentra la variable que eligió:
> valor=2380
> pnorm(valor,media,sigma)
[1] 0.1656566
> # Indique en su informe el resultado de la probabilidad obtenida
>
> # Presente todos los resultados solicitados en el informe de acuerdo a la guía de
la Fase 5
>
> # Preparado por:
>
> # Luis Alberto Cáceres
> # Director de Curso