Unidad I

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 27

UNIVERSIDAD NACIONAL AGRARIA LA MOLINA

Departamento Académico de Estadística e Informática


Estadística Computacional

UNIDAD I
CONCEPTOS PRELIMINARES Y SIMULACIÓN

«Es mejor tener una respuesta aproximada a la pregunta correcta que una
respuesta exacta a la pregunta equivocada»
John Tukey

Introducción

El análisis estadístico comprende el manejo de diversos conceptos que servirán


para afianzar el entendimiento de futuras técnicas cada vez más complejas.
Por ejemplo, para poder entender y posteriormente desarrollar adecuadamente
una prueba de hipótesis se necesita del conocimiento de probabilidad para poder
calcular el p-valor asociado a dicha hipótesis.
Muchos conceptos estadísticos pueden parecer inicialmente difíciles de
entender, como es el caso de la teoría de probabilidad o el de variables
aleatorias. Esto debido a que en algunos casos entender un experimento
aleatorio y modelar el comportamiento de una variable aleatoria X asociado a
este, sin el conocimiento de diferentes conceptos matemáticos (como
permutaciones o combinaciones) no es una tarea tan sencilla y esto implicaría
que no se pueda determinar adecuadamente la función de probabilidad o de
densidad de la variable aleatoria X.
Actualmente desarrollar y entender algunas aplicaciones (como la obtención de
una función de probabilidad) han sido superados gracias a la ayuda de las
computadoras. Esto se logra con la simulación de experimentos a través del uso
de diversos métodos computacionales.
Por otro lado, teoremas muy importantes en estadística como el Teorema Central
del Límite, cuando es discutido por primera vez en una clase de Estadística
Básica conceptualmente no queda muy claro. Sin embargo, si se desarrolla este
teorema con la ayuda de la generación de funciones mediante un programa
estadístico, esto complementaría su entendimiento.

Debemos entender que estos métodos computacionales pueden ser utilizados


para simplificar el cálculo matemático, pero estos no podrían ser desarrollados
si se desconoce de algunos conceptos estadísticos y procedimientos de
programación de un programa estadístico como R.

El presente capítulo tiene como objetivo fundamental presentar algunos


conceptos importantes en estadística (muchos de ellos vistos en otros cursos)
pero mediante un enfoque computacional.
Para el mejor entendimiento de este capítulo el estudiante debe tener
conocimiento básico de elaboración de funciones en R.

MS Jaime Carlos Porras Cerrón 1


[email protected]
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento Académico de Estadística e Informática
Estadística Computacional

1. Conceptos iniciales
a) Experimento Aleatorio ()
Es una operación o acto cuyo resultado no se puede predecir con certeza y que
se realiza bajo los siguientes criterios:
 Puede ser repetido bajo las mismas condiciones
 Se puede describir el número de resultados posibles.
 Se puede establecer un modelo matemático asociado a .

Ejemplo:
1 : {Extraer dos esferas de una urna que contiene 5 esferas de color azul y 2
rojas sin importar el orden}
#Se crean dos vectores de tipo character
azul<-rep("azul",5)
rojo<-rep("rojo",2)
urna<-c(azul,rojo)
sample(urna,2)

2 : {Contar el número de artículos defectuosos producidos al día}

3 : {Tiempo de vida (en horas) de un foco de luz}

b) Espacio Muestral   
Es el conjunto de todos los resultados posibles de un experimento aleatorio E.
Ejemplo
1  {(azul1, azul2),…,(rojo1,rojo2)}
 2  {x / x  0, x  Z}
 3  {x / x  0, x  R}
En muchas situaciones no interesa presentar la extensión del espacio muestral
sino calcular su cardinalidad, es decir:
n(1)=21
choose(7,2)
[1] 21

c) Punto muestral  oi 
Es cualquier elemento de  . Si 1  {o1 , o2 ,, on } entonces  1 tienen n puntos
muestrales.
Ejemplo:
Un punto muestras del primer experimento aleatorio podría ser:
o1={azul1, azul2}

Un punto muestral del segundo experimento aleatorio con ayuda de R


rpois(1,50)

Un punto muestral del tercer experimento aleatorio con R


rexp(1, 1/400)

MS Jaime Carlos Porras Cerrón 2


[email protected]
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento Académico de Estadística e Informática
Estadística Computacional

d) Evento
Es cualquier subconjunto de un espacio muestral. Los eventos se identifican
mediante letras mayúsculas.
Podemos definir experimentos aleatorios algo más complicados, por ejemplo:
E4: Extraer una carta solo del palo de corazones, lanzar una moneda y lanzar un
dado
¿Cuántos elementos tiene el espacio muestral?
n()=13x 2 x 6 =156

Indique la secuencia de comandos en R para poder obtener un punto muestral


de este experimento

r1<-seq(1,13)
r2<-c("cara","sello")
r3<-seq(1,6)
carta<-sample(r1,1,replace=F)
moneda<-sample(r2,1,replace=F)
dado<-sample(r3,1,replace=F)
punto<-cbind(carta,moneda,dado)
punto

2. Probabilidad.
Es un número real que expresa la confianza o incertidumbre de la ocurrencia de
un suceso o evento, cuyo resultado no se puede predecir con certeza.

Ejemplo
Según la revista Beverage Digest, la Coca Cola y la Pepsi ocuparon el primer y
segundo lugar en la preferencia de las personas.
Suponga que, en un grupo de 10 personas, seis prefieren Coca Cola y cuatro
prefieren Pepsi, Se selecciona una muestra aleatoria de cinco miembros de ese
grupo, calcule la probabilidad de que exactamente dos prefieran Coca Cola.
 6  4 
  
P( A)      0.2381
2 3
10 
 
5

choose(6,2)* choose(4,3)/choose(10,5)
[1] 0.2380952

Otra forma de calcular la probabilidad es usando la función dhyper


dhyper(2,6,4,5)
[1] 0.2380952

¿Cómo podría calcular dicha probabilidad sin necesidad de utilizar la función


choose o dhyper?

MS Jaime Carlos Porras Cerrón 3


[email protected]
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento Académico de Estadística e Informática
Estadística Computacional

#Se crea el vector de 10 personas


personas1<-c(1,1,1,1,1,1,0,0,0,0)
#Otra forma de crear el vector de 10 personas
personas2<-c(rep(1,6),rep(0,4))
personas3<- rep(0:1,c(4,6))
#Se aleatoriza el vector de personas
set.seed(40)
personas<-sample(personas3,10,F)

Una función que permite calcular la probabilidad solicitada en el ejemplo anterior


se presenta a continuación:

sim1<-function(personas,n,r){
resul<-matrix(0,r,n)
for (i in 1:r){
resul[i,]<-sample(personas,n)
}
cc<-apply(resul,1,sum)
prob<-table(cc)[2]/r
return(prob)
}

set.seed(10)
sim1(personas3,5,10000)
#Distribución teórica
dhyper(2,6,4,5)

Surgen algunas inquietudes:


 ¿Cuál es número óptimo de r?
 ¿A qué se debe la diferencia entre el valor simulado y el valor teórico?
 ¿Cómo se puede denominar a esta diferencia?
 Existe alguna relación entre la diferencia del valor simulado y el valor
teórico con respecto a r.

ropt<-function(personas,n,r){
t<-length(r)
probs<-rep(0,t)
for (i in 1:t){
probs[i]<-sim1(personas,n,r[i])
}
err<-abs(probs-dhyper(2,6,4,5))
plot(r,err,type="b")
return(err)
}

rs<-c(50,100,200,500,1000,2000,5000)
ropt(personas,5,rs)

MS Jaime Carlos Porras Cerrón 4


[email protected]
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento Académico de Estadística e Informática
Estadística Computacional

a) Definición Clásica de probabilidad (a priori)


Si un experimento aleatorio  tiene n  resultados “mutuamente excluyentes e
igualmente posibles”, y si n A de tales resultados están a favor de un evento A;
entonces, la probabilidad de ocurrencia del evento A es dada por:
n( A)
P( A) 
n()
Se dice que es a priori porque antes de realizarse el experimento ya se sabe cuál
es la probabilidad de que ocurra el evento A.

Ejemplo
Se tiene dos dados no cargados, si se lanzan los dados ¿cuál es la probabilidad
de que la suma de las caras superiores de los dados sea mayor a 8?
10
P ( A)   0.28
36

b) Definición de probabilidad a partir de frecuencias relativas (frecuencial)


Si un experimento aleatorio E se repite n veces bajo las mismas condiciones y
nA resultados están a favor de un evento A, la frecuencia relativa del evento es
frA=nA/n y la probabilidad del evento A es igual a:
nA
P( A)  lim frA  lim
n  n  n

Presente líneas de comandos en R que permita obtener dicho cálculo.


dado<-seq(1,6)
lanza1<-sample(dado,10000,replace=T)
lanza2<-sample(dado,10000,replace=T)
resul<-lanza1+lanza2
probas<-as.vector((table(resul>8)/10000)[2])

¿Cómo podría generalizar estas líneas de comandos en una función de tal


manera que el valor de los lanzamientos (r) lo defina Ud. inicialmente?

sim2<-function(r)
{
dado<-seq(1,6)
lanza1<-sample(dado,r,replace=T)
lanza2<-sample(dado,r,replace=T)
resul<-lanza1+lanza2
proba<-table(resul>8)/r
print(as.vector(proba[2]))}

set.seed(20)
sim2(1000)
[1] 0.276

Como va a apreciar en las siguientes funciones una aplicación de cálculo de


probabilidad y la determinación del valor óptimo de r se pueden razonar de
diferentes formas.

MS Jaime Carlos Porras Cerrón 5


[email protected]
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento Académico de Estadística e Informática
Estadística Computacional

Otra forma:
sim2<-function(r){
dado<-seq(1,6)
resul<-rep(0,r)
for(i in 1:r){
suma<-sum(sample(dado,2,T))
resul[i]<-ifelse(suma>8,1,0)
}
proba<-mean(resul)
return(proba)
}

Una pregunta que se puede hacer es ¿cuál es el valor óptimo de r?


repet<-function(r,pc,fun){
probas<-rep(0,length(r))
for(i in 1:length(r)){
probas[i]<-fun(r[i])
}
plot(r,probas,type="b")
abline(h=pc, col=2)
return(probas)
}

r<-c(10,30,100,200,500,1000)
repet(r,10/36,sim2)
0.35
0.30
probas

0.25
0.20

0 200 400 600 800 1000

c) Definición axiomática de probabilidad


Sea E un experimento aleatorio,  su espacio muestral asociado y A un evento
cualquiera de  . Un número real es P(A) llamado probabilidad de ocurrencia del
evento A, si satisface las siguientes condiciones:
 0  P( A)  1
 P()  1
 Si los eventos A1 , A2 , A3 ,, Ak son eventos mutuamente excluyentes, es decir
Ai  A j   i  j i, j  1,2, , k se cumple que:

 k  k
P  Ai    P( Ai )
 i 1  i 1

MS Jaime Carlos Porras Cerrón 6


[email protected]
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento Académico de Estadística e Informática
Estadística Computacional

Aplicaciones
 Un estudiante va a rendir un examen compuesto por una cierta cantidad “p” de
preguntas cada una de ellas con “a” alternativas, de las cuales solo una de ellas
es la respuesta correcta.
Un profesor tiene dos posibilidades:
Primera alternativa: Tomar un examen compuesto por p=10 preguntas con a=3,
por lo que cada pregunta vale dos puntos cada una.
Segunda alternativa: Tomar un examen compuesto por p=5 preguntas con a=5,
por lo que cada pregunta vale 4 puntos cada una.
Si Ud. es el estudiante que va a rendir el examen y no se ha preparado para
dicho examen ¿Cuál de las dos alternativas le conviene si solo quiere aprobar el
examen?
Elabore una función en R que le ayude a tomar una decisión.

 Un lote de tablets está compuesto por 10 artículos, de los cuales se sabe que 3
son defectuosos. Si un inspector selecciona al azar 5 artículos ¿Cuál es la
probabilidad de que 4 de dichos artículos sean no defectuosos?
Elabore una función de R que le permita calcular la probabilidad solicitada.

3. Variable Aleatoria
Definición
Es una función que tiene como dominio a un espacio muestral  y como rango
un subconjunto de los números reales.

Clases de variable aleatoria.


Las variables aleatorias se pueden clasificar según el rango que se genere en:
 Variables aleatorias discretas.
 Variables aleatorias continuas.

3.1 Variables Aleatorias Discretas (v.a.d.)


Son aquellas variables cuyo rango es un conjunto numerable; es decir, si con los
valores posibles que puede tomar la variable X se puede formar un conjunto con
un número finito de elementos, ó si este conjunto tiene infinitos elementos pero
es numerable.

Ejemplo:
Sea el experimento aleatorio E: Inspeccionar 3 artículos y observar si el artículo
se encuentra en perfectas condiciones (C) o si presenta alguna falla (F).
Si se define la variable aleatoria
X: Número de artículos en perfectas condiciones
Halle el dominio y rango de la variable aleatoria X.

Solución:
El espacio muestral asociado al experimento es:
  {(C, C, C ), (C, C, F ), (C, F , C ), ( F , C, C ), (C, F , F ), ( F , C, F ), ( F , F , C ), ( F , F , F )}
n()  8 .
La variable aleatoria X es una función con dominio  y rango un subconjunto de
los números reales Rx={0, 1, 2, 3}.

MS Jaime Carlos Porras Cerrón 7


[email protected]
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento Académico de Estadística e Informática
Estadística Computacional

Se tiene los siguientes valores:


Resultados de los elementos Resultado de la variable
del espacio muestral aleatoria X (Rango de X: RX )
(F , F , F ) X 0
(C, F , F ), ( F , C, F ), ( F , F , C ) X 1
(C, C, F ), (C, F , C ), ( F , C, C ) X 2
(C , C , C ) X 3

Se puede generar más de una variable aleatoria para un experimento aleatorio


y por lo tanto para un mismo espacio muestral  , por ejemplo, sea Y: Número
de artículos en perfectas condiciones menos número de artículos con fallas.
¿Cuál es el rango de Y?
RY:{-3, -1, 1, 3}

Función de Probabilidad de una variable aleatoria discreta


Sea X una variable aleatoria discreta (v.a.d.) que tiene como rango RX , se
denomina función f (x) (modelo o distribución) de probabilidad de la variable
aleatoria X, si a cada valor de RX se le asocia su probabilidad de ocurrencia, y
la función f ( x)  P( X  x) cumple con las siguientes condiciones:
a) 0  f ( xi )  1 xi  RX
b)  f (x )  1
x i R X
i

Para el ejemplo anterior, hallar la función de probabilidad de la v.a.d.


X: Número de artículos en perfectas condiciones.
f (0)  P( X  0)  P({F , F , F})  1/ 8
f (1)  P( X  1)  P({(C, F , F ), ( F , C, F ), ( F , F , C )})  3 / 8
f (2)  P( X  2)  ({(C, C, F ), (C, F , C ), ( F , C, C )})  3 / 8
f (3)  P  X  3  {(C, C, C )}  1/ 8

La función de probabilidad es:

X 0 1 2 3
P(X=x) 1/8 3/8 3/8 1/8

También puede ser escrita de la siguiente manera:


1 / 8 x  0
1 / 8 x  3 1 / 8 x  0, 3
 
f ( x)  3 / 8 x  1 ó f ( x)  3 / 8 x  1, 2
3 / 8 x  2 0 de otro modo
 
0 de otro modo

MS Jaime Carlos Porras Cerrón 8


[email protected]
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento Académico de Estadística e Informática
Estadística Computacional

Una función en R que permita obtener la función de probabilidad anterior es:


sim3<-function(r)
{
articulo<-c(0,1)
resultados<-matrix(0,r,3)
for(i in 1:r)
{
resultados[i,]<-sample(articulo,3,replace=T)
}
dis<-apply(resultados,1,sum)
fp<-table(dis)/r
print(fp)
}

Generalización para n artículos


sim4<-function(n,r)
{
articulo<-c(0,1)
resultados<-rep(0,r)
for(i in 1:r)
{
resultados[i]<-sum(sample(articulo,n,replace=T))
}
fp<-table(resultados)/r
return(fp)
}

Aplicación
Elabore una función en R que permita obtener la función de probabilidad de la
variable aleatoria Y: Número de artículos en perfectas condiciones menos
número de artículos con fallas

Ejemplo:
Un experimento aleatorio consiste en lanzar al mismo tiempo dos dados no
cargados. Sea la variable aleatoria:
X: Número mayor que aparece en la cara superior de los dos dados.

Solución:
Dado el experimento anterior se puede definir su función de probabilidad de la
siguiente manera:

X 1 2 3 4 5 6

P(X=x) 1/36 3/36 5/36 7/36 9/36 11/36

P(X=x) 0.028 0.083 0.139 0.194 0.250 0.306

MS Jaime Carlos Porras Cerrón 9


[email protected]
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento Académico de Estadística e Informática
Estadística Computacional

D A D O 1
1 2 3 4 5 6

1
D (1,1) (2,1) (3,1) (4,1) (5,1) (6,1)

A 2 (1,2) (2,2) (3,2) (4,2) (5,2) (6,2)

D 3 (1,3) (2,3) (3,3) (4,3) (5,3) (6,3)

O 4 (1,4) (2,4) (3,4) (4,4) (5,4) (6,4)


5 (1,5) (2,5) (3,5) (4,5) (5,5) (6,5)

2 6 (1,6) (2,6) (3,6) (4,6) (5,6) (6,6)

Una aplicación en R que permita obtener la función de probabilidad anterior seria


la siguiente:

sim5<-function(lanza)
{
dado1<-sample(1:6,lanza,replace=T)
dado2<-sample(1:6,lanza,replace=T)
dados<-cbind(dado1,dado2) #une dos columnas
máximo<-apply(dados,1,max) #se obtiene el máximo por filas
distrib<-table(maximo)/lanza
print(distrib)
}

Otra forma
sim6<-function(r)
{
dado<-seq(1,6)
lanza<-matrix(0,r,2)
for (i in 1:r)
{
lanza[i,]<-sample(dado,2,replace=TRUE)
}
resul<-apply(lanza,1,max)
dis<-table(resul)/r
print(dis)
}

MS Jaime Carlos Porras Cerrón 10


[email protected]
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento Académico de Estadística e Informática
Estadística Computacional

3.2 Variables Aleatorias Continuas (v.a.c.)


Una variable aleatoria X es una variable aleatoria continua si el número infinito
no numerable o cuando el rango de X  RX  es un intervalo de los números
reales.

Ejemplo:
Sea X la variable aleatoria que representa la longitud de una varilla de acero
obtenida de la línea de producción de un fabricante.
La variable aleatoria X es continua pues su rango son todos los puntos de un
intervalo, por ejemplo RX = [ 3.5, 3.9 ] pulgadas.

Función de densidad de una variable aleatoria continua


Sea una v.a.c. X con rango RX , la función de densidad de probabilidades
asociada a la variable aleatoria continua X, es una función de densidad f  x 
integrable si satisface lo siguiente:
a) f ( x)  0 para todo X   ,  

b) 
f ( x)dx  1

4. Generación de Números Pseudoaleatorios


Principales Distribuciones
Nombre Notación Esperado Varianza
Binomial X~B(n,) n n(1-)
Hipergeométrica X~H(N,n,A) nA/N nA(1-A/N)(N-n)/(N(N-1))
Poisson X~P()  
Uniforme X~U(a,b) (a+b)/2 (b-a)2/12
Gamma X~G(k,) k k2
Exponencial X~E()  2
Normal X~N(,)  
Ji-Cuadrado 2
X~ n n 2n
T-Student X~tn 0 n/(n-2)
Beta X~B(a,b) a/(a+b) ab/(a+b)2(a+b+1)

Distribución Bernoulli
Sea X una vad que tiene la siguiente función de probabilidad
 x (1   )1 x x  0,1
P( X  x )  
 0 c.c.

Si se desea generar n números pseudoaleatorios de una variable aleatoria


X~Bernoulli(), un algoritmo sería el siguiente:
Generar U~U(0,1)
Si U  1 - , salir X = 1
En caso contrario, salir X = 0

MS Jaime Carlos Porras Cerrón 11


[email protected]
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento Académico de Estadística e Informática
Estadística Computacional

npber<-function(n,theta){
uni<-runif(n)
resul<-ifelse(uni>=1-theta,1,0)
return(resul)
}

npber(10,0.6)

Distribución Binomial
Sea X una vad que tiene la siguiente función de probabilidad
 r  x
   (1   )
rx
x  0,1,2 r
P ( X  x )   x 

 0 c.c.
Una variable aleatoria X con distribución binomial B(r,) puede describirse como
la suma de r pruebas independientes Bernoulli. Así, se tiene una forma de
muestreo generando r números aleatorios U1,..,Ur ~ U(0,1) y haciendo X igual al
número de ellos que son menores que p. El algoritmo seria entonces
Hacer X = 0
Desde i=1 hasta r
Generar U~ U(0,1)
Si U<p hacer X = X+1
Salir X

npbin<-function(n,r,theta){
resul<-rep(0,n)
for (i in 1:n){
uni<-runif(r)
resul[i]<-sum(ifelse(uni>=1-theta,1,0))
}
return(resul)
}

npbin(10,4,0.6)

Distribución Normal
Sea X una vac que tiene la siguiente función de probabilidad
1  x 
2

1   
2  
f ( x)  e   x  
2 
Un procedimiento denominado la suma de doce uniformes se basa en el
Teorema Central de Límite (TCL). Si las variables Ui, i=1,2,…,m son i.i.d. U(0,1),
con lo que E(Ui) = 1/2 , Var(Ui) = 1/12, por el TCL la variable aleatoria:

MS Jaime Carlos Porras Cerrón 12


[email protected]
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento Académico de Estadística e Informática
Estadística Computacional

𝑚
∑𝑚
𝑖=1 𝑈𝑖 −
𝑋= 2
√m⁄12

Se distribuye aproximadamente como una normal estándar, para n


suficientemente grande. Donde m es la cantidad de uniformes que se deben
generar.
Una buena aproximación se tiene ya para n=12, con lo que X toma
𝑋 = ∑12𝑖=1 𝑈𝑖 − 6 y el procedimiento quedaría:

Generar U1,…,U12 ~ U(0,1)


Hacer 𝑋 = ∑12
𝑖=1 𝑈𝑖 − 6
Salir X

npne<-function(n){
resul<-rep(0,n)
for (i in 1:n){
uni<-runif(12)
resul[i]<-sum(uni)-6
}
return(resul)
}

set.seed(10)
dat1<-npne(50)
shapiro.test(dat1)

Si deseamos generar valores aleatorios Y~N(,), bastaría hacer la


transformación Y =  + X
npn<-function(n,mu,sigm){
resul<-rep(0,n)
for (i in 1:n){
uni<-runif(12)
resul[i]<-sum(uni)-6
Y<-mu+resul*sigm
}
return(Y)
}

set.seed(20)
dat2<-npn(40,5,2)

Aplicación:
Genere 50 muestras de tamaños (20, 50 y 200) provenientes de una distribución
exponencial con media 5 y compare la potencia de las pruebas de Anderson
Darling y Shapiro Wilk.

library(nortest)

MS Jaime Carlos Porras Cerrón 13


[email protected]
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento Académico de Estadística e Informática
Estadística Computacional

sim7<-function(r,n){
p1<-rep(0,r)
p2<-rep(0,r)
for (i in 1:r){
datos<-rexp(n,1/3)
p1[i]<-shapiro.test(datos)$p.val
p2[i]<-ad.test(datos)$p.val
}
r1<-mean(ifelse(p1<0.05,1,0))
r2<-mean(ifelse(p2<0.05,1,0))
return(list(r1=r1,r2=r2))
}

set.seed(30)
sim3(500,15)

5. Función de distribución Acumulada


La función de distribución acumulada de una variable aleatoria X, denotada por
FX(x), es una función, definida por la regla de correspondencia
F  x   P  X  x  x 

En otras palabras, FX(x) denota la probabilidad de que la variable aleatoria X


toma valores menores o iguales a x.

Por ejemplo
Si X~Exp() tiene función de densidad de probabilidad:
0 x0
FX(x)=e-x x>0 , entonces su FX(x) es igual a FX ( x)    x
1  e x0

La gráfica de la función de distribución acumulada X~Exp(10)


x<-0:100
px<-pexp(x,1/10)
plot(x,px,type="l")

MS Jaime Carlos Porras Cerrón 14


[email protected]
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento Académico de Estadística e Informática
Estadística Computacional

Propiedades de distribución acumulada


 FX(x) es una función no decreciente, esto es, si para todo x1, x2  con x1 ≤ x2,
F  x1   F  x2  .
 F  x  es una función continua por la derecha, esto es
lim F  x   F  x0 
x  x0

 lim F  x   0 y lim F  x   1 . Luego se de escribir: F     0 y F     1.


x  x 

 Para todo a, b  con a < b, tenemos:


P  a  x  b  P  x  b  P  x  a   F  b   F  a 
 Para todo b  se tiene:
P  x  b  1  P  x  b  1  F b 

6. Distribución Acumulada Empírica de la m.a


Un concepto de gran importancia en el planteamiento de la Inferencia Estadística
es el de función de distribución empírica de la muestra, definida en una muestra
de tamaño n como:
F n  xi   i
^ n
n

siendo ni el número de observaciones muestrales menores o iguales que xi es


decir, la frecuencia acumulada. Esta función presenta tantos saltos como valores
1
muestrales distintos haya, siendo la cuantía del salto cuando no se repite el
n
n
valor xi , y i cuando xi se repite ni veces, lo que indica que la función de
n
distribución empírica es siempre discreta.

Ejemplo:
Los tiempos (en minutos) de un proceso computacional realizado por 5
computadoras fueron: 2.3;1.2; 4.5;3.1; 2.3
Ordenando las observaciones se tiene: 1.2, 2.3, 2.3 3.1, 4.5
i= 1, 2,3, 4, 5

X: Tiempo de ^ ni
F n ( xi ) 
procesamiento n
xi<1.2 0.0
xi1.2 0.2
xi 2.3 0.6
xi 3.1 0.8
xi <4.5 1.0

MS Jaime Carlos Porras Cerrón 15


[email protected]
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento Académico de Estadística e Informática
Estadística Computacional

datos<-c(2.3,1.2,4.5,3.1,2.3)
plot.ecdf(datos)
#lee los datos
fdae<-ecdf(datos)
#brinda la probabilidad de la fdae para cada dato
pfdae<-sort(fdae(datos))

ecdf(x)
0.0 0.2 0.4 0.6 0.8 1.0
Fn(x)

0 1 2 3 4 5

Lo que realmente confiere a las muestras aleatorias toda su potencialidad


inductiva, es que la función de distribución empírica converge en probabilidad a
la función de distribución poblacional (teorema de Glivenko-Cantelli, denominado
teorema fundamental de la Estadística) implicando que las características
muestrales, bajo condiciones generales, convergen en probabilidad a las
correspondientes poblacionales.

Ejemplo:
Comparar gráficamente la verdadera distribución acumulada de la curva normal
estándar con la distribución empírica usando muestras aleatorias de tamaños
5,10 y 100.

# Generando los 3 conjuntos de datos


datos1<-rnorm(10)
datos2<-rnorm(50)
datos3<-rnorm(100)

sim7<-function(datos)
{
plot.ecdf(datos)
points(sort(datos),pnorm(sort(datos)),type="l")
}

¿Cómo realizaría Ud. la anterior simulación, pero ahora utilizando datos


provenientes de una distribución exponencial?

MS Jaime Carlos Porras Cerrón 16


[email protected]
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento Académico de Estadística e Informática
Estadística Computacional
# Generando los 3 conjuntos de datos
datos4<-rexp(100)
sim8<-function(datos)
{
plot.ecdf(datos)
points(sort(datos),pexp(sort(datos)),type="l")
}

simu9<-function(n,fun,...)
{
datos<-round(fun(n,...),1)
plot.ecdf(datos)
points(sort(datos),pnorm(sort(datos),mean(datos),sd(datos))
,type="l")
}
par(mfrow=c(2,2))
simul4(10,rexp,1/5)
simul4(40,rexp,1/5)
simul4(100,rexp,1/5)
simul4(1000,rexp,1/5)

Propiedades de la distribución Acumulada Empírica


^
 F n ( x ) es creciente de 0 a 1.
^
 F n ( x ) es escalonada con saltos en los distintos valores de X1,X2,…,Xn.
 El valor esperado de la función de distribución empírica coincide con el
verdadero valor de la distribución E  F n x   F x 
^

 
^
 La varianza de F n ( x ) converge a cero a medida que el tamaño muestral
F x 1  F x 
tiende a infinito V  F n x  
^
.
  n
^
 F n ( x )  F ( x ) cuando n   (consecuencia del Teorema de Glivenko
Cantelli).

7. El Método de estimación por sustitución (“plug in”)


El principio plug-in es un simple método de estimación de parámetros a partir de
la muestra. El estimador plug-in de un parámetro   t (F ) es definido por:
^ ^
  t( F )
En otras palabras, nosotros estimamos la función   t (F ) de la distribución de
^
probabilidad F mediante la misma función de la distribución empírica F .
El principio plug-in no es bueno en situaciones donde se conoce información
adicional sobre F, información que no proviene de la muestra x.

MS Jaime Carlos Porras Cerrón 17


[email protected]
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento Académico de Estadística e Informática
Estadística Computacional

8. Muestra Aleatoria
Se dice que un conjunto de n variables aleatorias (v.a.) X 1 , X 2 , ..., X n forman una
muestra aleatoria (m.a.) de tamaño n seleccionada de la población en estudio, si
verifica las siguientes relaciones entre sus elementos:
a) Las v.a. X 1 , X 2 , ..., X n son independientes. Es decir, F(x1,…,xn)=F(x1)F(x2)F(xn)
b) Todas las v.a. X i tienen la misma distribución de probabilidad, esto es:
FX i  x   FX  x   P  X  x  i  1, 2, ,n .

Es decir, las v.a. X i i  1, 2, , n son independientes e idénticamente distribuidas


(i.i.d.) con la misma distribución de probabilidad que tenga la población.
 Si el muestreo es con reemplazo o de una población infinita (conceptual), las
condiciones a) y b) se satisfacen exactamente.
 Si la selección es sin reemplazo la condición de independencia no se cumple.
A esta muestra se la refiere como muestra aleatoria simple.

La parte fundamental de la definición de la m.a. es el significado de las variables


aleatorias X 1 , X 2 , ..., X n . La variable aleatoria X i de la muestra denota el valor
numérico del i-ésimo elemento muestreado. Después que la muestra ha sido
seleccionada, los valores actuales de X 1 , X 2 , ..., X n son conocidos y usualmente
estos valores se denotan por x1 , ..., xn .

9. Distribuciones Muestrales
Es la distribución de probabilidad de una estadística, la cual se genera a partir
de todas las posibles muestras de tamaño fijado, elegidas al azar de una
población determinada.
En el caso de una población seria todas las muestras de tamaño n, para generar
la distribución de X , S 2 , p , etc.
En el caso de dos poblaciones independientes, todas las muestras de tamaño n1
de la primera población con todas las muestras de tamaño n2 de la segunda
población, para generar la distribución de X 1  X 2 , p1  p2 , S12 S 22 .
En el caso de dos poblaciones dependientes, todas las muestras de tamaño n
de la diferencia Di  X i  Yi , para generar la distribución de X D .
Esquemáticamente tendríamos el siguiente procedimiento:

T1=t1(x1,x2,…,xn fT(t)
)
P
T2=t2(x1,x2,…,xn
)
θ
… θ t
Tb=tb(x1,x2,…,xn
)
MS Jaime Carlos Porras Cerrón 18
[email protected]
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento Académico de Estadística e Informática
Estadística Computacional

 Una población P, con cierto parámetro de interés.


 Todas las b muestras elegidas de la población de acuerdo a cierto
procedimiento (con o sin reemplazo).
 Para cada muestra, se calcula el valor t de la estadística T.
 Los valores de t forman una nueva población, cuya distribución recibe el
nombre de distribución muestral de T.

Cuando la población es infinita, tenemos que concebir la distribución muestral


como una distribución muestral teórica, pues es imposible extraer todas las
muestras aleatorias posibles.
Cuando la población es finita y de tamaño moderado, podemos construir una
distribución muestral experimental, seleccionando todas las muestras
aleatorias posibles de un tamaño dado, calculando para cada muestra el valor
de la estadística junto con su probabilidad de ocurrencia.

En general, cuando estudiamos una distribución muestral, estamos interesados


en conocer las siguientes características:
 Su forma funcional (representación gráfica de su función de densidad)
 Su media T
 Su desviación estándar T

9.1 Distribución muestral de la media


Es la distribución que se forma con los promedios muestrales que se obtienen
de cada una de las muestras posibles de tamaño n que se puede extraer de una
población de tamaño N .

Teorema
Si de una población P de tamaño N con media  X y varianza  X2 , se extraen
todas las m.a. posibles X 1 , X 2 , ..., X n de tamaño n y para cada una de ellas se
calcula el promedio, entonces:

 Si el muestreo es con reemplazo de una población finita o sin reemplazo de


una población infinita, se cumple que:
 X2
E  X   X  X y Var  X    X2 
n

 Si el muestreo es sin reemplazo de una población de tamaño N, se cumple


que:
 X2  N  n 
E  X   X  X y Var  X    
2
 
X
n  N 1 

 N n
  se conoce como factor de corrección de población finita (fcpf).
 N 1 

MS Jaime Carlos Porras Cerrón 19


[email protected]
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento Académico de Estadística e Informática
Estadística Computacional

En el caso que el muestreo es sin reemplazo y si el tamaño de la población es


N n n
grande, entonces el f.c.p.f. puede ser expresado por  1   1  f . Donde
N N
f es conocida como la fracción de muestreo

Distribución de la media o promedio muestral cuando la variable en análisis


tiene una Distribución Normal
Teorema
Si X 1 , X 2 , ..., X n es una muestra aleatoria de tamaño n, donde X i es extraída de
una distribución normal con media  X y varianza  X2 ; entonces la variable
aleatoria X tiene una distribución normal con media  X y varianza  X (donde
2

la varianza de X depende, del tipo de muestreo es decir si es multiplicado o no


por el factor de corrección de población finita)


Es decir, si X ~ N  X ,  X
2
 
X ~ N  X ,  X2 

Distribución de la media o promedio muestral, cuando la variable en


análisis no tiene una distribución normal.
Teorema Central del Límite
Si X 1 , X 2 , ..., X n es una muestra aleatoria de una distribución (distinta a la
distribución normal) con media  X y varianza  X2 , entonces, para n
suficientemente grande (n ≥ 30) X tiene una distribución aproximadamente
normal con media  X y varianza  X (donde la varianza de X depende del tipo
2

de muestreo para que pueda ser multiplicado por el factor de corrección de


población finita).


Es decir, si X ~ ?  X ,  X
2
 y se extrae una muestra n (donde n  30 ) 
X ~ N (  X ,  X2 )
a

dmm.cr<-function(datos,r,n)
{
N<-length(datos)
mu<-mean(datos)
sigma2<-((N-1)/N)*var(datos)
medias<-rep(0,r)
for (i in 1:r)
{
medias[i]<-mean(sample(datos,n,T))
}
xbar<-mean(medias)
sigma2.xbar=((r-1)/r)*var(medias)
media<-c(mu,xbar)

MS Jaime Carlos Porras Cerrón 20


[email protected]
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento Académico de Estadística e Informática
Estadística Computacional
varianzas<-c((sigma2/n),sigma2.xbar)
par(mfrow=c(1,2))
hist(datos)
hist(medias)
print(media)
print(varianzas)
}

set.seed(10)
datos1<-rnorm(300,2,1)
dmm.cr(datos1,100,15)

Histogram of datos Histogram of medias

20
0 10 20 30 40 50

15
Frequency

Frequency

10
5
0

0 2 4 1.4 2.0

datos medias

[1] 1.932413 1.912274


[1] 0.06131913 0.05589683

set.seed(20)
datos2<-rexp(200,1/5)
dmm.cr(datos2,100,55)

Histogram of datos Histogram of medias


5 10 15 20 25 30
0 20 40 60 80 100
Frequency

Frequency

0 20 40 3 5 7

datos medias

MS Jaime Carlos Porras Cerrón 21


[email protected]
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento Académico de Estadística e Informática
Estadística Computacional

[1] 5.081479 5.065635


[1] 0.6164821 0.5963856

La función elaborada en R permite analizar el concepto de distribución muestral


de una media para el caso con reemplazo o población finita y permite analizar
los dos casos cuando X proviene de una distribución normal y cuando X proviene
de una distribución distinta a la normal.
Note que los resultados no coinciden principalmente por dos razones:
 No se han considerado todas las muestras posibles de tamaño n
proveniente de una población de tamaño N.
 No necesariamente las muestras consideradas son diferentes.

9.2 Distribución de la diferencia de promedios muestrales X 1  X 2  


Teorema
Si de dos poblaciones independientes distribuidas con medias 1 , 2 y
variancias  12 ,  22 se extraen muestras de tamaños n1 y n2 , respectivamente;
 
entonces, la variable aleatoria X 1  X 2 (diferencia de promedios muestrales)
tendrá una distribución con media  X 1  X 2 y varianza  2 (según el tipo de
X 1 X 2

muestreo):

 Si las muestras son aleatorias (con reemplazo) de poblaciones normales o se


cumple con el Teorema Central del Límite  n1  30 y n2  30  con otro tipo de
distribución.
 12  22
X 1X 2
 1  2 y  X2 1  X 2  
n1 n2
 Si las muestras son aleatorias simples (sin reemplazo) de poblaciones de
tamaños N1 y N2 normales o se cumple el Teorema Central del Límite:
2  N n  2  N n 
 X 1  X 2  1  2 y  X2 1  X 2  1  1 1   2  2 2 
n1  N1  1  n2  N 2  1 
Por lo tanto, si:
  ó X ~ ?   ,   X ~ N   , 
X1 ~ N  1 , 12   X 1 ~ N  X 1 ,  2X
1
1 1
2
1 1
a X1
2
X1

X2 ~ N   ,   X ~ N   ,  ó X ~ ?   ,   X ~ N   , 
2
2
2 2
X 2
2
2 2
2
2 2
X 2
2
X2 a X2

X1  X ~ N 
2 ,
X 1X  ó X  X ~ N   , 
2
2
X 1X 2
1 2
X 1X 2
2
X 1X 2
a

dmm.cr<-function(pobla1,pobla2,n1,n2,r)
{
N1<-length(pobla1)
N2<-length(pobla2)
mu1<-mean(pobla1)
mu2<-mean(pobla2)
sigma21<-((N1-1)/N1)*var(pobla1)
sigma22<-((N2-1)/N2)*var(pobla2)

MS Jaime Carlos Porras Cerrón 22


[email protected]
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento Académico de Estadística e Informática
Estadística Computacional
dif<-rep(0,r)
for (i in 1:r)
{
dif[i]<-mean(sample(pobla1,n1,T))-mean(sample(pobla2,n2,T))
}
xbar<-mean(dif)
sigma2.xbar<-((r-1)/r)*var(dif)
media<-c(mu1-mu2,xbar)
varianzas<-c((sigma21/n1+sigma22/n2),sigma2.xbar)
par(mfrow=c(1,3))
hist(pobla1)
hist(pobla2)
hist(dif)
print(media)
print(varianzas)
}

set.seed(10)
datos1<-rnorm(80,3,1)
datos2<-rnorm(100,4,2)
dmm.cr(datos1,datos2,16,24,100)

[1] -1.225726 -1.317468


[1] 0.2047775 0.1865044

Histogram of pobla1 Histogram of pobla2 Histogram of dif


50
15

20

40
15

30
Frequency

Frequency

Frequency
10

10

20
5

10
0

1 3 5 0 4 8 -2.5 -1.0

pobla1 pobla2 dif

MS Jaime Carlos Porras Cerrón 23


[email protected]
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento Académico de Estadística e Informática
Estadística Computacional

9.3 Distribución de la proporción muestral  p 


Aproximación Normal a la distribución de proporción muestral.
Cuando n es grande (por lo general, n  30), la variable aleatoria p se aproxima
a una distribución normal. Esto resulta de aplicar el Teorema Central del Límite
Por lo tanto, si p ~ f ( p) y n  30  p ~ N   p ,  p2 
a
Donde:
 p   y  p2 depende del tipo de muestreo forma de extracción de la muestra.
 Cuando el muestreo es con reemplazo o el tamaño de la población N es
grande se define como:
 (1   )
 2p 
n
 Cuando el muestreo es sin reemplazo o el tamaño de la muestra es finita se
define como:
 (1   )  N  n 
 p2   
n  N 1 

9.4 Distribución de la diferencia de Proporciones Muestrales  p1  p2 


Sean 1 y  2 las proporciones de éxitos (que poseen la característica de interés)
de dos poblaciones independientes N1 y N2 . De la primera población se extraen
muestras aleatorias de tamaño n1 y de la segunda población muestras aleatorias
de tamaño n2 . Sean p1 y p2 las proporciones de las muestras extraídas de la
primera y segunda población respectivamente. Luego, la diferencia de
proporciones muestrales p  p1  p2 tendrá una distribución con media
 p   1   2 y varianza  2p (la cual depende del tipo de muestreo y del tamaño
de las poblaciones)
 Cuando el muestreo es con reemplazo o los tamaños de las poblaciones N1
y N2 son grandes entonces:
1 (1  1 )  2 (1   2 )
 2p  
n1 n2

 Cuando el muestreo es sin reemplazo o los tamaños de las poblaciones N1 y


N2 son finitos entonces:
1 (1  1 )  N1  n1   2 (1   2 )  N 2  n2 
 2p     
n1  1
N  1  n2  N2 1 

MS Jaime Carlos Porras Cerrón 24


[email protected]
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento Académico de Estadística e Informática
Estadística Computacional

Ejercicios Resueltos y Propuestos

1. Se venden 1000 boletos para un sorteo en el que hay un premio mayor de S/.500,
cuatro premios de S/.100 y cinco premios de S/.10. Se sabe que el boleto cuesta
S/.5. Elabore una función en R que permita simular la función de probabilidad de
la variable aleatoria X: Ganancia neta al comprar el boleto.

ganancia<-function(r){
gana<-c(rep(500-5,1),rep(100-5,4),rep(10-5,5),rep(0-5,990))
bc<-rep(0,r)
for(i in 1:r)
{
bc[i]<-sample(gana,1,replace=T)
}
Fp<-table(bc)/r
print(fp)
}

ganancia(10000)

2. Se tiene una urna con 12 esferas numeradas del 1 al 12. Se saca tres esferas y
se define la variable aleatoria X: Número de esferas divisibles por 2. Elabore una
función en R que permita simular la función de probabilidad de la variable
aleatoria X.

esferas<-function(r){
urna<-seq(1:12)
m<-matrix(0,r,3)
for(i in 1:r){
m[i,]<-sample(urna,3,replace=F)
}
for(i in 1:r)
{
for(j in 1:3)
{
if(m[i,j]%%2==0){
m[i,j]=1
}
else{
m[i,j]=0
}
}
}
x<-apply(m,1,sum)
fp<-table(x)/r
print(fp)
}

esferas(1000)

MS Jaime Carlos Porras Cerrón 25


[email protected]
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento Académico de Estadística e Informática
Estadística Computacional

3. Elabore una función en R que permita simular la siguiente definición:


Sean 1 y  2 las proporciones de éxitos (que poseen la característica de interés)
de dos poblaciones independientes N1 y N2 . Si de la primera población se
extraen muestras aleatorias sin reemplazo de tamaño n1 y de la segunda
población muestras aleatorias sin reemplazo de tamaño n2 y se definen p1 y p2
como las proporciones de las muestras extraídas de la primera y segunda
población respectivamente, entonces.
La diferencia de proporciones muestrales p  p1  p2 tendrá una distribución
con:
 p   1   2 1 (1  1 )  N1  n1   2 (1   2 )  N 2  n2 
y  2p     
n1  1
N  1  n2  N2 1 
dif.prop<-function(d1,d2,n1,n2,r){
N1<-length(d1)
N2<-length(d2)
pi1<-sum(d1)/N1
pi2<-sum(d2)/N2
mu<-(pi1-pi2)
fcpf1<-(N1-n1)/(N1-1)
fcpf2<-(N2-n2)/(N2-1)
sigma2<-(pi1*(1-pi1)/n1)*fcpf1+(pi2*(1-pi2)/n2)*fcpf2
muestras<-rep(0,r)
for(i in 1:r){
p1<-sum(sample(d1,n1,replace=F))/n1
p2<-sum(sample(d2,n2,replace=F))/n2
muestras[i]=p1-p2
}
media<-mean(muestras)
varianza<-var(muestras)*(r-1)/r
medias<-c(mu,media)
varianzas<-c(sigma2,varianza)
print(medias)
print(varianzas)
}

d1=c(1,1,0,0,1,0,0,1,0)
d2=c(0,0,0,0,1,0,1,0,0,1,0,1,1,0)
dif.prop(d1,d2,3,4,10000)

4. Sea X una variable aleatoria que se considera como el beneficio de un jugador,


en un juego en el que se tira un dado y el jugador gana 100 soles, si sale los
números 1 ó 3, no gana ni pierde si sale los números 2 ó 5, pierde 100 soles si
sale 4 ó 6.
a) Elabore una función en R que permita simular la función de probabilidad del
beneficio del jugador.
b) Obtenga el error absoluto de estimación para el segundo valor de la variable X,
utilice r=500 y anteponga a su función set.seed(55)

MS Jaime Carlos Porras Cerrón 26


[email protected]
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento Académico de Estadística e Informática
Estadística Computacional

5. Hay 10 estudiantes inscritos en una clase de estadística, de entre los cuales 3


tienen 19 años, 4 tienen 20, 1 tiene 21, 1 tiene 24 y 1 tiene 26 años. De esta
clase se seleccionan dos estudiantes al azar sin reemplazo. Sea X la edad
promedio de los 2 estudiantes seleccionados.
a) Elabore una función en R que permita simular la función de probabilidad de X.
b) Obtenga la probabilidad mediante simulación, para el tercer valor de X, utilice
r=800 y anteponga a su función set.seed(55)
6. Un determinado antibiótico se envía a las farmacias en cajas de 24 botellas. El
farmacéutico sospecha que la cantidad de antibiótico en algunos frascos es
deficiente y decide analizar el contenido de 5 frascos. Suponga que 10 de las 24
botellas tienen cantidad deficiente de antibióticos.
a) Elabore una función en R que permita simular la función de probabilidad de la
variable X: Número de frascos con cantidad deficiente de antibióticos.
b) Estime la probabilidad mediante simulación para el primer valor de X, utilice
r=1000 y anteponga a su función set.seed(75)

7. Una urna contiene 10 esferas numeradas del 1 al 10, luego de ser mezcladas se
extraen dos esferas sin reemplazo y se define la variable aleatoria X=Rango
obtenido (máximo –mínimo).
a) Elabore una función en R que permita simular la función de probabilidad de la
variable aleatoria X.
b) Obtenga la probabilidad simulada para el cuarto valor de la variable X para r=900.
Anteponga set.seed(15)

8. Una caja contiene 8 esferas negras, 6 esferas blancas y 10 esferas rojas. Luego
de ser mezcladas, se extraen 4 esferas de dicha caja, una por una y con
reemplazo. Se define la variable aleatoria Y: Número de esferas rojas extraídas.
a) Elabore una función en R que permita simular la función de probabilidad de la
variable aleatoria Y.
b) Obtenga el error absoluto de estimación para el quinto valor de la variable Y,
utilice r=700 y anteponga a su función set.seed(16)

MS Jaime Carlos Porras Cerrón 27


[email protected]

También podría gustarte