Universidad Nacional Agraria La Molina: Estadística Computacional

Descargar como pptx, pdf o txt
Descargar como pptx, pdf o txt
Está en la página 1de 23

UNIVERSIDAD NACIONAL AGRARIA LA

MOLINA
Departamento Académico de
Estadística e Informática

Estadística Computacional

Dr. Jaime Porras Cerrón


“My thesis is simply this:
probability does not exist”

Bruno de Finetti
(1906-1985)
Contenido
Unidad I:
Conceptos Preliminares
1. Experimento Aleatorio
2. Espacio muestral
3. Evento
4. Probabilidad
5. Variables Aleatorias
6. Función de probabilidad
7. Aplicaciones
8. Simulación de números pseudoaleatorios
9. Algoritmos de generación de números
pseudoaleatorios normales
10. Simulación de Montecarlo
11. Ejercicios
1. Experimento Aleatorio ()
Es una operación o acto cuyo resultado no se
puede predecir con certeza y que se realiza bajo
los siguientes criterios:
 Puede ser repetido bajo las mismas condiciones.
 Se puede describir el número de resultados posibles.
 Se puede establecer un modelo matemático asociado a
.
Ejemplo:
1 : Lanzar una moneda y observar el valor de la cara
superior.
2: Lanzar dos dados.
2.Espacio muestral ()
Es el conjunto de todos los resultados
posibles de un experimento aleatorio . Cada
elemento del espacio muestral se le
denomina punto muestral y lo denotaremos
con 
El espacio muestral se denota con la letra .
Ejemplo:
El espacio muestral asociado al experimento
anterior es:
1={cara, sello}
2={(1,1),(1,2),…,(5,6),(6,6)}
3. Evento
Es cualquier subconjunto del espacio muestral. Los
eventos se identifican mediante letras mayúsculas.
Ejemplo:
Sea el experimento aleatorio
1 : Lanzar 2 dados y observar el valor obtenido en la
cara superior de los dados.
Se define el evento A
A: La suma de los valores obtenidos es mayor a 8.

¿Cuántos elementos del espacio muestral cumplen con


la condición del evento A?
Si en lugar de lanzar dos dados se lanzan tres dados
cuantos elementos cumplirían con la condición del
evento A.
4. Probabilidad
Es un número real que expresa la confianza o
incertidumbre en la ocurrencia de un suceso o
evento cuyo resultado no se puede predecir
con certeza.
Ejemplo:
¿Cuál es la probabilidad de que al lanzar dos
dados la suma de los números obtenidos en la
cara superior sea mayor a 8?
Mediante simulación ¿Qué cantidad de
repeticiones es la óptima?

Existen diferentes definiciones de probabilidad


 Definición subjetiva. n( A)
P( A) 
 Definición clásica de probabilidad n ( )
4. Probabilidad
 Definición a partir de frecuencias relativas
nA
P ( A)  lim frA  lim
n  n  n

 Definición axiomática
Sea E un experimento aleatorio,  su espacio muestral
asociado y A un evento cualquiera de E. Un número real
P(A)es llamado probabilidad de ocurrencia del evento A, si
satisface
0  P ( A)las
1 siguientes condiciones:
P ( )  1
A1 , A2 , A3 ,  , Ak
Ai  A j   i  j i, j  1,2,  , k
Si los eventos son eventos mutuamente
excluyentes, es decir k se cumple
  k
que: P Ai    P ( Ai )
 i 1  i 1
5. Variables Aleatorias (VA)

Sea  un experimento aleatorio y  su espacio


muestral asociado a este experimento. Una
función X:    tal que a cada elemento
   le asocia un número real x=X()
El dominio de la VA X es todo  y el rango es
un subconjunto de  que denotaremos como
Rx.

Una variable aleatoria puede ser discreta


(VAD) o continua (VAC) de acuerdo al rango de
valores que se puedan obtener.
6. Función de Probabilidad de una VAD:

Sea X una variable aleatoria discreta (VAD)


que tiene rango Rx , se denomina función
(f(x)) de probabilidad de la variable aleatoria
X, si tiene como dominio a Rx y como rango a
un número finito o infinito numerable de
resultados posibles que cumple con las
siguientes condiciones:

f ( xi )  0 xi  RX

 f (x )  1
x i R X
i
7. Aplicaciones
Ejemplo 1:
Un experimento
aleatorio consiste en
D A D O 1
lanzar al mismo tiempo 1 2 3 4 5 6
dos dados no cargados.
D 1 (1,1) (2,1) (3,1) (4,1) (5,1) (6,1)
Sea la variable
aleatoria A 2 (1,2) (2,2) (3,2) (4,2) (5,2) (6,2)

X: Número mayor que D 3 (1,3) (2,3) (3,3) (4,3) (5,3) (6,3)


aparece en la cara
superior de los dos
O 4 (1,4) (2,4) (3,4) (4,4) (5,4) (6,4)

dados. 5 (1,5) (2,5) (3,5) (4,5) (5,5) (6,5)

2 6 (1,6) (2,6) (3,6) (4,6) (5,6) (6,6)

Rx={1,2,3,4,5,6}
7. Aplicaciones
Dado el experimento anterior se puede definir
su función de probabilidad de la siguiente
manera:

X 1 2 3 4 5 6
P(X=x) 1/36 3/36 5/36 7/36 9/36 11/36
Teóricos
P(X=x) 0.028 0.083 0.139 0.194 0.250 0.306
Simulado
s

 2x 1
 x  1, 2,3, 4,5, 6
f ( x)   36
 0 otro modo
7. Aplicaciones
Ejemplo 2:
Sea el experimento aleatorio E: Inspeccionar 3
artículos y observar si el artículo se encuentra en
perfectas condiciones (C) o si presenta alguna falla
(F).
Si se define la variable aleatoria
Y: Número de artículos en perfectas condiciones

Ry={0,1,2,3,}
7. Aplicaciones
Dado el experimento anterior se puede definir
su función de probabilidad de la siguiente
manera:
Y 0 1 2 3
Teóricos P(Y=y) 1/8 3/8 3/8 1/8
Simulado P(Y=y)
s
¿Qué se esta considerando por defecto sobre
los artículos?
¿Qué cambiaría si la probabilidad de obtener
un artículo en perfectas condiciones es el triple
que obtener un artículo con alguna falla?
8. Simulación de números aleatorios
A medida que las computadoras han aumentado su
velocidad y se ha extendido su utilización, las
simulaciones probabilísticas se han hecho cada vez mas
comunes en las aplicaciones informáticas, la
investigación científica, el control de calidad, el
marketing, etc.
En la mayoría de aplicaciones que utilizan la simulación
probabilística, la primera etapa consiste en simular
variables aleatorias que siguen ciertas distribuciones. Es
decir, establecida una determinada distribución de
probabilidad, se desea generar una o más variables
aleatorias que sigan dicha distribución.
8. Simulación de números aleatorios
Hoy en día, prácticamente todos los lenguajes de
programación disponen de un generador de números
pseudoaleatorios que permite generar una secuencia
de números aleatorios aproximadamente
independientes y que siguen, también
aproximadamente, la distribución Uniforme [0,1]. Ahora
bien, hay que tener en cuenta que normalmente los
valores de se generan a partir de un procedimiento
iterativo determinista diseñado para que resulte
“aparentemente” aleatorios. Por tanto, de hecho los
valores provenientes de la uniforme no son
estrictamente aleatorios, sino pseudoaleatorios.
8. Simulación de números aleatorios
Algunas transformaciones con el método de inversión:
9. Algoritmos de generación de números
pseudoaleatorios normales

Distribución Normal
La distribución Normal es quizás la mas importante
distribución continua de la estadística clásica.
Ejemplos:
 Errores cometidos al medir ciertas magnitudes
Para generar n observaciones se han desarrollado
diferentes métodos aquí discutiremos algunos.
Ley de Stigler:
«ningún descubrimiento científico recibe el
nombre de quien lo descubrió en primer
lugar».[
A. de Moivre P. Laplace A. M Legendre C. Gauss
9. Algoritmos de generación de números
pseudoaleatorios normales

Algoritmo 1: Suma de doce uniformes:


Este procedimiento se basa en el Teorema Central de Límite
(TCL) y puede verse como un ejemplo de transformación. Si
las variables Ui, i=1,2,…,k son i.i.d. U(0,1), con lo que E(Ui)
=1/2, Var(Ui) = 1/12, por el TCL la variable aleatoria:

Es decir sumando 12 observaciones provenientes de una


uniforme (0,1) se puede obtener una observación normal
estándar. Con lo que la expresión anterior se simplifica a:
9. Algoritmos de generación de números
pseudoaleatorios normales

Algoritmo 2: Método de Box Muller:

Si se quiere generar n observaciones de una variable aleatoria


N(0,1) y si U1~Unif(0,1) y U2~Unif(0,1), con U1 y U2 independientes y
)
hacemos
)
entonces, X~N(0,1) e Y~N(0,1), además son independientes.

Una vez que tenemos X~N(0,1) si hacemos W= X +  entonces


W~N(, )

En R existe la función rnorm para generar datos normales


univariados.

La función mvrnorm del paquete MASS permite generar datos


10. Simulación Montecarlo
En algunas situaciones se quiere simular un proceso
complejo como la atención de un cliente desde que llega
hasta que sale del sistema.
Monte Carlo es un proceso de resolver un problema
simulando datos con generadores de números al azar. Su
aplicación requiere de dos cosas básicas:
 Tenerun modelo que represente una imagen de la realidad
tal como la vemos.
 Un mecanismo para simular el modelo.
En resumen, el método Montecarlo es para simular,
mediante procedimientos al azar, situaciones del mundo real
de naturaleza probabilística.
10. Simulación Montecarlo
La técnica Monte Carlo puede ser aplicada en muchas
situaciones económicas y comerciales. Puede usarse para
pronosticar ventas, el costo de producción, políticas de
inventario, planes de fijación de precios, publicidad y
distribución, para resolver complicados problemas de
formación de colas, etc.
El método Monte Carlo puede ser aplicado para simular
experiencia real con objeto de juzgar la eficacia de
soluciones antes de la instalación del plan de acción
propuesto. Si el modelo en que se basa la simulación es
correcto, puede evitarse costosos errores en decisiones
gerenciales.
11. Ejercicios
a) Utilice los números pseudoaleatorios normales
para comparar la potencia de prueba de las
pruebas de normalidad de Anderson-Darling y
Pearson.
Nota: Recuerde que la potencia de prueba
se define como la probabilidad de rechazar una
hipótesis nula que es falsa.

b) Simule muestras de tamaño 10, 30, 50, 300,


500 y 1000 provenientes de distribuciones
Poi(4) y Bin(20,0.25) compare gráficamente.
¿Qué puede observar?

También podría gustarte