Numeros Pseudo-Aleatorios y Variables Aleatorias

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 28

UNIDAD II NMEROS ALEATORIOS Y PSEUDO ALEATORIOS

1. Qu son los nmeros aleatorios y pseudo aleatorios y para qu sirven? Los nmeros aleatorios tienen la propiedad de ser obtenidos al azar, es decir, son resultado de un proceso en el cual su resultado no es predecible ya que todo nmero tiene la misma probabilidad de ser elegido y la eleccin de uno no depende de la eleccin del otro. La palabra aleatorio se usa para expresar una aparente carencia de propsito, causa, u orden. El ejemplo clsico ms utilizado para generarlos es el lanzamiento repetitivo de una moneda o dado. Los nmeros pseudo aleatorios son nmeros generados en un proceso que parece producir nmeros al azar, pero no lo hace realmente, de aqu el prefijo pseudo que quiere decir falso, ya que su generacin parte de algoritmos determinsticos, lo cual nos quiere decir que obtendremos siempre el mismo resultado bajo las mismas condiciones iniciales. Estas condiciones se refieren a varios parmetros de arranque, siendo el valor inicial, tambin llamado semilla, el denominador comn de todos los algoritmos. Estos nmeros tienen la caracterstica de que deben seguir una distribucin Uniforme, es decir que pueden tomar cualquier valor dentro del intervalo (0, 1), entonces podemos decir que los nmeros pseudo aleatorios son nmeros entre 0 y 1 que han pasado por un tamizado de pruebas para poder determinar que tendrn una funcin aproximada a la realidad es decir, haya aleatoriedad. La funcin de los nmeros pseudo aleatorios es que a partir de ellos podemos generar variables aleatorias las cuales estn sujetas en el mayor de los casos, a distribuciones estadsticas que son las que se usan para establecer el comportamiento de materiales, sucesos, personas, etc., en todo proceso de simulacin. 2. Para qu y cmo se usan dichos nmeros? Se usan como una fuente confiable de variabilidad dentro de los modelos de simulacin fundamentalmente porque las sucesiones de nmeros pseudoaleatorios son ms rpidas de generar que las de nmeros aleatorios.

La simulacin es el proceso de disear un modelo de un sistema real, que servir para dirigir experimentos con el propsito de entender, explicar, analizar o mejorar el comportamiento del sistema. Para simular el comportamiento de una o ms variables aleatorias es necesario contar con un conjunto suficientemente grande de nmeros aleatorios, pero por desgracia generar una sucesin de nmeros que sean completamente aleatorios resulta muy complicado, ya que tendramos que generar una sucesin infinita de valores que nos permitiera comprobar la inexistencia de correlaciones entre ellos, lo que sera costoso y tardado volviendo imprctica la simulacin; por ello es necesario utilizar los nmeros pseudoaleatorios de los cuales podemos asegurar con un nivel alto de confiabilidad que se comportan de manera similar a un conjunto de nmeros aleatorios. La experimentacin directa sobre la realidad puede algunos tipo de problemas como: costo muy alto, gran lentitud, en ocasiones las pruebas son destructivas, puede no ser tica (sobre todo si estn involucrados seres humanos), puede resultar imposible, por ejemplo, para predecir sucesos futuros. 3. Cmo se generan los nmeros pseudo aleatorios entre 0 y 1? Los nmeros pseudo aleatorios se generan mediante algoritmos determinsticos, es decir aquellos en que se obtiene el mismo resultado bajo las mismas condiciones iniciales, por lo cual requieren parmetros de arranque. Sea una secuencia ri = {r1 ,r2 ,r3, ..., rn} con n valores distintos, se le conoce como el conjunto necesario de nmeros entre 0 y 1 para realizar una simulacin, siendo n el periodo o ciclo de vida. Esta secuencia forma la parte principal de la simulacin de procesos estocsticos (basado en probabilidades) y son usados para generar la conducta de variables aleatorias, continuas o discretas. Estos nmeros se consideran pseudo-aleatorios porque es imposible el generar nmeros realmente aleatorios. Es preciso contar con un conjunto ri grande, esto con la finalidad de simular el comportamiento de una o ms variables aleatorias, adems el periodo de vida debe ser amplio debido a que es conveniente realizar varias rplicas de simulacin, corriendo cada una con nmeros pseudo aleatorios distintos. Es importante sealar que ri se considera satisfactorio si pasa sin problema las pruebas de uniformidad e independencia, solo as podr ser usado en la simulacin.

Los algoritmos determinsticos para generar nmeros pseudo aleatorios se dividen en no congruenciales y congruenciales, stos a su vez se dividen en lineales y no lineales. Algoritmos No Congruenciales

a) Algoritmo de cuadrados medios

Propuesto en la dcada de los cuarenta del siglo XX por Von Neumann y Metrpolis, este algoritmo requiere un nmero entero, llamado semilla, con D dgitos, este es elevado al cuadrado para seleccionar del resultado los D dgitos del centro; el primer nmero ri se determina simplemente anteponiendo el "0" a esos dgitos. Para obtener el segundo ri se sigue el mismo procedimiento, slo que ahora se elevan al cuadrado los D dgitos del centro que se seleccionaron para obtener el primer ri. Este mtodo se repite hasta obtener n nmeros ri. Pasos para generar nmeros con el algoritmo de cuadrados medios: 1. Seleccionar semilla (X0) con D dgitos (D > 3). 2. Sea X0 = resultado de elevar X0 al cuadrado; sea X1 = los D dgitos del centro, y sea ri = 0.D dgitos del centro. 3. Sea Yi = resultado de elevar Xi al cuadrado; sea Xi+1 = los D dgitos del centro, y sea ri = 0.D dgitos del centro para toda i = 1, 2, 3,..., n. 4. Repetir el paso 3 hasta obtener los n nmeros ri deseados. Nota: Si no es posible obtener los D dgitos del centro del nmero Yi, agregue ceros a la izquierda del nmero Yi. Ejemplo Generar los primeros 5 nmeros ri a partir de una semilla X0 = 5 735, de donde se puede observar que D = 4 dgitos. Solucin: Y0 = (5735)2 = 32 890 225 Y1 = (8902)2 = 79 245 604 Y2 = (2456)2 = 06 031 936 Y3 = (0319)2 = 101 761 2= Y4 = (0176) 030 976 X1 = 8902 X2 = 2456 X1 = 0319 X1 = 0176 X1 = 3097 ri = 0.8902 ri = 0.2456 ri = 0.0319 ri = 0.0176 ri = 0.3097

Generalmente este algoritmo es incapaz de generar una secuencia de r i con periodo de vida n grande. En ocasiones slo es capaz de generar un

nmero, Por ejemplo si X0 = 1 000, entonces X1 = 0000; ri = 0.0000 y se dice que el algoritmo se degenera con la semilla de X 0 = 1 000.

b) Algoritmo de productos medios

La mecnica de generacin de nmeros pseudo aleatorios de este algoritmo no congruencial es similar a la del algoritmo de cuadrados medios. La diferencia entre ambos radica en que el algoritmo de productos medios requiere dos semillas, ambas con D dgitos; adems, en lugar de elevarlas al cuadrado, las semillas se multiplican y del producto se seleccionan los D dgitos del centro. A continuacin se presentan con ms detalle los pasos del mtodo para generar nmeros con el algoritmo de producto medios. 1. Seleccionar una semilla (X0) con D dgitos (D > 3). 2. Seleccionar una semilla (X1) con D dgitos (D > 3). 3. Sea Y0 = X0*X1; sea X2 = los D dgitos del centro, y sea ri = 0.D dgitos del centro. 4. Sea Yi = Xi*Xi+1; sea Xi+2 = los D dgitos del centro, y sea ri+1 = 0.D dgitos del centro para toda f= 1,2,3,...,n; 5. Repetir el paso 4 hasta obtener los n nmeros ri deseados. Nota: Si no es posible obtener los D dgitos del centro del nmero Yi agregue ceros a la izquierda del nmero Yi.

c) Algoritmo de multiplicador constante

Este algoritmo no congruencial es similar al algoritmo de productos medios. Los siguientes son los pasos necesarios para generar nmeros pseudo aleatorios con el algoritmo de multiplicador constante. 1. Seleccionar una semilla (X0) con D dgitos (D > 3). 2. Seleccionar una constante (a) con D dgitos (D > 3). 3. Sea Y0 - a*X0; sea X1 = los D dgitos del centro, y sea ri = 0.D dgitos del centro. 4. Sea Yi = a*Xi; sea Xi+1 = los D dgitos del centro, y sea ri+1 = 0.D dgitos del centro para toda i = 1, 2, 3,..., n. 5. Repetir el paso 4 hasta obtener los n nmeros ri deseados. Nota: Si no es posible obtener los D dgitos del centro del nmero Yi agregue ceros a la izquierda del nmero Yi.

Algoritmos Congruenciales

d) Algoritmo Lineal

Este algoritmo congruencial fue propuesto por D.H. Lehmer en 1951. Segn Law y Kelton, este algoritmo ha sido el ms usado. El algoritmo congruencial lineal genera una secuencia de nmeros enteros por medio de la siguiente ecuacin recursiva: Xi+1 = (aXi + c) mod (m) i= 0, 1, 2, 3 n donde; X0 = es la semilla, X0 >0 y debe ser entero. a = es la constante multiplicativa, a >0 y debe ser entero. c = constante aditiva, c >0 y debe ser entero. mod m = modulo, significa realizar las operaciones anteriores y dividir el resultado entre el valor de m, para obtener solamente el residuo. Es importante sealar que la ecuacin recursiva del algoritmo congruencial lineal genera una secuencia de nmeros enteros S= {0, 1, 2, 3,, m-1}, y que para obtener nmeros pseudo aleatorios en el intervalo (0, 1) se requiere la siguiente ecuacin: ri = Para que el algoritmo sea capaz de lograr el mximo periodo de vida n, es preciso que dichos parmetros cumplan ciertas condiciones, Banks, Carson, Nelson y Nicol sugieren lo siguiente: m = 2g a = 1 + 4k k, debe ser entero. c, relativamente primo a m. g, debe ser entero. Bajo estas condiciones se obtiene un periodo de vida mximo N= m= 2g. Ejemplo: Generar suficientes nmeros entre 0 y 1 con los parmetros X 0 = 6, k =3, g =3, c =7, hasta encontrar el periodo de vida mximo (N). a = 1 + 4(3) = 13 m = 23 = N= 8 r1 = 5/7 = 0.714 r2 = 0/7 = 0.000 r3 = 7/7 = 1.000

X0 = 6 X1 = (13*6+7) mod 8 = 5 X2 = (13*5+7) mod 8 = 0 X3 = (13*0+7) mod 8 = 7

X4 = (13*7+7) mod 8 = 2 X5 = (13*2+7) mod 8 = 1 X6 = (13*1+7) mod 8 = 4 X7 = (13*4+7) mod 8 = 3 X8 = (13*3+7) mod 8 = 6

r4 = 2/7 = 0.214 r5 = 1/7 = 0.142 r6 = 4/7 = 0.571 r7 = 3/7 = 0.428 r8 = 6/7 = 0.857

Es importante mencionar que el nmero generado en X 8 = 6 es exactamente igual a la semilla X0, y si continuramos generando ms nmeros stos se repetiran. Adems sabemos que el algoritmo congruencial lineal genera una secuencia de nmeros enteros S = {0,1, 2, 3,, m-1}. Si no se cumple algunas de las condiciones, el periodo de vida mximo N=m no se garantiza, por lo que el periodo de vida ser menor que m.

e) Algoritmo Congruencial Multiplicativo

El algoritmo congruencial multiplicativo surge del algoritmo congruencial lineal cuando c= 0. Entonces la ecuacin recursiva es: Xi+1 = (aXi) mod (m) i= 0, 1, 2, 3 n En comparacin con el algoritmo congruencial lineal, la ventaja del algoritmo multiplicativo es que implica una operacin menos a realizar. Los parmetros de arranque de este algoritmo son X 0, a y m, todos los cuales deben ser nmeros enteros y mayores que cero. Para transformar los nmeros Xi en el intervalo de (0, 1) se usa la ecuacin: ri = De acuerdo con Banks, Carson, Nelson y Nicol las condiciones que deben cumplir los parmetros para que el algoritmo congruencial multiplicativo alcance su mximo periodo son: m = 2g a = 3 + 8k o a = 5 + 8k k = 0, 1, 2, 3 X0 debe ser un nmero impar. g, debe ser entero. A partir de estas condiciones se logra un periodo de vida mximo: N= m/4= 2g-2.

Ejemplo: Generar suficientes nmeros entre 0 y 1 con los siguientes parmetros: X0 = 17, k =2, y g =5 hasta encontrar el periodo o ciclo de vida. Solucin: a = 5 + 8(2) = 21 =32 y m X0 = 17 r1 = 5/31 = 0.1612 r2 = 9/31 = 0.2903 r3 = 29/31 = 0.9354 r4 = 1/31 = 0.3225 r5 = 21/31 = 0.6774 r6 = 25/31 = 0.8064 r7 = 13/31 = 0.4193 r8 = 17/31 = 0.5483

X1 = (21*17) mod 32 = 5 X2 = (21*5) mod 32 = 9 X3 = (21*9) mod 32 = 29 X4 = (21*29) mod 32 = 1 X5 = (21*1) mod 32 = 21 X6 = (21*21) mod 32 = 25 X7 = (21*25) mod 32 = 13 X8 = (21*13) mod 32 = 17

Toda vez que la semilla X0 se repite, volvern a generarse los mismos nmeros. Por lo tanto, el periodo de vida es n =8, el cual corresponde a N= m/4 = 32/4 = 8.

f) Algoritmo congruencial aditivo

Este algoritmo requiere una secuencia previa de n nmeros enteros X 1, X2, X3, X4,..., Xn para generar una nueva secuencia de nmeros enteros que empieza en Xn+1, Xn+2, Xn+3, Xn+4 , Su ecuacin recursiva es: Xi = (Xi-1 + Xi-n) mod (m) i = n + 1, n + 2, n + 3,, N Los nmeros ri pueden ser generados mediante la ecuacin ri = xi/ (m-1) Ejemplo Generar 7 nmeros pseudo aleatorios entre cero y uno a partir de la siguiente secuencia de nmeros enteros: 65, 89, 98, 03, 69; m = 100. Sean X1 = 65, X2 = 89, X3 = 98, X4 = 03, X5 = 69. Para generar r1, r2, r3 r4, r5, r6 y r7 antes es necesario generar X6, X7, X8, X9, X10, X11, X12. Solucin:
X6 = (X5 + X1) mod 100 = (60+ 65) mod 100 = 34 X7 = (X6 + X2) mod 100 = (34 + 89) mod 100 = 23 X8 = (X7 + X3) mod 100 = (23 + 98) mod 100 = 21 r1 = 34/99 = 0.3434 r2 = 23/99 = 0.2323 r3 = 21/99 = 0.2121

X9 = (X8 + X4) mod 100 = (21 +03) mod 100 = 24 X10 = (X9 +X5) mod 100 = (24 + 69) mod 100 = 93 X11 = (X10 +X6) mod 100 = (93 + 34) mod 100 = 27 X12 = (X11 +X7) mod 100 = (27 + 23) mod 100 = 50

r4 = 24/99 = 0.2424 r5 = 93/99 = 0.9393 r6 = 27/99 = 0.2727 r7 = 50/99 = 0.5050

g) Algoritmos congruenciales no lineales


En esta seccin se analizarn dos algoritmos congruenciales no lineales: el congruencial cuadrtico y el algoritmo presentado por Blum, Blum y Shub. 1. Algoritmo congruencial cuadrtico Este algoritmo tiene la siguiente ecuacin recursiva: Xi + 1 = (aX2i + bX + c) mod (m) i = 0,1,2,3,, N En este caso, los nmeros r. pueden ser generados con la ecuacin r = x-/(m - 1). De acuerdo con L'Ecuyer, las condiciones que deben cumplir los parmetros m, a, b y c para alcanzar un periodo mximo de N = m son: m = 2g a, debe ser un nmero par c, debe ser un nmero impar g debe ser entero (b- 1) mod 4 = 1 De esta manera se logra un periodo de vida mximo N = m. Ejemplo Generar, a partir del algoritmo congruencial cuadrtico, suficientes nmeros enteros hasta alcanzar el periodo de vida, considerando los parmetros X0 = 13, m = 8, a = 26, b = 27 y c = 27. Como todas las condiciones estipuladas para los parmetros se satisfacen, es de esperarse que el periodo de vida del generador sea N = m = 8, tal como podr comprobar al revisar los clculos correspondientes, que se presentan a continuacin. Solucin: X1 = (26*1322 + 27*13 + 27) mod (8) = 4 X2 = (26*422 + 27*4 + 27) mod (8) = 7 X3 = (26*722 + 27*7 + 27) mod (8) = 2 X4 = (26*222 + 27*2 + 27) mod (8) = 1 X5 = (26*122 + 27*1 + 27) mod (8) = 0 X6 = (26*022 + 27*0 + 27) mod (8) = 3 X7 = (26*322 + 27*3 + 27) mod (8) = 6

X8 = (26*622 + 27*6 + 27) mod (8) = 5 X9 = (26*522 + 27*5 + 27) mod (8) = 4 Por otro lado, el algoritmo cuadrtico genera una secuencia de nmeros enteros S = {0,1, 2,3..., m-1}, al igual que el algoritmo congruencial lineal. 2. Algoritmo de Blum, Blum y Shub Si en el algoritmo congruencial cuadrtico a = 1, b = 0 y c = 0, entonces se construye una nueva ecuacin recursiva: Xi+1= (X2i) mod (m) i = 0, 1, 2, 3, n La ecuacin anterior fue propuesta por Blum, Blum y Shub como un nuevo mtodo para generar nmeros que no tienen un comportamiento predecible. De un ejemplo utilizando un algoritmo de generacin de nmeros pseudo aleatorios Algoritmo de cuadrados medios X0 = 2342 D = 4
Y0 = Y1 = Y2 = Y3 = Y4 = Y5 = Y6 = Y7 = Y8 = Y9 = Y10 = Y11= Y12= Y13= Y14= Y15= Y16= Y17= Y18= Y19= = 05484964 = 23512801 = 26296384 = 08779369 = 60730849 = 53406864 = 165448624 = 30096196 = 923521 = 05531904 = 28291761 = 08508889 = 25887744 = 78801129 = 64176121 = 03101121 = 01022121 = 048841 = 23853456 = 71132356 X1 = 4849 X2 = 5128 X3 = 2963 X4 = 7793 X5 = 7306 X6 = 4068 X7 = 5486 X8 = 0961 X9 = 2352 X10 = 5319 X11 = 2917 X12 = 5088 X13 = 8877 X14 = 8011 X15 = 1761 X16 = 1011 X17 = 0221 X18 = 4884 X19 = 8534 X20 = 1323 r1 = 0.4849 r2 = 0.5128 r3 = 0.2963 r4 = 0.7793 r5 = 0.7306 r6 = 0.4068 r7 = 0.5486 r8 = 0.0961 r9 = 0.2352 r10 = 0.5319 r11 = 0.2917 r12 = 0.5088 r13 = 0.8877 r14 = 0.8011 r15 = 0.1761 r16 = 0.1011 r17 = 0.0221 r18 = 0.4884 r19 = 0.8534 r20 = 0.1323

4. Qu propiedades deben cumplir los nmeros pseudoaleatorios entre cero y uno? En gran medida, conocer las propiedades que deben tener los nmeros aleatorios garantiza una buena simulacin, por ello se enumeran a continuacin.

Media de los nmeros aleatorios entre cero y uno


En vista de que estos nmeros deben de tener la misma probabilidad de presentarse, es preciso que su comportamiento muestre una distribucin de probabilidad uniforme continua, con lmite inferior cero y lmite superior uno. La funcin de densidad de una distribucin uniforme es la siguiente.

Para obtener la media de la distribucin multiplicamos la funcin de densidad por x, y la integramos en todo el rango de la distribucin de la siguiente manera:

Sustituyendo los valores de a y b

Por lo tanto el valor esperado (es decir, la media de los nmeros aleatorios entre cero y uno) es

Varianza de los nmeros aleatorios


Partiendo de la misma distribucin uniforme continua obtenemos la varianza de la distribucin por medio de la ecuacin

Lo que nos da

Al sustituir tenemos que

Por lo tanto ( ) Dado estos resultados podemos decir que los nmeros aleatorios entre cero y uno deben tener

Independencia
Esta es una propiedad muy importante, e indica que los nmeros aleatorios no deben tener correlacin entre s; es decir, que sean independientes, de manera que puedan dispersarse uniformemente dentro de un espectro de valores posibles. Los datos deben mostrar dispersin como en la figura. Es posible realizar una serie de pruebas para corroborar que no existe correlacin ente los nmeros aleatorios, e incluso para garantizar que no existe un sesgo o tendencia entre los dgitos de cada uno de ellos.

Ejemplifique generando un conjunto de nmeros y aplicndoles las pruebas necesarias para comprobar que renen las propiedades. Algoritmo congruencial lineal X0 = 23 K=4 g=5 c = 31 m = 32 a = 17
6 5 20 19 2 1 16 15 30 29 12 11 26 25 8 7 22 21 4 3 18 17 0 31 14 13 28 27 10 9 24 23 6/31= 5/31= 20/31= 19/31= 2/31= 1/31= 16/31= 15/31= 30/31= 29/31= 12/31= 11/31= 26/31= 25/31= 8/31= 7/31= 22/31= 21/31= 4/31= 3/31= 18/31= 17/31= 0/31= 31/31= 14/31= 13/31= 28/31= 27/31= 10/31= 9/31= 24/31= 23/31= 0.1935 0.1612 0.6451 0.6129 0.0645 0.0322 0.5161 0.4838 0.9677 0.9354 0.3870 0.3548 0.8387 0.8064 0.2580 0.2258 0.7096 0.6774 0.1290 0.0967 0.5806 0.5483 0.0000 1.0000 0.4516 0.4193 0.9032 0.8709 0.3225 0.2903 0.7741 0.7419

Prueba de medias

Lmites de aceptacin inferiores y superiores

Con lo anterior podemos comprobar que el valor de la media del conjunto de datos se encuentra dentro de los lmites de aceptacin, por lo tanto se acepta la H0 que nos dice que el conjunto de nmeros pseudo aleatorios cumplen con la primer propiedad de tener una media de 0.5. Prueba de varianza

Dado que el valor de la varianza V(r)= se encuentra dentro de los lmites de aceptacin, podemos decir que no se puede rechazar que el conjunto de nmeros tiene una varianza de 1/12. Prueba de uniformidad H 0: r i U (0,1)

H1: ri no son uniformes Para comprobar si nuestro conjunto de datos se distribuyen uniformemente en el intervalo (0, 1) procederemos a comprobarlo mediante la prueba de Chi-Cuadrada, en la cual se debe calcular un estadstico de prueba que posteriormente se va a comparar con un valor crtico utilizando la tabla de la distribucin Chi-cuadrada, si X20 < se acepta la H0. Para llevar a cabo esta prueba, es necesario dividir el intervalo (0, 1) en m subintervalos, en donde es recomendable m= posteriormente, se clasifica cada nmero pseudo aleatorio del conjunto r i en los m intervalos. A la cantidad de nmeros ri que se clasifican en cada intervalo se le denomina frecuencia observada (Oi), y a la cantidad de nmeros ri que se espera encontrar en cada intervalo se le llama frecuencia esperada (E i). A partir de estos valores se calcula el estadstico de prueba:

X20 =

)2

Oi (0.00 0.166) (0.166 0.33) (0.33 0.5) (0.5 0.666) (0.666 0.833) (0.833 1) 6 5 5 5 5 6

Ei = 5.6569 5.6569 5.6569 5.6569 5.6569 5.6569 0.0209222 0.0760848 0.0760848 0.0760848 0.0760848 0.0209222 0.3461838

El estadstico = 0.3461838 es menor al valor crtico correspondiente de la chi-cuadrada , entonces no se puede rechazar que el conjunto de nmeros ri sigue una distribucin uniforme. Prueba de independencia H0: los nmeros de los conjuntos ri son independientes H1: los nmeros de los conjuntos ri no son independientes Existen mltiples mtodos que tratan de corroborar que si los nmeros en el intervalo (0, 1) son independientes o, en otras palabras s parecen pseudoaleatorios, a continuacin se realizar la prueba de corridas arriba y abajo. El procedimiento de esta prueba consiste en determinar una secuencia de nmeros (S) que slo contiene unos y ceros, de acuerdo con una comparacin entre ri y ri-1, la cual se construye de la siguiente manera: se coloca un cero si el nmero ri ri-1; en caso de ser mayor que el que nmero ri anterior, se pone un uno. Posteriormente, se determina el nmero de corridas observadas, Co la cual se identifica como la cantidad de unos o ceros consecutivos. Adems se necesita hacer los siguientes clculos: Co = = Para aceptar o rechazar la hiptesis nula, es necesario hacer una comparacin entre el siguiente estadstico de prueba y el valor crtico, si Z0< Z/2 podemos concluir que los nmeros generados corresponden a la propiedad de ser independientes.

Z0 = [

Se aplica la prueba de corridas arriba abajo al conjunto de 32 nmeros pseudo aleatorios generados anteriormente: 0.1935 0.9677 0.7096 0.4516 0.1612 0.9354 0.6778 0.4193 0.6451 0.3870 0.1290 0.9032 0.6129 0.3548 0.0967 0.8709 0.0645 0.8387 0.5806 0.3225 0.0322 0.8064 0.5483 0.2903 0.5161 0.2850 0 0.7741 0.4838 0.2258 1 0.7419

S = {0 1 0 0 0 1 0 1 0 0 0 1 0 0 0 1 0 0 0 1 0 0 1 0 0 1 0 0 0 1 0} Co = 19 = = Z0 = *

= 21 = 5.3666 + = - 0.8634

= = 1.96 entonces - 0.8634 es menor que 1.96 se concluye que no se puede rechazar que los nmeros del conjunto r i sean independientes.

UNIDAD III VARIABLES ALEATORIAS


1. A qu se llama variable aleatoria y que tipos de variable aleatoria existen? El trmino variable significa valores inestables, pero decir que una variable es aleatoria, se refiere a mediciones cuyos valores se obtienen de algn tipo de experimento aleatorio. Los experimentos aleatorios presentan un tratamiento matemtico, en el cual se deben cuantificar los resultados de modo que se asigne un nmero real a cada uno de los resultados posibles del experimento. Las variables aleatorias son aquellas comportamiento probabilstico de la realidad. Tipos de variables que existen: Variables Discretas Son aquellas que presentan de modo inherente separaciones entre valores observables sucesivos. Dicho de otra manera, se define una variable discreta como la variable tal que entre dos cualesquiera valores observables hay por lo menos un valor no observable. Por ejemplo 3 y 4 son potencialmente observables, mientras que 3.5 no lo es. Las variables discretas son valores enteros que no presentan continuidad o sea, existe una ruptura, por ejemplo, el nmero de hijos. Variables Continuas Las variables continuas son aquella que puede tomar un valor cualquiera para un determinado intervalo. Tienen la propiedad de que entre dos cualesquiera valores observables, hay otro valor observable. En pocas palabras son nmeros enteros y fraccionarios, por ejemplo, el peso, la estatura. que tienen un

2. Determine el tipo de distribucin a que pertenecen el conjunto de datos del ejercicio 6 de la pgina 91 del libro Simulacin y Anlisis de sistemas con Promodel con la herramienta Stat: :Fit.

Objetivo Utilizar la herramienta Stat::Fit con la finalidad de determinar la distribucin de probabilidad a partir de un conjunto de datos. Introduccin Stat::Fit permite comparar los resultados entre varias distribuciones analizadas mediante una calificacin. Entre sus procedimientos emplea las pruebas estadsticas Chi-cuadrada, de Kolmogorov-Smirnov y de Anderson-Darling. Conjuntamente calcula los parmetros apropiados para cada tipo de distribucin, e incluye informacin estadstica adicional como media, moda, valor mnimo, valor mximo y varianza, entre otros datos. Stat::Fit se puede ejecutar desde la pantalla de inicio de Promodel, o bien desde el comando Stat::Fit del men Tools. Entrada de datos y manipulacin Tabla de Datos Un nuevo proyecto se crea haciendo clic en el icono new document en la barra de control o seleccionando File en la barra de men y luego New en el submen, esta accin genera un nuevo documento de Stat::Fit , y muestra una tabla vaca de datos.

Es en la tabla vaca donde se insertan uno por uno los datos del ejemplo:

Opciones de entrada Opciones de entrada de datos (Input options) permite establecer varias opciones de manejo: El nmero de intervalos para el histograma, la precisin con que los datos se muestran y almacenan, y los tipos de distribucin que se permitirn. El cuadro de dilogo Opciones de entrada se ingresa haciendo clic en el icono Input Options o mediante la seleccin Input de la barra de men y luego Options en el men secundario. Se aconseja que el nmero de intervalos se calcule con la raz cuadrada del total de datos, 10 para este ejemplo. La precisin de los datos es el nmero de decimales que se muestran en los datos de entrada y todos los clculos posteriores. La precisin por defecto es de 6 cifras decimales y se ajusta inicialmente. La precisin se puede ajustar entre 0 y 15. Tenga en cuenta que la mayora de los datos de este ejemplo tiene un mximo de 5 dgitos por lo tanto es este valor que se establecer.

El tipo de distribucin de anlisis puede ser continua o discreta. En general, todas las distribuciones sern tratadas como cualquier tipo de forma predeterminada. Sin embargo, el anlisis puede ser forzado a cualquiera de las distribuciones continuas o distribuciones discretas, marcando la casilla correspondiente en el cuadro de dilogo Opciones de entrada. Continua en este caso, clic en OK para guardar las opciones registradas.

Un grfico de los datos de entrada se puede ver mediante la seleccin de input de la barra de mens y, a continuacin input graph desde el men secundario, o haciendo clic en el icono de grfico de entrada. Un histograma de los datos se desplegara en pantalla. Anlisis estadstico Estadstica Descriptiva La estadstica descriptiva de los datos de entrada se puede ver mediante la seleccin de Statistics en la barra de Men y luego descriptive desde el men secundario. Se muestra la siguiente ventana:

El comando de Estadstica Descriptiva proporciona las observaciones y los clculos estadsticos bsicos sobre los datos de entrada y los presenta en una vista simple como se muestra arriba. El tiempo que esta ventana este abierta, los clculos se actualizarn a medida que los datos de entrada cambien.

Ajuste de la Distribucin El ajuste automtico de distribuciones continuas se puede realizar mediante el comando Auto::Fit. Este comando sigue el mismo procedimiento como se explica a continuacin para el ajuste manual, pero opta por la distribucin adecuada de los datos de entrada. Tambin califica las distribuciones de acuerdo con su relativa bondad de ajuste, y da una indicacin de su aceptacin como buenas representaciones de los datos de entrada. En el ajuste manual de las distribuciones de anlisis de los datos de entrada en la tabla de datos, las distribuciones adecuadas de los datos de entrada deben ser elegidas en la configuracin del ajuste (setup) junto con las pruebas de bondad de ajuste deseadas. Comience el proceso de ajuste de la distribucin mediante la seleccin de Fit en la barra de men y luego de setup desde el men secundario, o haciendo clic en el icono de setup apropiado.

La pgina de distribuciones del cuadro de dilogo Configuracin de ajuste proporciona una lista de distribuciones para la eleccin de la distribucin para el ajuste posterior. Todas las distribuciones elegidas aqu se utilizarn de forma secuencial para las estimaciones y pruebas de bondad de ajuste. Despus de seleccionar las distribuciones, vaya a la siguiente pestaa del cuadro de dilogo para seleccionar los clculos a realizar. Las estimaciones pueden ser obtenidas en momentos o clculos de probabilidad mxima (MLEs). El valor predeterminado para el clculo es MLE.

Para distribuciones continuas con un lmite inferior o mnimo como la exponencial, el lmite inferior puede ser obligado a asumir un valor igual o inferior al valor mnimo de datos. Este lmite inferior se utilizar tanto para los momentos y las estimaciones de mxima verosimilitud. De forma predeterminada, se deja desconocido, esto causa que todos los procedimientos de estimacin varen el lmite inferior con el resto de los parmetros. Pruebas de bondad de ajuste Las pruebas de bondad de ajuste no son ms que las comparaciones de los datos de entrada a las distribuciones ajustadas de una manera estadsticamente significativa. Cada prueba tiene la hiptesis de que el ajuste es bueno y calcula un estadstico de prueba para la comparacin con un estndar. Las pruebas de bondad de ajuste son: Chi-cuadrada Kolmogorov Smirnov Anderson Darling Si la eleccin de la prueba es incierto, utilice el test de Kolmogorov Smirnov, que es aplicable a la gama ms amplia de datos y parmetros ajustados. Auto::Fit El ajuste automtico distribuciones continuas se puede realizar haciendo clic en el icono Auto::Fit o mediante la seleccin de Fit de la barra de Men y luego Auto::Fit en el submen.

Este comando sigue el mismo procedimiento como se mencion anteriormente para el ajuste manual. Auto::Fit elegir automticamente distribuciones continuas adecuadas para adaptarse a los datos de entrada, calcular las estimaciones de probabilidad mxima para las distribuciones, los resultados de la prueba de bondad de ajuste, y mostrar la distribucin por orden de su calificacin relativa. La calificacin relativa se determina por un mtodo emprico que utiliza efectivos clculos de la bondad de ajuste. Una calificacin alta indica que la distribucin ajustada es una buena representacin de los datos de entrada.

La distribucin Normal con media 18.7 y desviacin estndar 4.11 consigue una calificacin de 100, por lo cual se acepta que esta es la indicada para seleccionar que los datos del ejemplo siguen esta distribucin.

Grficos
Un grfico de la densidad de los datos de entrada y la densidad ajustada pueden ser vistos seleccionando Fit de la barra de mens y, a continuacin Result Graphs, submen Density, tambin se puede acceder a las grficas haciendo clic sobre la distribucin en la ventana Automatic Fitting. Este grfico muestra un histograma de los datos de entrada cubierto de las densidades ajustadas para distribuciones especficas. El grfico aparecer con la configuracin por defecto de los datos de entrada en un histograma azul y los datos ajustados en un polgono de color rojo, como se muestra a continuacin.

La distribucin ajustada se muestra en el cuadro inferior de la derecha. Si ha seleccionado ms de una distribucin para ajustar, una lista de las distribuciones se da en el cuadro superior de la derecha. Seleccione distribuciones adicionales para mostrarlas, para compararlas, haciendo clic en el nombre de la distribuciones en el cuadro superior. Habr una leyenda en la parte inferior de la grfica, como se muestra a continuacin:

Se puede observar que la distribucin Lognormal traslapa a la distribucin Normal, dada la semejanza con esta ltima, y que obtuvo una calificacin de 99.9. La distribucin Uniforme es la que menos se ajusta pues los datos evidentemente no siguen esta tendencia.

3. Mediante un ejemplo genere una variable aleatoria usando el mtodo de la transformada inversa. a) Usando distribucin exponencial El mtodo de la transformada inversa puede utilizarse para simular variables aleatorias continuas, lo cual se logra mediante la funcin acumulada f(x) y la generacin de nmeros pseudo aleatorios r i U (0, 1). El mtodo consiste en desarrollar los siguientes pasos: 1. Definir la funcin de densidad F(x) que represente la variable a modelar: F(x) = e-x para x 0 2. Calcular la funcin acumulada F(x): F(x) = dx = 1-e-x para x 0 3. Despejar la variable aleatoria x y obtener la funcin acumulada inversa F(x)-1 Despeje de la variable aleatoria: Xi = - ln (1-ri) Funcin acumulada inversa: Xi= -Ln (1-ri) 4. Generar las variables aleatorias x, sustituyendo los valores con nmeros pseudo aleatorios ri U (0, 1) en la funcin acumulada inversa. El tiempo, en minutos, que un alumno usa una terminal de cmputo en una importante universidad sigue una distribucin exponencial de probabilidad, con promedio de 36 minutos. Xi= -36Ln (1-ri) Alumno 1 2 3 4 5 6 7 8 9 10 ri 0.4849 0.5128 0.2963 0.7793 0.7306 0.4068 0.5486 0.0961 0.2352 0.5319 Tiempo Alumno ri Tiempo 23.882192 11 0.2917 12.4159517 25.8869003 12 0.5088 25.5925405 12.6505134 13 0.8877 78.716931 54.3942348 14 0.8011 58.1383114 47.2160885 15 0.1761 6.97342016 18.8000521 16 0.1011 3.83700547 28.6344509 17 0.0221 0.80452309 3.63731559 18 0.4884 24.1276395 9.65307302 19 0.8534 69.1217096 27.3266399 20 0.1323 5.10873286

a) Usando la distribucin de Bernoulli El mtodo de la transformada inversa tambin se emplea para simular variables aleatorias de tipo discretas. El mtodo consiste en: 1. Calcular todos los valores de la distribucin de probabilidad p(x) de la variable a modelar. 2. p(x)= px (1-p) 1-x para x=0, 1 Se calculan las probabilidades para x=0 y x=1, para obtener: x p(x) 0 1-p 1 p

3. Calcular todos los valores de la distribucin acumulada P(x). x P(x) 0 1-p 1 1

4. Generar nmeros pseudo aleatorios ri U (0, 1). 5. Comparar con el valor de P(x) y determinar qu valor de x corresponde a P(x). Si ri Xi = Si ri (1 p, 1) x=1 (0, 1 p) x=0

La probabilidad de que un prospecto elegido al azar realice una compra a un agente de ventas es 0.20 (x=1) y de 0.8 de que no compre (x=0) en un dia determinado. p(x)= (0.2)x (0.8) 1-x para x=0, 1 Clculo de probabilidades puntuales y acumuladas para x=0 y x=1. X p(x) P(x) 0 0.8 0.8 1 0.2 1

Si ri Xi = Si ri

(0 0.8) x=0 (0.8 - 1) x=1

Si el nmero pseudo aleatorio es menor que 0.8, no hay compra. Si el nmero pseudo aleatorio es mayor que 0.8, si hay compra.
Persona 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 ri 0.1935 0.1612 0.6451 0.6129 0.0645 0.0322 0.5161 0.4838 0.9677 0.9354 0.387 0.3548 0.8387 0.8064 0.285 0.2258 0.7096 0.6774 0.129 0.0967 0.5806 0.5483 0 1 0.4516 0.4193 0.9032 0.8709 0.3225 0.2903 0.7741 0.7419 Xi 0 0 0 0 0 0 0 0 1 1 0 0 1 1 0 0 0 0 0 0 0 0 0 1 0 0 1 1 0 0 0 0 Evento: Compra No No No No No No No No Si Si No No Si Si No No No No No No No No No Si No No Si Si No No No No

Instituto Tecnolgico de Reynosa


Ingeniera Industrial 6to semestre Simulacin MII. Jos Mara Gonzlez Rodrguez

UNIDAD II: Nmeros Aleatorios y Pseudo aleatorios UNIDAD III: Variables Aleatorias

Abasolo Melchor Alberto Carranza Garca Alberto de Jess De Luna Prez Nancy Yadira Hernndez Martnez Diana Celeste Medrano Meza Erick Roberto

Reynosa, Tamps, 09 de Mayo de 2011

También podría gustarte