VARIABLE ALEATORIA Ejercicios Resueltos
VARIABLE ALEATORIA Ejercicios Resueltos
VARIABLE ALEATORIA Ejercicios Resueltos
Ejercicios resueltos
1. Calcular los ndices estadsticos basados en los momentos (media, varianza, desviacin tpica, asimetra
y apuntamiento) de la distribucin de tallas (en cm) de la siguiente muestra de 5 chicos:
154
158
162
158
168
Solucin:
SUMMARIZE TABLES = Tallas
FORMAT=NOLIST TOTAL
MISSING=VARIABLE
CELLS=COUNT MEAN VAR STDDEV SKEW KURT
Media: 160 cm; Varianza: 28 cm2; SD: 5,292 cm; Curtosis: 0,673; Asimetra: 0,810
2. Calcular la edad media en el momento del diagnstico de una muestra de 5 sujetos cuyos datos aparecen
tabulados a continuacin.
Caso
1
2
3
4
5
Fecha nacimiento
11/9/1989
20/05/1989
7/10/1987
23/10/1990
14/8/1988
Fecha diagnstico
17/8/2001
14/6/2001
10/6/2001
30/5/2001
21/4/2001
Solucin:
El tiempo transcurrido es una variable continua cuyo valor se acostumbra a presentar en forma de tiempo
cumplido (valor truncado). Para calcular un tiempo transcurrido de forma exacta es necesario registrar las
fechas de inicio (FI) y final (FF) del periodo y proceder de la siguiente manera
Calcular el tiempo transcurrido en das (con SPSS se hara un COMPUTE TT_DIA= FF-FI, en el ejemplo
la FF=Fecha diagnstico y FI=Fecha nacimiento)
Transformar los das en las unidades de tiempo deseadas (semanas, meses o aos) sin truncar. Para
ello tambin con un COMPUTE se calcularan las variables siguientes y se les pone la etiqueta de valor
y el formato correspondientes:
TT_SEM=TT_DIA/7
TT_MES=TT_DIA / 30.4375
TT_AO=TT_DIA / 365.25
Caso
1
2
3
4
5
Fecha
nacimiento
11/9/1989
20/05/1989
7/10/1987
23/10/1990
14/8/1988
Fecha
diagnstico
17/8/2001
14/6/2001
10/6/2001
30/5/2001
21/4/2001
Medias
Edad
(das)
4358
4408
4995
3872
4633
4453,2
Edad (aos
decimales)
11,93
12,07
13,68
10,60
12,43
12,2
Valor exacto
Edad (aos
cumplidos)
11
12
13
10
12
11,6
Valor sesgado
Observar que, si slo se dispone de aos cumplidos, se produce un sesgo. Para corregirlo, se incrementan
las edades en + 0,5 aos, como indica la ltima columna de la tabla, antes de incorporarlas a los
tratamientos estadsticos, de modo que el valor es bastante aproximado al real.
3. Se ha administrado un tratamiento antibitico a 12 pacientes con sepsis bacteriana y se ha registrado la
PCT antes y al da siguiente del inicio del mismo. Se trata de crear la variable Cambio en niveles de PCT y
obtener los descriptivos de la misma mediante el procedimiento EXPLORE de SPSS.
PCT antes
92
14
10,9
12,5
8,8
7,7
13,8
11,4
5,4
9,5
10,2
10,2
PCT despus
62
11,4
10,2
8,2
16,6
5
9,9
10,8
1,2
10
6,9
5,7
Descriptivos
Cambio_PCT
Media
Intervalo de confianza
para la media al 95%
Estadstico
4,0417
-1,5843
Lmite inferior
Lmite superior
Error tp.
2,55611
9,6676
Media recortada al 5%
Mediana
Varianza
Desv. tp.
Mnimo
Mximo
Rango
Amplitud intercuartil
Asimetra
Curtosis
3,2574
3,0000
78,404
8,85463
-7,80
30,00
37,80
3,65
2,460
8,128
,637
1,232
Percentiles
5
Promedio
ponderado(definicin 1)
Cambio_PCT
Bisagras de Tukey
Cambio_PCT
-7,8000
10
25
-5,6100
Valores extremos
Cambio_PCT
Mayores
Menores
1
2
3
4
5
1
2
3
4
5
Nmero
del caso
1
12
4
9
7
5
10
8
3
2
Valor
30,00
4,50
4,30
4,20
3,90
-7,80
-,50
,60
,70
2,60
Percentiles
50
75
,6250
3,0000
4,2750
,6500
3,0000
4,2500
90
22,3500
95
.
Pruebas de normalidad
a
Cambio_PCT
Kolmogorov-Smirnov
Estadstico
gl
Sig.
,396
12
,000
Shapiro-Wilk
Estadstico
gl
,663
12
Sig.
,000
30
1,5
20
Normal esperado
1,0
0,5
10
0,0
-0,5
0
-1,0
-1,5
-10
-10
10
20
30
Valor observado
Cambio_PCT
Ejercicios propuestos
Verdadero o falso?
1. En un proceso de Bernouilli, hay exactamente dos posibles resultados en cada prueba
2. Las variables discretas slo pueden tomar valores positivos
3. Una variable Binomial puede aproximarse por una de Poisson, si n es grande, p pequea y n p
moderada
4. Para una variable de Poisson, la suma de las probabilidades de todos puntos muestrales es mayor que 1,
porque es una suma con infinitos sumandos
5. El color de del pelo es una variable cuantitativa
6. El nmero de televisores que hay en una casa es una variable cualitativa
7. Las posibles respuestas a los tems de un cuestionario: si, no, no lo s, constituyen una variable
cualitativa
8. La variable X = nmero de manchas en un esqu es Binomial (1, p ) , donde p es la proporcin de
esqus defectuosos
9. Si X Binomial ( 7,0, 4 ) , los valores que puede adoptar X son: {0,1, 2,3, 4,5,6,7}
10. Si X Poisson ( 6 ) , los valores que puede adoptar X son: {0,1, 2,3, 4,5,6}
Cuestiones a completar
1. Una variable discreta puede tomar un conjunto finito o infinito numerable (contable) de valores, cada uno
de los cuales con una cierta (probabilidad, posibilidad.asociada.
2. Para tener un modelo Binomial de parmetros n y p debemos repetir un experimentoveces
y cada prueba tendr slo
posible(s)(.y..). La
probabilidad del xito esy la probabilidad del fracaso es. Ambas probabilidades (se
mantienen constantes, pueden variar).durante todo el proceso
continua).
4. Lanzamos un dado 4 veces. Consideramos xito sacar 5. Para calcular la probabilidad de obtener
como mucho 2 xitos, consideramos una variable ( Binomial ,
Poisson , Uniforme )
6. El conjunto de todos los posibles valores que puede adoptar una variable aleatoria es (la muestra, el
espacio muestral, los puntos muestrales)
7. xito o fracaso al aplicar un tratamiento a los pacientes corresponde a una variable aleatoria de
8. El nmero de veces que obtenemos concentraciones de glucosas sricas mayores de 7 mmol/L (126
mg/dL) en un da corresponde a una variable aleatoria de.
9. El nmero de veces que un mdico logra xito al aplicar un tratamiento a sus pacientes corresponde a
una variable ..
10. Los valores de concentracin srica de la glucosa corresponde a una variable.
Cuestiones
1. Cuando a todos los datos de una muestra se les suma una constante:
(a)
(b)
(c)
(d)
(e)
La media no vara
La media queda incrementada en esa constante
La desviacin tpica no vara
La desviacin tpica queda incrementada en esa constante
(b) y (c)
Un estadstico de centralizacin
Un estadstico de dispersin adimensional
Una medida de variacin conjunta entre dos variables
Un ndice de asimetra
(c) y (d)
4. Cuando una muestra es asimtrica, el mejor estadstico de centralizacin que puede emplearse es la:
(a)
(b)
(c)
(d)
(e)
Media aritmtica
Moda
Mediana
Media geomtrica
Media armnica
5. Cuando todos los datos de una muestra se multiplican por una constante:
(a)
(b)
(c)
(d)
(e)
El intervalo o recorrido
La desviacin media
La varianza
La desviacin tpica
El coeficiente de variacin
7. Es un estadstico de dispersin:
(a)
(b)
(c)
(d)
(e)
Moda
Intervalo
Mediana
Media armnica
Media geomtrica
8. Para comparar correctamente, desde un punto de vista descriptivo, la dispersin de dos o ms variables,
debe utilizarse:
(a)
(b)
(c)
(d)
(e)
La desviacin tpica
La amplitud
El coeficiente de variacin
La covarianza
La desviacin media
Media geomtrica
Media ponderada
Varianza
Percentil
Covarianza
0
1
1,96
1
1,96
12. El estadstico de centralizacin que debe calcularse en una muestra con un coeficiente de asimetra
distinto de 0 es la:
(a)
(b)
(c)
(d)
(e)
Media armnica
Mediana
Media geomtrica
Media aritmtica
Moda
13. En una muestra, a una observacin que discrepa del resto se le denomina:
(a)
(b)
(c)
(d)
(e)
Error aleatorio
Dato aberrante o extremo
Sesgo
Error sistemtico
Caso
Varianza
Intervalo intercuartlico
Intervalo
Desviacin tpica
Error estndar
16. Indquese cul de las siguientes frases define el concepto estadstico de intervalo:
(a)
(b)
(c)
(d)
(e)
(c)
(d)
x
n
s12
s22
( x x )
n 1
s
n
(e) 100
s
n
2
3
2,5
4
2,75
El cuadrado de la varianza
La desviacin ms grande
La raz cuadrada positiva de la varianza
El cuadrado de la media armnica
La diferencia entre la media y la moda
21. Si se multiplica cada observacin de un conjunto de datos por una constante, la desviacin tpica:
(a)
(b)
(c)
(d)
No vara
Queda multiplicada por el valor absoluto de la constante
Queda multiplicada por un factor igual al valor absoluto de la constante dividido por el nmero de datos
Queda multiplicado por un factor igual al valor absoluto de la constante multiplicado por el nmero de
datos
(e) Queda multiplicado por el cuadrado de la constante
Ejercicios
1. Para la variable tiempo de seguimiento (en meses cumplidos) creada a partir de los datos de la siguiente
distribucin, y para su transformacin logartmica, calcular media, media geomtrica, mediana, y coeficiente
de apuntamiento
Fecha diagnstico
12/01/2001
15/02/2001
16/03/2001
25/02/2001
15/02/2001
08/03/2001
10/03/2001
14/04/2001
22/04/2001
02/05/2001
06/06/2001
08/01/2001
Fecha alta
10/02/2001
27/02/2001
03/04/2001
28/04/2001
20/05/2001
15/07/2001
17/08/2001
21/10/2001
30/11/2001
10/09/2002
15/12/2003
03/07/2006
casos
1
1
1
1
1
1
1
1
1
1
1
1
2. El coeficiente de variacin:
(a)
(b)
(c)
(d)
3. Si se quiere disponer de una representacin grfica de datos cuantitativos que conserve los datos
originales se utilizar:
(a)
(b)
(c)
(d)
Un diagrama de caja
Un histograma
Un diagrama de barras
Un diagrama de tallos y hojas
4. Se ha evaluado la accin global de un frmaco sobre un conjunto de enfermos con las siguientes
variaciones clnicas: -1=peor, = igual, 1=algo mejor, 2=mejor, 3=mucho mejor. Con qu escala de medida
ha sido registrada esta variable?
(a)
(b)
(c)
(d)
Discreta
Nominal
Ordinal
Con ninguna escala
5. Suponiendo que la media de la concentracin de paratirina (PTH) de una muestra de sujetos sanos fuera
de 1,75 ng/mL, este valor indicara que
(a)
(b)
(c)
(d)
8. La presin sangunea sistlica presenta en un grupo de pacientes con arteriosclerosis una media de 120
mmHg y una varianza de 14 mmHg2. Se ha registrado para los mismos individuos la concentracin de
colesterol, obteniendo una media de 2,30 g/L y una varianza de 0,11 (g/L)2. Cul de las dos distribuciones
presenta mayor variabilidad?
(a)
(b)
(c)
(d)
La concentracin de colesterol
La presin sangunea
No se puede contestar sin conocer el nmero de sujetos
Es preciso evaluar las condiciones de registro antes de contestar
9. Se han tabulado las observaciones de una variable cuantitativa continua y se ha dibujado un histograma.
Si un intervalo es el doble de ancho que el resto de intervalos su altura ser:
(a)
(b)
(c)
(d)
10. Cul de los siguientes ndices permite medir la variabilidad de una distribucin simtrica de valores
cuantitativos?
(a)
(b)
(c)
(d)
La desviacin tpica
La moda
La mediana
Otro ndice diferente de los dems
11. Cul de las siguientes afirmaciones es correcta respecto a las variables cuantitativas continuas?
(a)
(b)
(c)
(d)
Desviacin tpica
Amplitud o intervalo
Desviacin cuartil
Amplitud intercuartil
15. Tenemos 5 sujetos de 16, 20, 23, 25 y 36 aos (cumplidos) Cunto vale la media de edad de este
grupo?
(a)
(b)
(c)
(d)
24,5 aos
24 aos
23,5 aos
otro valor
56,5
8,02
7,52
otro valor
17. En un hospital se han registrado 125 nacimientos durante un periodo de tiempo. La distribucin de
frecuencias del peso, obtenida en una muestra aleatoria de 35 recin nacidos, presenta una media de 3,51
Kg y una varianza de 0,65 Kg2. Cuntos grados de libertad han intervenido en el clculo del segundo
estadstico?
(a)
(b)
(c)
(d)
35
34
124
otro valor
18. El objetivo principal de la tabulacin de una variable cuantitativa continua en intervalos de clase es:
(a)
(b)
(c)
(d)
19. Cuando decimos que un individuo con valor de paratirina plasmtica (PTH) igual a 2,00 ng/mL ocupa el
percentil 70 de una distribucin, queremos que:
(a)
(b)
(c)
(d)
20. Si la distribucin de frecuencias de una variable cuantitativa, obtenida en una muestra , presenta un
valor elevado de la desviacin tpica:
(a)
(b)
(c)
(d)
21. La diferencia entre el valor correspondiente al tercer cuarto y el valor correspondiente al primer cuarto
indica
(a)
(b)
(c)
(d)
22. Se ha medido el peso en Kg de un grupo de sujetos (con precisin 0,5 Kg), y el resultado se ha
redondeado al valor exacto ms prximo. Para tabularlos se han construido intervalos de amplitud igual a 10
Kg. Si el peso ms pequeo ha sido 60 Kg, el primer intervalo tendr por lmites verdaderos:
(a)
(b)
(c)
(d)
56-69
60-69,5
59,5-69,5
60-70
23. Continuando con la pregunta anterior, los lmites que aparecern en la tabla correspondientes a los dos
primeros intervalos de clase sern:
(a)
(b)
(c)
(d)
59-69 y 69-79
60-70 y 70-80
60-69 y 70-79
60-69,5 y 70-79,5
10
24. En un hospital el 80 % de los recin nacidos obtienen una puntuacin APGAR igual a 9. Qu
representa el valor 9 de esta distribucin?
(a)
(b)
(c)
(d)
La media
El percentil 80
La moda
El decil 2
26. Se ha registrado para una muestra de sujetos la concentracin corpuscular media de hemoglobina.
Qu ndices son ms indicados para sintetizar esa distribucin suponiendo que es simtrica?
(a)
(b)
(c)
(d)
Media y moda
Media, amplitud, asimetra y apuntamiento y porcentajes
Mediana y porcentajes
Media, desviacin tpica y tamao de la muestra
Binaria
Cuantitativa discreta
Ordinal
Numrica
28. Se ha efectuado un estudio en jvenes con edades comprendidas entre los 12 y 16 aos. Considerando
que se ha efectuado la correccin correspondiente (0,5 aos) sobre las edades antes de calcular los ndices
estadsticos, cul de las siguientes afirmaciones es la ms correcta?
(a) La mediana es una medida de dispersin adecuada para la descripcin de esta distribucin
(b) El valor ms frecuente de esta distribucin representar adecuadamente la tendencia central de la
distribucin
(c) La correccin afectar al valor de la varianza
(d) Ninguna de las anteriores respuestas es cierta
29. Cul de las siguientes afirmaciones respecto a las variables categricas ordinales es cierta?
(a)
(b)
(c)
(d)
Un diagrama de caja
Un diagrama de sectores
Un histograma
Cualquiera de los anteriores
11
31. Cul de los siguientes ndices estadsticos no corresponde al valor de la mediana en una distribucin
de valores cuya asimetra toma un valor muy inferior a 0?
(a)
(b)
(c)
(d)
El cuartil 2
La media aritmtica
El decil 5
Todos los ndices anteriores representan el valor de la mediana en esta distribucin
32. Se quiere estudiar el nivel de consumo de cocana en jvenes con edades comprendidas entre los 13 y
los 16 aos. La diferencia de estos dos valores:
(a)
(b)
(c)
(d)
Problemas
A. La siguiente tabla presenta la distribucin de la hemoglobina en sangre (g/dL) en un grupo de pacientes
con leucemia. Se trata de entrar estos datos en MS Excel y capturarlos con SPSS para completar el listado
obtenido con el procedimiento EXAMINE
Hemoglobina (g/dL)
3,1
6,5
7,1
7,7
8,7
8,9
9,5
9,6
10,0
10,3
10,7
10,9
11,3
11,4
11,7
11,9
12,6
13,1
15,0
12
casos
1
1
1
1
1
2
1
1
1
2
1
1
1
4
2
1
2
1
1
Ordinal
Categrica
Cuantitativa continua
Cuantitativa discreta
Un diagrama de caja
Un diagrama de barras
Un polgono de frecuencias
Un diagrama de sectores
Descriptivos
Hemoglobina (g/dL)
Media
Intervalo de confianza
para la media al 95%
Estadstico
A
8,706
Lmite inferior
Lmite superior
11,294
Media recortada al 5%
Mediana
Varianza
Desv. tp.
Mnimo
Mximo
Rango
Amplitud intercuartil
Asimetra
Curtosis
10,106
10,300
7,210
B
3,1
C
D
E
-,710
1,371
10,800
10,796
10,296
otro valor
2,685
5,773
0,471
otro valor
11,.9
3,1
15
otro valor
Error tp.
,6160
3,1
15
11,9
otro valor
13
,524
1,014
3,0
11,9
15
otro valor
0,471
0,27
2,403
otro valor
10,43
2,296
9,548
10,296
10,296
10,800
11,400
otro valor
Percentiles
Promedio
ponderado(definicin 1)
Hemoglobina (g/dL)
Bisagras de Tukey
Hemoglobina (g/dL)
10
25
3,100
6,500
8,700
F
11,70
10,80
8,80
otro valor
11,70
10,30
8,90
otro valor
14
Percentiles
50
75
90
11,700
13,100
95
.
11,55
10,80
8,90
otro valor
15