Todos Examenes Yo
Todos Examenes Yo
Todos Examenes Yo
Tema 2 Sean x1 , x2 , . . . , xn los los n valores observados. La muestra ordenada (variables no categóricas nominales)
se denota por x(1) , x(2) , . . . , x(n) .
• Media aritmética: x(= n1 n
P
i=1 xi .
1
2
(x( n ) + x( n +1) ), si n es par,
• Mediana: M e = 2 2
x( n+1 ) , si n es impar.
2
• Moda: La moda es el valor xi que presenta una mayor frecuencia absoluta (o relativa).
• Cuartiles: Qk = x(k(n+1)/4) para k = 1, 2, 3.
• Percentiles: Pk = x(k(n+1)/100) para k = 1, 2, . . . , 99.
• Rango o amplitud: R = xmax − xmin .
• Rango intercuartı́lico: RIC P = Q3 − Q1 .
Varianza muestral: σ̂ 2 = n1 n 2
Pn
1
x2 − nx2 .
• i=1 (xi − x) = n
√ i=1 i
• Desviación tı́pica (o estándar) muestral: 2
Pn σ̂ = σ̂2 . 1 Pn
2 1 2 2
• Cuasivarianza muestral: s = n−1 i=1 (xi − x) = n−1 i=1 xi − nx .
√
• Cuasidesviación tı́pica muestral: s = s2 .
• Coeficiente de variación de Pearson: CV =Ps/|x|.
n 3
i=1 (xi −x)
• Coeficiente de asimetrı́a de Fisher: CA = ns3
.
Pn 4
i=1 (xi −x)
• Coeficiente de curtosis de Fisher: CC = ns4
− 3.
Tema 4 Sea Ω el espacio muestral asociado a cierto experimento aleatorio, B1 , . . . , Bk una partición de Ω, tal que
P (Bi ) 6= 0 para i = 1, . . . , k y A un suceso cualquiera.
• Ley de la probabilidad total:
• Teorema de Bayes:
X
(x − E(X))2 P (X = x), si X es una v.a. discreta,
x∈S
var(X) = Z
(x − E(X))2 f (x) dx,
si X es una v.a. continua.
S
Ejemplo:
X P
Z
V
P [Z > 1] = 0.1587
P [Z > 1.96] = 0.0250
Desv.
normal 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
x
0.0 0.5000 0.4960 0.4920 0.4880 0.4840 0.4801 0.4761 0.4721 0.4681 0.4641
0.1 0.4602 0.4562 0.4522 0.4483 0.4443 0.4404 0.4364 0.4325 0.4286 0.4247
0.2 0.4207 0.4168 0.4129 0.4090 0.4052 0.4013 0.3974 0.3936 0.3897 0.3859
0.3 0.3821 0.3783 0.3745 0.3707 0.3669 0.3632 0.3594 0.3557 0.3520 0.3483
0.4 0.3446 0.3409 0.3372 0.3336 0.3300 0.3264 0.3228 0.3192 0.3156 0.3121
0.5 0.3085 0.3050 0.3015 0.2981 0.2946 0.2912 0.2877 0.2843 0.2810 0.2776
0.6 0.2743 0.2709 0.2676 0.2643 0.2611 0.2578 0.2546 0.2514 0.2483 0.2451
0.7 0.2420 0.2389 0.2358 0.2327 0.2296 0.2266 0.2236 0.2206 0.2177 0.2148
0.8 0.2119 0.2090 0.2061 0.2033 0.2005 0.1977 0.1949 0.1922 0.1894 0.1867
0.9 0.1841 0.1814 0.1788 0.1762 0.1736 0.1711 0.1685 0.1660 0.1635 0.1611
1.0 0.1587 0.1562 0.1539 0.1515 0.1492 0.1469 0.1446 0.1423 0.1401 0.1379
1.1 0.1357 0.1335 0.1314 0.1292 0.1271 0.1251 0.1230 0.1210 0.1190 0.1170
1.2 0.1151 0.1131 0.1112 0.1093 0.1075 0.1056 0.1038 0.1020 0.1003 0.0985
1.3 0.0968 0.0951 0.0934 0.0918 0.0901 0.0885 0.0869 0.0853 0.0838 0.0823
1.4 0.0808 0.0793 0.0778 0.0764 0.0749 0.0735 0.0721 0.0708 0.0694 0.0681
1.5 0.0668 0.0655 0.0643 0.0630 0.0618 0.0606 0.0594 0.0582 0.0571 0.0559
1.6 0.0548 0.0537 0.0526 0.0516 0.0505 0.0495 0.0485 0.0475 0.0465 0.0455
1.7 0.0446 0.0436 0.0427 0.0418 0.0409 0.0401 0.0392 0.0384 0.0375 0.0367
1.8 0.0359 0.0351 0.0344 0.0336 0.0329 0.0322 0.0314 0.0307 0.0301 0.0294
1.9 0.0287 0.0281 0.0274 0.0268 0.0262 0.0256 0.0250 0.0244 0.0239 0.0233
2.0 0.0228 0.0222 0.0217 0.0212 0.0207 0.0202 0.0197 0.0192 0.0188 0.0183
2.1 0.0179 0.0174 0.0170 0.0166 0.0162 0.0158 0.0154 0.0150 0.0146 0.0143
2.2 0.0139 0.0136 0.0132 0.0129 0.0125 0.0122 0.0119 0.0116 0.0113 0.0110
2.3 0.0107 0.0104 0.0102 0.0099 0.0096 0.0094 0.0091 0.0089 0.0087 0.0084
2.4 0.0082 0.0080 0.0078 0.0075 0.0073 0.0071 0.0069 0.0068 0.0066 0.0064
2.5 0.0062 0.0060 0.0059 0.0057 0.0055 0.0054 0.0052 0.0051 0.0049 0.0048
2.6 0.0047 0.0045 0.0044 0.0043 0.0041 0.0040 0.0039 0.0038 0.0037 0.0036
2.7 0.0035 0.0034 0.0033 0.0032 0.0031 0.0030 0.0029 0.0028 0.0027 0.0026
2.8 0.0026 0.0025 0.0024 0.0023 0.0023 0.0022 0.0021 0.0021 0.0020 0.0019
2.9 0.0019 0.0018 0.0018 0.0017 0.0016 0.0016 0.0015 0.0015 0.0014 0.0014
3.0 0.0013 0.0013 0.0013 0.0012 0.0012 0.0011 0.0011 0.0011 0.0010 0.0010
2
Probabilidad
Probabilidad
⫺3.4 .0003 .0003 .0003 .0003 .0003 .0003 .0003 .0003 .0003 .0002 0.0 .5000 .5040 .5080 .5120 .5160 .5199 .5239 .5279 .5319 .5359
⫺3.3 .0005 .0005 .0005 .0004 .0004 .0004 .0004 .0004 .0004 .0003 0.1 .5398 .5438 .5478 .5517 .5557 .5596 .5636 .5675 .5714 .5753
⫺3.2 .0007 .0007 .0006 .0006 .0006 .0006 .0006 .0005 .0005 .0005 0.2 .5793 .5832 .5871 .5910 .5948 .5987 .6026 .6064 .6103 .6141
⫺3.1 .0010 .0009 .0009 .0009 .0008 .0008 .0008 .0008 .0007 .0007 0.3 .6179 .6217 .6255 .6293 .6331 .6368 .6406 .6443 .6480 .6517
⫺3.0 .0013 .0013 .0013 .0012 .0012 .0011 .0011 .0011 .0010 .0010 0.4 .6554 .6591 .6628 .6664 .6700 .6736 .6772 .6808 .6844 .6879
⫺2.9 .0019 .0018 .0018 .0017 .0016 .0016 .0015 .0015 .0014 .0014 0.5 .6915 .6950 .6985 .7019 .7054 .7088 .7123 .7157 .7190 .7224
⫺2.8 .0026 .0025 .0024 .0023 .0023 .0022 .0021 .0021 .0020 .0019 0.6 .7257 .7291 .7324 .7357 .7389 .7422 .7454 .7486 .7517 .7549
⫺2.7 .0035 .0034 .0033 .0032 .0031 .0030 .0029 .0028 .0027 .0026 0.7 .7580 .7611 .7642 .7673 .7704 .7734 .7764 .7794 .7823 .7852
⫺2.6 .0047 .0045 .0044 .0043 .0041 .0040 .0039 .0038 .0037 .0036 0.8 .7881 .7910 .7939 .7967 .7995 .8023 .8051 .8078 .8106 .8133
⫺2.5 .0062 .0060 .0059 .0057 .0055 .0054 .0052 .0051 .0049 .0048 0.9 .8159 .8186 .8212 .8238 .8264 .8289 .8315 .8340 .8365 .8389
⫺2.4 .0082 .0080 .0078 .0075 .0073 .0071 .0069 .0068 .0066 .0064 1.0 .8413 .8438 .8461 .8485 .8508 .8531 .8554 .8577 .8599 .8621
⫺2.3 .0107 .0104 .0102 .0099 .0096 .0094 .0091 .0089 .0087 .0084 1.1 .8643 .8665 .8686 .8708 .8729 .8749 .8770 .8790 .8810 .8830
⫺2.2 .0139 .0136 .0132 .0129 .0125 .0122 .0119 .0116 .0113 .0110 1.2 .8849 .8869 .8888 .8907 .8925 .8944 .8962 .8980 .8997 .9015
⫺2.1 .0179 .0174 .0170 .0166 .0162 .0158 .0154 .0150 .0146 .0143 1.3 .9032 .9049 .9066 .9082 .9099 .9115 .9131 .9147 .9162 .9177
⫺2.0 .0228 .0222 .0217 .0212 .0207 .0202 .0197 .0192 .0188 .0183 1.4 .9192 .9207 .9222 .9236 .9251 .9265 .9279 .9292 .9306 .9319
⫺1.9 .0287 .0281 .0274 .0268 .0262 .0256 .0250 .0244 .0239 .0233 1.5 .9332 .9345 .9357 .9370 .9382 .9394 .9406 .9418 .9429 .9441
⫺1.8 .0359 .0351 .0344 .0336 .0329 .0322 .0314 .0307 .0301 .0294 1.6 .9452 .9463 .9474 .9484 .9495 .9505 .9515 .9525 .9535 .9545
⫺1.7 .0446 .0436 .0427 .0418 .0409 .0401 .0392 .0384 .0375 .0367 1.7 .9554 .9564 .9573 .9582 .9591 .9599 .9608 .9616 .9625 .9633
⫺1.6 .0548 .0537 .0526 .0516 .0505 .0495 .0485 .0475 .0465 .0455 1.8 .9641 .9649 .9656 .9664 .9671 .9678 .9686 .9693 .9699 .9706
⫺1.5 .0668 .0655 .0643 .0630 .0618 .0606 .0594 .0582 .0571 .0559 1.9 .9713 .9719 .9726 .9732 .9738 .9744 .9750 .9756 .9761 .9767
⫺1.4 .0808 .0793 .0778 .0764 .0749 .0735 .0721 .0708 .0694 .0681 2.0 .9772 .9778 .9783 .9788 .9793 .9798 .9803 .9808 .9812 .9817
⫺1.3 .0968 .0951 .0934 .0918 .0901 .0885 .0869 .0853 .0838 .0823 2.1 .9821 .9826 .9830 .9834 .9838 .9842 .9846 .9850 .9854 .9857
⫺1.2 .1151 .1131 .1112 .1093 .1075 .1056 .1038 .1020 .1003 .0985 2.2 .9861 .9864 .9868 .9871 .9875 .9878 .9881 .9884 .9887 .9890
⫺1.1 .1357 .1335 .1314 .1292 .1271 .1251 .1230 .1210 .1190 .1170 2.3 .9893 .9896 .9898 .9901 .9904 .9906 .9909 .9911 .9913 .9916
⫺1.0 .1587 .1562 .1539 .1515 .1492 .1469 .1446 .1423 .1401 .1379 2.4 .9918 .9920 .9922 .9925 .9927 .9929 .9931 .9932 .9934 .9936
⫺0.9 .1841 .1814 .1788 .1762 .1736 .1711 .1685 .1660 .1635 .1611 2.5 .9938 .9940 .9941 .9943 .9945 .9946 .9948 .9949 .9951 .9952
⫺0.8 .2119 .2090 .2061 .2033 .2005 .1977 .1949 .1922 .1894 .1867 2.6 .9953 .9955 .9956 .9957 .9959 .9960 .9961 .9962 .9963 .9964
⫺0.7 .2420 .2389 .2358 .2327 .2296 .2266 .2236 .2206 .2177 .2148 2.7 .9965 .9966 .9967 .9968 .9969 .9970 .9971 .9972 .9973 .9974
⫺0.6 .2743 .2709 .2676 .2643 .2611 .2578 .2546 .2514 .2483 .2451 2.8 .9974 .9975 .9976 .9977 .9977 .9978 .9979 .9979 .9980 .9981
⫺0.5 .3085 .3050 .3015 .2981 .2946 .2912 .2877 .2843 .2810 .2776 2.9 .9981 .9982 .9982 .9983 .9984 .9984 .9985 .9985 .9986 .9986
⫺0.4 .3446 .3409 .3372 .3336 .3300 .3264 .3228 .3192 .3156 .3121 3.0 .9987 .9987 .9987 .9988 .9988 .9989 .9989 .9989 .9990 .9990
⫺0.3 .3821 .3783 .3745 .3707 .3669 .3632 .3594 .3557 .3520 .3483 3.1 .9990 .9991 .9991 .9991 .9992 .9992 .9992 .9992 .9993 .9993
⫺0.2 .4207 .4168 .4129 .4090 .4052 .4013 .3974 .3936 .3897 .3859 3.2 .9993 .9993 .9994 .9994 .9994 .9994 .9994 .9995 .9995 .9995
⫺0.1 .4602 .4562 .4522 .4483 .4443 .4404 .4364 .4325 .4286 .4247 3.3 .9995 .9995 .9995 .9996 .9996 .9996 .9996 .9996 .9996 .9997
⫺0.0 .5000 .4960 .4920 .4880 .4840 .4801 .4761 .4721 .4681 .4641 3.4 .9997 .9997 .9997 .9997 .9997 .9997 .9997 .9997 .9997 .9998
Examen Final de Estadı́stica I, 27 de junio de 2017.
Grados en ADE, DER-ADE, ADE-INF, FICO, ECO, ECO-DER, ADE-EEII.
1. (3 puntos) Las elecciones generales del 2016 en España fueron un verdadero quebradero de cabeza
para los partidos tradicionales. El PP, partido que obtuvo el mayor porcentaje de votos a favor,
apenas obtuvo el 28.72% de los votos contabilizados. Algunos analistas se preguntan si el apoyo a
este partido dependió de la participación ciudadana, la cual miden en términos de concurrencia de
votantes el dı́a de las elecciones.
(a) (0.75 puntos) El diagrama de dispersión de p (porcentaje de participación por mesa electoral, eje
x) y v (porcentaje de votos a favor del PP, eje y) se muestra en la Figura 1. El coeficiente de
correlación entre estas variables es 0.26 Valore si existe una relación lineal o de otro tipo entre p
y v.
0.8
0.6
0.4
0.2
0
0 0.2 0.4 0.6 0.8 1
(b) (0.75 puntos) La tabla adjunta muestra algunas medidas descriptivas de las variables bajo estudio.
Teniendo en cuenta la información disponible (gráfico de dispersión y tabla), deduzca si existen
mesas atı́picas, bien sea por valores extremos de participación o por votos a favor del PP. ¿Existen
mesas con porcentajes atipicamente pequeños de votos a favor?
10 4 10 4
2 2
1.5 1.5
1 1
0.5 0.5
0 0
0 0.5 1 0 0.5 1
(d) (0.75 puntos) Los analistas del partido del PP sospechan que la caı́da de votos a favor se debió a la
falta de movilización. En ese sentido, aseguran que en las mesas con baja participación (≤ 70%,
según ellos), su porcentaje de votos a favor fue considerablemente más bajo del obtenido en las
mesas con alta participación (> 70%). ¿Es razonable esa idea? Justifique la respuesta utilizando
la información de la siguiente tabla:
2
2. (1.75 puntos) Una encuesta para medir el voto en la segunda vuelta en las elecciones presidenciales
francesas entre los candidatos Le Pen y Macron, encontró que el 40% de los votantes son menores
de 30 años y el 45% tienen entre 30 y 50 años. Por otro lado, el porcentaje de personas que tienen
intención de votar a Le Pen es del 20% entre las personas menores de 30 años, del 55% en las personas
entre 30 y 50 años y del 70% para las personas mayores de 50 años.
a) (0.5 puntos) ¿Cuál es la probabilidad de que una persona elegida al azar tenga intención de votar
a Le Pen y sea mayor de 30 años?
b) (0.5 puntos) Si una persona elegida al azar tiene intención de votar por Macron, ¿cuál es la
probabilidad de que el/ella tenga menos de 50 años?
c) (0.75 puntos) En el caso de los votantes mayores de 30 años, ¿qué porcentaje votará a Le Pen?
3. (1.5 puntos) El Estado emite bonos del Tesoro cuyo vencimiento fluctua entre 1 y 7 años. La función
de distribución de T , número de años hasta el vencimiento (vida residual), para un bono seleccionado
al azar, es
0, t < 1,
0.2, 1 ≤ t < 3,
FT (t) 0.7, 3 ≤ t < 5,
5 ≤ t < 7,
0.8,
1, t ≥ 7.
4. (1.5 puntos) Una determinada empresa de ventas online ha detectado que la probabilidad de que una
venta recibida sea fraudulenta es de 0.01. Si en una hora reciben 20 operaciones de venta y sabiendo
que se pueden realizar ventas las 24 horas del dı́a, conteste justificadamente a las siguientes cuestiones:
a) (0.75 pts) ¿Cuál es la probabilidad de que tenga al menos una operación fraudulenta en una hora
seleccionada al azar? Indique las hipótesis asumidas para obtener esta probabilidad.
b) (0.75 pts) La empresa de ventas ha contratado un seguro que cubre el coste de las ventas frau-
dulentas por el que paga una prima semanal global de 50 euros más 7 euros por cada operación
3
fraudulenta que reciba durante esa semana. En estas condiciones, calcula el coste semanal esperado
por la empresa por este concepto y su devsiación tı́pica.
5. (2.25 puntos) La duración, en minutos, en que los usuarios de un número de atención telefónica
consiguen obtener la información requerida se puede modelizar según una variable aleatoria de media
2 minutos y desviación tı́pica 1.9 minutos. Responda justificadamente a las siguientes cuestiones:
a) (0.75 pts) Se ha tomado una muestra de 100 tiempos y se han obtenido los siguientes gráficos:
¿Podemos suponer que la muestra sigue un modelo de probabilidad Normal? ¿Por qué?
b) (0.75 pts) Si es posible, calcule la probabilidad de que el tiempo medio de atención telefónica de 100
usuarios seleccionados al azar supere los dos minutos y medio. Comente por qué ha sido posible
o no calcular dicha probabilidad. ¿Podrı́a calcular la probabilidad requerida para una muestra
seleccionada al azar de 10 clientes?
c) (0.75 pts) Se han recogido los tiempos de atención de 100 usuarios seleccionados al azar obteniéndose
que 38 tuvieron una duración superior a 2 minutos, calcule un intervalo de confianza para la pro-
porción poblacional de duraciones superiores a 2 minutos a un 95% de nivel confianza.
4
Examen Final de Estadı́stica I, 17 de mayo de 2017.
Grados en ADE, DER-ADE, ADE-INF, FICO, ECO, ECO-DER, TUR, ADE-EEII.
NORMAS: 1) Realizar los cálculos con al menos dos cifras decimales significativas.
2) No se podrá abandonar el examen hasta transcurridos 30 minutos depués de haber empezado.
3) No está permitido salir del aula sin entregar el examen, aunque esté en blanco.
1. (3 pts) La siguiente tabla muestra los valores del Indice de Desarrollo Humano (IDH) para diferentes paı́ses de África,
América y Europa en el año 2015.
África 0,348 0,411 0,413 0,416 0,419 0,646 0,666 0,684 0,69 0,698 0,721 0,724 0,736 0,772 0,777
América 0,483 0,666 0,679 0,714 0,715 0,772 0,78 0,783 0,785 0,79 0,793 0,827 0,847 0,919 0,923
Europa 0,693 0,751 0,754 0,761 0,771 0,899 0,907 0,907 0,908 0,916 0,916 0,922 0,923 0,93 0,944
(a) (0,7 pts) Especifique un modelo probabilı́stico para la variable aleatoria Y , que representa el beneficio que se obtendrá
con la campaña. Indique y justifique las hipótesis necesarias.
(b) (0,6 pts) Calcule la media, varianza y desviación tı́pica del beneficio Y .
(c) (0,7 pts) Calcule (de forma exacta o aproximada) la probabilidad de que el beneficio Y supere los 712000 euros.
3. (3 pts) Según los datos del INE, la distribución de hogares españoles en función del número de sus miembros viene dada
en la siguiente tabla. La tercera columna de la tabla refleja el porcentaje de hogares que disponen de lector de libros
electrónicos (e-book):
Conteste a las siguientes preguntas inicando claramente los sucesos con los que trabaja y los resultados que emplea en cada
caso.
(a) (0,6 pts) Calcule la probabilidad de que un hogar español seleccionado al azar no disponga de lector de libros electrónicos.
(b) (0,6 pts) Se selecciona un hogar español al azar y resulta que no dispone de e-book, ¿Cuál es la probabilidad de que
solo tenga 1 o 2 miembros?
(c) (0,6 pts) Elegido un hogar al azar, ¿Cuál es la probabilidad de que vivan en el mismo menos de 4 personas y no tengan
e-book?
(d) (0,6 pts) Entre los hogares con 3 o más miembros, ¿Cuántos disponen de lector de libros electrónicos?
(e) (0,6 pts) Una empresa proveedora de libros electrónicos diseña una campaña de promoción de e-books y para ello
selecciona una muestra aleatoria de 20 hogares, calcule la probabilidad de que más del 85% de los hogares seleccionados
no disponga de e-book.
4. (2 pts) A continuación, en la Tabla 1, se presentan los resultados del estudio realizado por el CIS sobre ”Actitudes y
Comportamientos Innovadores en la Sociedad Española”. A los encuestados se les pregunta por la importancia que asignan
a la innovación en distintos ámbitos o sectores (las fuentes de energı́a, las infraestructuras, el medio ambiente, la medicina,
la alimentación, la administración pública, la enseñanza, las empresas y los servicios sociales). Adicionalmente, con las
respuestas de los encuestados se construye el siguiente indicador global de la importancia de la innovación:
9
1X
I= Xi
9 i=1
El análisis descriptivo básico de I se muestra en la Tabla 2 a continuación:
(a) (0,6 pts) Explique cómo cree que se ha obtenido la estimación de la media de la variable I, es decir, i ≈ 8, 20.
(b) (0,7 pts) Calcule un intervalo de confianza del 95% para el nivel medio de importancia que se asigna a la innovación,
µI .
(c) (0,7 pts) Comente el ajuste de la variable I a la distribución normal. Justifique su respuesta basándose en los siguientes
gráficos.
2
Estadı́stica I Examen Extraordinario, 23 Junio 2016.
Grados en ADE, DER-ADE, ADE-INF, ADE-INT, FICO, ECO, ECO-DER, TUR.
REGLAS DEL EXAMEN: 1) Usar cuadernillos separados para cada problema. 2) Hacer los
cálculos con al menos dos decimales significativos. 3) No se puede abandonar el examen durante
los primeros 30 minutos. 4) No está permitido salir de la clase sin entregar el examen.
1. Se dispone de la siguiente información acerca de 10 empresas del Dow Jones: X1 =“sueldo de ejecutivo
mejor pagado (en millones de dólares)” y X2 =“precio de la acción (en dólares)”. Fuente: El Paı́s, 8 de
Mayo de 2016.
(a) (1 punto) Para la variable X2 , dibujar el diagrama de caja (box-plot) e identificar los atı́picos (si los
hubiere). Justificar la respuesta.
(b) (0,5 puntos) Determinar si X1 y X2 presentan el mismo tipo de asimetrı́a. Justificar la respuesta.
(c) (0,5 puntos) Determinar cuál de los diagramas de caja (A, B, C) corresponde a la variable X1 .
Justificar la respuesta.
(d) (0,5 puntos) Sabiendo que 1 euro = 1,14 dólares, obtener el sueldo medio de estos ejecutivos (en
millones de euros) y la varianza.
(a) (0,75 puntos) Calcular la probabilidad de que un habitante utilice solamente uno de los tres medios de
transporte en un dı́a laborable.
(b) (0,5 puntos) Calcular la probabilidad de que un habitante utilice por lo menos un medio de transporte
en un dı́a laborable.
(c) (0,75 puntos) Cuando en un dı́a laborable sólo se usa un medio de transporte, la probabilidad de
sufrir un retraso de más de 5 minutos es del 2%. Sin embargo, cuando se combina más de un medio
de transporte, esta probabilidad alcanza el 7%. Calcular la probabilidad que un habitante sufra un
retraso de más de 5 minutos en un dı́a laborable.
(d) (0,5 puntos) Utilizando la misma información del apartado (c) y sabiendo que un viajero ha sufrido
un retraso de más de 5 minutos, calcular la probabilidad de que haya utilizado más de un tipo de
transporte.
4. Sea X una v.a. que toma valores en el conjunto S = {2, 3, 5, 7}, con la siguiente función de probabilidad:
0.10
si x = 2,
0.25 si x = 3,
P (X = x) = 0.35 si x = 5,
0.30 si x = 7,
0 en el resto de valores.
(a) (1 punto) Considerar una muestra aleatoria simple con la misma distribución que X, de tamanño
n = 150. Calcular la probabilidad de que la media muestral tome valores entre 4.6 y 5.0.
(b) (0.5 puntos) Comparar el resultado obtenido en el apartado (a) con la cota inferior que se obtendrı́a
utilizando la desigualdad de Chebyschev. ¿Es contradictorio el resultado? ¿Cuando es adecuado
utilizar la aproximación que porporciona la desigualdad de Chebyschev?
(c) (0.5 puntos) Sea Y una nueva v.a. que toma valor 1 si X < 5, y valor 0 en caso contrario. Determinar
el modelo de probabilidad que sigue Y , calcular su esperanza y varianza.
(d) (0.5 puntos) En una muestra de tamanño n = 250, X ha tomado valores menores que 5 en 75 ocasiones.
Obtener el intervalo de confianza para la media de Y al 98% de confianza.
2
Examen Final de Estadı́stica I, 26 de Mayo de 2016.
Grados en ADE, DER-ADE, ADE-INF, FICO, ECO, ECO-DER, TUR.
1. En las siguientes tablas se recoge información acerca de 10 empresas del IBEX 35. En concreto, se tienen tres
variables X1 =“retribución media del consejo de dirección”, X2 =“retribución media de la alta dirección”
y X3 =“gasto medio por empleado” (expresadas en millones de euros). Fuente: El Paı́s, 8 de Mayo de 2016.
Tabla 1 / Table 1
Empresa / Company X1 X2 X3 Figura 1 / Figure 1
BBVA 0,985 1,144 0,455
ACS 0,667 0,540 0,401
FCC 0,720 0,650 0,323
I dit
Inditex 1,270
1 270 1,730
1 730 0,231
0 231 A
Acciona 0,463 0,590 0,390
Santander 1,484 2,580 0,586
IAG 1,220 2,440 0,809
Iberdrola 0,920 1,979 0,894
Ferrovial 1,330 1,800 0,391
Telefónica 1,240 1,869 0,491 B
Tabla 2 / Table 2
X1 X2 X3
Media / Mean 1,030 0,497
Mediana / Median 1,765 0,428
Desv. típica / Standard dev. 0,333 0,756 0,210
Varianza / Variance 0,572 0,044
Q1 0,770 0,774 0,390
Q3 , 63
1,263 ,95
1,952
1
0,9
0,8
0,7
0,6
0,5
04
0,4
0,3
0,2
0,1
0
1 2 3 4 5
3. El indicador AROPE mide el riesgo de padecer ciertos factores de vulnerabilidad social dentro del hogar.
A largo de 2014, de un total de 1.200.000 hogares atendidos por cierta ONG, solamente 156.000 no estaban
en situación de AROPE. Además, de los hogares que no estaban en situación de AROPE, el 84% tampoco
presentaban sobre-endeudamiento. Por otro lado, de los que sı́ estaban en situación de AROPE, el 40%
también presentaba sobre-endeudamiento.
(a) (0,5 puntos) Del total de hogares atendidos por esta ONG, calcular cuántos hogares presetan sobre-
endeudamiento.
(b) (0,75 puntos) Sabiendo que un hogar no tiene sobre-endeudamiento, determinar la probabilidad de que
esté en situación de AROPE.
(c) (0,5 puntos) Si en un dı́a cualquiera, un trabajador social de esta ONG visita 20 hogares, calcular la
probabilidad de que 5 de ellos no estén en situación de AROPE.
(d) (0,75 puntos) Si en un mes cualquiera se visitan 420 hogares, calcular la probabilidad de que por lo
menos 150 hogares estén en situación de AROPE y sobre-endeudamiento.
4. La retribución media de los directivos mejor pagados de las empresas españolas que cotizan en bolsa es de
2, 3 millones de euros anuales, con una desviación tı́pica de 0, 7. Se pide:
(a) (0,75 puntos) Calcular la probabilidad de que la retribución media anual de 100 de estos directivos
esté entre 2, 15 y 2, 45 millones de euros.
(b) (0,5 puntos) Si en lugar de 100 directivos se consideran solamente 50, sin realizar ningún cálculo
adicional, decidir si la probabilidad en (a) se incrementará o se reducirá. Justicar la respuesta.
(c) (0,5 puntos) Calcular la probabilidad de que la suma de retribuciones de 100 de estos directivos sea
mayor de 250 millones de euros.
(d) (0,75 puntos) Si para una muestra de 30 empresas españolas, la retribución media de los directivos
mejor pagados es de 2 millones de euros con una deviación tı́pica de 1, 4, calcular un intervalo de
confianza al 90% para la retribución media suponiendo normalidad. ¿Qué nivel de confianza tienes
en que la retribución media verdadera sea de 1, 5 millones de euros?
2
Estadı́stica I Examen Extraordinario, 23 Junio 2015.
Grados en ADE, DER-ADE, ADE-INF, FICO, ECO, ECO-DER, TUR.
REGLAS DEL EXAMEN: 1) Usar cuadernillos separados para cada problema. 2) Hacer los
cálculos con al menos dos decimales significativos. 3) No se puede abandonar el examen durante
los primeros 30 minutos. 4) No está permitido salir de la clase sin entregar el examen.
1. En las siguientes tablas se recoge información acerca del PIB y de la tasa de paro de las Comunidades
Autónomas españolas:
Tabla 1 Tabla 2
CCAA PIB Tasa de paro PIB Tasa de paro
Andalucía 13595.8 18.6 media 17530.7
Aragón 18766.0 6.6 mediana 16876.5
Asturias (Principado de) 15287.7 11.2 cuasi-desviación 3251.1
Balears (Illes) 20389.2 9.7 Q1 14834.7 9.3
Canarias 16832.7 11.4 Q3 20198.0
Cantabria 17425.7 10.6 Rango
Castilla y León 16920.4 11.1 intercuartílico 5363.3 1.9
Castilla-La Mancha 13978.5 10.1 percentil 85 21360.3 12.0
Cataluña 20783.7 10.1 percentil 15 14362.0
Comunidad Valenciana 16656.1 11.2
Extremadura 12240.6 17.4
Galicia 14683.7 12.7
Madrid (Comunidad de) 22968.7 7.4
Murcia (Región de) 14675.9 10.7
Navarra (Comunidad Foral) 22065.1 5.7
País Vasco 22444.5 9.5
Rioja (La) 19624.4 6.0
Ceuta y Melilla 16213.8 9.2
Solución.
(a) En la Tabla 2 faltan algunos estadı́sticos descriptivos para la variable tasa de paro: media 10.5, mediana
10.3, cuasi-desviación tı́pica 3.4, Q3 = 11.2, P15 = 7.0.
(b) Puesto que las unidades de medida y el rango de valores son muy distintos para el PIB y la tasa de
paro, la cuasi-desviación tı́pica no es un buen descriptivo para comparar sus variabilidades. Es mejor
utilizar una medida adimensional, como el coeficiente de variación (CV). En este caso,
3251.1 3.4
CV (P IB) = = 0.19, CV (t.paro) = = 0.32,
17530.7 10.5
luego la variación de la tasa de paro es mayor.
(c) El grupo de CCAA formado por el 15% con mayor PIB son aquellas cuyo PIB sea superior al percentil
85, es decir superior a 21360.3. Hay tres CCAA que cumplen esta condición: Navarra, Paı́s Vasco y
Madrid.
(d) Diagrama de caja para la tasa de paro
18
16
14
12
10
tasa de paro
La distribución presenta una ligera asimetrı́a hacia la derecha, puesto que la media es ligerante superior
a la mediana. La posible causa de esta asimetrı́a son dos atı́picos extremos con tasas de paro superiores
a 17.
(e) Para la variable tasa de paro será un atı́co cualquier observación superior a Q3 + 1.5 × RI = 14.1 o
inferior a Q1 − 1.5 × RI = 6.4. Además, serán atı́picos extremos aquellas observaciones superiores a
Q3 + 3 × RI = 16.9 o inferiores a Q1 − 3 × RI = 3.6. Luego Navarra y La Rioja son atı́picos porque sus
tasas de paro son inferiores a 6.4 y Extremadura y Andalucı́a son atı́picos extremos porque sus tasas
de paro son superiores a 16.9.
2. La duración (en minutos) de cierto proceso de fabricación es una variable aleatoria X con función de
densidad 1
f (x) = 2 + c (1 − x), 1 ≤ x ≤ 2,
0, en caso contrario,
donde c es una constante adecuada.
(a) (0.5 puntos) Determinar el valor de la constante c para que f (x) sea realmente una función de densidad.
Dibujar la función de densidad.
(b) (0.75 puntos) ¿Cuál es la probabilidad de que el proceso de fabricación dure menos de 90 segundos?
(c) (0.75 puntos) Calcular la esperanza y la varianza de X.
(d) (0.5 puntos) Calcular exactamente la probabilidad P (|X − E(X)| ≥ 0.3). Comparar este resultado con
la cota superior que se obtendrı́a mediante la desigualdad de Chebyschev. ¿Es contradictorio el resul-
tado? ¿Cuando es adecuado utilizar la aproximación que porporciona la desigualdad de Chebyschev?
(Indicación: Si no has podido calcular la esperanza y varianza de X, puedes considerar E(X) = 1.583
y var(X) = 0.076).
Solución.
(a) Para que f (x) sea una función de densidad debe integrar 1 sobre su soporte, es decir,
2 2
x2
Z
1 1 1 1
+ c (1 − x) dx = 1 ⇒ x+c x− =1⇒ +c − = 1 ⇒ c = −1,
1 2 2 2 1 2 2
x − 12 , 1 ≤ x ≤ 2,
f (x) =
0, en caso contrario.
2
2
1.5
0.5
0
0 1 2 3
(b) La probabilidad de que el proceso de fabricación dure menos de 90 segundos, es decir, menos de 1.5
minutos es Z 1.5 2 1.5
1 x x
P (X < 1.5) = x− dx = − = 0.375.
1 2 2 2 1
(c) La esperanza y varianza de X son:
+∞ 2 2
x3 x2
Z Z
2 x 19
E(X) = x f (x) dx = x − dx = − = = 1.5833.
−∞ 1 2 3 4 1 12
P (|X − E(X)| ≥ 0.3) = 1 − P (|X − E(X)| < 0.3) = 1 − P (−0.3 < X − E(X) < 0.3)
Z 1.8833
1
= 1 − P (1.2833 < X < 1.8833) = 1 − x− dx
1.2833 2
2 1.8833
x x
= 1− − = 0.35002,
2 2 1.2833
3. Una agencia de viajes ofrece tres tipos de destinos: regional, nacional e internacional. En general, los
porcentajes de ventas suelen ser del 30% para regional, del 20% para nacional y del 50% para internacional
y las reclamaciones que suele recibir son del 1% para regional, del 1% para nacional y del 1.5% para
internacional.
3
(a) (0.5 puntos) Determinar el porcentaje de reclamaciones que recibe.
(b) (0.75 puntos) Determinar la probabilidad de que dada una reclamación, ésta sea debida a un destino
regional.
(c) (0.5 puntos) Determinar la probabilidad de que un cliente contrate un destino internacional y no emita
ninguna reclamación.
(d) (0.75 puntos) De un total de 10 clientes, determinar la probabilidad que 3 o más de ellos contraten un
destino internacional y no emitan ninguna reclamación.
Solución. Consideramos los siguientes sucesos Reg =“destino regional”, N ac =“destino nacional” e
Inter =“destino internacional”, con probabilidades P (Reg) = 0.30, P (N ac) = 0.20, P (Inter) = 0.50),
respectivamente. Además, consideramos los sucesos R =“el cliente emite reclamación” y R̄ =“el cliente no
emite reclamación”.
(c) La probabilidad de que un cliente contrate un destino internacional y no emita ninguna reclamación
se obtiene como la intersección de los sucesos Inter y R̄, es decir:
(d) Conisderemos la v.a. X =“número de clientes de un total de 10 que contratan destino internacional
y no emiten reclamación”, que puede modelarse según una ley Binomial Bin(10, 0.4925). Luego,
la probabilidad de que 3 o más clientes contraten un destino internacional y no emitan ninguna
reclamación es:
P (X ≥ 3) = 1 − P (X < 3) = 1 − (P (X = 0) + P (X = 1) + P (X = 2))
10 10 10
= 1− 0.49250 (1 − 0.4925)10 + 0.49251 (1 − 0.4925)9 + 0.49252 (1 − 0.4925)8
0 1 2
10 9 2 8
= 1 − 0.5075 + 10 · 0.4925 · 0.5075 + 45 · 0.4925 · 0.5075 = 1 − 0.0602 = 0.9398.
(a) (1 punto) Calcular la probabilidad de que el salario medio semanal de 100 de estos trabajadores esté
entre 600e y 660e.
(b) (0.5 puntos) Sin realizar ningún tipo de cálculo adicional, decidir si la probabilidad en (a) se incre-
mentará o se reducirá si el número de trabajadores es 200 en lugar de 100. Justica tu respuesta.
(c) (0.5 puntos) Calcular la probabilidad de que la suma de salarios de 100 trabajadores sea mayor de
70000e.
(d) (0.5 puntos) El gobierno sospecha que algunas de las compañı́as mineras están pagando a los tra-
bajadores de producción no supervisada un sueldo inferior al estipulado. Para comprobar esto, el
gobierno obtiene una muestra del salario semanal de 50 trabajadores y obtienen una media muestral
de 605e. Se pide obtener un intervalo de confianza al 90% para el salario medio suponiendo que dichos
salarios tienen una distribución Normal con desviación tı́pica 35. ¿Que nivel de confianza tienes en
que la media verdadera sea realmente 630e?
4
Solución:
(a) Puesto que n ≥ 30, por el CLT tenemos que X ∼ N 630, √35 100
= N (630, 3.5). Entonces, la
probabilidad requerida está dada por:
−30 X 30
Pr 600 < X < 660 = Pr < < ' Pr (−8.57 < Z < 8.57) =
3.5 3.5 3.5
= Pr (Z < 8.57) − Pr (Z < −8.57) = 1 − 0 = 1,
En consecuencia, estamos más de un 90% seguros de que el salario mensual verdadero medio es menor
de 630e.
5
Examen Final de Estadı́stica I, 27 de Mayo de 2015.
Grados en ADE, DER-ADE, ADE-INF, FICO, ECO, ECO-DER, TUR.
1. Se quiere determinar el impacto económico de los negocios de una gran compañia en las ventas totales
de pequeñas empresas. Para ello se obtiene una muestra de 15 de esas pequeñas empresas y se toman
los porcentajes del total de ventas anual de las 15 pequeñas empresas como resultado de las ventas a la
compañı́a:
(a) (0.5 puntos) Es la media muestral de los 15 porcentajes mayor que la mediana muestral? En caso
afirmativo, ¿qué sugiere este resultado? Justifica tus respuestas.
(b) (0.5 puntos) Calcular los tres cuartiles muestrales. Interpretarlos en términos de los porcentajes.
(c) (0.5 puntos) Calcular la cuasi-varianza y el coeficiente de variación de la muestra de 15 porcentajes.
(d) (1 punto) Dibujar un diagrama de caja de los datos e identificar los atı́picos (si hubiere). Justifica tu
respuesta.
Solución.
(a) La media muestral de los 15 porcentajes es x = 5.96, mientras que la mediana muestral es M =
3.2. Entonces, la media muestral es mayor que la mediana muestral. Este resultado sugiere que la
distribución de los datos es asimétrica a la derecha (asimetrı́a positiva), es decir, hay un número
reducido de pequeñas compañı́as para las que los porcentajes de ventas totales anuales a la gran
compañı́a son notablemente mayores que para el resto.
(b) Los cuartiles muestrales son Q1 = x(4) = 1, Q2 = x(8) = 3.2 y Q3 = x(12) = 7.6, respectivamente.
Entonces, el 25% de los porcentajes son menores que el 1%, el 50% de los porcentajes son menores
que el 3.2% y el 75% de los porcentajes son menores que el 7.6%. Consecuentemente, los tres cuartiles
muestrales dividen la muestra en cuatro sub-muestras que contienen respectivamente el mismo número
de porcentajes. En general, los porcentajes de ventas totales a la compañı́a para la mayorı́a de las
pequeñas empresas representa menos del 7.6%.
b2 = 53.2668, mientras que el coeficiente de variación muestral es
(c) La cuasi-varianza muestral es σ
CV = 1.2245.
(d) Para construir el diagrama de caja, necesitamos el rango intercuartı́lico que está dado por IQR =
Q3 −Q1 = 7.6−1 = 6.6. Más aún, para construir las barras del diagrama y para detectar atı́picos, si los
hay, necesitamos los valores Q1 −1.5IQR = 1−1.5×6.6 = −8.9 y Q3 +1.5IQR = 7.6+1.5×6.6 = 17.5.
Además, los valores máximo y mı́nimo en la muestra son 0.1 y 27, respectivamente. Entonces, hay un
sólo dato atı́pico ya que 17.5 < 27. El diagrama de caja aparece en la Figura 1.
2. Se realiza una encuesta a 500 personas estadounidenses acerca de su afiliación polı́tica y de su actitud
respecto a un plan nacional de salud. Las respuestas se disponen en una tabla de contingencias de acuerdo
a la afiliación polı́tica y la actitud como sigue:
Actitud
Afiliación Favor Indiferente Contrario Total
Demócrata 138 83 64 285
Republicano 64 67 84 215
Total 202 150 148 500
0 5 10 15 20 25
(a) (1 punto) Obtener la distribución de frecuencias relativas conjunta de las dos variables y las distribu-
ciones de frecuencias relativas marginales.
(b) (0.5 puntos) Obtener la distribución condicional de Actitud dada Afiliación. ¿Qué actitud es más
frecuente entre Republicanos? Justifica tus respuestas.
(c) (0.5 puntos) Obtener la distribución condicional de Afiliación dada Actitud. ¿Qué afiliación polı́tica
es más favorable al plan nacional de salud? Justifica tus respuestas.
(d) (0.5 puntos) ¿Serı́a correcto decir que entre la gente que no se opone al plan de salud propuesto, la fre-
cuencia relativa de votantes Demócratas es mayor que la frecuencia relativa de votantes Republicanos?
Justifica tu respuesta.
Solución.
(a) La distribución de frecuencias relativa conjunta de las dos variables y las distribuciones de frecuencias
relativas marginales están dadas en la tabla siguiente:
Actitud
Afiliación Favor Indiferente Contrario Total
Demócrata 0.276 0.166 0.128 0.57
Republicano 0.128 0.134 0.168 0.43
Total 0.404 0.3 0.296 1
(b) La distribución condicional de Actitud dada Afiliación está dada por:
Actitud|Afiliación Favor Indiferente Contrario
f·|Democrata 0.4842105 0.2912281 0.2245614
f·|Republicano 0.2976744 0.3116279 0.3906977
Por lo tanto, la Actitud más frecuente entre Republicanos es Contrario.
(c) La distribución condicional de Afiliación dada Actitud está dada por:
Afiliación|Actitud f·|F avor f·|Indif erente f·|Contrario
Demócrata 0.6831683 0.5533333 0.4324324
Republicano 0.3168317 0.4466667 0.5675676
Por lo tanto, la Afiliación polı́tica con mayor Actitud favorable al plan de salud es Demócrata.
(d) La respuesta es Si. Notar que,
Afiliación|Actitud f·|N ocontraria f·|Contrario
Demócrata 0.6278409 0.4324324
Republicano 0.3721591 0.5675676
2
Por lo tanto, entre la gente que no se opone al plan de salud propuesto, la frecuencia relativa de
votantes Demócratas es mayor que la frecuencia relativa de votantes Republicanos.
3. El número de llamadas nocturnas a un servicio de emergencia de una empresa de calefacción y aire acondi-
cionado tiene probabilidades 0.05, 0.1, 0.15, 0.35, 0.2 y 0.15 para 0, 1, 2, 3, 4 y 5 llamadas por noche,
respectivamente.
(a) (0.5 puntos) Obtener la función de probabilidad del número de llamadas al servicio en una noche.
¿Cuál es la probabilidad de que el número de llamadas en una noche sea mayor de 3?
(b) (0.5 puntos) ¿Cuál es el número medio de llamadas por noche? ¿Y la varianza?
(c) (0.5 puntos) Suponiendo que el número de llamadas en noches diferentes sean independientes, ¿cuál
es el número medio de llamadas por semana? ¿y la varianza?
(d) (1 punto) Obtener la probabilidad (o una aproximación) de que el número de llamadas en un año
(365 dı́as) sea mayor que 1300.
Solución.
(a) La función de probabilidad del número de llamadas de emergencia, X, está dada por:
0.05 x = 0
0.1 x = 1
0.15 x = 2
Pr (X = x) =
0.35 x = 3
0.2 x = 4
0.15 x = 5
(c) La media y la varianza del número de llamadas de emergencia por semana, Y , coinciden con la media
de 7X y con siete veces la varianza de X. Entonces,
E [Y ] = 7 × E [X] = 7 × 3 = 21
mientras que
V [Y ] = 7 × V [X] = 7 × 1.8 = 12.6
(d) La media y la varianza del número de llamadas de emergencia por año, M , coinciden con la media de
365X y con 365 veces la varianza de X. Entonces,
mientras que
V [M ] = 365 × V [X] = 365 × 1.8 = 657.
Por el TCL, tenemos que:
M − 1095 1300 − 1095 M − 1095
Pr (M > 1300) = Pr > = Pr > 7.997812 '
25.63201 25.63201 25.63201
' Pr (Z > 7.997812) = 1 − Pr (Z ≤ 7.997812) = 1 − 1 = 0,
3
4. El número de descargas por hora de cierta aplicación para móvil puede modelarse según una variable
aleatoria de media 100 y desviación tı́pica 20.
(a) (0.5 puntos) Dada una muestra de tamaño 100 se obtienen los siguientes gráficos para el número de
descargas por hora:
QQ Plot of Sample Data versus Standard Normal
180
35
160
30
Razonar si el número de descargas por hora puede modelarse según una ley Normal.
(b) (0.75 puntos) Calcular la probabilidad (sin aproximar) de que en un dı́a (24 horas) la media de
descargas por hora esté comprendida entre 90 y 110, suponiendo que el número de descargas en cada
hora es una muestra aleatoria simple. ¿Qué otra hipótesis es necesario asumir?
(c) (0.75 puntos) Calcular la probabilidad aproximada de que en una semana (168 horas) el total de
descargas llegue a superar las 17000, suponiendo que el número de descargas en cada hora es una
muestra aleatoria simple. ¿Qué teorema es necesario aplicar para poder calcular esta probabilidad?
(d) (0.5 puntos) Se han controlado las descargas de la aplicación durante 40 horas obteniéndose una
media muestral de 99.5. Calcular el intervalo de confianza al 95% para la media de descargas por hora
(suponiendo σ = 20 y que el número de descargas en cada hora es una muestra aleatoria simple).
Solución:
(a) Atendiendo al histograma y al qq-plot parece que los datos no se alejan demasiado de la ley Normal.
(b) Si se supone que la v.a. X =“número de descargas por hora” sigue una ley N (100, 202 ), entonces
dadas n = 24 v.a. independientes y con la misma ley que X, la media muestral X̄n ∼ N (100, 202 /24).
Por tanto,
P (90 < X̄n < 110) = P (−2.45 < Z < 2.45) = 2 P (Z < 2.45) − 1 = 2 · 0.9929 − 1 = 0.9858,
donde Z ∼ N (0, 1). Para poder calcular esta probabilidad es necesario asumir que X tiene ley Normal.
(c) Dadas X1 , . . . , Xn , n = 168 v.a.Pindependientes y con la misma ley que X =“número de descargas
n
por hora”, consideramos la v.a. i=1 Xi = n X̄n . Puesto que n ≥ 30, el Teorema Central del Lı́mite
2
asegura que X̄n ∼ N (100, 20 /168). Entonces,
n
X
P( Xi > 17000) = P (n X̄n > 17000) = P (X̄n > 17000/168) ≈ P (Z > 0.77) = 0.2206,
i=1
4
Estadı́stica I Examen Extraordinario, 24 Junio 2014.
Grados en ADE, DER-ADE, ADE-INF, FICO, ECO, ECO-DER.
REGLAS DEL EXAMEN: 1) Usar cuadernillos separados para cada problema. 2) Hacer los
cálculos con al menos dos decimales significativos. 3) No se puede abandonar el examen durante
los primeros 30 minutos. 4) No está permitido salir de la clase sin entregar el examen.
9 8 14 23 23 27 18 18 8 21 20 18 14 20 29 18 33 19 23 24 24 14 19
(a) (0.5 puntos) ¿Es la media de las ventas mensuales anteriores mayor de 20? ¿Y la mediana? ¿Es cierto
que la venta más frecuente durante el mes fue de 20 coches? Justificar las respuestas.
(b) (0.5 puntos) Calcular la cuasi-varianza muestral y el coeficiente de variación muestral para el conjunto
de datos.
(c) (1 punto) Dibujar un diagrama de caja para el conjunto de datos, obteniendo para ello las medidas
numéricas necesarias. ¿Es cierto que la forma de la distribución presenta una fuerte asimetrı́a a la
derecha? Justificar la respuesta.
(d) (0.5 puntos) Basándose en el diagrama de cajas realizado en el apartado anterior, ¿hay atı́picos en el
conjunto de datos? Justificar la respuesta.
Solución.
(a) La media muestral es x = 19.30. La mediana muestral es M = 19. La moda muestral es 18. Entonces,
la respuesta es NO para todas las preguntas.
b2 = 40.13043. El coeficiente de variación muestral es 0.3281.
(b) La cuasi-varianza muestral es σ
(c) Los cuartiles muestrales son Q1 = 14, Q2 = 19 y Q3 = 23. Entonces, el rango intercuartı́lico muestral
es IQR = 23 − 14 = 9. El diagrama de caja es:
10 15 20 25 30
(a) (0.75 puntos) Obtener la función de distribución acumulada de los ingresos anuales (en millones de
euros).
(b) (0.25 puntos) Obtener la probabilidad de que los ingresos anules del negocio abierto por el joven
emprendedor estén entre 0.5 (no incluido) y 1.5 (incluido) millones de euros.
(c) (0.75 puntos) Calcular el valor esperado y la desviación tı́pica de los ingresos anuales (en millones de
euros).
(d) (0.75 puntos) Si el negocio tiene éxito, el joven emprendedor planea abrir otro negocio más pequeño
que el primero. Se sabe que los ingresos anuales de los negocios más pequeños son un cuarto de los
ingresos anuales de los negocios grandes. Entonces, ¿cuáles son los ingresos esperados del segundo
negocio? ¿y la desviación tı́pica?
Solución.
(a) Sea X los ingresos anuales del negocio (en millones de euros). Entonces, la función de densidad de X
está dada por: 1
x≤1
41
2 1<x≤2
f (x) = 1
2<x≤3
4
0 en otro caso
Por lo tanto, la función de distribución acumulada se puede calcular como:
• Para x ≤ 0,
F (x) = 0
• Para 0 < x ≤ 1, Z x
1 x
F (x) = dx =
0 4 4
• Para 1 < x ≤ 2,
Z 1 Z x
1 1 1 1 1 1
F (x) = dx + dx = + (x − 1) = x−
0 4 1 2 4 2 2 2
• Para 2 < x ≤ 3,
Z 1 Z 2 Z x
1 1 1
F (x) = dx + dx + dx =
0 4 1 2 2 4
1 1 1 1
= + + (x − 2) = (x + 1)
4 2 4 4
• Para 3 < x,
F (x) = 1
En resumen,
0 x<0
x
0<x≤1
4
1
x − 12
F (x) = 2 1<x≤2
1
(x + 1) 2<x≤3
4
1 3≤x
2
(b) La probabilidad de que los ingresos anuales del negocio (en millones de euros) estén entre 0.5 y 1.5
millones de euros está dada por:
1 1 3
Pr (0.5 < x ≤ 1.5) = F (1.5) − F (0.5) = − = = 0.375
2 8 8
donde:
3 1 2 3
x2 x2 x2
Z Z Z Z
E X2 = x2 f (x) dx =
dx + dx + dx =
0 0 4 1 2 2 4
3 |x=1 3 |x=2 3 |x=3
x x x 1 7 19 17
= + + = + + =
12 |x=0 6 |x=1 12 |x=2 12 6 12 6
Entonces,
17 9 7
V [X] = − = ' 0.5833
6 4 12
q
7
y la desviación tı́pica es 12 ' 0.7637 millones de euros.
(d) Los ingresos anuales esperados del segundo negocio y su desviación tı́pica son un cuarto de las corre-
spondientes al primer negocio. Entonces, el valor esperado es 38 = 0.375 millones de euros, mientras
que la desviación tı́pica es 0.1909.
3. Cada dı́a un agente de ventas llama a 25 hogares independientes para intentar vender un nuevo producto,
ganando una comisión de 45 euros por venta. Basado en su experiencia, el agente realiza, en promedio,
una venta de cada seis llamadas en hogares con niños en edad escolar, y una venta de cada diez llamadas
en hogares sin niños en edad escolar. El agente desconoce por completo el tipo de hogar al que va a llamar,
pero sabe que el 30% de los hogares tienen niños en edad escolar. Se pide obtener:
(a) (0.5 puntos) La probabilidad de que se produzca una venta en una llamada cualquiera.
(b) (0.5 puntos) La probabilidad de que el número de ventas en un dı́a cualquiera sea 3 o menos de 3.
(c) (0.5 puntos) La media, varianza y desviación tı́pica de la comisión total por ventas en un dı́a.
(d) (1 punto) La probabilidad (o una aproximación de ella) de que el agente gane en una semana (5 dı́as
de trabajo) más de 1000 euros en comisiones por ventas.
Solución.
(a) Por la ley de probabilidad total, escribiendo “niños en edad escolar” como NEE, la probabilidad de
que una llamada resulte en una venta es:
3
(b) El número de ventas en un dı́a es N ∼ Bin (25, 0.12). Por lo tanto, la probabilidad de que el número
de ventas en un dı́a sea 3 o menos de 3 está dado por:
Pr (N ≤ 3) = Pr (N = 0) + Pr (N = 1) + Pr (N = 2) + Pr (N = 3) =
25 0 25 25 24
= 0.12 (1 − 0.12) + 0.121 (1 − 0.12) +
0 1
25 2 23 25 22
+ 0.12 (1 − 0.12) + 0.123 (1 − 0.12) =
2 3
= 1 × 0.0409 + 25 × 0.0056 + 300 × 0.0008 + 2300 × 0.0001 =
' 0.6475
Entonces, la media, varianza y desviación tı́pica de la comisión de ventas totales en un dı́a están dadas
por:
E [45N ] = 45 × E [N ] = 45 × 3 = 135 euros
V [45N ] = 452 × V [N ] = 5346 euros2
DT [45N ] = 45 × DT [N ] = 45 × 1.6248 = 73.116 euros
(d) El número de ventas en una semana es M ∼ Bin (125, 0.12). Entonces, la comisión total ganada en
una semana de trabajo es W = 45M . La media, varianza y desviación tı́pica de M está dada por:
E [M ] = 125 × 0.12 = 15
V [M ] = 125 × 0.12 × 0.88 = 13.2
√
DT [M ] = 13.2 = 3.6331
Usando el TCL, obtenemos que:
Pr (W > 1000) = Pr (45M > 1000) = Pr (M > 22.22) =
M − 15 22.22 − 15
= Pr > ' Pr (Z > 1.9872) =
3.6331 3.6331
= 1 − Pr (Z < 1.9872) = 1 − 0.9761 = 0.0239
donde Z ∼ N (0, 1).
4. Los clientes de un banco pueden ingresar o retirar dinero. Sea X la cuantia de una operación realizada por
un cliente donde el valor de X es positivo, si el dinero es ingresado, o negativo, si el dinero es retirado. Los
analistas del banco asumen que la esperanza y la desviación tı́pica de X son 0 y 100 euros, respectivamente.
(a) (1 punto) Calcular la probabilidad de que la media de 100 operaciones realizadas por clientes inde-
pendientes esté entre −3 and 3 euros.
(b) (0.5 puntos) Sin realizar ningún tipo de cálculo adicional, decidir si la probabilidad en el apartado (a)
será mayor o menor si el tamaño muestral aumenta. Justificar la respuesta.
(c) (0.5 puntos) Supongamos que 100 clientes visitan el banco un cierto dı́a. Calcular la probabilidad de
que la suma de operaciones al final de dicho dı́a sea positiva.
(d) (0.5 puntos) Incluso si el banco asume que el valor esperado de X es 0, los analistas del banco sospechan
que últimamente los clientes ingresan más dinero del que retiran. Para comprobar esta sospecha, los
analistas toman una muestra de 25 operaciones realizadas por clientes independientes y obtienen una
media muestral de 50 euros. Se pide obtener un intervalo de confianza al 90% para el valor esperado
suponiendo que la distribución de X es Gaussiana con desviación tı́pica 100. ¿Que nivel de confianza
tienes de que el valor esperado sea realmente mayor que 0?
4
Solución:
(a) Como n ≥ 30, por el TCL tenemos que X ∼ N 0, 100 √
n
= N (0, 10). Entonces, la probabilidad
requerida está dada por:
−3 X 3
Pr −3 < X < 3 = Pr < < ' Pr (−0.3 < Z < 0.3) =
10 10 10
= Pr (Z < 0.3) − Pr (Z < −0.3) = 0.6179 − 0.3821 = 0.2358
Consecuentemente, estamos más de un 90% seguros de que la media verdadera sea positiva.
5
Examen Final de Estadı́stica I, 26 de Mayo de 2014.
Grados en ADE, DER-ADE, ADE-INF, FICO, ECO, ECO-DER.
1. En las siguientes tablas y gráficos se recoge información sobre las atenciones sanitarias no domiciliarias
atendidas a través del teléfono 112 de Protección Civil durante los últimos 180 dı́as en Pamplona. Para
cada dı́a se ha observado el tiempo medio de respuesta (en minutos) de las ambulancias para accidentes
con heridos y el número de accidentes atendidos según su tipologı́a (accidente de tráfico, laboral y otros).
Tabla 2: Número de accidentes atendidos Gráfico 2: Tiempo medio de respuesta según el tipo de dı́a
Tipo de accidente 70
Tipo día tráfico laboral otros
de Lunes a Viernes 111 9 30
60
Sábado y Domingo 26 1 3
e respuesta (minutos)
40
80
Tiempos medios de
30
60
Frequency
20
40
10
20
0
0
Responde justificadamente a las siguientes cuestiones, indicando claramente las tablas y/o gráficos que
utilizas para tu razonamiento:
a) (0.5 puntos) Describe la forma de la distribución del tiempo medio de respuesta (global) e indica si hay
datos atı́picos. ¿Qué medida de centralización es más adecuada utilizar en este caso y por qué?
b) (0.75 puntos) Justifica si son ciertas o falsas las afirmaciones siguientes: [1] En más de la mitad de
los casos el tiempo medio de respuesta de las ambulancias durante los fines de semana es más de dos
veces superior al de los dı́as laborables. [2] En el 75% de los casos el tiempo medio de respuesta de las
ambulancias durante los fines de semana es superior a 30 minutos.
c) (0.5 puntos) Si tuvieras que dar un tiempo máximo de respuesta por debajo del cual pudieras garantizar
que se ha atendido el 75% de las emergencias de lunes a viernes, ¿qué tiempo darı́as?
d) (0.75 puntos) Obtén las distribuciones de la variable tipo de accidente condicionadas al tipo de dı́a y
determina en qué tipo de dı́a son más frecuentes los accidentes de tráfico.
Solución.
a) El Gráfico 1 es el histograma de la distribución de frecuencias absolutas de la variable tiempo medio de
respuesta (en minutos) (sin distinguir por tipo de dı́a). Se observa claramente que la distribución es
asimétrica (con asimetrı́a a la derecha, positiva).
Al tratarse de una distribución asimétrica es mejor dar la Mediana como medida de centralización. En
este caso, el tiempo mediano de respuesta (ver panel (a) de la Tabla 1) es de 7.7257 minutos.
De forma aproximada (a partir del Gráfico 1) puede llegar a intuirse la presencia de datos atı́picos. El
razonamiento serı́a el siguiente: El tercer cuartil está en la posición 135, que corresponde a un valor
situado entre 10 y 20, es decir, Q3 ∈ (10, 20). Por tanto, se deduce que Q3 < 20, al igual que RIC < 20.
Ası́, Q3 + 1.5 RIC < 50, con lo que cualquier dato superior a 50 puede ser considerado como atı́pico.
b) La afirmación [1] es cierta, puesto que la mediana del tiempo medio de respuesta de las ambulacias
durante los fines de semana es de 16.46, mientras que de lunes a viernes vale 7.43 (ver paneles (b) y (c)
de la Tabla 1 y también diagramas de caja del Gráfico 2). Sin embargo, la afirmación [2] es falsa, puesto
que en el diagrama de caja del Gráfico 2 se observa que, para los fines de semana, el tercer cuartil del
Tipo de accidente más frecuente
tiempo medio de respuesta es 31. Por tanto, el tiempo medio de repuesta es inferior a 31 minutos en el
75% de los casos. Tipo día trafico laboral otros
Lunes a Viernes 111 9 30 150
c) Nos están pidiendo el tercer cuartil de la 26
Sábado‐Domingo muestra: 1Q3 . En el3 diagrama
30 de cajas correspondiente se
aprecia que Q3 ≈ 18 minutos. 137 10 33 180
d) Para poder compararlas es más conveniente obtener las distribuciones condicionadas relativas (obtenidas
a partir de la Tabla 2), que son:
Tipo de accidente más frecuente / tipo de día
trafico laboral otros
Lunes a Viernes 0,74 0,06 0,2 1
Sábado‐Domingo 0,8666667 0,0333333 0,1 1
De ella se observa que los accidentes de tráfico son más frecuentes durante el fin de semana, con un
porcentaje del 86.67%.
2. Una empresa paga una cuota mensual de 175 euros en concepto de suscripción a un servicio de reparaciones.
Además, cada visita de un técnico para realizar una reparación en la empresa cuesta 350 euros. Se sabe
que la media de averı́as es de 9.5 al mes, con una desviación tı́pica de 2.
a) (0.5 puntos) Calcula el valor esperado y la varianza del coste mensual de las reparaciones (incluyendo
la cuota mensual).
b) (0.75 puntos) Utilizando la desigualdad de Chebyshev, da una cota para la probabilidad de que en un
mes determinado el coste de las reparaciones sea menor o igual que 2000 o mayor o igual que 5000 euros.
c) (0.75 puntos) Si se supone que el coste mensual sigue una distribución uniforme continua con la esperanza
y la varianza obtenidas en a), calcula de nuevo la probabilidad del apartado anterior.
d) (0.5 puntos) A qué se debe la diferencia entre los resultados obtenidos en los apartados b) y c)?
Solución.
a) X = número de averı́as al mes. E[X] = 9.5 y V ar[X] = 22 = 4.
Sea C = coste mensual de las reparaciones. Como C = 350X+175, entonces E[C] = 350·9.5+175 = 3500
y V ar[C] = 3502 · 4 = 490000.
b)
Solution:
a) Puesto que n > 30, puede aplicarse elTLC, que asegura queX tiene una ley aproximadamente normal.
80−90 100−90
En concreto: P 80 < X < 100 = P 30/ √
35
< Z < 30/ √
35
= P (−1.97 < Z < 1.97) = 0.9512, donde
X̄−90
Z= √
30/ 35
sigue aproximadamente una distribucin N (0, 1).
b) En virtud del TLC, el intervalo de confianza es I.C.95% (µ) = x±1.96 √σn = 85±1.96 √3035 = [75.06, 94.94].
No serı́a correcto afirmar que con un 95% de probabilidad, el verdadero valor de la media está entre
[75.06, 94.94]. Sin embargo, sı́ podrı́amos afirmar que el 95% de las veces que construimos un I.C. del
modo anterior, encontraremos el verdadero valor de la media dentro de los mismos.
c) La longitud del intervalo es 2 × 1.96 × √σn1 . Por tanto, queremos un n2 tal que la nueva longitud del
intervalo sea 2 × 1.96 × √σn1 × 0.9. Por tanto, tenemos la siguiente relación:
σ σ n1 35
2 × 1.96 × √ × 0.9 = 2 × 1.96 × √ ⇒ n2 = = = 43.2 → n2 = 44.
n1 n2 0.92 0.92
d) Si dibujamos las funciones de densidad para el puntuaje promedio de un partido en una temporada,
i.e. para X, vemos que para ambos entrenadores la función está centrada en la misma media. Sin
embargo, el segundo entrenador tiene un promedio de puntuaje más estable, por lo que dará resultados
más homogéneos a lo largo de la temporada.