Todos Examenes Yo

Formulario de Estadı́stica I
Tema 2 Sean x1 , x2 , . . . , xn los los n valores observados. La muestra ordenada (variables no categóricas nominales)
se denota por x(1) , x(2) , . . . , x(n) .
• Media aritmética: x(= n1 n
P
i=1 xi .
1
2
(x( n ) + x( n +1) ), si n es par,
• Mediana: M e = 2 2
x( n+1 ) , si n es impar.
2
• Moda: La moda es el valor xi que presenta una mayor frecuencia absoluta (o relativa).
• Cuartiles: Qk = x(k(n+1)/4) para k = 1, 2, 3.
• Percentiles: Pk = x(k(n+1)/100) para k = 1, 2, . . . , 99.
• Rango o amplitud: R = xmax − xmin .
• Rango intercuartı́lico: RIC P = Q3 − Q1 .
Varianza muestral: σ̂ 2 = n1 n 2
Pn
1
x2 − nx2 .

• i=1 (xi − x) = n
√ i=1 i
• Desviación tı́pica (o estándar) muestral: 2
Pn σ̂ = σ̂2 . 1 Pn
2 1 2 2

• Cuasivarianza muestral: s = n−1 i=1 (xi − x) = n−1 i=1 xi − nx .
√
• Cuasidesviación tı́pica muestral: s = s2 .
• Coeficiente de variación de Pearson: CV =Ps/|x|.
n 3
i=1 (xi −x)
• Coeficiente de asimetrı́a de Fisher: CA = ns3
.
Pn 4
i=1 (xi −x)
• Coeficiente de curtosis de Fisher: CC = ns4
− 3.
Tema 3 Sean (x1 , y1 ), (x2 , y2 ), . . . , (xn , yn ) los n pares de valores observados !

para (X, Y ).
n n
1 X 1 X
• Covarianza: sxy = (xi − x) (yi − y) = xi yi − nx y
n − 1 i=1 n−1 i=1
sxy
• Coeficiente de correlación lineal de Pearson: r(x,y) =
sx sy
Tema 4 Sea Ω el espacio muestral asociado a cierto experimento aleatorio, B1 , . . . , Bk una partición de Ω, tal que
P (Bi ) 6= 0 para i = 1, . . . , k y A un suceso cualquiera.
• Ley de la probabilidad total:
P (A) = P (A ∩ B1 ) + . . . + P (A ∩ Bk ) = P (A|B1 ) P (B1 ) + . . . + P (A|Bk ) P (Bk ).
• Teorema de Bayes:
P (Bj ∩ A) P (A|Bj ) P (Bj )

P (Bj |A) = = , para j = 1, . . . , k.
P (A) P (A|B1 ) P (B1 ) + . . . + P (A|Bk ) P (Bk )
Esperanza y varianza de una variable aleatoria.

Sea X una v.a. que toma valores en un conjunto S. La esperanza y varianza de X se definen como:
 X

 x P (X = x), si X es una v.a. discreta,

x∈S
E(X) = Z


 x f (x) dx, si X es una v.a. continua.
S
 X

 (x − E(X))2 P (X = x), si X es una v.a. discreta,

x∈S
var(X) = Z
(x − E(X))2 f (x) dx,


 si X es una v.a. continua.
S
Tema 5 Algunos modelos de probabilidad.
Modelo X Conjunto S Función de probabilidad / densidad E(X) var(X)

Ber(p) {0, 1} P (X = 1) = p, P (X = 0) = 1 − p p p (1 − p)
P (X = x) = nx px (1 − p)n−x

B(n, p) {0, 1, . . . , n} np n p (1 − p)
λx
P ois(λ) N ∪ {0} P (X = x) = e−λ x!
λ λ
U (a, b) (a, b) f (x) = 1
b−a
(a + b)/2 (b − a)2 /12
+ −λ x
exp(λ) R f (x) = λ e 1/λ 1/λ2
f (x) = σ 2 π exp − 2 1σ2 (x − µ)2
1
σ2

N (µ, σ) R √ µ
TABLA 1: DISTRIBUCIÓN NORMAL
Áreas bajo la curva normal
Ejemplo:
X P
Z
V
P [Z > 1] = 0.1587
P [Z > 1.96] = 0.0250
Desv.
normal 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
x
0.0 0.5000 0.4960 0.4920 0.4880 0.4840 0.4801 0.4761 0.4721 0.4681 0.4641
0.1 0.4602 0.4562 0.4522 0.4483 0.4443 0.4404 0.4364 0.4325 0.4286 0.4247
0.2 0.4207 0.4168 0.4129 0.4090 0.4052 0.4013 0.3974 0.3936 0.3897 0.3859
0.3 0.3821 0.3783 0.3745 0.3707 0.3669 0.3632 0.3594 0.3557 0.3520 0.3483
0.4 0.3446 0.3409 0.3372 0.3336 0.3300 0.3264 0.3228 0.3192 0.3156 0.3121
0.5 0.3085 0.3050 0.3015 0.2981 0.2946 0.2912 0.2877 0.2843 0.2810 0.2776
0.6 0.2743 0.2709 0.2676 0.2643 0.2611 0.2578 0.2546 0.2514 0.2483 0.2451
0.7 0.2420 0.2389 0.2358 0.2327 0.2296 0.2266 0.2236 0.2206 0.2177 0.2148
0.8 0.2119 0.2090 0.2061 0.2033 0.2005 0.1977 0.1949 0.1922 0.1894 0.1867
0.9 0.1841 0.1814 0.1788 0.1762 0.1736 0.1711 0.1685 0.1660 0.1635 0.1611
1.0 0.1587 0.1562 0.1539 0.1515 0.1492 0.1469 0.1446 0.1423 0.1401 0.1379
1.1 0.1357 0.1335 0.1314 0.1292 0.1271 0.1251 0.1230 0.1210 0.1190 0.1170
1.2 0.1151 0.1131 0.1112 0.1093 0.1075 0.1056 0.1038 0.1020 0.1003 0.0985
1.3 0.0968 0.0951 0.0934 0.0918 0.0901 0.0885 0.0869 0.0853 0.0838 0.0823
1.4 0.0808 0.0793 0.0778 0.0764 0.0749 0.0735 0.0721 0.0708 0.0694 0.0681
1.5 0.0668 0.0655 0.0643 0.0630 0.0618 0.0606 0.0594 0.0582 0.0571 0.0559
1.6 0.0548 0.0537 0.0526 0.0516 0.0505 0.0495 0.0485 0.0475 0.0465 0.0455
1.7 0.0446 0.0436 0.0427 0.0418 0.0409 0.0401 0.0392 0.0384 0.0375 0.0367
1.8 0.0359 0.0351 0.0344 0.0336 0.0329 0.0322 0.0314 0.0307 0.0301 0.0294
1.9 0.0287 0.0281 0.0274 0.0268 0.0262 0.0256 0.0250 0.0244 0.0239 0.0233
2.0 0.0228 0.0222 0.0217 0.0212 0.0207 0.0202 0.0197 0.0192 0.0188 0.0183
2.1 0.0179 0.0174 0.0170 0.0166 0.0162 0.0158 0.0154 0.0150 0.0146 0.0143
2.2 0.0139 0.0136 0.0132 0.0129 0.0125 0.0122 0.0119 0.0116 0.0113 0.0110
2.3 0.0107 0.0104 0.0102 0.0099 0.0096 0.0094 0.0091 0.0089 0.0087 0.0084
2.4 0.0082 0.0080 0.0078 0.0075 0.0073 0.0071 0.0069 0.0068 0.0066 0.0064
2.5 0.0062 0.0060 0.0059 0.0057 0.0055 0.0054 0.0052 0.0051 0.0049 0.0048
2.6 0.0047 0.0045 0.0044 0.0043 0.0041 0.0040 0.0039 0.0038 0.0037 0.0036
2.7 0.0035 0.0034 0.0033 0.0032 0.0031 0.0030 0.0029 0.0028 0.0027 0.0026
2.8 0.0026 0.0025 0.0024 0.0023 0.0023 0.0022 0.0021 0.0021 0.0020 0.0019
2.9 0.0019 0.0018 0.0018 0.0017 0.0016 0.0016 0.0015 0.0015 0.0014 0.0014
3.0 0.0013 0.0013 0.0013 0.0012 0.0012 0.0011 0.0011 0.0011 0.0010 0.0010
2
Probabilidad
Probabilidad
El valor de la tabla para z El valor de la tabla para z

es el área bajo la curva es el área bajo la curva
de la normal estándar z de la normal estándar z
a la izquierda de z a la izquierda de z
TABLA A: Probabilidades de la normal estándar TABLA A: Probabilidades de la normal estándar (cont. )

z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09 z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09
⫺3.4 .0003 .0003 .0003 .0003 .0003 .0003 .0003 .0003 .0003 .0002 0.0 .5000 .5040 .5080 .5120 .5160 .5199 .5239 .5279 .5319 .5359
⫺3.3 .0005 .0005 .0005 .0004 .0004 .0004 .0004 .0004 .0004 .0003 0.1 .5398 .5438 .5478 .5517 .5557 .5596 .5636 .5675 .5714 .5753
⫺3.2 .0007 .0007 .0006 .0006 .0006 .0006 .0006 .0005 .0005 .0005 0.2 .5793 .5832 .5871 .5910 .5948 .5987 .6026 .6064 .6103 .6141
⫺3.1 .0010 .0009 .0009 .0009 .0008 .0008 .0008 .0008 .0007 .0007 0.3 .6179 .6217 .6255 .6293 .6331 .6368 .6406 .6443 .6480 .6517
⫺3.0 .0013 .0013 .0013 .0012 .0012 .0011 .0011 .0011 .0010 .0010 0.4 .6554 .6591 .6628 .6664 .6700 .6736 .6772 .6808 .6844 .6879
⫺2.9 .0019 .0018 .0018 .0017 .0016 .0016 .0015 .0015 .0014 .0014 0.5 .6915 .6950 .6985 .7019 .7054 .7088 .7123 .7157 .7190 .7224
⫺2.8 .0026 .0025 .0024 .0023 .0023 .0022 .0021 .0021 .0020 .0019 0.6 .7257 .7291 .7324 .7357 .7389 .7422 .7454 .7486 .7517 .7549
⫺2.7 .0035 .0034 .0033 .0032 .0031 .0030 .0029 .0028 .0027 .0026 0.7 .7580 .7611 .7642 .7673 .7704 .7734 .7764 .7794 .7823 .7852
⫺2.6 .0047 .0045 .0044 .0043 .0041 .0040 .0039 .0038 .0037 .0036 0.8 .7881 .7910 .7939 .7967 .7995 .8023 .8051 .8078 .8106 .8133
⫺2.5 .0062 .0060 .0059 .0057 .0055 .0054 .0052 .0051 .0049 .0048 0.9 .8159 .8186 .8212 .8238 .8264 .8289 .8315 .8340 .8365 .8389
⫺2.4 .0082 .0080 .0078 .0075 .0073 .0071 .0069 .0068 .0066 .0064 1.0 .8413 .8438 .8461 .8485 .8508 .8531 .8554 .8577 .8599 .8621
⫺2.3 .0107 .0104 .0102 .0099 .0096 .0094 .0091 .0089 .0087 .0084 1.1 .8643 .8665 .8686 .8708 .8729 .8749 .8770 .8790 .8810 .8830
⫺2.2 .0139 .0136 .0132 .0129 .0125 .0122 .0119 .0116 .0113 .0110 1.2 .8849 .8869 .8888 .8907 .8925 .8944 .8962 .8980 .8997 .9015
⫺2.1 .0179 .0174 .0170 .0166 .0162 .0158 .0154 .0150 .0146 .0143 1.3 .9032 .9049 .9066 .9082 .9099 .9115 .9131 .9147 .9162 .9177
⫺2.0 .0228 .0222 .0217 .0212 .0207 .0202 .0197 .0192 .0188 .0183 1.4 .9192 .9207 .9222 .9236 .9251 .9265 .9279 .9292 .9306 .9319
⫺1.9 .0287 .0281 .0274 .0268 .0262 .0256 .0250 .0244 .0239 .0233 1.5 .9332 .9345 .9357 .9370 .9382 .9394 .9406 .9418 .9429 .9441
⫺1.8 .0359 .0351 .0344 .0336 .0329 .0322 .0314 .0307 .0301 .0294 1.6 .9452 .9463 .9474 .9484 .9495 .9505 .9515 .9525 .9535 .9545
⫺1.7 .0446 .0436 .0427 .0418 .0409 .0401 .0392 .0384 .0375 .0367 1.7 .9554 .9564 .9573 .9582 .9591 .9599 .9608 .9616 .9625 .9633
⫺1.6 .0548 .0537 .0526 .0516 .0505 .0495 .0485 .0475 .0465 .0455 1.8 .9641 .9649 .9656 .9664 .9671 .9678 .9686 .9693 .9699 .9706
⫺1.5 .0668 .0655 .0643 .0630 .0618 .0606 .0594 .0582 .0571 .0559 1.9 .9713 .9719 .9726 .9732 .9738 .9744 .9750 .9756 .9761 .9767
⫺1.4 .0808 .0793 .0778 .0764 .0749 .0735 .0721 .0708 .0694 .0681 2.0 .9772 .9778 .9783 .9788 .9793 .9798 .9803 .9808 .9812 .9817
⫺1.3 .0968 .0951 .0934 .0918 .0901 .0885 .0869 .0853 .0838 .0823 2.1 .9821 .9826 .9830 .9834 .9838 .9842 .9846 .9850 .9854 .9857
⫺1.2 .1151 .1131 .1112 .1093 .1075 .1056 .1038 .1020 .1003 .0985 2.2 .9861 .9864 .9868 .9871 .9875 .9878 .9881 .9884 .9887 .9890
⫺1.1 .1357 .1335 .1314 .1292 .1271 .1251 .1230 .1210 .1190 .1170 2.3 .9893 .9896 .9898 .9901 .9904 .9906 .9909 .9911 .9913 .9916
⫺1.0 .1587 .1562 .1539 .1515 .1492 .1469 .1446 .1423 .1401 .1379 2.4 .9918 .9920 .9922 .9925 .9927 .9929 .9931 .9932 .9934 .9936
⫺0.9 .1841 .1814 .1788 .1762 .1736 .1711 .1685 .1660 .1635 .1611 2.5 .9938 .9940 .9941 .9943 .9945 .9946 .9948 .9949 .9951 .9952
⫺0.8 .2119 .2090 .2061 .2033 .2005 .1977 .1949 .1922 .1894 .1867 2.6 .9953 .9955 .9956 .9957 .9959 .9960 .9961 .9962 .9963 .9964
⫺0.7 .2420 .2389 .2358 .2327 .2296 .2266 .2236 .2206 .2177 .2148 2.7 .9965 .9966 .9967 .9968 .9969 .9970 .9971 .9972 .9973 .9974
⫺0.6 .2743 .2709 .2676 .2643 .2611 .2578 .2546 .2514 .2483 .2451 2.8 .9974 .9975 .9976 .9977 .9977 .9978 .9979 .9979 .9980 .9981
⫺0.5 .3085 .3050 .3015 .2981 .2946 .2912 .2877 .2843 .2810 .2776 2.9 .9981 .9982 .9982 .9983 .9984 .9984 .9985 .9985 .9986 .9986
⫺0.4 .3446 .3409 .3372 .3336 .3300 .3264 .3228 .3192 .3156 .3121 3.0 .9987 .9987 .9987 .9988 .9988 .9989 .9989 .9989 .9990 .9990
⫺0.3 .3821 .3783 .3745 .3707 .3669 .3632 .3594 .3557 .3520 .3483 3.1 .9990 .9991 .9991 .9991 .9992 .9992 .9992 .9992 .9993 .9993
⫺0.2 .4207 .4168 .4129 .4090 .4052 .4013 .3974 .3936 .3897 .3859 3.2 .9993 .9993 .9994 .9994 .9994 .9994 .9994 .9995 .9995 .9995
⫺0.1 .4602 .4562 .4522 .4483 .4443 .4404 .4364 .4325 .4286 .4247 3.3 .9995 .9995 .9995 .9996 .9996 .9996 .9996 .9996 .9996 .9997
⫺0.0 .5000 .4960 .4920 .4880 .4840 .4801 .4761 .4721 .4681 .4641 3.4 .9997 .9997 .9997 .9997 .9997 .9997 .9997 .9997 .9997 .9998
Examen Final de Estadı́stica I, 27 de junio de 2017.
Grados en ADE, DER-ADE, ADE-INF, FICO, ECO, ECO-DER, ADE-EEII.
NORMAS: 1) Usar cuadernillos separados para cada problema.

2) Realizar los cálculos con al menos dos cifras decimales significativas.
3) No se podrá abandonar el examen hasta transcurridos 30 minutos depués de haber empezado.
4) No está permitido salir del aula sin entregar el examen, aunque esté en blanco.
1. (3 puntos) Las elecciones generales del 2016 en España fueron un verdadero quebradero de cabeza
para los partidos tradicionales. El PP, partido que obtuvo el mayor porcentaje de votos a favor,
apenas obtuvo el 28.72% de los votos contabilizados. Algunos analistas se preguntan si el apoyo a
este partido dependió de la participación ciudadana, la cual miden en términos de concurrencia de
votantes el dı́a de las elecciones.
(a) (0.75 puntos) El diagrama de dispersión de p (porcentaje de participación por mesa electoral, eje
x) y v (porcentaje de votos a favor del PP, eje y) se muestra en la Figura 1. El coeficiente de
correlación entre estas variables es 0.26 Valore si existe una relación lineal o de otro tipo entre p
y v.
0.8
0.6
0.4
0.2
0
0 0.2 0.4 0.6 0.8 1
Figure 1: Diagrama de dispersión de p versus v.
(b) (0.75 puntos) La tabla adjunta muestra algunas medidas descriptivas de las variables bajo estudio.
Teniendo en cuenta la información disponible (gráfico de dispersión y tabla), deduzca si existen
mesas atı́picas, bien sea por valores extremos de participación o por votos a favor del PP. ¿Existen
mesas con porcentajes atipicamente pequeños de votos a favor?
Medidas media mediana cuasi desv-tip Q1 Q3

p 0.73 0.73 0.07 0.67 0.78
v 0.29 0.29 0.14 0.18 0.38
(c) (0.75 puntos) A continuación se muestran los histogramas de las variables p y v. Se pide que
conteste a las dos siguientes cuestiones:
• Compare los valores medianos y medios de cada una de las variables y a partir de ese análisis
valore si las distribuciones de p y v son simétricas.
• Ahora, considere los histogramas y valore de nuevo la asimetrı́a de las distribuciones.
10 4 10 4
2 2
1.5 1.5
1 1
0.5 0.5
0 0
0 0.5 1 0 0.5 1
Figure 2: Participación p (izquierda) y votos a favor por mesa v (derecha)
(d) (0.75 puntos) Los analistas del partido del PP sospechan que la caı́da de votos a favor se debió a la
falta de movilización. En ese sentido, aseguran que en las mesas con baja participación (≤ 70%,
según ellos), su porcentaje de votos a favor fue considerablemente más bajo del obtenido en las
mesas con alta participación (> 70%). ¿Es razonable esa idea? Justifique la respuesta utilizando
la información de la siguiente tabla:
p ≤ 0.70 p > 0.70

v ≤ 0.40 2239 9022
v > 0.40 14803 27686
2
2. (1.75 puntos) Una encuesta para medir el voto en la segunda vuelta en las elecciones presidenciales
francesas entre los candidatos Le Pen y Macron, encontró que el 40% de los votantes son menores
de 30 años y el 45% tienen entre 30 y 50 años. Por otro lado, el porcentaje de personas que tienen
intención de votar a Le Pen es del 20% entre las personas menores de 30 años, del 55% en las personas
entre 30 y 50 años y del 70% para las personas mayores de 50 años.
a) (0.5 puntos) ¿Cuál es la probabilidad de que una persona elegida al azar tenga intención de votar
a Le Pen y sea mayor de 30 años?
b) (0.5 puntos) Si una persona elegida al azar tiene intención de votar por Macron, ¿cuál es la
probabilidad de que el/ella tenga menos de 50 años?
c) (0.75 puntos) En el caso de los votantes mayores de 30 años, ¿qué porcentaje votará a Le Pen?
3. (1.5 puntos) El Estado emite bonos del Tesoro cuyo vencimiento fluctua entre 1 y 7 años. La función
de distribución de T , número de años hasta el vencimiento (vida residual), para un bono seleccionado
al azar, es



 0, t < 1,

 0.2, 1 ≤ t < 3,



FT (t) 0.7, 3 ≤ t < 5,

5 ≤ t < 7,



 0.8,


 1, t ≥ 7.
(a) (0.5 pts) Dibuje la función de distribución de T .

(b) (0.5 pts) Defina la función de probabilidad (o función masa) correspondiente.
(c) (0.5 pts) Calcule la probabilidad de que el número de años hasta el vencimiento de un bono
seleccionado al azar sea exactamente de 5 años. ¿Cuál es es la probabilidad de que T sea más de
4 años?
4. (1.5 puntos) Una determinada empresa de ventas online ha detectado que la probabilidad de que una
venta recibida sea fraudulenta es de 0.01. Si en una hora reciben 20 operaciones de venta y sabiendo
que se pueden realizar ventas las 24 horas del dı́a, conteste justificadamente a las siguientes cuestiones:
a) (0.75 pts) ¿Cuál es la probabilidad de que tenga al menos una operación fraudulenta en una hora
seleccionada al azar? Indique las hipótesis asumidas para obtener esta probabilidad.
b) (0.75 pts) La empresa de ventas ha contratado un seguro que cubre el coste de las ventas frau-
dulentas por el que paga una prima semanal global de 50 euros más 7 euros por cada operación
3
fraudulenta que reciba durante esa semana. En estas condiciones, calcula el coste semanal esperado
por la empresa por este concepto y su devsiación tı́pica.
5. (2.25 puntos) La duración, en minutos, en que los usuarios de un número de atención telefónica
consiguen obtener la información requerida se puede modelizar según una variable aleatoria de media
2 minutos y desviación tı́pica 1.9 minutos. Responda justificadamente a las siguientes cuestiones:
a) (0.75 pts) Se ha tomado una muestra de 100 tiempos y se han obtenido los siguientes gráficos:
¿Podemos suponer que la muestra sigue un modelo de probabilidad Normal? ¿Por qué?
b) (0.75 pts) Si es posible, calcule la probabilidad de que el tiempo medio de atención telefónica de 100
usuarios seleccionados al azar supere los dos minutos y medio. Comente por qué ha sido posible
o no calcular dicha probabilidad. ¿Podrı́a calcular la probabilidad requerida para una muestra
seleccionada al azar de 10 clientes?
c) (0.75 pts) Se han recogido los tiempos de atención de 100 usuarios seleccionados al azar obteniéndose
que 38 tuvieron una duración superior a 2 minutos, calcule un intervalo de confianza para la pro-
porción poblacional de duraciones superiores a 2 minutos a un 95% de nivel confianza.
4
Examen Final de Estadı́stica I, 17 de mayo de 2017.
Grados en ADE, DER-ADE, ADE-INF, FICO, ECO, ECO-DER, TUR, ADE-EEII.
NORMAS: 1) Realizar los cálculos con al menos dos cifras decimales significativas.
1. (3 pts) La siguiente tabla muestra los valores del Indice de Desarrollo Humano (IDH) para diferentes paı́ses de África,
América y Europa en el año 2015.
África 0,348 0,411 0,413 0,416 0,419 0,646 0,666 0,684 0,69 0,698 0,721 0,724 0,736 0,772 0,777
América 0,483 0,666 0,679 0,714 0,715 0,772 0,78 0,783 0,785 0,79 0,793 0,827 0,847 0,919 0,923
Europa 0,693 0,751 0,754 0,761 0,771 0,899 0,907 0,907 0,908 0,916 0,916 0,922 0,923 0,93 0,944
Responder a las siguientes cuestiones:

(a) (0,6 pts) Halle las medidas necesarias para justificar adecuadamente la veracidad o falsedad de cada una de las siguientes
afirmaciones:
1) El 50% de los paı́ses de África tiene un IDH que está por debajo del nivel alcanzado por cualquiera de los paı́ses de
Europa.
2) El 75% de los paı́ses de América tiene un IDH que está por encima del valor alcanzado por los paı́ses de África.
3) El 50% del los paı́ses europeos tiene un IDH que supera el IDH del 75% de los paı́ses americanos.
(b) (0,6 pts) Represente conjuntamente los diagramas de cajas de los tres continentes, determine la forma de cada dis-
tribución y verifique para cada uno de los continentes la existencia o no de datos atı́picos.
(c) (0,6 pts) ¿Qué medidas de centralidad y variabilidad resultan más adecuadas en cada caso? Obténgalas. Comente las
diferencias entre los tres continentes.
(d) (0,6 pts) El IDH se puede clasificar de la siguiente manera: Muy Alto [0.8, 1); Alto [0.7, 0.8); Medio [0.55, 0, 7) y Bajo
[0, 0.55). Construya la tabla de contingencia para la variable continente (X) y la variable IDH categorizada (Y ). Halle
sus distribuciones marginales.
(e) (0,6 pts) ¿Qué porcentaje de los paı́ses que tienen un IDH Alto o Muy alto pertenecen a Europa? De los paı́ses con un
IDH inferiores a 0.5, ¿qué porcentaje pertenece al continente Africano?
2. (2 pts) Una empresa ha diseñado la siguiente campaña para anunciar un producto a escala global mediante el envı́o masivo de
correos electrónicos (emails): Enviará cien mil emails a potenciales clientes no relacionados entre sı́ ofertando su producto,
que reporta un beneficio de 70 euros por unidad adquirida. La empresa asume que, en promedio, una de cada diez personas
que recibe el email comprará el producto. Responda a las siguientes preguntas, justificándolas adecuadamente.
(a) (0,7 pts) Especifique un modelo probabilı́stico para la variable aleatoria Y , que representa el beneficio que se obtendrá
con la campaña. Indique y justifique las hipótesis necesarias.
(b) (0,6 pts) Calcule la media, varianza y desviación tı́pica del beneficio Y .
(c) (0,7 pts) Calcule (de forma exacta o aproximada) la probabilidad de que el beneficio Y supere los 712000 euros.
3. (3 pts) Según los datos del INE, la distribución de hogares españoles en función del número de sus miembros viene dada
en la siguiente tabla. La tercera columna de la tabla refleja el porcentaje de hogares que disponen de lector de libros
electrónicos (e-book):
Hogares Número Porcentaje de hogares con e-book

de 1 o 2 miembros 7899565 18.60%
de 3 miembros 3847663 23.90%
de 4 o más miembros 4282595 29.30%
Conteste a las siguientes preguntas inicando claramente los sucesos con los que trabaja y los resultados que emplea en cada
caso.
(a) (0,6 pts) Calcule la probabilidad de que un hogar español seleccionado al azar no disponga de lector de libros electrónicos.
(b) (0,6 pts) Se selecciona un hogar español al azar y resulta que no dispone de e-book, ¿Cuál es la probabilidad de que
solo tenga 1 o 2 miembros?
(c) (0,6 pts) Elegido un hogar al azar, ¿Cuál es la probabilidad de que vivan en el mismo menos de 4 personas y no tengan
e-book?
(d) (0,6 pts) Entre los hogares con 3 o más miembros, ¿Cuántos disponen de lector de libros electrónicos?
(e) (0,6 pts) Una empresa proveedora de libros electrónicos diseña una campaña de promoción de e-books y para ello
selecciona una muestra aleatoria de 20 hogares, calcule la probabilidad de que más del 85% de los hogares seleccionados
no disponga de e-book.
4. (2 pts) A continuación, en la Tabla 1, se presentan los resultados del estudio realizado por el CIS sobre ”Actitudes y
Comportamientos Innovadores en la Sociedad Española”. A los encuestados se les pregunta por la importancia que asignan
a la innovación en distintos ámbitos o sectores (las fuentes de energı́a, las infraestructuras, el medio ambiente, la medicina,
la alimentación, la administración pública, la enseñanza, las empresas y los servicios sociales). Adicionalmente, con las
respuestas de los encuestados se construye el siguiente indicador global de la importancia de la innovación:
9
1X
I= Xi
9 i=1
El análisis descriptivo básico de I se muestra en la Tabla 2 a continuación:
(a) (0,6 pts) Explique cómo cree que se ha obtenido la estimación de la media de la variable I, es decir, i ≈ 8, 20.
(b) (0,7 pts) Calcule un intervalo de confianza del 95% para el nivel medio de importancia que se asigna a la innovación,
µI .
(c) (0,7 pts) Comente el ajuste de la variable I a la distribución normal. Justifique su respuesta basándose en los siguientes
gráficos.
2
Estadı́stica I Examen Extraordinario, 23 Junio 2016.
Grados en ADE, DER-ADE, ADE-INF, ADE-INT, FICO, ECO, ECO-DER, TUR.
REGLAS DEL EXAMEN: 1) Usar cuadernillos separados para cada problema. 2) Hacer los
cálculos con al menos dos decimales significativos. 3) No se puede abandonar el examen durante
los primeros 30 minutos. 4) No está permitido salir de la clase sin entregar el examen.
1. Se dispone de la siguiente información acerca de 10 empresas del Dow Jones: X1 =“sueldo de ejecutivo
mejor pagado (en millones de dólares)” y X2 =“precio de la acción (en dólares)”. Fuente: El Paı́s, 8 de
Mayo de 2016.
Tabla 1 / Table 1 Figura 1 / Figure 1

X1 X2
44,91 106,11
27,29 87,81
24,2 53,95
23,79 113,69
23,37 29,97
22,58 158,31
22,03 100,31
21 98
21,98 64,21
64 21 A
20,01 110,68
19,82 147,6
B
C
(a) (1 punto) Para la variable X2 , dibujar el diagrama de caja (box-plot) e identificar los atı́picos (si los
hubiere). Justificar la respuesta.
(b) (0,5 puntos) Determinar si X1 y X2 presentan el mismo tipo de asimetrı́a. Justificar la respuesta.
(c) (0,5 puntos) Determinar cuál de los diagramas de caja (A, B, C) corresponde a la variable X1 .
Justificar la respuesta.
(d) (0,5 puntos) Sabiendo que 1 euro = 1,14 dólares, obtener el sueldo medio de estos ejecutivos (en
millones de euros) y la varianza.
2. La cantidad de periódicos y revistas (expresada en decenas) que se venden semanalmente en un centro

comercial de cierta localidad puede representarse mediante una variable aleatoria con función de densidad:

k (x − 1)(3 − x), 1 ≤ x ≤ 3,
f (x) =
0, en caso contrario,
donde k es una constante adecuada.

(a) (0,5 puntos) Determinar el valor de la constante k para que f (x) sea realmente una función de densidad.
(b) (0,5 puntos) Obtener la función de distribución.
(c) (1 punto) Calcular la probabilidad de que en una semana cualquiera la cantidad de periódicos y revistas
vendidos supere la media.
(d) (0,5 puntos) Calcular la varianza de la cantidad de periódicos y revistas vendidos semanalmente.
3. Una ciudad de 3.5 millones de habitantes dispone de tres medios de transporte urbanos: metro, autobús
y tranvı́a. En general, en un dı́a laborable, el número de viajeros de metro asciende a 1.500.000, el de
autobús a 750.000 y los que viajan en tranvı́a son 450.000. Además se sabe que, de los viajeros de metro,
el 30% usa también autobús, el 10% usa también tranvı́a y el 5% utiliza también autobús y tranvı́a. De
los viajeros de autobús, sólo el 15% usa también tranvı́a. (Nota: Un habitante puede o no tomar algún
medio de transporte).
(a) (0,75 puntos) Calcular la probabilidad de que un habitante utilice solamente uno de los tres medios de
transporte en un dı́a laborable.
(b) (0,5 puntos) Calcular la probabilidad de que un habitante utilice por lo menos un medio de transporte
en un dı́a laborable.
(c) (0,75 puntos) Cuando en un dı́a laborable sólo se usa un medio de transporte, la probabilidad de
sufrir un retraso de más de 5 minutos es del 2%. Sin embargo, cuando se combina más de un medio
de transporte, esta probabilidad alcanza el 7%. Calcular la probabilidad que un habitante sufra un
retraso de más de 5 minutos en un dı́a laborable.
(d) (0,5 puntos) Utilizando la misma información del apartado (c) y sabiendo que un viajero ha sufrido
un retraso de más de 5 minutos, calcular la probabilidad de que haya utilizado más de un tipo de
transporte.
4. Sea X una v.a. que toma valores en el conjunto S = {2, 3, 5, 7}, con la siguiente función de probabilidad:

 0.10
 si x = 2,
 0.25 si x = 3,


P (X = x) = 0.35 si x = 5,
0.30 si x = 7,




0 en el resto de valores.

(a) (1 punto) Considerar una muestra aleatoria simple con la misma distribución que X, de tamanño
n = 150. Calcular la probabilidad de que la media muestral tome valores entre 4.6 y 5.0.
(b) (0.5 puntos) Comparar el resultado obtenido en el apartado (a) con la cota inferior que se obtendrı́a
utilizando la desigualdad de Chebyschev. ¿Es contradictorio el resultado? ¿Cuando es adecuado
utilizar la aproximación que porporciona la desigualdad de Chebyschev?
(c) (0.5 puntos) Sea Y una nueva v.a. que toma valor 1 si X < 5, y valor 0 en caso contrario. Determinar
el modelo de probabilidad que sigue Y , calcular su esperanza y varianza.
(d) (0.5 puntos) En una muestra de tamanño n = 250, X ha tomado valores menores que 5 en 75 ocasiones.
Obtener el intervalo de confianza para la media de Y al 98% de confianza.
2
Examen Final de Estadı́stica I, 26 de Mayo de 2016.
Grados en ADE, DER-ADE, ADE-INF, FICO, ECO, ECO-DER, TUR.
NORMAS: 1) Entregar cada problema en un cuadernillo distinto, aunque esté en blanco.

1. En las siguientes tablas se recoge información acerca de 10 empresas del IBEX 35. En concreto, se tienen tres
variables X1 =“retribución media del consejo de dirección”, X2 =“retribución media de la alta dirección”
y X3 =“gasto medio por empleado” (expresadas en millones de euros). Fuente: El Paı́s, 8 de Mayo de 2016.
Tabla 1 / Table 1
Empresa / Company X1 X2 X3 Figura 1 / Figure 1
BBVA 0,985 1,144 0,455
ACS 0,667 0,540 0,401
FCC 0,720 0,650 0,323
I dit
Inditex 1,270
1 270 1,730
1 730 0,231
0 231 A
Acciona 0,463 0,590 0,390
Santander 1,484 2,580 0,586
IAG 1,220 2,440 0,809
Iberdrola 0,920 1,979 0,894
Ferrovial 1,330 1,800 0,391
Telefónica 1,240 1,869 0,491 B
Tabla 2 / Table 2
X1 X2 X3
Media / Mean 1,030 0,497
Mediana / Median 1,765 0,428
Desv. típica / Standard dev. 0,333 0,756 0,210
Varianza / Variance 0,572 0,044
Q1 0,770 0,774 0,390
Q3 , 63
1,263 ,95
1,952
Responder a las siguientes cuestiones:
(a) (0,4 puntos) Completar los datos que faltan en la Tabla 2.

(b) (0,4 puntos) Respecto de la variable X2 , determinar la forma de su distribución. Justificar la respuesta.
(c) (0,4 puntos) ¿Cuál de las tres variables tiene mayor dispersión? Justificar la respuesta.
(d) (0,4 puntos) Determinar si la variable X3 tiene algún dato atı́pico. Justificar la respuesta.
(e) (0,4 puntos) Indicar a qué variables (X1 , X2 , X3 ) corresponden los diagramas de caja (box-plot) A y
B de la Figura 1. Justificar la respuesta.
(f) (0,5 puntos) Se sabe que la correlación entre X1 y X3 es 0,175 y, por otro lado, que la covarianza entre
X2 y X3 es de 0,093. ¿Es cierto que la relación lineal entre X3 y X1 es más fuerte que entre X3 y X2 ?
Justificar la respuesta.
2. Una empresa ofrece a cada uno de sus empleados la posibilidad de conseguir hasta 5 dı́as extra de vacaciones
en función de los objetivos alcanzados. Sea X la v.a. que mide el “número de dı́as extra de vacaciones”,
cuya función de distribución (o de probabilidad acumulada) es:
1
0,9
0,8
0,7
0,6
0,5
04
0,4
0,3
0,2
0,1
0
1 2 3 4 5
(a) (0,75 puntos) Escribir la función de probabilidad de X.

(b) (0,75 puntos) Calcular la esperanza de X y su desviación tı́pica.
(c) (0,5 puntos) Si un dı́a extra de vacaciones le cuesta a la empresa 100 euros, calcular el coste medio y
la varianza.
(d) (0,5 puntos) La empresa prevé que de 300 trabajadores, 1/3 consigan 4 dı́as extra de vacaciones y el
resto sólo 1 dı́a. Calcular el coste que le supone a la empresa (asumir que un dı́a extra son 100 euros
de coste).
3. El indicador AROPE mide el riesgo de padecer ciertos factores de vulnerabilidad social dentro del hogar.
A largo de 2014, de un total de 1.200.000 hogares atendidos por cierta ONG, solamente 156.000 no estaban
en situación de AROPE. Además, de los hogares que no estaban en situación de AROPE, el 84% tampoco
presentaban sobre-endeudamiento. Por otro lado, de los que sı́ estaban en situación de AROPE, el 40%
también presentaba sobre-endeudamiento.
(a) (0,5 puntos) Del total de hogares atendidos por esta ONG, calcular cuántos hogares presetan sobre-
endeudamiento.
(b) (0,75 puntos) Sabiendo que un hogar no tiene sobre-endeudamiento, determinar la probabilidad de que
esté en situación de AROPE.
(c) (0,5 puntos) Si en un dı́a cualquiera, un trabajador social de esta ONG visita 20 hogares, calcular la
probabilidad de que 5 de ellos no estén en situación de AROPE.
(d) (0,75 puntos) Si en un mes cualquiera se visitan 420 hogares, calcular la probabilidad de que por lo
menos 150 hogares estén en situación de AROPE y sobre-endeudamiento.
4. La retribución media de los directivos mejor pagados de las empresas españolas que cotizan en bolsa es de
2, 3 millones de euros anuales, con una desviación tı́pica de 0, 7. Se pide:
(a) (0,75 puntos) Calcular la probabilidad de que la retribución media anual de 100 de estos directivos
esté entre 2, 15 y 2, 45 millones de euros.
(b) (0,5 puntos) Si en lugar de 100 directivos se consideran solamente 50, sin realizar ningún cálculo
adicional, decidir si la probabilidad en (a) se incrementará o se reducirá. Justicar la respuesta.
(c) (0,5 puntos) Calcular la probabilidad de que la suma de retribuciones de 100 de estos directivos sea
mayor de 250 millones de euros.
(d) (0,75 puntos) Si para una muestra de 30 empresas españolas, la retribución media de los directivos
mejor pagados es de 2 millones de euros con una deviación tı́pica de 1, 4, calcular un intervalo de
confianza al 90% para la retribución media suponiendo normalidad. ¿Qué nivel de confianza tienes
en que la retribución media verdadera sea de 1, 5 millones de euros?
2
1. En las siguientes tablas se recoge información acerca del PIB y de la tasa de paro de las Comunidades
Autónomas españolas:
Tabla 1 Tabla 2
CCAA PIB Tasa de paro PIB Tasa de paro
Andalucía 13595.8 18.6 media 17530.7
Aragón 18766.0 6.6 mediana 16876.5
Asturias (Principado de) 15287.7 11.2 cuasi-desviación 3251.1
Balears (Illes) 20389.2 9.7 Q1 14834.7 9.3
Canarias 16832.7 11.4 Q3 20198.0
Cantabria 17425.7 10.6 Rango
Castilla y León 16920.4 11.1 intercuartílico 5363.3 1.9
Castilla-La Mancha 13978.5 10.1 percentil 85 21360.3 12.0
Cataluña 20783.7 10.1 percentil 15 14362.0
Comunidad Valenciana 16656.1 11.2
Extremadura 12240.6 17.4
Galicia 14683.7 12.7
Madrid (Comunidad de) 22968.7 7.4
Murcia (Región de) 14675.9 10.7
Navarra (Comunidad Foral) 22065.1 5.7
País Vasco 22444.5 9.5
Rioja (La) 19624.4 6.0
Ceuta y Melilla 16213.8 9.2
Responder a las siguientes cuestiones, justificando cada una de ellas:

(a) (0.5 puntos) Completar los datos que faltan en la Tabla 2.
(b) (0.5 puntos) ¿Cuál de las dos variables tiene mayor variación?
(c) (0.5 puntos) Determinar el grupo de Comunidades Autónomas formado por el 15% de las que tienen
mayor PIB.
(d) (0.5 puntos) Dibujar el diagrama de caja (box-plot) para la tasa de paro. ¿Qué forma presenta la
distribución?
(e) (0.5 puntos) A partir del box-plot anterior, determinar si hay atı́picos y/o atı́picos extremos. Identificar
de qué comunidades se trata.
Solución.
(a) En la Tabla 2 faltan algunos estadı́sticos descriptivos para la variable tasa de paro: media 10.5, mediana
10.3, cuasi-desviación tı́pica 3.4, Q3 = 11.2, P15 = 7.0.
(b) Puesto que las unidades de medida y el rango de valores son muy distintos para el PIB y la tasa de
paro, la cuasi-desviación tı́pica no es un buen descriptivo para comparar sus variabilidades. Es mejor
utilizar una medida adimensional, como el coeficiente de variación (CV). En este caso,
3251.1 3.4
CV (P IB) = = 0.19, CV (t.paro) = = 0.32,
17530.7 10.5
luego la variación de la tasa de paro es mayor.
(c) El grupo de CCAA formado por el 15% con mayor PIB son aquellas cuyo PIB sea superior al percentil
85, es decir superior a 21360.3. Hay tres CCAA que cumplen esta condición: Navarra, Paı́s Vasco y
Madrid.
(d) Diagrama de caja para la tasa de paro
18
16
14
12
10
tasa de paro
La distribución presenta una ligera asimetrı́a hacia la derecha, puesto que la media es ligerante superior
a la mediana. La posible causa de esta asimetrı́a son dos atı́picos extremos con tasas de paro superiores
a 17.
(e) Para la variable tasa de paro será un atı́co cualquier observación superior a Q3 + 1.5 × RI = 14.1 o
inferior a Q1 − 1.5 × RI = 6.4. Además, serán atı́picos extremos aquellas observaciones superiores a
Q3 + 3 × RI = 16.9 o inferiores a Q1 − 3 × RI = 3.6. Luego Navarra y La Rioja son atı́picos porque sus
tasas de paro son inferiores a 6.4 y Extremadura y Andalucı́a son atı́picos extremos porque sus tasas
de paro son superiores a 16.9.
2. La duración (en minutos) de cierto proceso de fabricación es una variable aleatoria X con función de
densidad 1
f (x) = 2 + c (1 − x), 1 ≤ x ≤ 2,
0, en caso contrario,
donde c es una constante adecuada.
(a) (0.5 puntos) Determinar el valor de la constante c para que f (x) sea realmente una función de densidad.
Dibujar la función de densidad.
(b) (0.75 puntos) ¿Cuál es la probabilidad de que el proceso de fabricación dure menos de 90 segundos?
(c) (0.75 puntos) Calcular la esperanza y la varianza de X.
(d) (0.5 puntos) Calcular exactamente la probabilidad P (|X − E(X)| ≥ 0.3). Comparar este resultado con
la cota superior que se obtendrı́a mediante la desigualdad de Chebyschev. ¿Es contradictorio el resul-
tado? ¿Cuando es adecuado utilizar la aproximación que porporciona la desigualdad de Chebyschev?
(Indicación: Si no has podido calcular la esperanza y varianza de X, puedes considerar E(X) = 1.583
y var(X) = 0.076).
Solución.
(a) Para que f (x) sea una función de densidad debe integrar 1 sobre su soporte, es decir,
2 2
x2
Z
1 1 1 1
+ c (1 − x) dx = 1 ⇒ x+c x− =1⇒ +c − = 1 ⇒ c = −1,
1 2 2 2 1 2 2
de manera que la función de densidad es
x − 12 , 1 ≤ x ≤ 2,

f (x) =
0, en caso contrario.
2
2
1.5
0.5
0
0 1 2 3
(b) La probabilidad de que el proceso de fabricación dure menos de 90 segundos, es decir, menos de 1.5
minutos es Z 1.5 2 1.5
1 x x
P (X < 1.5) = x− dx = − = 0.375.
1 2 2 2 1
(c) La esperanza y varianza de X son:
+∞ 2 2
x3 x2
Z Z

2 x 19
E(X) = x f (x) dx = x − dx = − = = 1.5833.
−∞ 1 2 3 4 1 12
Para calcular la varianza de X, utilizamos que var(X) = E(X 2 ) − (E(X))2 , donde

2 2
x2 x4 x3
Z
31
E(X 2 ) = x3 − dx = − = = 2.5833,
1 2 4 6 1 12
2
luego var(X) = 31/12 − (19/12) = 11/144 = 0.0764.
(d) Para calcular P (|X − E(X)| ≥ 0.3) de forma exacta se usa de nuevo la función de densidad de X:
P (|X − E(X)| ≥ 0.3) = 1 − P (|X − E(X)| < 0.3) = 1 − P (−0.3 < X − E(X) < 0.3)
Z 1.8833
1
= 1 − P (1.2833 < X < 1.8833) = 1 − x− dx
1.2833 2
2 1.8833
x x
= 1− − = 0.35002,
2 2 1.2833
donde se ha utilizado que E(X) = 1.5833.

La aproximación que proporciona la desigualdad de Chebyschev es:
var(X) 0.0764
P (|X − E(X)| ≥ 0.3) ≤ = = 0.8489,
0.32 0.32
donde se observa que esta cota superior (0.8489) es mucho mayor que el valor exacto (0.35002).
Este resultado no es contradictorio, puesto que Chebyschev proporciona una cota superior, es decir,
que la probabilidad exacta siempre será menor que la aproximación mediante Chebyschev. Por este
motivo, se recomienda usar la desigualdad de Chevyschev para aproximar probabilidades de una v.a.
solamente cuando se desconozca la ley de probabilidad de dicha v.a.
3. Una agencia de viajes ofrece tres tipos de destinos: regional, nacional e internacional. En general, los
porcentajes de ventas suelen ser del 30% para regional, del 20% para nacional y del 50% para internacional
y las reclamaciones que suele recibir son del 1% para regional, del 1% para nacional y del 1.5% para
internacional.
3
(a) (0.5 puntos) Determinar el porcentaje de reclamaciones que recibe.
(b) (0.75 puntos) Determinar la probabilidad de que dada una reclamación, ésta sea debida a un destino
regional.
(c) (0.5 puntos) Determinar la probabilidad de que un cliente contrate un destino internacional y no emita
ninguna reclamación.
(d) (0.75 puntos) De un total de 10 clientes, determinar la probabilidad que 3 o más de ellos contraten un
destino internacional y no emitan ninguna reclamación.
Solución. Consideramos los siguientes sucesos Reg =“destino regional”, N ac =“destino nacional” e
Inter =“destino internacional”, con probabilidades P (Reg) = 0.30, P (N ac) = 0.20, P (Inter) = 0.50),
respectivamente. Además, consideramos los sucesos R =“el cliente emite reclamación” y R̄ =“el cliente no
emite reclamación”.
(a) El porcentaje de reclamaciones se obtiene aplicando el teorema de la probabilidad total:
P (R) = P (R|Reg) · P (Reg) + P (R|N ac) · P (N ac) + P (R|Inter) · P (Inter)

= 0.01 · 0.30 + 0.01 · 0.20 + 0.015 · 0.50 = 0.0125,
luego el porcentaje de reclamaciones es del 1.25%.

(b) Para obtener la probabilidad P (Reg|R) es necesario aplicar el teorema de Bayes:
P (R|Reg) · P (Reg) 0.01 · 0.30

P (Reg|R) = = = 0.24.
P (R) 0.0125
(c) La probabilidad de que un cliente contrate un destino internacional y no emita ninguna reclamación
se obtiene como la intersección de los sucesos Inter y R̄, es decir:
P (Inter ∩ R̄) = P (R̄|Inter) ·P (Inter) = 0.985 · 0.5 = 0.4925.

| {z }
1−P (R|Inter)
(d) Conisderemos la v.a. X =“número de clientes de un total de 10 que contratan destino internacional
y no emiten reclamación”, que puede modelarse según una ley Binomial Bin(10, 0.4925). Luego,
la probabilidad de que 3 o más clientes contraten un destino internacional y no emitan ninguna
reclamación es:
P (X ≥ 3) = 1 − P (X < 3) = 1 − (P (X = 0) + P (X = 1) + P (X = 2))

10 10 10
= 1− 0.49250 (1 − 0.4925)10 + 0.49251 (1 − 0.4925)9 + 0.49252 (1 − 0.4925)8
0 1 2
10 9 2 8

= 1 − 0.5075 + 10 · 0.4925 · 0.5075 + 45 · 0.4925 · 0.5075 = 1 − 0.0602 = 0.9398.
4. El salario semanal de trabajadores de producción no supervisada en la industria minera se supone que

tiene media y desviación tı́pica iguales a 630ey 35e, respectivamente. Se pide:
(a) (1 punto) Calcular la probabilidad de que el salario medio semanal de 100 de estos trabajadores esté
entre 600e y 660e.
(b) (0.5 puntos) Sin realizar ningún tipo de cálculo adicional, decidir si la probabilidad en (a) se incre-
mentará o se reducirá si el número de trabajadores es 200 en lugar de 100. Justica tu respuesta.
(c) (0.5 puntos) Calcular la probabilidad de que la suma de salarios de 100 trabajadores sea mayor de
70000e.
(d) (0.5 puntos) El gobierno sospecha que algunas de las compañı́as mineras están pagando a los tra-
bajadores de producción no supervisada un sueldo inferior al estipulado. Para comprobar esto, el
gobierno obtiene una muestra del salario semanal de 50 trabajadores y obtienen una media muestral
de 605e. Se pide obtener un intervalo de confianza al 90% para el salario medio suponiendo que dichos
salarios tienen una distribución Normal con desviación tı́pica 35. ¿Que nivel de confianza tienes en
que la media verdadera sea realmente 630e?
4
Solución:

(a) Puesto que n ≥ 30, por el CLT tenemos que X ∼ N 630, √35 100
= N (630, 3.5). Entonces, la
probabilidad requerida está dada por:

−30 X 30
Pr 600 < X < 660 = Pr < < ' Pr (−8.57 < Z < 8.57) =
3.5 3.5 3.5
= Pr (Z < 8.57) − Pr (Z < −8.57) = 1 − 0 = 1,
donde Z ∼ N (0, 1).

(b) Puesto que 200 > 100, la varianza de X se espera que sea menor. Por lo tanto, la probabilidad de
que X esté en el intervalo (600, 660) deberı́a aumentará (aunque ya es 1).
(c) Queremos calcular la probabilidad siguiente:
100
!
X
Pr Xi > 70000
i=1
Esta cantidad es similar a:

70000
Pr X > = Pr X > 700
100
Entonces, como en a), por el TCL tenemos que X ∼ N (630, 3.5). Entonces, la probabilidad requerida
está dada por:
100
!
X X − 630 700 − 630
Pr Xi > 70000 = Pr X > 700 = Pr > '
i=1
3.5 3.5
' Pr (Z > 20) = 1 − Pr (Z ≤ 20) = 1 − 1 = 0
donde Z ∼ N (0, 1).

(d) El intervalo de confianza para la media está dado por:

35 35
605 − 1.65 √ , 605 + 1.65 √ = (596.8329, 613.1671)
50 50
En consecuencia, estamos más de un 90% seguros de que el salario mensual verdadero medio es menor
de 630e.
5

1. Se quiere determinar el impacto económico de los negocios de una gran compañia en las ventas totales
de pequeñas empresas. Para ello se obtiene una muestra de 15 de esas pequeñas empresas y se toman
los porcentajes del total de ventas anual de las 15 pequeñas empresas como resultado de las ventas a la
compañı́a:
27 12 14.9 1.2 0.1 1 0.1 5.3 7.6 5 1 1 3.2 3 7
(a) (0.5 puntos) Es la media muestral de los 15 porcentajes mayor que la mediana muestral? En caso
afirmativo, ¿qué sugiere este resultado? Justifica tus respuestas.
(b) (0.5 puntos) Calcular los tres cuartiles muestrales. Interpretarlos en términos de los porcentajes.
(c) (0.5 puntos) Calcular la cuasi-varianza y el coeficiente de variación de la muestra de 15 porcentajes.
(d) (1 punto) Dibujar un diagrama de caja de los datos e identificar los atı́picos (si hubiere). Justifica tu
respuesta.
Solución.
(a) La media muestral de los 15 porcentajes es x = 5.96, mientras que la mediana muestral es M =
3.2. Entonces, la media muestral es mayor que la mediana muestral. Este resultado sugiere que la
distribución de los datos es asimétrica a la derecha (asimetrı́a positiva), es decir, hay un número
reducido de pequeñas compañı́as para las que los porcentajes de ventas totales anuales a la gran
compañı́a son notablemente mayores que para el resto.
(b) Los cuartiles muestrales son Q1 = x(4) = 1, Q2 = x(8) = 3.2 y Q3 = x(12) = 7.6, respectivamente.
Entonces, el 25% de los porcentajes son menores que el 1%, el 50% de los porcentajes son menores
que el 3.2% y el 75% de los porcentajes son menores que el 7.6%. Consecuentemente, los tres cuartiles
muestrales dividen la muestra en cuatro sub-muestras que contienen respectivamente el mismo número
de porcentajes. En general, los porcentajes de ventas totales a la compañı́a para la mayorı́a de las
pequeñas empresas representa menos del 7.6%.
b2 = 53.2668, mientras que el coeficiente de variación muestral es
(c) La cuasi-varianza muestral es σ
CV = 1.2245.
(d) Para construir el diagrama de caja, necesitamos el rango intercuartı́lico que está dado por IQR =
Q3 −Q1 = 7.6−1 = 6.6. Más aún, para construir las barras del diagrama y para detectar atı́picos, si los
hay, necesitamos los valores Q1 −1.5IQR = 1−1.5×6.6 = −8.9 y Q3 +1.5IQR = 7.6+1.5×6.6 = 17.5.
Además, los valores máximo y mı́nimo en la muestra son 0.1 y 27, respectivamente. Entonces, hay un
sólo dato atı́pico ya que 17.5 < 27. El diagrama de caja aparece en la Figura 1.
2. Se realiza una encuesta a 500 personas estadounidenses acerca de su afiliación polı́tica y de su actitud
respecto a un plan nacional de salud. Las respuestas se disponen en una tabla de contingencias de acuerdo
a la afiliación polı́tica y la actitud como sigue:
Actitud
Afiliación Favor Indiferente Contrario Total
Demócrata 138 83 64 285
Republicano 64 67 84 215
Total 202 150 148 500
Dada la información previa, responder a las siguientes preguntas:

Diagrama de caja
0 5 10 15 20 25
(a) (1 punto) Obtener la distribución de frecuencias relativas conjunta de las dos variables y las distribu-
ciones de frecuencias relativas marginales.
(b) (0.5 puntos) Obtener la distribución condicional de Actitud dada Afiliación. ¿Qué actitud es más
frecuente entre Republicanos? Justifica tus respuestas.
(c) (0.5 puntos) Obtener la distribución condicional de Afiliación dada Actitud. ¿Qué afiliación polı́tica
es más favorable al plan nacional de salud? Justifica tus respuestas.
(d) (0.5 puntos) ¿Serı́a correcto decir que entre la gente que no se opone al plan de salud propuesto, la fre-
cuencia relativa de votantes Demócratas es mayor que la frecuencia relativa de votantes Republicanos?
Justifica tu respuesta.
Solución.
(a) La distribución de frecuencias relativa conjunta de las dos variables y las distribuciones de frecuencias
relativas marginales están dadas en la tabla siguiente:
Actitud
Afiliación Favor Indiferente Contrario Total
Demócrata 0.276 0.166 0.128 0.57
Republicano 0.128 0.134 0.168 0.43
Total 0.404 0.3 0.296 1
(b) La distribución condicional de Actitud dada Afiliación está dada por:
Actitud|Afiliación Favor Indiferente Contrario
f·|Democrata 0.4842105 0.2912281 0.2245614
f·|Republicano 0.2976744 0.3116279 0.3906977
Por lo tanto, la Actitud más frecuente entre Republicanos es Contrario.
(c) La distribución condicional de Afiliación dada Actitud está dada por:
Afiliación|Actitud f·|F avor f·|Indif erente f·|Contrario
Demócrata 0.6831683 0.5533333 0.4324324
Republicano 0.3168317 0.4466667 0.5675676
Por lo tanto, la Afiliación polı́tica con mayor Actitud favorable al plan de salud es Demócrata.
(d) La respuesta es Si. Notar que,
Afiliación|Actitud f·|N ocontraria f·|Contrario
Demócrata 0.6278409 0.4324324
Republicano 0.3721591 0.5675676
2
Por lo tanto, entre la gente que no se opone al plan de salud propuesto, la frecuencia relativa de
votantes Demócratas es mayor que la frecuencia relativa de votantes Republicanos.
3. El número de llamadas nocturnas a un servicio de emergencia de una empresa de calefacción y aire acondi-
cionado tiene probabilidades 0.05, 0.1, 0.15, 0.35, 0.2 y 0.15 para 0, 1, 2, 3, 4 y 5 llamadas por noche,
respectivamente.
(a) (0.5 puntos) Obtener la función de probabilidad del número de llamadas al servicio en una noche.
¿Cuál es la probabilidad de que el número de llamadas en una noche sea mayor de 3?
(b) (0.5 puntos) ¿Cuál es el número medio de llamadas por noche? ¿Y la varianza?
(c) (0.5 puntos) Suponiendo que el número de llamadas en noches diferentes sean independientes, ¿cuál
es el número medio de llamadas por semana? ¿y la varianza?
(d) (1 punto) Obtener la probabilidad (o una aproximación) de que el número de llamadas en un año
(365 dı́as) sea mayor que 1300.
Solución.
(a) La función de probabilidad del número de llamadas de emergencia, X, está dada por:


 0.05 x = 0
0.1 x = 1




0.15 x = 2

Pr (X = x) =

 0.35 x = 3
0.2 x = 4




0.15 x = 5

Por lo tanto, Pr (X > 3) = Pr (X = 4) + Pr (X = 5) = 0.2 + 0.15 = 0.35.

(b) La media está dada por:
E [X] = 0 × 0.05 + 1 × 0.1 + 2 × 0.15 + 3 × 0.35 + 4 × 0.2 + 5 × 0.15 = 3
mientras que la varianza está dada por:

2 2 2
V [X] = (0 − 3) × 0.05 + (1 − 3) × 0.1 + (2 − 3) × 0.15 +
2 2 2
+ (3 − 3) × 0.35 + (4 − 3) × 0.2 + (5 − 3) × 0.15 =
= 9 × 0.05 + 4 × 0.1 + 1 × 0.15 + 0 × 0.35 + 1 × 0.2 + 4 × 0.15 = 1.8
(c) La media y la varianza del número de llamadas de emergencia por semana, Y , coinciden con la media
de 7X y con siete veces la varianza de X. Entonces,
E [Y ] = 7 × E [X] = 7 × 3 = 21
mientras que
V [Y ] = 7 × V [X] = 7 × 1.8 = 12.6
(d) La media y la varianza del número de llamadas de emergencia por año, M , coinciden con la media de
365X y con 365 veces la varianza de X. Entonces,
E [M ] = 365 × E [X] = 365 × 3 = 1095
mientras que
V [M ] = 365 × V [X] = 365 × 1.8 = 657.
Por el TCL, tenemos que:

M − 1095 1300 − 1095 M − 1095
Pr (M > 1300) = Pr > = Pr > 7.997812 '
25.63201 25.63201 25.63201
' Pr (Z > 7.997812) = 1 − Pr (Z ≤ 7.997812) = 1 − 1 = 0,
donde Z ∼ N (0, 1).
3
4. El número de descargas por hora de cierta aplicación para móvil puede modelarse según una variable
aleatoria de media 100 y desviación tı́pica 20.
(a) (0.5 puntos) Dada una muestra de tamaño 100 se obtienen los siguientes gráficos para el número de
descargas por hora:
QQ Plot of Sample Data versus Standard Normal
180
35
160
30
Quantiles of Input Sample

140
25
120
20
100
15
80
10
60
5
40
0 −3 −2 −1 0 1 2 3
40 55 70 85 100 115 130 145 160 175 Standard Normal Quantiles
Razonar si el número de descargas por hora puede modelarse según una ley Normal.
(b) (0.75 puntos) Calcular la probabilidad (sin aproximar) de que en un dı́a (24 horas) la media de
descargas por hora esté comprendida entre 90 y 110, suponiendo que el número de descargas en cada
hora es una muestra aleatoria simple. ¿Qué otra hipótesis es necesario asumir?
(c) (0.75 puntos) Calcular la probabilidad aproximada de que en una semana (168 horas) el total de
descargas llegue a superar las 17000, suponiendo que el número de descargas en cada hora es una
muestra aleatoria simple. ¿Qué teorema es necesario aplicar para poder calcular esta probabilidad?
(d) (0.5 puntos) Se han controlado las descargas de la aplicación durante 40 horas obteniéndose una
media muestral de 99.5. Calcular el intervalo de confianza al 95% para la media de descargas por hora
(suponiendo σ = 20 y que el número de descargas en cada hora es una muestra aleatoria simple).
Solución:
(a) Atendiendo al histograma y al qq-plot parece que los datos no se alejan demasiado de la ley Normal.
(b) Si se supone que la v.a. X =“número de descargas por hora” sigue una ley N (100, 202 ), entonces
dadas n = 24 v.a. independientes y con la misma ley que X, la media muestral X̄n ∼ N (100, 202 /24).
Por tanto,
P (90 < X̄n < 110) = P (−2.45 < Z < 2.45) = 2 P (Z < 2.45) − 1 = 2 · 0.9929 − 1 = 0.9858,
donde Z ∼ N (0, 1). Para poder calcular esta probabilidad es necesario asumir que X tiene ley Normal.
(c) Dadas X1 , . . . , Xn , n = 168 v.a.Pindependientes y con la misma ley que X =“número de descargas
n
por hora”, consideramos la v.a. i=1 Xi = n X̄n . Puesto que n ≥ 30, el Teorema Central del Lı́mite
2
asegura que X̄n ∼ N (100, 20 /168). Entonces,
n
X
P( Xi > 17000) = P (n X̄n > 17000) = P (X̄n > 17000/168) ≈ P (Z > 0.77) = 0.2206,
i=1
donde Z ∼ N (0, 1).

(d) A partir de las descargas observadas en 40 horas (X1 , . . . , Xn v.a. i.i.d. con n = 40) se obtuvo una
media muestral de x̄n = 99.5. Suponiendo σ = 20, el intervalo de confianza al 95% para la media de
descargas es
√ √
x̄n ∓ z1−α/2 σ/ n = 99.5 ∓ 1.96 · 20/ 40 = 99.5 ∓ 6.20 = (93.3, 105.7).
4
Grados en ADE, DER-ADE, ADE-INF, FICO, ECO, ECO-DER.
1. El siguiente conjunto de datos muestra el número de coches vendidos en un mes en 23 concesionarios

diferentes:
9 8 14 23 23 27 18 18 8 21 20 18 14 20 29 18 33 19 23 24 24 14 19
(a) (0.5 puntos) ¿Es la media de las ventas mensuales anteriores mayor de 20? ¿Y la mediana? ¿Es cierto
que la venta más frecuente durante el mes fue de 20 coches? Justificar las respuestas.
(b) (0.5 puntos) Calcular la cuasi-varianza muestral y el coeficiente de variación muestral para el conjunto
de datos.
(c) (1 punto) Dibujar un diagrama de caja para el conjunto de datos, obteniendo para ello las medidas
numéricas necesarias. ¿Es cierto que la forma de la distribución presenta una fuerte asimetrı́a a la
derecha? Justificar la respuesta.
(d) (0.5 puntos) Basándose en el diagrama de cajas realizado en el apartado anterior, ¿hay atı́picos en el
conjunto de datos? Justificar la respuesta.
Solución.
(a) La media muestral es x = 19.30. La mediana muestral es M = 19. La moda muestral es 18. Entonces,
la respuesta es NO para todas las preguntas.
b2 = 40.13043. El coeficiente de variación muestral es 0.3281.
(b) La cuasi-varianza muestral es σ
(c) Los cuartiles muestrales son Q1 = 14, Q2 = 19 y Q3 = 23. Entonces, el rango intercuartı́lico muestral
es IQR = 23 − 14 = 9. El diagrama de caja es:
10 15 20 25 30
La distribución es ligeramente asimétrica a la derecha. Por lo tanto, no es fuertemente asimétrica.

(d) Por un lado, tenemos que Q1 −1.5IQR = 14−1.5×9 = 0.5. Por otro lado, tenemos que Q3 +1.5IQR =
23 + 1.5 × 9 = 36.5. Como los valores mı́nimo y máximo en la muestra son 8 y 33, respectivamente,
y 0.5 < 8 y 36.5 > 33, concluimos que no hay datos atı́picos.
2. Un joven emprendedor abre un negocio en una ciudad. Según cierta información fiable sobre negocios
similares en dicha ciudad, se conoce que el 25% de ellos tienen ingresos anuales de hasta 1 millón de euros
(incluido), el 50% de ellos tienen ingresos anules entre 1 (no incluido) y 2 millones de euros (incluido), y
el resto tiene ingresos anules entre 2 (no incluido) y 3 millones de euros (incluido). Dada la información
anterior, y suponiendo que los negocios en cada una de las franjas de beneficio consideradas se distribuyen
uniformemente, se pide responder a las siguientes preguntas:
(a) (0.75 puntos) Obtener la función de distribución acumulada de los ingresos anuales (en millones de
euros).
(b) (0.25 puntos) Obtener la probabilidad de que los ingresos anules del negocio abierto por el joven
emprendedor estén entre 0.5 (no incluido) y 1.5 (incluido) millones de euros.
(c) (0.75 puntos) Calcular el valor esperado y la desviación tı́pica de los ingresos anuales (en millones de
euros).
(d) (0.75 puntos) Si el negocio tiene éxito, el joven emprendedor planea abrir otro negocio más pequeño
que el primero. Se sabe que los ingresos anuales de los negocios más pequeños son un cuarto de los
ingresos anuales de los negocios grandes. Entonces, ¿cuáles son los ingresos esperados del segundo
negocio? ¿y la desviación tı́pica?
Solución.
(a) Sea X los ingresos anuales del negocio (en millones de euros). Entonces, la función de densidad de X
está dada por:  1
x≤1
 41


2 1<x≤2
f (x) = 1
2<x≤3
 4


0 en otro caso
Por lo tanto, la función de distribución acumulada se puede calcular como:
• Para x ≤ 0,
F (x) = 0
• Para 0 < x ≤ 1, Z x
1 x
F (x) = dx =
0 4 4
• Para 1 < x ≤ 2,
Z 1 Z x
1 1 1 1 1 1
F (x) = dx + dx = + (x − 1) = x−
0 4 1 2 4 2 2 2
• Para 2 < x ≤ 3,
Z 1 Z 2 Z x
1 1 1
F (x) = dx + dx + dx =
0 4 1 2 2 4
1 1 1 1
= + + (x − 2) = (x + 1)
4 2 4 4
• Para 3 < x,
F (x) = 1
En resumen, 
 0 x<0
x

0<x≤1


 4
1
x − 12

F (x) = 2 1<x≤2
1
(x + 1) 2<x≤3



 4
1 3≤x

2
(b) La probabilidad de que los ingresos anuales del negocio (en millones de euros) estén entre 0.5 y 1.5
millones de euros está dada por:
1 1 3
Pr (0.5 < x ≤ 1.5) = F (1.5) − F (0.5) = − = = 0.375
2 8 8
(c) La esperanza de X está dada por:

Z 3 Z 1 Z 2 Z 3
x x x
E [X] = xf (x) dx = dx + dx + dx =
0 0 4 1 2 2 4
2 |x=1 2 |x=2 2 |x=3
x x x 1 3 5 3
= + + = + + = = 1.5 millones de euros
8 |x=0 4 |x=1 8 |x=2 8 4 8 2
La varianza de X está dada por:

2
V [X] = E X 2 − E [X]

donde:
3 1 2 3
x2 x2 x2
Z Z Z Z
E X2 = x2 f (x) dx =

dx + dx + dx =
0 0 4 1 2 2 4
3 |x=1 3 |x=2 3 |x=3
x x x 1 7 19 17
= + + = + + =
12 |x=0 6 |x=1 12 |x=2 12 6 12 6
Entonces,
17 9 7
V [X] = − = ' 0.5833
6 4 12
q
7
y la desviación tı́pica es 12 ' 0.7637 millones de euros.
(d) Los ingresos anuales esperados del segundo negocio y su desviación tı́pica son un cuarto de las corre-
spondientes al primer negocio. Entonces, el valor esperado es 38 = 0.375 millones de euros, mientras
que la desviación tı́pica es 0.1909.
3. Cada dı́a un agente de ventas llama a 25 hogares independientes para intentar vender un nuevo producto,
ganando una comisión de 45 euros por venta. Basado en su experiencia, el agente realiza, en promedio,
una venta de cada seis llamadas en hogares con niños en edad escolar, y una venta de cada diez llamadas
en hogares sin niños en edad escolar. El agente desconoce por completo el tipo de hogar al que va a llamar,
pero sabe que el 30% de los hogares tienen niños en edad escolar. Se pide obtener:
(a) (0.5 puntos) La probabilidad de que se produzca una venta en una llamada cualquiera.
(b) (0.5 puntos) La probabilidad de que el número de ventas en un dı́a cualquiera sea 3 o menos de 3.
(c) (0.5 puntos) La media, varianza y desviación tı́pica de la comisión total por ventas en un dı́a.
(d) (1 punto) La probabilidad (o una aproximación de ella) de que el agente gane en una semana (5 dı́as
de trabajo) más de 1000 euros en comisiones por ventas.
Solución.
(a) Por la ley de probabilidad total, escribiendo “niños en edad escolar” como NEE, la probabilidad de
que una llamada resulte en una venta es:
Pr (Venta) = Pr (Venta|NEE) Pr (NEE) + Pr (Venta|No NEE) Pr (No NEE) =

1 3 1 7
= × + × = 0.12
6 10 10 10
3
(b) El número de ventas en un dı́a es N ∼ Bin (25, 0.12). Por lo tanto, la probabilidad de que el número
de ventas en un dı́a sea 3 o menos de 3 está dado por:
Pr (N ≤ 3) = Pr (N = 0) + Pr (N = 1) + Pr (N = 2) + Pr (N = 3) =

25 0 25 25 24
= 0.12 (1 − 0.12) + 0.121 (1 − 0.12) +
0 1

25 2 23 25 22
+ 0.12 (1 − 0.12) + 0.123 (1 − 0.12) =
2 3
= 1 × 0.0409 + 25 × 0.0056 + 300 × 0.0008 + 2300 × 0.0001 =
' 0.6475
(c) La media, varianza y desviación tı́pica de N están dadas por:

E [N ] = 25 × 0.12 = 3
V [N ] = 25 × 0.12 × 0.88 = 2.64
√
DT [N ] = 2.64 = 1.6248
Entonces, la media, varianza y desviación tı́pica de la comisión de ventas totales en un dı́a están dadas
por:
E [45N ] = 45 × E [N ] = 45 × 3 = 135 euros
V [45N ] = 452 × V [N ] = 5346 euros2
DT [45N ] = 45 × DT [N ] = 45 × 1.6248 = 73.116 euros
(d) El número de ventas en una semana es M ∼ Bin (125, 0.12). Entonces, la comisión total ganada en
una semana de trabajo es W = 45M . La media, varianza y desviación tı́pica de M está dada por:
E [M ] = 125 × 0.12 = 15
V [M ] = 125 × 0.12 × 0.88 = 13.2
√
DT [M ] = 13.2 = 3.6331
Usando el TCL, obtenemos que:
Pr (W > 1000) = Pr (45M > 1000) = Pr (M > 22.22) =

M − 15 22.22 − 15
= Pr > ' Pr (Z > 1.9872) =
3.6331 3.6331
= 1 − Pr (Z < 1.9872) = 1 − 0.9761 = 0.0239
donde Z ∼ N (0, 1).
4. Los clientes de un banco pueden ingresar o retirar dinero. Sea X la cuantia de una operación realizada por
un cliente donde el valor de X es positivo, si el dinero es ingresado, o negativo, si el dinero es retirado. Los
analistas del banco asumen que la esperanza y la desviación tı́pica de X son 0 y 100 euros, respectivamente.
(a) (1 punto) Calcular la probabilidad de que la media de 100 operaciones realizadas por clientes inde-
pendientes esté entre −3 and 3 euros.
(b) (0.5 puntos) Sin realizar ningún tipo de cálculo adicional, decidir si la probabilidad en el apartado (a)
será mayor o menor si el tamaño muestral aumenta. Justificar la respuesta.
(c) (0.5 puntos) Supongamos que 100 clientes visitan el banco un cierto dı́a. Calcular la probabilidad de
que la suma de operaciones al final de dicho dı́a sea positiva.
(d) (0.5 puntos) Incluso si el banco asume que el valor esperado de X es 0, los analistas del banco sospechan
que últimamente los clientes ingresan más dinero del que retiran. Para comprobar esta sospecha, los
analistas toman una muestra de 25 operaciones realizadas por clientes independientes y obtienen una
media muestral de 50 euros. Se pide obtener un intervalo de confianza al 90% para el valor esperado
suponiendo que la distribución de X es Gaussiana con desviación tı́pica 100. ¿Que nivel de confianza
tienes de que el valor esperado sea realmente mayor que 0?
4
Solución:

(a) Como n ≥ 30, por el TCL tenemos que X ∼ N 0, 100 √
n
= N (0, 10). Entonces, la probabilidad
requerida está dada por:

−3 X 3
Pr −3 < X < 3 = Pr < < ' Pr (−0.3 < Z < 0.3) =
10 10 10
= Pr (Z < 0.3) − Pr (Z < −0.3) = 0.6179 − 0.3821 = 0.2358
donde Z ∼ N (0, 1).

(b) Si el tamaño muestral aumenta, la varianza de X decrece. Por lo tanto, la probabilidad de X de estar
en el intervalo (−3, 3) aumentará.
(c) Queremos calcular la siguiente probabilidad:
n
!
X
Pr Xi > 0
i=1
Esta probabilidad es equivalente a:

Pr X > 0

Entonces, como en a), por el TCL tenemos que X ∼ N 0, 100
√
n
= N (0, 10). Entonces, la probabilidad
requerida está dada por:
n
!
X X
Pr Xi > 0 = Pr X > 0 = Pr > 0 ' Pr (Z > 0) = 0.5
i=1
10
donde Z ∼ N (0, 1).

(d) El intervalo de confianza para la media al 90% está dado por:

100 100
50 − 1.65 √ , 50 + 1.65 √ = (17, 83)
25 25
Consecuentemente, estamos más de un 90% seguros de que la media verdadera sea positiva.
5
Grados en ADE, DER-ADE, ADE-INF, FICO, ECO, ECO-DER.

1. En las siguientes tablas y gráficos se recoge información sobre las atenciones sanitarias no domiciliarias
atendidas a través del teléfono 112 de Protección Civil durante los últimos 180 dı́as en Pamplona. Para
cada dı́a se ha observado el tiempo medio de respuesta (en minutos) de las ambulancias para accidentes
con heridos y el número de accidentes atendidos según su tipologı́a (accidente de tráfico, laboral y otros).
Tabla 1: Tiempo medio de respuesta (en minutos)

(a) Global (b) de Lunes a Viernes (c) Sábado y Domingo
Tiempo medio respuesta Tiempo medio respuesta
Tiempo medio respuesta Tipo de accidente (de lunes a viernes) (sábado y domingo)
Media 13.9189854 Media 12.65007263 Media 20.26354953
Mediana Tipo día tráfico laboral
7.72569374 Mediana otros 7.43135166 Mediana 16.45645042
de Lunes
Desviación a Viernes
típica 111
14.12497499 Desviación 30 típica 150 12.75266538 Desviación típica 18.59931717
Sábado
Varianza de ylaDomingo
muestra 26
199.5149151 Varianza 3de la muestra 30 162.6304743 Varianza de la muestra 345.9345992
Curtosis 137
2.0083481110 Curtosis 33 180 2.762768312 Curtosis -0.193607802
Coeficiente de asimetría 1.52135364 Coeficiente de asimetría 1.650832286 Coeficiente de asimetría 0.858543921
Rango 65.1620149 Rango 61.09465423 Rango 64.99579226
Mínimo Tipo de accidente más0.02300493
frecuente / tipo de día
Mínimo 0.023004926 Mínimo 0.189227592
Máximo trafico laboral
65.1850198 Máximootros 61.11765915 Máximo 65.18501985
Suma Lunes a Viernes 0.74
2505.41738 0.06Suma 0.2 1 1897.510894 Suma 607.9064858
Sábado-Domingo
Tamaño muestral 0.8666667 0.0333333
180 Tamaño0.1 muestral 1 150 Tamaño muestral 30
Tabla 2: Número de accidentes atendidos Gráfico 2: Tiempo medio de respuesta según el tipo de dı́a
Tipo de accidente 70
Tipo día tráfico laboral otros
de Lunes a Viernes 111 9 30
60
Sábado y Domingo 26 1 3
e respuesta (minutos)
Gráfico 1: Tiempo medio de respuesta (global) 50

100
40
80
Tiempos medios de
30
60
Frequency
20
40
10
20
0
0
Lunes a Viernes Sábado-Domingo

0 10 20 30 40 50 60 70 n = 150 n = 30
tiempo respuesta (minutos)
Responde justificadamente a las siguientes cuestiones, indicando claramente las tablas y/o gráficos que
utilizas para tu razonamiento:
a) (0.5 puntos) Describe la forma de la distribución del tiempo medio de respuesta (global) e indica si hay
datos atı́picos. ¿Qué medida de centralización es más adecuada utilizar en este caso y por qué?
b) (0.75 puntos) Justifica si son ciertas o falsas las afirmaciones siguientes: [1] En más de la mitad de
los casos el tiempo medio de respuesta de las ambulancias durante los fines de semana es más de dos
veces superior al de los dı́as laborables. [2] En el 75% de los casos el tiempo medio de respuesta de las
ambulancias durante los fines de semana es superior a 30 minutos.
c) (0.5 puntos) Si tuvieras que dar un tiempo máximo de respuesta por debajo del cual pudieras garantizar
que se ha atendido el 75% de las emergencias de lunes a viernes, ¿qué tiempo darı́as?
d) (0.75 puntos) Obtén las distribuciones de la variable tipo de accidente condicionadas al tipo de dı́a y
determina en qué tipo de dı́a son más frecuentes los accidentes de tráfico.
Solución.
a) El Gráfico 1 es el histograma de la distribución de frecuencias absolutas de la variable tiempo medio de
respuesta (en minutos) (sin distinguir por tipo de dı́a). Se observa claramente que la distribución es
asimétrica (con asimetrı́a a la derecha, positiva).
Al tratarse de una distribución asimétrica es mejor dar la Mediana como medida de centralización. En
este caso, el tiempo mediano de respuesta (ver panel (a) de la Tabla 1) es de 7.7257 minutos.
De forma aproximada (a partir del Gráfico 1) puede llegar a intuirse la presencia de datos atı́picos. El
razonamiento serı́a el siguiente: El tercer cuartil está en la posición 135, que corresponde a un valor
situado entre 10 y 20, es decir, Q3 ∈ (10, 20). Por tanto, se deduce que Q3 < 20, al igual que RIC < 20.
Ası́, Q3 + 1.5 RIC < 50, con lo que cualquier dato superior a 50 puede ser considerado como atı́pico.
b) La afirmación [1] es cierta, puesto que la mediana del tiempo medio de respuesta de las ambulacias
durante los fines de semana es de 16.46, mientras que de lunes a viernes vale 7.43 (ver paneles (b) y (c)
de la Tabla 1 y también diagramas de caja del Gráfico 2). Sin embargo, la afirmación [2] es falsa, puesto
que en el diagrama de caja del Gráfico 2 se observa que, para los fines de semana, el tercer cuartil del
Tipo de accidente más frecuente
tiempo medio de respuesta es 31. Por tanto, el tiempo medio de repuesta es inferior a 31 minutos en el
75% de los casos. Tipo día trafico laboral otros
Lunes a Viernes 111 9 30 150
c) Nos están pidiendo el tercer cuartil de la 26
Sábado‐Domingo muestra: 1Q3 . En el3 diagrama
30 de cajas correspondiente se
aprecia que Q3 ≈ 18 minutos. 137 10 33 180
d) Para poder compararlas es más conveniente obtener las distribuciones condicionadas relativas (obtenidas
a partir de la Tabla 2), que son:
Tipo de accidente más frecuente / tipo de día
trafico laboral otros
Lunes a Viernes 0,74 0,06 0,2 1
Sábado‐Domingo 0,8666667 0,0333333 0,1 1
De ella se observa que los accidentes de tráfico son más frecuentes durante el fin de semana, con un
porcentaje del 86.67%.
2. Una empresa paga una cuota mensual de 175 euros en concepto de suscripción a un servicio de reparaciones.
Además, cada visita de un técnico para realizar una reparación en la empresa cuesta 350 euros. Se sabe
que la media de averı́as es de 9.5 al mes, con una desviación tı́pica de 2.
a) (0.5 puntos) Calcula el valor esperado y la varianza del coste mensual de las reparaciones (incluyendo
la cuota mensual).
b) (0.75 puntos) Utilizando la desigualdad de Chebyshev, da una cota para la probabilidad de que en un
mes determinado el coste de las reparaciones sea menor o igual que 2000 o mayor o igual que 5000 euros.
c) (0.75 puntos) Si se supone que el coste mensual sigue una distribución uniforme continua con la esperanza
y la varianza obtenidas en a), calcula de nuevo la probabilidad del apartado anterior.
d) (0.5 puntos) A qué se debe la diferencia entre los resultados obtenidos en los apartados b) y c)?
Solución.
a) X = número de averı́as al mes. E[X] = 9.5 y V ar[X] = 22 = 4.
Sea C = coste mensual de las reparaciones. Como C = 350X+175, entonces E[C] = 350·9.5+175 = 3500
y V ar[C] = 3502 · 4 = 490000.
b)
P (C ≤ 2000 ó C ≥ 5000) = P (C − 3500 ≤ −1500 ó C − 3500 ≥ 1500) = P (|C − 3500| ≥ 1500)

Des.Cheb. V ar[C] 490000
= P (|C − E[C]| ≥ 1500) ≤ = = 0.22.
15002 15002
2
(b−a)
c) Si C ∼ U (a, b), entonces E[C] = a+b
2 = 3500 y V ar[C] = 12 = 490000. Por tanto
) √ )
a+b 7000− 12·490000
2 = 3500 a = √7000 − b a = = 2287.56
(b−a)2 ⇔ ⇔ √ 2
12 = 490000 b−a = 12 · 490000 b = 12 · 490000 + 2287.56 = 4712.44
Es decir, C ∼ U (2287.56, 4712.44) por lo que P (C ≤ 2000 C ≥ 5000) = 0.

d) En el primer caso sólo contamos con los valores de la esperanza y la varianza, y la desigualdad de
Chebyshev proporciona una cota muy gruesa de la probabilidad que se quiere calcular. En el segundo
caso, al disponer de la distribución de la variable aleatoria podemos calcular la probabilidad de manera
exacta.
3. La función de densidad asociada a la duración en dı́as de un determinado producto es:

k (2 − x), si 0 < x < 2,
f (x) =
0, en otro caso,
para un cierto valor de k.

a) (0.5 puntos) Determinar el valor de la constante k.
b) (0.5 puntos) Si el producto solamente está en condiciones óptimas para su venta entre 12 horas y 48
horas después de haber sido producido, calcular la probabilidad de que el producto esté en condiciones
óptimas para su venta. (Considerar que un dı́a son 24 horas).
c) (0.75 puntos) Una determinada empresa tiene capacidad para producir 4 de estos productos cada dı́a.
¿Cuál es la probabilidad que no pueda vender todos los productos fabricados en el último dı́a?
d) (0.75 puntos) La empresa quebrará si no puede vender todos los productos fabricados en al menos 320
dı́as del año. Calcular la probabilidad de quiebra de la empresa. (Considerar que un año son 365 dı́as).
Solución:
R2 2
x2
a) 0 k (2 − x) dx = 1 ⇒ k 2x − =1 ⇒ k = 12 .

2
0
b) Sea X la v.a. que representa la duración en dı́as de cierto producto. Si el producto solamente está en
condiciones óptimas para su venta entre 12 horas y 48 horas después de haber sido producido, entonces
P (0.5 < X < 2) = 0.5625.
c) Sea Y la v.a. que cuenta el número de productos óptimos para la venta de un total de 4. Y ∼
B(4, 0.5625) y entonces, P (Y < 4) = 1 − P (Y = 4) = 0.899.
d) Sea T la v.a. que cuenta el número de dı́as de un total de 365 en que no se venden todos los productos
fabricados. T ∼ B(365, 0.899) que puede aproximarse por el TCL como N (328.46, 5.983) y, por tanto,
P (“quiebra00 ) = P (T > 320) = P (Z > −1.41) = 1 − 0.0808 = 0.9192, donde Z ∼ N (0, 1).
4. Los puntos anotados por un equipo de baloncesto a lo largo de un partido pueden modelarse según una
variable aleatoria de media 90 y desviación tı́pica 30.
(a) (0.5 puntos) Si tomamos una muestra de 35 partidos, calcular la probabilidad de que el puntuaje
promedio de dicho equipo esté entre 80 y 100 puntos.
(b) (0.75 puntos) Calcular un intervalo de confianza al 95% para la media de puntos anotados por partido.
Suponer que tomamos una muestra de 35 partidos y que la media muestral toma un valor de 85.
Interpretar el resultado.
(c) (0.75 puntos) Suponer ahora que, para el intervalo de confianza del apartado b), se quiere reducir su
longitud en un 10%. Determinar el tamaño muestral (número de partidos) para que eso suceda.
(d) (0.5 puntos) Suponer ahora que el equipo contrata a un nuevo entrenador con el que se espera reducir
la desviación tı́pica hasta 15 (sin cambiar la media). Si una temporada tiene 50 partidos, dibujar
(de forma aproximada) la función de densidad del puntuaje promedio de una temporada para ambos
entrenadores y comparar ambas curvas. Comentar los resultados.
Solution:
a) Puesto que n > 30, puede aplicarse elTLC, que asegura queX tiene una ley aproximadamente normal.
80−90 100−90

En concreto: P 80 < X < 100 = P 30/ √
35
< Z < 30/ √
35
= P (−1.97 < Z < 1.97) = 0.9512, donde
X̄−90
Z= √
30/ 35
sigue aproximadamente una distribucin N (0, 1).
b) En virtud del TLC, el intervalo de confianza es I.C.95% (µ) = x±1.96 √σn = 85±1.96 √3035 = [75.06, 94.94].
No serı́a correcto afirmar que con un 95% de probabilidad, el verdadero valor de la media está entre
[75.06, 94.94]. Sin embargo, sı́ podrı́amos afirmar que el 95% de las veces que construimos un I.C. del
modo anterior, encontraremos el verdadero valor de la media dentro de los mismos.
c) La longitud del intervalo es 2 × 1.96 × √σn1 . Por tanto, queremos un n2 tal que la nueva longitud del
intervalo sea 2 × 1.96 × √σn1 × 0.9. Por tanto, tenemos la siguiente relación:
σ σ n1 35
2 × 1.96 × √ × 0.9 = 2 × 1.96 × √ ⇒ n2 = = = 43.2 → n2 = 44.
n1 n2 0.92 0.92
d) Si dibujamos las funciones de densidad para el puntuaje promedio de un partido en una temporada,
i.e. para X, vemos que para ambos entrenadores la función está centrada en la misma media. Sin
embargo, el segundo entrenador tiene un promedio de puntuaje más estable, por lo que dará resultados
más homogéneos a lo largo de la temporada.

Todos Examenes Yo

Cargado por

Copyright:

Formatos disponibles

Todos Examenes Yo

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Todos Examenes Yo

Cargado por

Copyright:

Formatos disponibles

Formulario de Estadı́stica I

Tema 3 Sean (x1 , y1 ), (x2 , y2 ), . . . , (xn , yn ) los n pares de valores observados !

P (A) = P (A ∩ B1 ) + . . . + P (A ∩ Bk ) = P (A|B1 ) P (B1 ) + . . . + P (A|Bk ) P (Bk ).

P (Bj ∩ A) P (A|Bj ) P (Bj )

Esperanza y varianza de una variable aleatoria.

Tema 5 Algunos modelos de probabilidad.

Modelo X Conjunto S Función de probabilidad / densidad E(X) var(X)

Áreas bajo la curva normal

El valor de la tabla para z El valor de la tabla para z

TABLA A: Probabilidades de la normal estándar TABLA A: Probabilidades de la normal estándar (cont. )

NORMAS: 1) Usar cuadernillos separados para cada problema.

Figure 1: Diagrama de dispersión de p versus v.

Medidas media mediana cuasi desv-tip Q1 Q3

Figure 2: Participación p (izquierda) y votos a favor por mesa v (derecha)

p ≤ 0.70 p > 0.70

(a) (0.5 pts) Dibuje la función de distribución de T .

Responder a las siguientes cuestiones:

Hogares Número Porcentaje de hogares con e-book

Tabla 1 / Table 1 Figura 1 / Figure 1

2. La cantidad de periódicos y revistas (expresada en decenas) que se venden semanalmente en un centro

donde k es una constante adecuada.

NORMAS: 1) Entregar cada problema en un cuadernillo distinto, aunque esté en blanco.

Responder a las siguientes cuestiones:

(a) (0,4 puntos) Completar los datos que faltan en la Tabla 2.

(a) (0,75 puntos) Escribir la función de probabilidad de X.

Responder a las siguientes cuestiones, justificando cada una de ellas:

de manera que la función de densidad es

Para calcular la varianza de X, utilizamos que var(X) = E(X 2 ) − (E(X))2 , donde

donde se ha utilizado que E(X) = 1.5833.

(a) El porcentaje de reclamaciones se obtiene aplicando el teorema de la probabilidad total:

P (R) = P (R|Reg) · P (Reg) + P (R|N ac) · P (N ac) + P (R|Inter) · P (Inter)

luego el porcentaje de reclamaciones es del 1.25%.

P (R|Reg) · P (Reg) 0.01 · 0.30

P (Inter ∩ R̄) = P (R̄|Inter) ·P (Inter) = 0.985 · 0.5 = 0.4925.

4. El salario semanal de trabajadores de producción no supervisada en la industria minera se supone que

donde Z ∼ N (0, 1).

Esta cantidad es similar a:  

donde Z ∼ N (0, 1).

NORMAS: 1) Entregar cada problema en un cuadernillo distinto, aunque esté en blanco.

27 12 14.9 1.2 0.1 1 0.1 5.3 7.6 5 1 1 3.2 3 7

Dada la información previa, responder a las siguientes preguntas:

Por lo tanto, Pr (X > 3) = Pr (X = 4) + Pr (X = 5) = 0.2 + 0.15 = 0.35.

E [X] = 0 × 0.05 + 1 × 0.1 + 2 × 0.15 + 3 × 0.35 + 4 × 0.2 + 5 × 0.15 = 3

mientras que la varianza está dada por:

E [M ] = 365 × E [X] = 365 × 3 = 1095

donde Z ∼ N (0, 1).

Quantiles of Input Sample

donde Z ∼ N (0, 1).

1. El siguiente conjunto de datos muestra el número de coches vendidos en un mes en 23 concesionarios

La distribución es ligeramente asimétrica a la derecha. Por lo tanto, no es fuertemente asimétrica.

(c) La esperanza de X está dada por:

La varianza de X está dada por:

Pr (Venta) = Pr (Venta|NEE) Pr (NEE) + Pr (Venta|No NEE) Pr (No NEE) =

(c) La media, varianza y desviación tı́pica de N están dadas por:

donde Z ∼ N (0, 1).

Esta probabilidad es equivalente a:

donde Z ∼ N (0, 1).

NORMAS: 1) Entregar cada problema en un cuadernillo distinto, aunque esté en blanco.

Esta cantidad es similar a: