Estadistica Descriptiva
Estadistica Descriptiva
Estadistica Descriptiva
Por:
Abril de 2013
1.
Preliminares
1.1.
Terminologa estadstica
Estadstica:
Es la ciencia que proporciona un conjunto e mtodos que se utilizan para recolectar, resumir, clasicar e interpretar
el comportamiento de los datos con respecto a una caracterstica materia de estudio o investigacin. En primera instancia
se encarga de obtener informacin, describirla y luego utiliza esta informacin para predecir algo respecto a la fuente de
informacin
La estadstica descriptiva:
conjunto de datos a n de describir en forma apropiada las diversas caractersticas de sta, es decir, un estudio estadstico
se considera descriptivo cuando solo se analiza y describe los datos.
Es una gran parte de la estadstica que se dedica a analizar y representar los datos. Este anlisis es muy bsico. Aunque
hay tendencia a generalizar a toda la poblacin, las primeras conclusiones obtenidas tras un anlisis descriptivo, es un
estudio calculando una serie de medidas de tendencia central, para ver en qu medida los datos se agrupan o dispersan
en torno a un valor central. FUENTE http://es.wikipedia.org/
Estadstica inferencial:
Luego de describir, el segundo aspecto de la denicin de la estadstica es: predecir algo con respecto
a la fuente de informacin, es lo que constituye la estadstica inferencia que es el conjunto de tcnicas que posibilitan la
generalizacin o toma de decisiones en base a una informacin parcial obtenida mediante tcnicas descriptivas.
Poblacin:
conjunto de todos los individuos (personas, objetos, animales, etc.) que porten informacin sobre el fenmeno que
se estudia. Por ejemplo, si estudiamos el precio de la vivienda en una ciudad, la poblacin ser el total de las viviendas
de dicha ciudad.
Muestra:
Subconjunto que seleccionamos de la poblacin. As, si se estudia el precio de la vivienda de una ciudad, lo normal
ser no recoger informacin sobre todas las viviendas de la ciudad (sera una labor muy compleja), sino que se suele
seleccionar un subgrupo (muestra) que se entienda que es sucientemente representativo. El proceso y/o tcnica de
obtencin de la muestra a partir de la poblacin se denomina muestreo.
Unidad de anlisis:
Cualquier elemento que porte informacin sobre el fenmeno que se estudia. As, si estudiamos la altura
de los nios de una clase, cada alumno es una unidad de anlisis; si estudiamos el precio de la vivienda, cada vivienda es
una unidad de anlisis.
Variable:
Es una caracterstica que puede tomar varios valores. Las variables son caractersticas observables, susceptibles a
tomar distintos valores o ser expresados en varias categoras. Variable es un aspecto especco de la realidad referido a la
unidad de anlisis y que puede ser susceptible a ser medido o cuanticado, adquiere un valor determinado en cada unidad
de anlisis
Dato:
Es el valor o respuesta que adquiere la variable en cada unidad de anlisis. Dato es el resultado de la observacin,
Estadstica Descriptiva
a) Variable nominal: Aquellas que establecen la distincin de los elementos en categoras sin implicar el orden entre ellas
b) Variable ordinal: son aquellas que agrupan a los individuos en categoras ordenadas, para establecer relaciones comparativas, por ejemplo clasicar personas por su habito de fumar (no fumadores, fumadores leves, fumadores moderados,
fumadores severos) o clasicar a un grupo de individuos de acuerdo a su grado de instruccin (analfabeto, primaria,
secundaria, superior).
2. Variables cuantitativas: Cuando el valor de la variable se expresa por una cantidad, es de carcter numrico, el dato puede
resultar de la operacin de medir o contar, stas se clasican a su vez en:
a) Variable discreta: Cuando el valor de la variable resulta de la operacin de contar, su valor esta expresado por nmeros
enteros positivos.
b) Variable continua: Cuando la variable es susceptible a medirse, su valor se obtiene por medicin o comparacin con
una unidad o patrn de medida, pueden tener su valor dentro de un rango o recorrido, por tanto su valor se expresa
por un nmero real.
UNSCH
Digitado en
)
L TEX por: Surez Azpur, Fredy R.
Estadstica Descriptiva
2.
Presentacin de datos
2.1.
Sean
x1 , x2 , , xn
las
X.
Si el nmero de valores
diferentes que asumen estos datos es muy pequeo en relacin al nmero de datos, los agruparemos en una tabla de distribucin
y1 , y 2 , , y m
yi
ni
Ni
Ni
hi
Hi
Hi
100hi
100Hi
100Hi
y1
n1
N1
N1
h1
H1
H1
100h1
100H1
100H1
y2
n2
N2
N2
h2
H2
H2
100h2
100H2
100H2
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
ym
nm
Nm
Nm
hm
Hm
Hm
100hm
100Hm
100Hm
100
Definicin 1
Definicin 2
menores o iguales a
Definicin 3
yi .
Ni
correspondiente al valor
yi
es el nmero de observaciones
Ni
correspondiente al valor
yi
es el nmero de observaciones
hi
correspondiente al valor
yi
yi .
Hi
correspondiente al valor
yi
Hi
correspondiente al valor
yi
yi .
yi .
Definicin 7
Definicin 8
Definicin 9
yi .
Definicin 6
yi
yi .
de observaciones iguales a
Definicin 5
correspondiente al valor
mayores o iguales a
Definicin 4
ni
100hi
correspondiente al valor
yi .
100Hi
correspondiente al valor
yi
es el porcentaje de observa-
100Hi
correspondiente al valor
yi
es el porcentaje de observa-
yi .
yi
yi .
Para cada
i = 1, 2, , m: ni
2.
Para cada
i = 1, 2, , m: Ni
3.
Para cada
4.
i = 1, 2,
tenemos
Ni = n1 + n2 + + ni ,
de donde
N1 = n1 ,
N2 = n1 + n2 = N1 + n2 ,
N3 = n1 + n2 + n3 = N2 + n3 ,
.
.
.
.
Nm = n1 + n2 + + nm = n.
Por lo tanto:
UNSCH
Digitado en
)
L TEX por: Surez Azpur, Fredy R.
Estadstica Descriptiva
5.
N1
N2
N3
i = 1, 2, , m
Ni = ni + ni+1 + + nm ,
tenemos
de donde
= n1 + n2 + + nm = n,
= n2 + n3 + + nm ,
= n3 + n4 + + nm ,
.
.
.
Nm = nm .
7.
De la denicin resultan hi =
,
Hi =
y
Hi = i
n
n
n
8.
Por lo tanto:
6.
H 1 = h1 ,
H2 = h1 + h2 ,
Por lo tanto:
9.
i = 1, 2, , m
i = 1, 2, , m
100H1 = 100h1 ,
11.
+ + hm ,
de donde
H3 = h3 + h4 + + hm ,
Hm = hm .
= hm .
100Hi = 100h1 + 100h2 + + 100hi ,
tenemos
de donde
100h1 = 100H1 < 100H2 < 100H3 < < 100Hm = 100.
i = 1, 2, , m
100 =
100H1
>
100H2
>
tenemos
100H2
Por lo tanto:
Ejemplo 1
i = 1, 2, , m
100H1
Hm = h1 + h2 + + hm = 1.
Hi = hi + hi+1 + + hm ,
tenemos
= h1 + h2 + + hm = 1, H2 = h2 + h3
Por lo tanto:
H3 = h1 + h2 + h3 ,
de donde
H1
10.
Hi = h1 + h2 + + hi ,
tenemos
100H3
> >
100Hm
de donde
100Hm = 100hm .
= 100hm .
20
20
20
20
20
22
22
22
22
22
22
22
23
23
23
23
23
23
23
23
23
23
23
25
25
25
25
25
25
25
25
25
25
25
25
25
27
27
27
27
27
27
27
27
27
27
30
30
30
y6 = 30;
Ni
Ni
hi
Hi
50
0.12
13
44
0.14
23
11
24
37
25
13
37
27
10
47
30
50
yi
ni
20
22
Hi
100hi
100Hi
100Hi
0.12
12
12
100
0.26
0.88
14
26
88
0.22
0.48
0.74
22
48
74
26
0.26
0.74
0.52
26
74
52
13
0.20
0.94
0.26
20
94
26
0.06
0.06
100
50
Ni
100
hi , Hi y Hi representan proporcin
de datos y las frecuencias porcentuales 100hi , 100Hi y 100Hi representan porcentaje de datos, interpretemos algunas de ellas
1.
n3 = 11:
2.
n6 = 3 :
3.
n3 + n4 = 24:
ni , Ni
ellos es igual a 24, menos, que la mitad son iguales a 23 y la otra mitad iguales a 25).
4.
N3 = 24:
Signica que 24 datos son iguales como mnimo a 20 y como mximo 23.
5.
N3 = 37:
Signica que 37 datos son iguales como mnimo a 23 y como mximo 30.
6.
h5 = 0,20 =
UNSCH
1
:
5
Digitado en
)
L TEX por: Surez Azpur, Fredy R.
Estadstica Descriptiva
10.
3
: Signica que 3 de 25 datos son iguales a 20.
25
12
H3 = 0,48 =
: Signica que 12 de cada 25 datos son iguales como mnimo a 20 y como mximo a 23.
25
13
H4 = 0,52 =
: Signica que 13 de cada 25 datos son igules como mnimo a 25 y como mximo a 30.
25
100h5 = 20: Signica que el 20 % de los datos son iguales a 27.
11.
100h1 = 12:
12.
100H3 = 48:
Signica que el 48 % de los datos son iguales como mnimo a 20 y como mximo a 23.
13.
100H4 = 52:
Signica que el 52 % de los datos son iguales como mnimo a 25 y como mximo a 30.
7.
8.
9.
h1 = 0,12 =
A continuacin presentamos los diagramas de barras o diagramas de bastones de las frecuencias simples correspondientes a la
tabla anterior, si por ejemplo diseamos el diagrama de barras de las frecuencias absolutas simples, stas se disponen sobre
el eje vertical (si dos frecuencias absolutas simples son iguales, solo se debe escribir una) y los valores diferentes de los datos
sobre el eje horizontal, sobre cada valor que est en el eje horizonta dibujamos una barra vertical cuya altura debe ser igual a
la frecuencia absoluta simple que le corresponde, tal como se aprecia en el siguiente diagrama sobre 20 una barra de altura 6,
sobre 22 una barra de altura 7, sobre 27 una barra de altura 10, etc.
ni
Nmero
de datos
hi
13
0,26
11
10
0,22
0,20
7
6
0,14
0,12
0,06
Valores
diferentes
de datos
20
22 23
25
27
Valores
diferentes
de datos
30
20
22 23
25
27
30
100hi
Porcentaje
TITULO :(Debe ser el mismos ttulo de la tabla)
de datos
0,26
0,22
0.20
0,14
0,12
0,06
Valores
diferentes
de datos
20
UNSCH
22 23
25
27
30
Digitado en
)
L TEX por: Surez Azpur, Fredy R.
Estadstica Descriptiva
2.1.1.
Si los datos
x1 , x 2 , , x n
Caracterstica1, Caracterstica2,
Caractersticas
ni
hi
100hi %
Caracterstica1
n1
h1
100h1
Caracterstica2
n2
h2
100h2
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Caractersticam
nm
hm
100hm
100 %
En este tipo de tablas no guran las frecuencias acumuladas pues no representan nada, y para elaborar su diagrama de barras
de las frecuencias se procede del mismo modo que para variables cuantitativas.
Ejemplo 2
Sean los datos correspondientes a las nacionalidades de los 40 participantes del Tercer Seminario Internacional de
Fsica Cuntica
P
Br
Br
Br
Br
Br
Br
Br
Ru
Ru
Ru
Ru
Ru
Ru,
donde P: Peruano, B: Boliviano, Br: Brasileo, E: Espaol, F: Francs y Ru: Ruso, la tabla de distribucin de frecuencias para
estos datos es
Nacionalidad
ni
hi
100hi
Peruano
0,150
15
Boliviano
0,175
17,5
Brasileo
0,175
17,5
Espaol
0,225
22,5
Francs
0,125
12,5
Ruso
0,150
15
40
100
ni
Nmero de
participantes
hi
0,175
0,15
0,225
7
6
Proporcin de
participantes
0,125
UNSCH
P
e
r
B ua
o
li no
B via
ra n
s o
i
E le
s
p o
F a
ra o
n l
c
e
R s
u
s
o
Nacionalidades
P
e
r
B ua
o
liv no
B ia
ra n
s o
i
E le
s
p o
F a
ra o
n l
c
e
R s
u
s
o
Nacionalidades
Digitado en
)
L TEX por: Surez Azpur, Fredy R.
Estadstica Descriptiva
100hi
Porcentaje de
participantes
22,5
17,5
15
12,5
2.2.
e
ru
o an
li
o
B via
ra n
s o
i
E le
s
p o
F a
ra o
n l
c
e
R s
u
s
o
Nacionalidades
Sean
x1 , x2 , , xn
las
X.
Si el nmero de valores
diferentes que asumen estos datos no es muy pequeo en relacin al nmero de datos, los agruparemos en una tabla de distribucin de frecuencias con intervalos (tambin llamados clases) todos ellos de la misma amplitud (longitud) y del tipo
[yi1 ; yi
excepcin del primero y el ltimo que tendrn formas particulares de acuerdo a la ampliacin del recorrido de la variable. A
continuacin presentamos los
2.2.1.
1. Hallar el mnimo y mximo: El mnimo y mximo valor de los datos que son denidos respectivamente por:
xmn = m
n{x1 , x2 , , xn }
Es obvio que
por tanto
xmx = mx{x1 , x2 , , xn }.
a
2. Hallar el rango y su amplitud: El intervalo [xmn ; xmx ] es el rango o recorrido de la variable, y contiene a todos los
datos; su longitud
= xmx xmn
es denominado amplitud del recorrido de la variable.
3. Hallar la amplitud de cada intervalo: Si m representa el nmero de intervalos que tendra la tabla, entonces la amplitud
de cada intervalo es
c=
donde
y0 = xmn ;
y 1 = y 0 + c;
y 2 = y 1 + c;
Definicin 10
ym = xmx
y2
y1
y 0
y 1
ym
yi
y i-1
y 2
[yi1 ; yi
es su punto medio
y i
y m-1
yi =
yi1 + yi
,
2
y m
estn en esta clase y es utilizado para el clculo de algunos estadgrafos como la media aritmtica, desviacin tpica, etc.
Luego de culminar con el paso 4, la tabla tendr la siguiente forma
UNSCH
Digitado en
)
L TEX por: Surez Azpur, Fredy R.
Estadstica Descriptiva
i
[yi1 yi
yi
ni
Ni
Ni
hi
Hi
Hi
100hi
100Hi
100Hi
[y0 y1
y1
n1
N1
N1
h1
H1
H1
100h1
100H1
100H1
[y1 y2
y2
n2
N2
N2
h2
H2
H2
100h2
100H2
100H2
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
[ym1 ym ]
ym
nm
Nm
Nm
hm
Hm
Hm
100hm
100Hm
100Hm
100
Definicin 11
ni
correspondiente a la clase
[yi1 yi
en esta clase.
Definicin 12
Ni
correspondiente a la clase
[yi1 yi
es el nmero de
Ni
correspondiente a la clase
[yi1 yi
es el nmero de
Definicin 13
Definicin 14
hi
correspondiente a la clase
[yi1 yi
Definicin 15
Hi
[yi1 yi
es la proporcin, con
[yi1 yi
correspondiente a la clase
es la proporcin, con
respecto del total, del nmero de observaciones que estn en esta clase y las anteriores a ella.
Definicin 16
Hi
correspondiente a la clase
respecto del total, del nmero de observaciones que estn en esta clase y las posteriores a ella.
Definicin 17
100hi
correspondiente a la clase
[yi1 yi
es el porcentaje de observaciones
Definicin 18
100Hi
correspondiente a la clase
[yi1 yi
es el porcentaje
100Hi
correspondiente a la clase
[yi1 yi
es el porcentaje
Definicin 19
Observaciones:
1. Las frecuencias cumplen las mismas propiedades de las frecuencias para tablas de distribucin sin intervalos.
2. Una de las frecuencias absolutas simples puede ser igual a cero.
3. Una observacin
xi
Como elegir el nmero de intervalos: El valor de m, que representa el nmero de intervalos, se puede determinar de varias
maneras
Un nmero entero arbitrario
m tal que 5 m 16. Cuanto mayor sea el nmero de intervalos, los estadgrafos calculados
a partir de la tabla, son ms prximos al valor que se calculara si los datos no estuvieran agrupados.
m = 1 + 3,3 log n,
el valor de
no es siempre
La
mediante la frmula
m=
n.
regla de Sturges, propuesta por Herbert Sturges en 1926, es una regla prctica acerca del nmero de clases que deben considerar al
m = 1 + 3,3 log N :
m = 1 + log2 N ,
donde
UNSCH
Digitado en
)
L TEX por: Surez Azpur, Fredy R.
Estadstica Descriptiva
2.2.2.
Si
1.
2.
x1 , x 2 , , x n
Halle
xmn
son los
xmx ,
= xmx xmn
entonces
m = 1 + 3,3 log n,
siempre resulta entero, elegimos como el nmero de intervalo a uno de los enteros prximos a
a ) Si
b ) Si
m ,
, este valor
m
error de ampliacin es e = .
subintervalo ser c =
, este valor
m
error de ampliacin es e = .
, el valor ampliado de
m ,
es
=cm
y el
, el valor ampliado de
es
= c m
y el
m.
c=
de
debe ser
de
debe ser
pero si en ambos casos tenemos el mismo error de ampliacin el nmero de intervalos ser el valor redondeado por
exceso de
3.
m.
Con los redondeos ampliamos los valores mximo y mnimo de los datos del siguiente modo
]
[
]
e1
e+1
= xmn
y x
= xmx +
mx
2
2
e
e
Si
es impar x
mn
Si
es par
x
mn
donde
y1 = y0 + c;
;
y0 = x
mn
Ejemplo 3
y 2 = y 1 + c;
x1 , x 2 , , x n
con
ym = x
mx
xmx = 986.
661
Si m = 8, entonces c =
=
= 82,625, de donde c = 83. El rango ampliado es = m c = (8)(83) = 664 y el error
m
8
661
Si m = 9, entonces c =
=
= 73,44 . . ., de donde c = 74. El rango ampliado es = m c = (9)(74) = 666 y el
m
9
error de ampliacin es e = = 666 661 = 5
m = 8
e=3
intervalos todos
ellos de amplitud
x
mn
324 407
Ejemplo 4
[407 490
[490 573
x1 , x 2 , , x n
con
[573 656
[656 739
[739 822
[822 905
[905 988
xmx = 725.
=
= 57, 14 . . ., de donde c = 58. El rango ampliado es = m c = (7)(58) = 406 y el
Si m = 7, entonces c =
m
7
error de ampliacin es e = = 406 400 = 6
400
=
= 50, de donde c = 50. El rango ampliado es = m c = (8)(50) = 406 y el error de
Si m = 8, entonces c =
m
8
50,
m = 8
x
= xmn
mn
e
0
= 325 = 325
2
2
[325 375
[375 425
UNSCH
e=0
intervalos todos
x
= xmx +
mx
[425 475
e
0
= 725 + = 725
2
2
[475 525
[525 575
[575 625
Digitado en
[625 675
[675 725]
)
L TEX por: Surez Azpur, Fredy R.
Estadstica Descriptiva
Ejemplo 5
x1 , x 2 , , x n
con
n = 80, xmn = 80
xmx = 359.
279
Si m = 7, entonces c =
=
= 39,8 . . ., de donde c = 40. El rango ampliado es = m c = (7)(40) = 280 y el
m
7
error de ampliacin es e = = 280 279 = 1
279
Si m = 8, entonces c =
=
= 34,875, de donde c = 35. El rango ampliado es = m c = (8)(35) = 280 y el error
m
8
e = 1,
[ 8 intervalos todos ellos de amplitud 35, los valores ampliados del mximo]y mnimo son
]
[
]
[
]
[
e1
11
e+1
1+1
= xmn
= 80
= 80 y x
= xmx +
= 279 +
= 360 y los
mx
2
2
2
2
distribucin tendr
x
mn
[80 115
2.3.
[115 150
[150 185
[185 220
[220 255
[255 290
intervalos sern
[290 325
[325 360
En estadstica, un histograma es una representacin grca de una variable en forma de barras, donde la supercie de cada
barra es proporcional a la frecuencia de los valores representados. En el eje vertical se representan las frecuencias, y en el eje
horizontal los valores de las variables, normalmente sealando las clases y las marcas de clase. En trminos matemticos, puede
ser denida como una funcin inyectiva (o mapeo) que acumula (cuenta) las observaciones que pertenecen a cada subintervalo
de una particin. El histograma, como es tradicionalmente entendido, no es ms que la representacin grca de dicha funcin.
Se utiliza cuando los datos de una variable se agrupan en intervalos
histogramas para datos agrupados en una tabla de distribucin de frecuencia con intervalos todos ellos de la misma amplitud,
cada uno de los tipos de frecuencia tienen su propio histograma, decir para una tabla en total son 9 histogramas
1. Tener lista la tabla de distribucin de frecuencia con intervalos.
2. Dibujar los ejes cartesianos, uno horizontal y el otro vertical.
3. Sobre el eje horizontal representar todos los intervalos y sus respectivas marcas de clase que aparecen en la tabla. Estos
tres primeros pasos son los mismos que se han de seguir cuando se elaboren los 9 histogramas que se va elaborar a partir
de la tabla.
4. Sobre el eje vertical representar las frecuencias (si por ejemplo se esta diseando el histograma de frecuencias absolutas
simples
ni
entonces sobre el eje vertical sealamos los puntos que corresponden a estas frecuencias, si es que hubieran dos
c/2,
c/2,
UNSCH
10
Digitado en
)
L TEX por: Surez Azpur, Fredy R.
Estadstica Descriptiva
Ejemplo 6
La siguiente tabla corresponde a los salarios semanales en nuevos soles de todos los trabajadores de la constructora
Salarios(S/.)
yi
ni
Ni
Ni
hi
Hi
Hi
100hi
100Hi
100Hi
[ 80 110
95
50
0,10
0,10
10
10
100
[110 140
125
14
45
0,18
0,28
0,90
18
28
90
[140 170
155
14
28
36
0,28
0,56
0,72
28
56
72
[170 200
185
34
22
0,12
0,68
0,44
12
68
44
[200 230
215
10
44
16
0,20
0,88
0,32
20
88
32
[230 260]
245
50
0,12
0,12
12
100
12
50
100
Vemos que la constructora NEXT posee 50 trabajadores, el salario mnimo y mximo es de 80 y 260 nuevos soles respectivamente.
Las frecuencias
ni , Ni
Ni
hi , Hi
Hi
proporcin de trabajadores;
100hi , 100Hi
100Hi
1.
n3 = 14:
Signica que 14 trabajadores de la constructora NEXT tienen salarios semanales mayores o iguales a S/. 140 y
2.
n4 + n5 = 16:
Signica que 16 trabajadores de la constructora NEXT tienen salarios semanales mayores o iguales a S/.
3.
N4 = 34:
Signica que 34 trabajadores de la constructora NEXT tienen salarios semanales mayores o iguales a S/. 80 y
4.
N3 = 36:
Signica que 36 trabajadores de la constructora NEXT tienen salarios semanales mayores o iguales a S/. 140 y
5.
h5 = 0, 20 =
1
:
5
Signica que 1 de cada 5 trabajadores de la constructora NEXT tienen salarios semanales mayores o
6.
H2 = 0, 28 =
7
:
25
Signica que 7 de cada 25 trabajadores de la constructora NEXT tienen salarios semanales mayores o
7.
H5 = 0, 32 =
8
:
25
Signica que 8 de cada 25 trabajadores de la constructora NEXT tienen salarios semanales mayores o
8.
100h4 = 12: Signica que el 12 % de los trabajadores de la constructora NEXT tienen salarios semanales mayores o iguales
a S/. 170 y menores a S/. 200.
9.
100H3 = 56: Signica que el 56 % de los trabajadores de la constructora NEXT tienen salarios semanales mayores o iguales
a S/. 80 y menores a S/. 170.
10.
100H4 = 44: Signica que el 44 % de los trabajadores de la constructora NEXT tienen salarios semanales mayores o iguales
UNSCH
11
Digitado en
)
L TEX por: Surez Azpur, Fredy R.
Estadstica Descriptiva
HISTOGRAMA DE FRECUENCIAS ABSOLUTAS SIMPLES
ni
Nmero de
trabajadores
14
Polgono de frecuencias
10
9
6
5
Salarios
(S/.)
semanales
65
80
110
140
170
200
230
260
275
Ni
Nmero de
trabajadores
N*i
50
50
44
Nmero de
trabajadores
45
OJIVA mayor que
36
34
28
22
16
14
Salarios
(S/.)
semanales
80
110
140
170
200
230
Salarios
(S/.)
semanales
260
80
110
140
170
200
230
260
hi
Proporcin de
trabajadores
0,28
Polgono de frecuencias
0,20
0,18
0,12
0,10
Salarios
(S/.)
semanales
65
80
110
140
170
200
230
260
275
UNSCH
12
Digitado en
)
L TEX por: Surez Azpur, Fredy R.
Estadstica Descriptiva
Hi
Proporcin de
trabajadores
H*i
0,88
Proporcin de
trabajadores
0,90
OJIVA mayor que
0,72
0,68
0,56
0,44
0,32
0,28
0,10
Salarios
(S/.)
semanales
80
110
140
170
200
230
0,12
Salarios
(S/.)
semanales
260
80
110
140
170
200
230
260
100hi trabajadores
28
Polgono de frecuencias
20
18
12
10
Salarios
(S/.)
semanales
65
80
110
140
170
200
230
260
275
100Hi
Porcentaje de
trabajadores
100H*i
100
100
88
Porcentaje de
trabajadores
90
OJIVA mayor que
72
68
56
44
32
28
10
Salarios
(S/.)
semanales
80
110
140
170
200
230
260
Salarios
(S/.)
semanales
80
UNSCH
12
110
140
170
200
230
260
13
Digitado en
)
L TEX por: Surez Azpur, Fredy R.
Estadstica Descriptiva
Distribuciones Simtricas: Una tabla de distribucin de frecuencias, con o sin intervalos, se dice que es simtrica con respecto
a la frecuencia absoluta simple si
ni = nmi+1
para cada
Observaciones:
m
.
2
1. Si una tabla de distribucin de frecuencias, con o sin intervalos, es simtrica con respecto a la frecuencia absoluta simple,
entonces es simtrica con respecto a la frecuencia relativa simple y la frecuencia porcentual simple.
2. Sea una tabla de distribucin de frecuencias, con o sin intervalos, con
frecuencia absoluta simple debe vericarse
n1 = n7 , n2 = n6
n1 = n6 , n2 = n5
n1 = n9 , n2 = n8 , n3 = n7
Ejemplo 7
m = 6;
m = 9;
n3 = n4 .
n3 = n5 .
m = 7;
n1 = n8 , n2 = n7 , n3 = n6
n4 = n6 .
m = 8;
n4 = n5 .
Presentamos algunas tablas de distribucin simtricas con respecto a sus frecuencias simples.
yi
ni
y1
n1
y2
n2
y3
n3
n1 = n7
n3
y4
n4
n2 = n6
n2
y5
n5
n3 = n5
y6
n6
y7
n7
ni
Nmero
de datos
n 1 =n 7
n 2 =n 6
n 3 =n 5
n4
n1
y1
y2
y3
y4
y5
y6
y7
[yi1 yi
yi
ni
ni
[y0 y1
y1
n1
[y1 y2
n4
y2
n2
[y2 y3
y3
n3
n1 = n7
n3
[y3 y4
y4
n4
n2 = n6
n2
y5
n5
n3 = n5
y6
n6
y7
n7
5
6
7
[y4
[y5
[y6
y5
y6
y7 ]
Nmero
de datos
n 1 =n 7
n 2 =n 6
n 3 =n 5
n1
n
y
0
yi
ni
y
2
y
3
y
4
y
5
y
6
y
7
y1
n1
ni
y2
n2
y3
n3
n1 = n8
y4
n4
n2 = n7
y5
n5
n3 = n6
y6
n6
n4 = n5
y7
n7
y8
Nmero
de datos
n4
n8
n 1 =n 8
n 2 =n 7
n 3 =n 6
n 4 =n 5
n2
n3
n1
y1 y2
UNSCH
y
1
14
y3
y4 y5
Digitado en
y6 y7
y8
)
L TEX por: Surez Azpur, Fredy R.
Estadstica Descriptiva
[yi1 yi
yi
ni
ni
[y0 y1
y1
n1
[y1 y2
y2
n2
[y2 y3
y3
n3
n1 = n8
[y3 y4
y4
n4
n2 = n7
[y4 y5
y5
n5
n3 = n6
[y5 y6
y6
n6
n4 = n5
[y6 y7
y7
n7
[y7 y8 ]
y8
Nmero
de datos
n8
n1=n8
n2=n7
n3=n6
n4=n5
n4
n2
n3
n1
y
0
y
1
y
2
y
3
y
4
y
5
y
6
y
7
y
8
CUESTIONARIO
1)
2)
Debido a la falta de personal de la empresa SMART, dedicada al servicio de mensajera, los trabajadores laboraron horas
extras durante el ao 2010. El nmero de horas extras realizadas por 50 trabajadores de esta fueron:
20
20
20
30
30
35
35
35
35
35
35
35
35
35
40
40
40
40
40
40
40
40
50
50
50
50
50
50
50
50
50
55
55
55
55
55
55
55
60
60
60
60
60
60
65
65
65
65
65
75
3)
A continuacin presentamos la cantidad de vehculos vendidos por todos los trabajadores de la importadora Nissan durante
el verano 2012
20
21
21
21
24
22
25
21
21
22
22
21
20
22
21
23
20
20
24
20
24
23
24
25
22
26
25
23
23
23
25
24
25
21
21
26
26
24
26
20
21
21
22
23
23
21
22
21
21
21
UNSCH
15
Digitado en
)
L TEX por: Surez Azpur, Fredy R.
Estadstica Descriptiva
c) Construya una tabla de distribucin de frecuencias sin intervalos de clase.
d) Represente grcamente mediante un diagrama de barras las frecuencias simples.
e) Cuntos trabajadores vendieron 24 vehculos cada uno?.
f ) Cuntos trabajadores vendieron como mnimo 24 vehculos?.
g) Cuntos trabajadores vendieron como mximo 24 vehculos?.
h) Cuntos trabajadores vendieron como mnimo 22 y como mximo 25 vehculos?.
i) Qu porcentaje de trabajadores vendieron 25 vehculos cada uno?.
j) Qu porcentaje de trabajadores vendieron como mnimo 24 vehculos?.
k) Qu porcentaje de trabajadores vendieron como mximo 23 vehculos?.
l) Qu porcentaje de trabajadores vendieron como mnimo 21 y como mximo 24 vehculos?.
4)
Una fbrica de gaseosas proyecta lanzar al mercado un nuevo sabor. Se realiza un test de aceptacin de dicho sabor en una
muestra de 40 nios, utilizando una escala de 10 puntos, para medir el grado de aceptacin. Los puntos obtenidos en los 40
nios fueron
3
La muestra estuvo compuesta por igual nmero de nios de ambos sexos de 5 a 12 aos de edad residentes en el barrio San
Bernardo de la ciudad de Maracaibo.
a) Cul es la poblacin?, Cul es la muestra?.
b) Cul es la variable?, De qu tipo es?.
c) Construya una tabla de distribucin de frecuencias.
d) Cuntos nios calicaron con 4 puntos cada uno?.
e) Cuntos nios calicaron con 5 puntos como mnimo?.
f ) Cuntos nios calicaron con 6 puntos como mximo?.
g) Qu porcentaje de nios calicaron con 5 puntos como mximo?.
h) Represente grcamente mediante un diagrama de barras las frecuencias simples.
5)
El Grupo Megatech-Ayacucho, importadora de computadoras, realiza un estudio sobre la preferencia de marcas de computadoras porttiles de los docentes del Departamento Acadmico de Matemtica y Fsica, dicho estudio se realizo a un nmero
determinado de docentes, obtenindose los siguientes datos
Vaio
Toshiba
Samsung
OTRAS
Toshiba
HP
Samsung
Vaio
Toshiba
Lenovo
Vaio
HP
Apple
Toshiba
OTRAS
HP
Vaio
Toshiba
Lenovo
Toshiba
Acer
Acer
Acer
OTRAS
Toshiba
Toshiba
HP
HP
Samsung
Acer
Apple
HP
Lenovo
Lenovo
Toshiba
Samsung
Apple
OTRAS
Acer
HP
6)
Se realiza un estudio en la ciudad de Guayaquil a 150 familias de clase media, para conocer el tipo de aceite o manteca
usados en la cocina. Los resultados son los siguientes: Maz, 14 hogares; Soya 65, hogares; Ajonjol, 21 hogares; Pescado, 10
hogares; Manteca de cerdo, 21 hogares; Grasa de origen vegetal, 6 hogares; Oliva, 13 hogares.
a) Cul es la poblacin?, Cul es la muestra?, Cul es la variable?, De qu tipo es?.
b) Construya una tabla de distribucin de frecuencias.
c) Represente grcamente mediante un diagrama de barras las frecuencias simples.
UNSCH
16
Digitado en
)
L TEX por: Surez Azpur, Fredy R.
Estadstica Descriptiva
7)
Las nacionalidades de todos los participantes en el 1er Seminario Internacional de Fsica realizado en la UNI en el ao 2010
son los siguientes:
x1 = C ,
x2 = B ,
x3 = P ,
x4 = E ,
x5 = P ,
x6 = P a
x7 = P ,
x8 = V ,
x9 = C ,
x10 = B ,
x11 = P ,
x12 = Ch
x13 = P ,
x14 = C ,
x15 = E ,
x16 = P ,
x17 = B ,
x18 = B
x19 = V ,
x20 = P a,
x21 = Ch,
x22 = B ,
x23 = P ,
x24 = C
x25 = C ,
x26 = E ,
x27 = P ,
x28 = P ,
x29 = P ,
x30 = V
x31 = P ,
x32 = V ,
x33 = Ch,
x34 = C ,
x35 = P ,
x36 = V
x37 = P ,
x38 = V ,
x39 = Ch,
x40 = C ,
Donde:
B: Boliviano
C: Colombiano
E: Ecuatoriano
P: Peruano
V: Venezolano
Ch: Chileno
Pa: Paraguayo
Agrupe los datos en una tabla de distribucin de frecuencias, luego interprete todas las frecuencias.
8)
El seor Robles, al llegar a su vejez, decide adaptarse a los tiempos modernos, adquiriendo un telfono mvil. Transcurrido
un mes, la compaa de telfonos le remite el siguiente detalle de las llamadas efectuadas durante ese periodo.
duracin en minutos
Llamadas a mviles
Llamadas a jos
Llamadas al extranjero
< 00 10]
< 10 20]
10
25
< 20 30]
25
10
El precio por llamadas a mviles es de 0.12 euros, a jos 0.15 euros y 0.8 euros al extranjero.
a) Elabore la tabla de distribucin de frecuencias para llamadas a mviles y para llamadas a jos.
b) Calcule el monto que pagar por todas las llamadas a telfonos jos.
c) Calcule el monto que pagar por todas las llamadas a telfonos mviles.
d) Cuntas llamadas a telfonos mviles son superiores a 15 minutos por llamada?.
e) Cuntas llamadas a telfonos jos son inferiores a 18 minutos por llamada?.
9)
Los sueldos mensuales (en euros) de 60 empleados de la empresa Pirmide S.A. durante el ao 1998 son los siguientes:
440
560
335
587
613
400
424
466
565
393
453
650
407
376
470
560
321
500
528
526
570
430
618
537
409
600
550
432
591
428
440
340
558
460
560
607
382
667
512
492
450
530
501
471
660
470
364
634
580
450
574
500
462
380
518
480
625
507
645
382
Agrupe los datos en una tabla de distribucin de frecuencias, calcule el nmero de clases empleando la Regla de Sturges,
interprete todas las frecuencias
10)
Un nuevo hotel va a abrir sus puertas en Huamanga. Antes de decidir el precio de sus habitaciones, el gerente investiga los
precios por habitacin de 40 hoteles de esta ciudad. Los datos obtenidos en dlares fueron:
39
47
37
56
43
49
50
61
51
45
53
39
43
50
60
47
51
42
44
58
33
43
41
58
44
48
63
43
53
45
40
54
39
47
33
45
47
42
45
48
UNSCH
17
Digitado en
)
L TEX por: Surez Azpur, Fredy R.
Estadstica Descriptiva
11)
Suponiendo que se pierden todos los exmenes de estadstica, pero se recuerdan que las 120 notas tenan una distribucin
simtrica con 7 intervalos de clase de igual amplitud. Adems en los archivo se encuentra la siguiente informacin:
7
12)
La siguiente informacin se reere a las masas (en kg) de los 50 ingresantes a la EFP de Economa en el Examen de Admisin
del 2008:
13)
El siguiente histograma incompleto se reere a los salarios semanales (en dlares) de todos los trabajadores de la empresa
SONY
Nmero de
trabajadores
HISTOGRAMA DE FRECUENCIAS
ABSOLUTAS ACUMULADAS
80
79
76
61
44
24
11
Salarios
semanales ($)
90 105
a ) A partir de ello Construya la tabla de distribucin de frecuencias, si los intervalos de clase tienen todas la misma
amplitud.
b ) Calcule e interprete
UNSCH
n4 + n5 ,
n2 + N3 ,
100H5 % + 100h6 %.
18
Digitado en
)
L TEX por: Surez Azpur, Fredy R.
Estadstica Descriptiva
14)
De un examen realizado a un grupo de alumnos, cuyas notas se han evaluado del 1 al 8, se ha obtenido la siguiente tabla de
distribucin de frecuencias:
Notas
ni
Ni
Ni
hi
Hi
100Hi
0,08
16
0,16
100hi
100Hi
Hi
0,14
28
38
0,14
Se pide:
15)
Una fbrica empaqueta en lotes de 100 unidades los tornillos que produce. Se establece un plan de inspeccin por muestreo
consistente en examinar, de cada lote, 20 tornillos elegidos al azar y rechazar el lote si de los 20 aparecen ms de 4 defectuosos;
almacenar el lote como revisable si el nmero de defectuosos es menor que 5 pero mayor que 1, y aceptarlo en otro caso.
Se inspeccionan 64 lotes y resulta el siguiente nmero de tornillos defectuosos de cada uno:
1
16)
Las estaturas (en centmetros) de los socios de un club juvenil de Pker de Panam, son:
153
123
129
132
147
138
137
134
131
147
138
128
134
148
125
139
146
145
148
135
152
128
146
143
138
138
122
146
137
151
145
124
132
138
144
141
137
146
138
146
152
136
160
159
157
150
160
142
148
130
a ) Agruparlas en una tabla de distribucin de frecuencias con 6 intervalos, luego elaborar los histogramas de frecuencia
relativas.
17)
Con los siguientes datos, correspondientes a los saldos (en miles de dlares) de cuentas pendientes
77
70
65
62
53
78
41
48
74
63
34
38
69
79
76
55
59
69
78
75
68
56
61
41
83
54
49
68
48
64
84
74
68
73
69
31
69
78
64
34
UNSCH
19
Digitado en
c, y 3 , y 5 , H 4
N5 .
)
L TEX por: Surez Azpur, Fredy R.
Estadstica Descriptiva
18)
En una investigacin realizada a 800 empresas sobre valor de las ventas, en una quincena, se obtuvo la siguiente distribucin
ventas($)
Proporcin de empresas
[18 28
0,30
[28 48
0,25
[48 98
0,20
[98 148
0,15
[148 198]
0,10
se pide
19)
Con los siguientes datos correspondientes al nmero de retrasos (en la maana) por parte de los empleados del Banco de la
Nacin
2
Se pide elaborar una tabla de frecuencias y los diagramas de frecuencia simples correspondientes.
20)
Segn la Asociacin de lucha contra la Bulimia y la Anorexia, las pautas culturales han determinado que la delgadez sea
sinnimo de xito social. Muchos jvenes luchan para conseguir el fsico ideal motivados por modelos, artistas o por la
publicidad comercial. Durante el mes de marzo del ao 2006, en el colegio Alcntara de la ciudad de Talca, despus de las
vacaciones de verano, se observ con precaucin a 27 alumnos con sntomas de anorexia, registrndose los siguientes signos
visibles:
Dieta Severa
Miedo a Engordar
Hiperactividad
Dieta Severa
Miedo a Engordar
Dieta Severa
Dieta Severa
Dieta Severa
Dieta Severa
Hiperactividad
Uso de Laxantes
Uso de Laxantes
Dieta Severa
Uso de Laxantes
Hiperactividad
Dieta Severa
Uso de Laxantes
Miedo a Engordar
Uso de Laxantes
Dieta Severa
Hiperactividad
21)
La tabla muestra una distribucin de frecuencias de la duracin de 400 tubos de electricidad de radio comprobados en la
L& M Tube Company.
Duracin (horas)
Nmero de tubos
[300 400
14
[400 500
46
[500 600
58
[600 700
76
[700 800
68
[800 900
62
[900 1000
48
[1000 1100
22
[1100 1200
UNSCH
20
Digitado en
)
L TEX por: Surez Azpur, Fredy R.
Estadstica Descriptiva
f ) Frecuencia relativa de la sexta clase.
g ) Porcentaje de tubos cuya duracin es menor a las 600 horas.
h ) Porcentaje de tubos cuya duracin es mayor o igual a 900 horas.
i ) Porcentaje de tubos cuya duracin es al menos de 500 horas pero menor de 1000 horas.
j ) Construir un histograma y un polgono de frecuencias.
k ) Construir un histograma y un polgono de frecuencias relativas.
l ) Construir una ojiva porcentual.
m ) Estimar el porcentaje de tubos con duraciones de menos de 560 horas.
n ) Estimar el porcentaje de tubos con duraciones de 970 o ms horas.
) Estimar el porcentaje de tubos con duraciones entre 620 y 890 horas.
22)
En una empresa el personal (500 empleados) se distribuye de acuerdo con su actividad desarrollada en la misma, como se
indica a continuacin en el siguiente diagrama de pastel:
Profesional
10%
Operario
10%
70%
8%
2%
Tcnica
Ayudante
Aseo
A partir de esta informacin construya la tabla de distribucin de frecuencias y sus diagramas de barras correspondientes.
23)
Los datos que se muestran a continuacin, son los cargos (en dlares) por los servicios de electricidad, agua y gas durante
el mes de julio del 2000 para una muestra de 50 apartamentos de 3 habitaciones en Caracas.
96
171
202
157
185
90
141
149
206
95
163
150
108
119
183
178
147
102
116
172
111
175
123
128
154
130
143
151
114
135
153
197
127
82
148
213
130
165
144
168
109
167
187
166
139
149
191
137
129
158
Elaborar:
a ) Una tabla de distribucin de frecuencias, hallando el nmero de clases con la regla de Sturges.
b ) Un histograma y un polgono de frecuencias.
c ) Un histograma porcentual.
d ) Una ojiva.
Determinar:
UNSCH
21
Digitado en
)
L TEX por: Surez Azpur, Fredy R.
Estadstica Descriptiva
24)
En Beverage Digest se informa que, con base en las ventas de 1998, las 5 marcas de refrescos que ms se vendieron fueron
Coke Classic, Diet Coke, Dr.Pepper, Pepsi Cola y Sprite. La lista siguiente proviene de una muestra de 50 compras de esas
marcas fue:
Coke Classic
Dr.Pepper
Sprite
Coke Classic
Pepsi Cola
Pepsi Cola
Sprite
Diet Coke
Diet Coke
Coke Classic
Diet Coke
Coke Classic
Coke Classic
Diet Coke
Pepsi Cola
Pepsi Cola
Diet Coke
Coke Classic
Coke Classic
Pepsi Cola
Coke Classic
Diet Coke
Pepsi Cola
Coke Classic
Diet Coke
Coke Classic
Pepsi Cola
Pepsi Cola
Coke Classic
Coke Classic
Coke Classic
Coke Classic
Pepsi Cola
Coke Classic
Dr.Pepper
Coke Classic
Dr.Pepper
Sprite
Sprite
Coke Classic
Pepsi Cola
Dr.Pepper
Sprite
Pepsi Cola
Pepsi Cola
Pepsi Cola
Coke Classic
Diet Coke
Coke Classic
Dr.Pepper
25)
La siguiente informacin se reere al tiempo, en minutos, que han utilizado los usuarios del Banco de la Nacin Sede
Huamanga durante el 12 de mayo de 2011 para llevar a cabo una operacin bancaria en ventanilla (el tiempo se midi desde
que el usuario llega al banco hasta realizar la operacin bancaria):
y2 = 46,
(a)
N1 = 12,
H6 = 1,
h1 = 0,04,
H4 = 0, 74,
100H5 = 90,
n2 = 2 n1 ,
100h4 = 30.
(b)
y5 = 70,
tiempo(min)
yi
ni
Ni
Ni
BUENA
hi
Hi
Hi
100hi
100Hi
100Hi
MALA.
(c)
Calcule el porcentaje de personas cuya operacin bancaria duro como mnimo 50 minutos.
(d)
UNSCH
22
Digitado en
)
L TEX por: Surez Azpur, Fredy R.