Organización de Datos

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 21

Probabilidad y Estadística –

Organización de Datos

Unidad 1:
Naturaleza y objeto de la Estadística: Poblaciones y muestras. Variables: concepto y clasifi-
cación.
Organización y presentación de datos univariables: Recopilación, tabulación, análisis, inter-
pretación y representación gráfica de datos estadísticos. Series simples y series de frecuen-
cias, para variables discretas y continuas. Distribuciones de frecuencias absolutas, relativas y
acumuladas. Gráficos.

“un método de toma


como
Definiremos a la Estadística de decisiones frente a
la incertidumbre”

Estudia problemas
referidos a una
es el conjunto de indi-
Que es viduos u objetos en los
Población
cuales un investigador
En algunos casos
está interesado.
se considera una

Muestra Que es parte representativa de


una la población
y a través del
análisis de

Datos
Se realiza el

ANÁLISIS EXPLORATORIO
(ESTADÍSTICA DESCRIPTIVA)

Que consiste en la ... y el

Organización Procesamiento
y resumen (Gráficas y medidas descriptivas)
Diagrama 1

Dra. Ing. Gisella Mautino 1


Probabilidad y Estadística –
Organización de Datos

1.- VARIABLES: Clasificación. Escalas de medición

Cualquier característica que


Una es varía de una unidad experi-
Variable mental a otra en la pobla-
Puede ser ción o en la muestra.

Cualitativa Numérica
o o
categórica cuantitativa

DISCRETA CONTINUA

Escala Escala Escala Escala


nominal ordinal de de
razón intervalo

Diagrama 2

Las variables se simbolizan con una letra mayúscula y los valores que toma la variable con la misma
letra en minúscula y con subíndices.
Por ejemplo si queremos clasificar las siguientes variables e indicar la escala de medición:
a) Cantidad de alumnas egresadas del Colegio de Huerto durante los últimos diez años.
b) Temperatura diaria de Jujuy durante el mes de Julio de 2000.
c) Lugar de nacimiento de las personas que viven en San Salvador de Jujuy.
d) Nivel educacional de los padres de los alumnos de Ingeniería.

1.1.- Clasificación de las variables


Para la clasificación de las variables debemos considerar los valores que toma la variable X.

Si los valores son numéricos, la variable es numérica o cuantitativa. Si el número pro-


viene de contar es discreta, si resulta de efectuar mediciones es continua.

Dra. Ing. Gisella Mautino 2


Probabilidad y Estadística –
Organización de Datos

X: Cantidad de alumnas egresadas del Colegio de Huerto durante los últimos diez años.
La cantidad de egresadas puede ser 42, 58, etc. Son cantidades enteras que provienen de contar a las
alumnas egresadas. Entonces la variable es cuantitativa discreta.

X: Temperatura diaria de Jujuy.


La temperatura diaria puede ser 12º, 23º o puede estar comprendida entre 21º y 22º etc. Estas
cantidades provienen de realizar mediciones de la temperatura diaria. Entonces la variable es cuanti-
tativa continua.
Escala de medición
Para reconocer la escala de medición, en una variable cuantitativa observamos:
Si la variable tiene un cero natural, es decir si el cero indica la ausencia de la característica, la escala
es de Razón.
Para el caso a) 0 indicaría la ausencia de alumnas egresadas, entonces la escala es de Razón.
Para el caso c) de las mediciones de la temperatura 0º no indica la ausencia de temperatura, el 0
considerado es un 0 convencional, en este caso la escala de medición es de intervalo.

Para el caso en que los valores de la variable están asociados a distintas categorías o
cualidades, la variable es categórica o cualitativa.

X: Lugar de nacimiento de personas que viven en Jujuy.


Los lugares de nacimiento podrían ser El Carmen, Palpalá, Humahuaca, etc. Cada uno de los luga-
res de nacimiento constituye una categoría o una cualidad, entonces X es categórica. En este caso
las categorías o cualidades no están relacionadas, no tienen un orden preestablecido, en este caso la
escala de medición es nominal.

X: Nivel educacional de los padres de los alumnos de Ingeniería.


En este caso los valores de la variable pueden agruparse en categorías ordenadas: primario, medio,
terciario, etc. entonces la variable es categórica o cualitativa y la escala de medición es ordinal.

Dra. Ing. Gisella Mautino 3


Probabilidad y Estadística –
Organización de Datos

2.- ORGANIZACIÓN Y RESUMEN DE DATOS


2.1.- Variable categórica
Veamos un problema:
Problema 1: En una encuesta efectuada en la Facultad de Ciencias Económicas se preguntó a los
alumnos de primer año acerca de su preferencia en cuanto a las tres áreas fundamentales de la carre-
ra: Matemática, Contabilidad y Economía. En una muestra de 40 alumnos se obtuvieron las siguien-
tes respuestas:

Alumno Alumno Alumno Alumno


Preferencia Preferencia Preferencia Preferencia
Nº Nº Nº Nº
1 Economía 11 Contabilidad 21 Matemática 31 Matemática
2 Matemática 12 Economía 22 Economía 32 Matemática
3 Matemática 13 Matemática 23 Contabilidad 33 Contabilidad
4 Contabilidad 14 Economía 24 Contabilidad 34 Economía
5 Economía 15 Contabilidad 25 Economía 35 Economía
6 Contabilidad 16 Matemática 26 Matemática 36 Contabilidad
7 Contabilidad 17 Matemática 27 Economía 37 Matemática
8 Matemática 18 Economía 28 Economía 38 Economía
9 Economía 19 Economía 29 Contabilidad 39 Economía
10 Economía 20 Economía 30 Contabilidad 40 Contabilidad

a) Identifique la variable en estudio, a que tipo pertenece y la escala de medición.


b) Resuma la información en una tabla de frecuencias.
c) Represente las frecuencias mediante un gráfico.
d) ¿Cuál es el área de preferencia predominante de los alumnos de primer año de la Facultad de
Ciencias Económicas?.
Solución
a) Identificación de la variable
X: Área de preferencia
Tipo de variable
Los valores que toma la variable en este caso son cualitativos o también podemos decir que
se pueden establecer categorías: Matemática, Contabilidad o Economía. La variable es entonces
cualitativa o categórica.
La escala de medición es nominal.

Dra. Ing. Gisella Mautino 4


Probabilidad y Estadística –
Organización de Datos

b) Tabla de frecuencias

Una tabla de frecuencias para variables categóricas es una tabla que asocia cada
categoría de la variable con el número de veces que se repite dicha categoría. Esta tabla
también se denomina tabla de distribución de frecuencias.
Los datos cualitativos o categóricos se ordenan en frecuencias absolutas, frecuencias
. relativas y relativas porcentuales

La tabla de distribución de frecuencias adoptará la siguiente forma:

Tabla I: Tabla genérica de distribución de frecuencias categóricas


Variable Frecuencias Frecuencias Frecuencia
(categorías) Absolutas Relativas relativa porcentual
fi fi ri %
r=
i
n
Categoría A fA rA 100 rA %
Categoría B fB rB 100rB %
....... .... ..... .....
Categoría Z fZ rZ 100rZ %
Totales n 1 100%

Tabla II: Tabla de distribución de frecuencias de a variable área de preferencia


Categoría: área Frecuencia absoluta Frecuencia relativa Frecuencia relativa Porcentual
de preferencia fi ri ri %
Economía 17 0.425 42.5
Matemática 11 0.275 27.5
Contabilidad 12 0.30 30
Total 40 1 100

Interpretación de las frecuencias:


17 alumnos prefieren el área de Economía.
El 27.5 % de los alumnos prefiere el área de Matemática.
0.30 es la proporción de alumnos que prefiere Contabilidad.

c) Representación gráfica
La tabla de frecuencia anterior se puede representar por medio de un gráfico de barras horizontales.

Dra. Ing. Gisella Mautino 5


Probabilidad y Estadística –
Organización de Datos

Contabilidad
Área de preferencia
Matemática
Economía

0 0.1 0.2 0.3 0.4 0.5 ri


Frecuencias relativas

Gráfico 1: Frecuencias relativas de la variable área de preferencia

d) Para contestar esta pregunta observamos la tabla de frecuencias o el gráfico y se concluye que el
área de preferencia que predomina es el de Economía.

2.2.- Variable numérica


2.2.1.- Variable numérica discreta
Problema 2: Un ingeniero agrónomo visita 50 plantaciones de naranja en la zona del ramal y en cada
una anotó el número de plantas atacadas por cierto hongo, de lo cual resultaron los siguientes datos:

15 16 18 18 15 15 17 20 17 20
20 17 18 18 16 16 17 20 17 20
22 18 19 19 15 21 18 21 16 21
15 20 16 18 16 21 19 19 19 21
18 18 17 19 20 17 19 19 17 22

a. Defina la variable considerada. Clasifíquela e indique la escala de medición.


b. Construya una tabla de distribución de frecuencias, interprételas y represéntelas gráficamen-
te.
Dra. Ing. Gisella Mautino 6
Probabilidad y Estadística –
Organización de Datos

c. ¿Cuántas plantaciones tienen a lo sumo 19 plantas atacadas por hongos?.


d. ¿Cuántas plantaciones tienen por lo menos 17 plantas atacadas por hongos?.
e. ¿Qué proporción de las plantaciones bajo estudio tienen 18 plantas atacadas por hongos?
f. ¿Qué proporción de las plantaciones bajo estudio tienen 18 o menos plantas atacadas por
hongos?
g. ¿Qué proporción de las plantaciones bajo estudio tienen 18 o más plantas atacadas por hon-
gos?

Solución
a) Definición de la variable
X: Cantidad de plantas atacadas por cierto hongo.
Clasificación
Cómo cada valor que toma la variable proviene de contar las plantas, entonces la variable es
numérica discreta.
Escala de medición
Si teóricamente X tomara el valor 0, entonces 0 indica la ausencia de plantas atacadas por
hongos, entonces la escala de medición es de razón.

b) Tabla de distribución de frecuencias


El conjunto de observaciones supera los 25 datos, en este caso, la forma conveniente de
examinar los datos es presentarlos en forma de resumen mediante la construcción de tablas y gráfi-
cas apropiadas.
Para la organización de los datos se considera el tamaño de la muestra. A este tamaño desig-
naremos con n. En nuestro problema n = 50 y la variable es cuantitativa discreta. La información
recogida puede ser resumida en una tabla de frecuencias.
Para este tipo de variable, es una tabla en la que se asocia cada valor de la variable con la
cantidad de veces que se observa dicho valor. Se pueden obtener frecuencias absolutas, relativas,
porcentuales y acumuladas.

Tabla III.- Tabla genérica de distribución de frecuencias de una variable cuantitativa discreta para
una muestra de tamaño = n

Dra. Ing. Gisella Mautino 7


Probabilidad y Estadística –
Organización de Datos

Variable Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia


Diferentes Absoluta Relativa Relativa Absoluta Absoluta Relativa Relativa
valores ob- fi fi Porcentual Acumulada Acumulada Acumulada Acumulada
ri = ri % Menor que Mayor que Menor que Mayor que
servados n
xi Fi F’i Ri R’i
x1 f1 r1 100r1 F1 F’1 = n R1 R’1 = 1
x2 f2 r2 100r2 F2 F’2 R2 R’2
..... ..... ..... …… ….. …. ….. ….
xm fm rm 100rm Fm = n F’m Rm = 1 R’m

Totales fi = n ri = 1 100

Tabla IV.- Distribución del número de plantas de naranjas atacadas por un cierto hongo

Variable Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia


Diferentes Absoluta Relativa Relativa Absoluta Absoluta Relativa Relativa
valores ob- fi fi Porcentual Acumulada Acumulada Acumulada Acumulada
servados ri = ri % Menor que Mayor que Menor que Mayor que
xi n
Fi F’i Ri R’i
15 5 0.1 10% 5 50 0.1 1
16 6 0.12 12% 11 45 0.22 0.9
17 8 0.16 16% 19 39 0.38 0.78
18 9 0.18 18% 28 31 0.56 0.62
19 8 0.16 16% 36 22 0.72 0.44
20 7 0.14 14% 43 14 0.86 0.28
21 5 0.1 10% 48 7 0.96 0.14
22 2 0.04 4% 50 2 1 0.04
Totales 50 1 100

En nuestro problema, los valores que toma la variable X son: 15, 16, 17, ........25 plantas ataca-
das por el hongo.

Frecuencia absoluta

Las frecuencias absolutas se obtienen observando las veces que se repite cada valor de la
variable.

Dra. Ing. Gisella Mautino 8


Probabilidad y Estadística –
Organización de Datos

Interpretación:
f1 = 5, significa: 5 plantaciones de las observadas tienen 15 plantas de naranjas atacadas por cierto
hongo.
f2 = 6, significa: 6 plantaciones de las observadas tienen 16 plantas de naranjas atacadas por cierto
hongo.

Frecuencia relativa

La frecuencia relativa de un valor de la variable es la proporción de veces que ocurre di-


cho valor.

Interpretación
0.1 es la proporción de plantaciones de la muestra que tiene 15 plantas atacadas.
0.12 es la proporción de plantaciones de la muestra que tiene 16 plantas atacadas.

Frecuencia relativa porcentual


Interpretación
El 12% de las plantaciones de la muestra tiene 16 plantas atacadas.
El 14% de las plantaciones de la muestra tiene 22 plantas atacadas.
Frecuencias acumuladas

La frecuencia acumulada para un valor dado de la variable es la suma de las frecuencias (ab-
solutas o relativas ) de los valores menores o iguales al valor que se está considerando.

Frecuencia absoluta acumulada “Menor que”


F1 = f1 = 5
F2 = F1 + f2 = 5 + 6 = 11
F8 = F7 + f8 = 48 + 2 = 50

Interpretación
11 significa que: 11 plantaciones poseen 16 plantas atacadas o menos.
19 significa que: 19 plantaciones poseen a lo sumo17 plantas atacadas.

Frecuencia absoluta acumulada “Mayor que”


Dra. Ing. Gisella Mautino 9
Probabilidad y Estadística –
Organización de Datos

F’1 = f1 + f2 + f3 + f4 + f5 + f6 + f7 + f8 = n = 50
F’2 = f2 + f3 + f4 + f5 + f6 + f7 + f8 = 6 + 8 + 9 + 8 + 7 + 5 + 2 = 45
F’8 = f8 = 2

Interpretación
F’2 = 45 significa que: 45 plantaciones de la muestra tienen 16 o más plantas atacadas por el hongo.
F’4 = 31 significa que: 31 plantaciones de la muestra tienen 18 o más plantas atacadas por el hongo.
En forma similar se calculan las frecuencias relativas acumuladas.

Frecuencias relativas acumuladas “Menor que”


Interpretación
0.22 significa que: 0.22 es la proporción de plantaciones de la muestra que tienen 16 o menos plan-
tas atacadas.
0.38 significa que: 0.38 es la proporción de plantaciones de la muestra que tienen 17 o menos plan-
tas atacadas.

Frecuencias relativas acumuladas “Mayor que”


Interpretación
0.9 significa que: 0.9 es la proporción de las plantaciones de la muestra que tienen 16 o más plantas
atacadas.
0.78 significa que: 0.78 es la proporción de las plantaciones de la muestra que tienen 17 o más plan-
tas atacadas.

Representación gráfica
Por tratarse de una variable discreta, la distribución de las frecuencias absolutas y relativas se
realiza a través del gráfico de bastones; las frecuencias acumuladas a través del gráfico de escalones.

Gráfico de bastones:
El gráfico de bastones se usa para representar a las distintas distribuciones de frecuencias co-
rrespondientes a datos discretos.

Dra. Ing. Gisella Mautino 10


Probabilidad y Estadística –
Organización de Datos

Sobre el eje de abscisas o de las “x” se representan los valores de la variable; en nuestro pro-
blema la cantidad de plantas atacadas. Sobre el eje de las ordenadas o de las “y”, las frecuencias
absolutas, las frecuencias relativas o las porcentuales.
Sobre cada valor de la variable se levanta un segmento vertical de longitud igual a la frecuencia ab-
soluta (o la relativa, o la porcentual) del valor correspondiente.

Distribución de las plantas de naranjas atacadas por un cierto hongo

fi

8
Nº de plantaciones

15 16 17 18 19 20 21 22 xi
Cantidad de plantas atacadas

Gráfico 2: Gráfico a bastones de las frecuencias absolutas

Interpretación: La mayoría de las plantaciones tienen entre 17 y 20 plantas de naranjas atacadas por
un cierto hongo.

Dra. Ing. Gisella Mautino 11


Probabilidad y Estadística –
Organización de Datos

ri

0.18
Prop. Del nº de plantaciones

0.16

0.14

0.12

0.1

0.08

0.06

0.04

0.02

15 16 17 18 19 20 21 22 xi
Cantidad de plantas atacadas

Gráfico 3: Gráfico a bastones de las frecuencias relativas

Gráfico de escalones
Las frecuencias acumuladas (absolutas, relativas o porcentuales) “Mayor que” y “Menor
que” de una variable discreta se representan por el gráfico de escalones.
Sobre el eje horizontal de la “x” se representas cada uno de los valores de la variable, en nuestro
problema: cantidad de plantas atacadas. Por cada uno de estos valores se levanta un segmento verti-
cal igual a la frecuencia acumulada y se completan con tramos horizontales hasta el valor inmediato
siguiente.

Dra. Ing. Gisella Mautino 12


Probabilidad y Estadística –
Organización de Datos

Ri
Frec. Relativas Acumuladas 1

0.9

0.8

0.7

0.6

0.5

0.4

0.3

0.2

0.1

15 16 17 18 19 20 21 22 xi
Cantidad de plantas atacadas

Gráfico 4: Gráfico a escalones de las frecuencias relativas acumuladas “Menor que”

R’i
1
Frec. Relativas Acumuladas

0.9

0.8

0.7

0.6

0.5

0.4

0.3

0.2

0.1

15 16 17 18 19 20 21 22 xi

Cantidad de plantas atacadas

Gráfico 5: Gráfico a escalones de las frecuencias relativas acumuladas “Mayor que”

Dra. Ing. Gisella Mautino 13


Probabilidad y Estadística –
Organización de Datos

c) ¿Cuántas plantaciones tienen a lo sumo 19 plantas atacadas por hongos?.


Respuesta: 36 plantaciones tienen a lo sumo 19 plantas atacadas.
Esta respuesta se la puede leer en la tabla o en el gráfico de escalones. Este número se encuentra en
la tabla II, en la intersección de la fila correspondiente al valor de 19 plantas atacadas con la colum-
na de frecuencia absoluta acumulada “menor que”.
De acuerdo a la interpretación de las frecuencias absolutas menor que: 36 plantaciones poseen 19
plantas afectadas o menos.
d) ¿Cuántas plantaciones tienen por lo menos 17 plantas atacadas por hongos?.
En este caso se utiliza la columna de frecuencia absoluta acumulada “mayor que” y la fila corres-
pondiente a 17 plantas afectadas. En la intersección tenemos 39 plantaciones.
Respuesta: 39 plantaciones tienen por lo menos 17 plantas atacadas.
Responde las preguntas e), f) y g).

2.2.2.- Variable cuantitativa continua


Para el estudio de una variable continua, consideraremos el siguiente problema

Problema 3
Suponga que se han registrado 50 observaciones referentes a los pesos de 50 lingotes de acero
producidos por SIDER, la muestra fue obtenida de la producción semanal y las unidades están dadas
en Kg.
94.5 93.0 95.5 95.3 92.4 94.4 92.8 93.2 93.6 95.5
92.9 93.6 95.7 93.8 94.8 93.9 92.7 91.6 93.6 93.7
94.2 95.7 94.7 94.3 92.7 94.5 96.2 95.4 93.7 91.9
94.7 92.7 95.0 93.0 92.9 93.7 92.7 93.3 94.6 96.4
94.1 93.7 94.2 93.7 94.0 93.9 93.6 94.6 92.3 94.4

a) Defina la variable considerada. Clasifíquela e indique la escala de medición.


b) Organizar las observaciones realizadas en una tabla de distribución de frecuencias con 5 cla-
ses de igual amplitud.
c) Interprete las distintas frecuencias y construya las gráficas correspondientes.
d) ¿Cuántos lingotes de acero pesan 94.5 Kg. o más?
e) ¿Cuántos lingotes de acero pesan más de 93.5 Kg.?
f) ¿Qué porcentaje de lingotes de acero pesan menos de 94.5 Kg. ?

Dra. Ing. Gisella Mautino 14


Probabilidad y Estadística –
Organización de Datos

Solución
a) Definición de la variable
La variable X es: Peso de lingotes de acero expresado en Kg.
Clasificación: Los valores que toma la variable son valores numéricos que resultan de realizar medi-
ciones, entonces se trata de una variable numérica o cuantitativa continua.
Escala de medición: El valor de 0 Kg. indicaría la ausencia de peso, es un cero natural, por lo que
la escala de medición corresponde a la de razón.
b) Distribución de frecuencias
Para construir una tabla de distribución de frecuencias recordaremos que:
“Una distribución de frecuencias es una tabla de resumen en la que los datos se agrupan o
arreglan en clases o categorías ordenadas en forma numérica, establecidas de modo conve-
niente” 1
Como se trata de una variable continua, y que teóricamente la magnitud peso de la variable
puede tomar una infinidad de valores y que entre dos pesos de la variables puede existir otro peso, la
organización de los datos o tabla de distribución de frecuencias contiene intervalos de clase.
“Al construir la tabla de distribución de frecuencias, se debe prestar atención a:
1. Seleccionar el número apropiado de clases para la tabla.
2. Obtener un intervalo de clase o “ancho” apropiados para cada clase.
3. Establecer los límites y las fronteras de cada clase para evitar superposición." 2
Una tabla de distribución de frecuencias de una variable continua es como la que sigue:

Tabla V.- Tabla de distribución de frecuencias de una variable continua para una muestra n.

Intervalos Marca de Frec. Frec. Abs. Frec. Frecuenc. Frec. Rel. Frec. Rel. Frec. Frec. Frec.
de clase clase Abs. Acumul. Abs. Relativa Acumul. Acumul. Porcent. Porc. Porc.
Li – Ls x’i fi Menor Acumul. f Menor Mayor ri % Acumul. Acumul.
que Mayor ri = i que que Menor Mayor
que n que que
Fi Ri R’i
F’i Ri % R’i %
L0 – L1 x’1 f1 F1 F’1 = n r1 R1 R’1 = 1 r1 % R1 % R’1%=100
L1 – L2 x’2 f2 F2 F’2 r2 R2 R’2 r2 % R2 % R’2 %
……. ……... …. ….. …… ...... .... ..….. … ... ....
Lm-1 – Lm x’m fm Fm = n F’m= fm rm Rm = 1 R’m= rm rm % Rm%=100 R’m %=rm
Totales n 1 100

1, 2
Berenson, M.L.- Levine, D.M. Estadística para Administración y Economía. Conceptos y Aplicaciones.
Dra. Ing. Gisella Mautino 15
Probabilidad y Estadística –
Organización de Datos

Al observar los datos del problema, puede verse que el mayor valor que toma la variable pe-
so de los lingotes de acero es de 96.4 Kg. y el menor valor es 91.6 Kg.

El rango o recorrido r = xi máx. – xi mín. = 96.4 Kg. – 91.6 Kg. = 4.8 Kg., que es la amplitud total.
“El rango se define como la diferencia que existe entre el mayor y el menor valor observado
que toma la variable en estudio”.2

La decisión sobre la cantidad de intervalos y la amplitud de cada uno de ellos es arbitraria, depende
del problema en cuestión y en última instancia del investigador. Los intervalos de clase pueden ser
de igual o distinta amplitud dependiendo del problema o el criterio del investigador. Generalmente
se utiliza entre 5 y 15 clases.
- En nuestro problema está establecido que debemos considerar 5 intervalos de igual amplitud.
La amplitud o ancho del intervalo = amplitud total o rango / nº de intervalos
Amplitud = 4.8 Kg. / 5 = 0.96 1
Trabajar con 0.96 resultaría dificultoso por lo que es conveniente trabajar con el entero más próxi-
mo.
Ampliamos el rango o recorrido de datos original [91.6 , 96.4], por otro que lo contenga y que sea
múltiplo de 5. El rango ampliado y que contiene al original es (91.5 , 96.5).

Determinación de los límites de clase


Para el primer intervalo: Se toma el valor mínimo del rango ampliado, en nuestro caso 91.5 y este
es el límite inferior. El límite superior se obtiene sumando 1 que es el ancho o amplitud para los da-
tos de nuestro problema: 91.5 +1 = 92.5. Entonces el primer intervalo es 91.5 – 92.5

Segundo intervalo: El límite superior del primero pasa ser límite inferior del segundo, sumándole a
éste el ancho del intervalo se obtiene el límite superior: 92.5 – 93.5.
Con el mismo procedimiento se obtienen los demás intervalos.

2
Universidad Nacional de Córdoba. Curso de Posgrado. “ESTADÍSTICA APLICADA A LA INVESTIGACIÓN”
Dra. Ing. Gisella Mautino 16
Probabilidad y Estadística –
Organización de Datos

Tabla VI.- Tabla de distribución de frecuencias de los pesos de los 50 lingotes de acero
Intervalo Marca Frec. Frec. Abs. Frec. Abs. Frec. Frec. Rel. Frec. Rel. Frec. Frec. Porc. Frec. Porc.
de clase de clase Abs. Acumul. Acumul. Rel. Acumul. Acumul. Porcent. Acumul. Acumul.
Li – Ls x’i fi Menor que Mayor que ri Menor que Mayor que ri % Menor que Mayor que
Fi F’i Ri R’i Ri % R’i %
91.5 – 92.5 92 4 4 50 0.08 0.08 1 8 8 100

92.5 – 93.5 93 11 15 46 0.22 0.30 0.92 22 30 92

93.5 – 94.5 94 20 35 35 0.40 0.70 0.70 40 70 70

94.5 – 95.5 95 9 44 15 0.18 0.88 0.30 18 88 30

95.5 – 96.5 96 6 50 6 0.12 1 0.12 12 100 12

Totales 50 1 100

Ubicación de los pesos en los intervalos correspondientes


El peso del lingote igual a 94.5 Kg. ¿en qué intervalo considerarlo? ¿ en el tercer o cuarto in-
tervalo?. Se puede ubicar en cualquiera de los dos, pero el criterio adoptado se debe considerar en
todos los casos y para todo el estudio.
- En nuestro problema y en todos los que se consideren, el criterio es:
91.5 – 92.5 : peso igual o mayor que 91.5 pero menos de 92.5
93.5 – 94.5 : peso igual o mayor que 93.5 pero menos de 94.5
95.5 – 96.5 : peso igual o mayor que 95.5 pero menos de 96.5
- Entonces 94.5 ubicaremos en el cuarto intervalo.
Para el caso del peso 92.9, éste pertenece al segundo intervalo y así se continúa con los demás datos.

Frecuencias
Se pueden calcular, además de las frecuencias absolutas, las relativas o las porcentuales,
según el problema en estudio requiera proporciones o porcentajes respectivamente.
- En nuestro problema calcularemos todas las frecuencias ya que no se especifica cual se prefiere.
El cálculo de frecuencias relativas y acumuladas se realiza del mismo modo que se trabajó
con la variable discreta.
Para las frecuencias absolutas se consideran la cantidad de lingotes de acero contenidos en cada in-
tervalo.

Dra. Ing. Gisella Mautino 17


Probabilidad y Estadística –
Organización de Datos

Interpretaciones
Frecuencia absoluta
4 lingotes de acero pesan menos de 92.5
20 lingotes pesan 93.5 Kg. o más, pero menos de 94.5

Frecuencia Absoluta acumulada “Menor que”


5 es el número de lingotes de acero que pesan menos de 93.5 Kg.
35 lingotes de acero pesan menos de 94.5 Kg.

Frecuencia Absoluta acumulada “Mayor que”


50 lingotes de acero pesan 91.5 kg. o más.
46 lingotes de acero pesan 92.5 kg. o más,
o 46 lingotes de acero pesan por lo menos 92.5 kg.
15 lingotes de acero pesan 94.5 kg. o más.
Frecuencia relativa
Se divide cada frecuencia absoluta por el tamaño de la muestra. En nuestro problema se divide por
50.
0.08 es la proporción de lingotes de acero que pesan 91.5 Kg. o más pero menos de 92.5Kg.
0.12 es la proporción de lingotes de acero que pesan 95.5 Kg. o más pero menos de 96.5Kg.

Frecuencia Absoluta acumulada “Menor que”


0.70 es la proporción de lingotes de acero que pesan menos de 94.5 Kg.
0.88 es la proporción de lingotes de acero que pesan menos de 95.5 Kg.

Frecuencia Absoluta acumulada “Mayor que”


0.92 es la proporción de lingotes de acero que pesan 92.5 Kg o más.
o 0.92 es la proporción de lingotes de acero que pesan por lo menos 92.5 Kg.
0.70 es la proporción de lingotes de acero que pesan 93.5 Kg o más.
o es la proporción de lingotes de acero que pesan por lo menos 93.5 Kg.

Frecuencia porcentual acumulada “Menor que”


El 30% de los lingotes de acero pesan menos de 93.5 Kg.
El 88% de los lingotes de acero pesan menos de 95.5 Kg.
Dra. Ing. Gisella Mautino 18
Probabilidad y Estadística –
Organización de Datos

Frecuencia porcentual acumulada “Mayor que”


El 92% de los lingotes de acero pesan 92.5 Kg. o más , o el 92% de los lingotes de acero pesan por
lo menos 92.5 Kg.
El 30% de los lingotes de acero pesan 94.5 Kg. o más, o el 92% de los lingotes de acero pesan por lo
menos 94.5 Kg.

La marca de clase
La marca de clase es el punto medio del intervalo de clase, es el valor utilizado para repre-
sentar todos los datos resumidos en el intervalo en particular.
Por ejemplo, para el primer intervalo:
91.5 92.5
92 y así se calcula para el resto de los intervalos.
2
Gráfica de datos
Los histogramas y los polígonos de frecuencias se utilizan para representar gráficamente
las distribuciones de frecuencias absolutas, relativas y porcentuales de datos cuantitativos continuos
agrupados en clases. Los histogramas son gráficas de barras verticales.
Para las frecuencias acumuladas “Menor que” y “Mayor que” se usan polígonos llamados
ojivas.

Distribución del peso de 50 lingotes de acero

fi

20
Frecuencia Absoluta

15

10

5 9
0
91.5 92.5 93.5 94.5 95.5 96.5
Peso en Kg.
Gráfico 6: Histograma y polígono de frecuencias absolutas del peso de los lingotes de acero.

Dra. Ing. Gisella Mautino 19


Probabilidad y Estadística –
Organización de Datos

%
100
100
88

80
Frec. Porcentual Acumulada

70

60

40
30

20

0
91.5 92..5 93.5 94.5 95.5 96.5

Peso en Kg.

Gráfico 7: Polígonos de frecuencias acumuladas: Ojiva. Frecuencias porcentuales acumuladas “Menor que”

%
100
100

92
Frec. Porcentual Acumulada

80

70
60

40

30

20
12

0
91.5 92..5 93.5 94.5 95.5 96.5

Peso en Kg.
Gráfico 8: Ojiva. Frecuencias porcentuales acumuladas “Mayor que”

Responder d) e) f).
Dra. Ing. Gisella Mautino 20
Probabilidad y Estadística –
Organización de Datos

Diagrama resumen para la gráfica de datos

Inicio

Variable

No
▪ Gráfico de bastones
La variable es ¿Es cuanti- Si ¿Es dis- Si
▪ Gráfico de escalones
categórica tativa? creta?

No
▪ Histograma
Barras hori- La variable ▪ Polígono de
zontales es continua frecuencias
▪ Ojiva

Diagrama 3

Dra. Ing. Gisella Mautino 21

También podría gustarte