Act. Probabilidad y Estadística

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 55

“2024, Año de Felipe Carrillo Puerto, Benemérito del Proletariado, Revolucionario y Defensor del

Mayab”

PROBABILIDAD Y
ESTADISTICA.
“2024, Año de Felipe Carrillo Puerto, Benemérito del Proletariado, Revolucionario y Defensor del
Mayab”

UNIVERSIDAD TECNOLOGICA DE LA SELVA


RAYON; CHIAPAS.

T.S.U. EN CONSTRUCCIÓN

MATERIA: PROBABILIDAD Y ESTADISTICA.

INTEGRANTES:

ÁLVAREZ HERNÁNDEZ JUAN AROLDO.

ÁLVAREZ HERNÁNDEZ MARÍA CECILIA.

ÁLVAREZ LÓPEZ MIGUEL DE JESÚS.

PÉREZ LÓPEZ TATIANA.

URQUÍN ÁLVAREZ JOSÉ EDUARDO.

ACTIVIDAD: INVESTIGACIÓN Y EJERCICIOS PRÁCTICOS.

QUINTO CUATRIMESTRE

GRUPO: “A”

CATEDRÁTICO: ING.CARLOS FABIAN CAMACHO DURANRE.

FECHA DE ENTREGA: MARTES 20 DE FEBRERO DE 2024

A) PROCESO DEL DISEÑO DE UN MUESTREO NO PROBABILÍSTICO.

Variable cualitativa: variable cuyos valores son cualidades o categorías.


“2024, Año de Felipe Carrillo Puerto, Benemérito del Proletariado, Revolucionario y Defensor del
Mayab”
Variable cualitativa ordinal: las categorías de la variable se pueden ordenar.

Variable cualitativa nominal: los valores no admiten ningún orden jerárquico.

Variable cuantitativa discreta: la variable solo puede tomar un número finito de


valores.

Variable cuantitativa continua: la variable puede tomar cualquier valor dentro de


un intervalo.

Una variable cualitativa (o variable categórica) es un tipo de variable cuyos


valores son cualidades, características o categorías y, por lo tanto, no admite
valores numéricos. A la vez, las variables cualitativas se dividen en dos subtipos:
las variables cualitativas ordinales, las cuales se pueden ordenar según algún
criterio, y las variables cualitativas nominales, que no se pueden ordenar
jerárquicamente.

Ejemplos de variables cualitativas ordinales:

La nota de una asignatura: puede ser «matrícula de honor», «excelente»,


«notable», «aprobado» o «suspenso».

Los puestos de trabajo en una empresa: existe la posición de «presidente»,


«vicepresidente», «jefe de departamento», «becario»…

Ejemplos de variables cualitativas nominales:

El género de una persona: puede ser «hombre» o «mujer».

El estado civil de una persona: puede ser «casado/a», «soltero/a»,


«divorciado/a»…

Variables cuantitativas

Una variable cuantitativa (o variable numérica) es un tipo de variable que solo


admite valores numéricos, es decir, el valor de una variable cuantitativa siempre
será un número.
“2024, Año de Felipe Carrillo Puerto, Benemérito del Proletariado, Revolucionario y Defensor del
Mayab”
Existen dos subtipos de variables cuantitativas: las variables cuantitativas
discretas, que son variables que no pueden tomar algunos valores, y las variables
cuantitativas continuas, las cuales pueden tomar cualquier valor numérico.

Ejemplos de variables cuantitativas discretas:

El número de personas en una habitación: 1, 2, 5, 9…

El número de hijos en una familia: 0, 1, 2, 3, 4, 5…

Los posibles resultados del lanzamiento de un dado: 1, 2, 3, 4, 5 o 6.

Los goles marcados por un equipo de fútbol durante un partido: 1, 2, 4, 5…

Ejemplos de variables cuantitativas continuas:

El peso de un grupo de personas: 74,5 kg, 58,14 kg, 62,39 kg, 83,92 kg…

La temperatura de una habitación: 25 ºC, 19,50 ºC, 12,83 ºC, 17,52 ºC, 29,4 ºC…

El tiempo que tarda un atleta en recorrer los 100 m lisos: 9,81 s, 10,02 s, 9,52 s, 9,74 s, 11,25

Variable independiente: aquella variable cuyo valor no depende de ninguna otra


variable.

Variable dependiente: variable cuyo valor depende del valor que tome otra
variable (la variable independiente).

Variable interviniente: variable que afecta a la relación entre la variable


independiente y la variable dependiente pero que no se quiere analizar.

Por ejemplo, si en una investigación se estudia estadísticamente la relación entre


las calificaciones obtenidas por los alumnos y las horas de estudio dedicadas, la
variable dependiente son las calificaciones y la variable independiente son las
horas de estudio. Porque las notas dependen de las horas de estudio, y no al
revés.

Asimismo, una variable interviniente sería la motivación de los profesores al


explicar el temario. Lógicamente, las calificaciones variarán dependiendo de la
“2024, Año de Felipe Carrillo Puerto, Benemérito del Proletariado, Revolucionario y Defensor del
Mayab”
motivación de cada profesor ya que explicarán mejor o peor, sin embargo, es una
característica que no se pretende analizar.

Según su escala

Según cuál sea el cero absoluto de la escala que representa una variable
numérica, se pueden distinguir dos tipos:

Variable de razón: variable cuyos cero absolutos coincide con el cero absoluto de
la magnitud que representa. Por ejemplo: la velocidad de un coche (si la velocidad
de un coche es 0 km/h significa que no se está moviendo).

Variable de intervalo: variable cuyo 0 no corresponde con el cero absoluto de la


magnitud que representa. Por ejemplo: la temperatura (0 ºC no implica la ausencia
de temperatura, ya que también existen temperaturas negativas).

Variable de intervalo

Las variables que poseen escala en intervalo permiten la realización de relaciones


numéricas entre sí, aunque pueden verse limitadas por las relaciones de
proporcionalidad. Esto se debe a que dentro de este rango no existen “puntos
ceros” o “ceros absolutos” que puedan ser identificados en su totalidad.

Esto trae como consecuencia la imposibilidad de realizar transformaciones de


forma directa en los otros valores. Por lo tanto, las variables de intervalo, más que
medir valores concretos, miden los rangos. Esto complica en cierta forma la
operatividad, pero fomenta la cobertura de una amplia cantidad de los valores.

Las variables de intervalo pueden presentarse en grados, magnitudes o cualquier


otra expresión que simbolice cantidad. Asimismo, permiten clasificar y ordenar
categorías, e indicar los grados de distancia que existen entre estas.

Ejemplo

Dentro de esta clasificación pueden encontrarse la temperatura o el coeficiente


intelectual.

TAMAÑO DE LA MUESTRA
“2024, Año de Felipe Carrillo Puerto, Benemérito del Proletariado, Revolucionario y Defensor del
Mayab”
El tamaño de la muestra de una muestra estadística es el número de
observaciones que la componen.

El tamaño de la muestra normalmente es representado por "n" y siempre es un


número entero positivo. No se puede hablar de ningún tamaño exacto de la
muestra, ya que puede variar dependiendo de los diferentes marcos de
investigación. Sin embargo, si todo lo demás es igual, una muestra de tamaño
grande brinda mayor precisión en las estimaciones de las diversas propiedades de
la población.

¿Cuál debe ser el tamaño de la muestra?

Determinar el tamaño de la muestra que se va a seleccionar es un paso


importante en cualquier estudio de investigación. Por ejemplo, un investigador
desea determinar la prevalencia de problemas oculares en niños en edad escolar
y quiere realizar una encuesta.

La pregunta importante que debe ser contestada en todas las encuestas de


muestra es: "¿Cuántos participantes deben ser elegidos para una encuesta?" Sin
embargo, la respuesta no puede ser dada sin tener en cuenta los objetivos y
circunstancias de las investigaciones.

La elección del tamaño de la muestra depende de consideraciones no estadísticas


y estadísticas. Las consideraciones no estadísticas pueden incluir la disponibilidad
de los recursos, la mano de obra, el presupuesto, la ética y el marco de muestreo.
Las consideraciones estadísticas incluirán la precisión deseada de la estimación
de la prevalencia y la prevalencia esperada de los problemas oculares en niños en
edad escolar.

Para determinar el tamaño adecuado de las muestras es necesario seguir los tres
criterios:

1. Nivel de precisión

El nivel de precisión, también llamado error de muestreo, es el rango en donde se


estima que está el valor real de la población. Este rango se expresa en puntos
“2024, Año de Felipe Carrillo Puerto, Benemérito del Proletariado, Revolucionario y Defensor del
Mayab”
porcentuales. Por lo tanto, si un investigador descubre que el 70% de los
agricultores de la muestra han adoptado una tecnología recomendada con una
tasa de precisión de ± 5%, el investigador puede concluir que entre el 65% y el
75% de los agricultores de la población han adoptado la nueva tecnología.

2. Nivel de confianza

El intervalo de confianza es la medida estadística del número de veces de cada


100 que se espera que los resultados se encuentren dentro de un rango
específico.

Por ejemplo, un intervalo de confianza de 90% significa que los resultados de una
acción probablemente cubrirán las expectativas el 90% de las veces.

La idea básica descripta en el Teorema del límite central es que cuando una
población se muestrea muchas veces, el valor promedio de un atributo obtenido es
igual al valor real de la población. En otras palabras, si un intervalo de confianza
es del 95%, significa que 95 de 100 muestras tendrán el valor real de la población
dentro del rango de precisión.

3. Grado de variabilidad

Dependiendo de la población objetivo y los atributos a considerar, el grado


de variabilidad varía considerablemente. Cuanto más heterogénea sea una
población, mayor deberá ser el tamaño de la muestra para obtener un nivel óptimo
de precisión. Ten en cuenta que una proporción de 55% indica un nivel más alto
de variabilidad que un 10% o un 80%. Esto se debe a que 10% y 80% significa
que una gran mayoría no posee o posee el atributo en cuestión.

Existen muchos enfoques para determinar el tamaño de la muestra, incluyendo el


uso de un censo en el caso de poblaciones más pequeñas, el uso de tablas
publicadas, imitar un tamaño de muestra de estudios similares y aplicar fórmulas
para calcular un tamaño de la muestra.

Margen de error y nivel de confianza


“2024, Año de Felipe Carrillo Puerto, Benemérito del Proletariado, Revolucionario y Defensor del
Mayab”
El margen de error es el porcentaje de variación aceptable que existe en los
resultados de la investigación. Es la manera de aceptar que los datos no son
absolutamente exactos o precisos.

Generalmente las encuestas se basan en información obtenida de una muestra de


la población, es lógico que pueda ocurrir un error de muestreo.

Si el 90% de los encuestados respondió que “Sí”, mientras que el 10% no contestó
la encuesta, es un margen de error, podríamos decir “bueno”, a tener un 50-50 o
45-55.

Por lo regular el margen de error puede ser controlado eligiendo una muestra
aleatoria y aumentando el tamaño de la muestra, lamentablemente el presupuesto
puede llegar a ser un limitante.

Por lo regular el margen de error puede ser controlado eligiendo una muestra
aleatoria y aumentando el tamaño de la muestra, lamentablemente el presupuesto
puede llegar a ser un limitante.

Menor margen de error requiere un tamaño de muestra más grande. El


incrementar el tamaño de la muestra aumenta el nivel de confianza. ¿Qué nivel de
confianza se necesita? Las opciones típicas son 90%, 95%, o 99%.

Conoce los pasos para calcular el intervalo de confianza.

Cuando hacemos una investigación debemos tener cuidado con las decisiones
que tomamos en el camino; Hacer un plan de acción ayuda a resolver en gran
medida problemas que puedan surgir y a mantener el rumbo hacia tus objetivos.

En la elaboración de un plan de acción debes determinar el tamaño de la muestra


que usarás en la investigación. ¿Cómo calcular el tamaño de la muestra para una
encuesta? Es una decisión importante, no lo tomes a la ligera y asegúrate de
hacerlo bien, ya que de lo contrario puede influir negativamente en tus resultados.

Ejemplo de cómo calcular el tamaño de muestra finita


“2024, Año de Felipe Carrillo Puerto, Benemérito del Proletariado, Revolucionario y Defensor del
Mayab”
Es hora de aprender a determinar el tamaño de la muestra mediante un cálculo de
la misma.

n= Tamaño de muestra

N= Tamaño de población

Z= Parámetros estadísticos que depende del nivel de Confianza

e=Error de estimación máximo aceptado

p=probabilidad de que ocurra el evento estudiado

q=(1-p) =probabilidad de que no ocurra el evento estudiado

Tu nivel de confianza corresponde a una puntuación Z. Este es un valor constante


necesario para esta ecuación. Aquí están las puntuaciones Z para los niveles de
confianza más comunes:

90% - Puntuación Z = 1,645

95% - Puntuación Z = 1.96

99% - Puntuación Z = 2.576

Supongamos que nos piden calcular el tamaño para una población de 543.098
consumidores de una marca de bebidas energéticas, donde el investigador asigna
un nivel de confianza de 95% y un margen de error de 3%. Donde se desconoce la
probabilidad “p” del evento.

Basándonos en este ejemplo, y en nuestra fórmula, el "N" será 543.098, nuestro Z


será 1.96 (recuerda que el investigador asignó un nivel de confianza de 95%) y “e”
será de 3%. Y como nuestro ejemplo dice que se desconoce la probabilidad de
que ocurra el evento, se asigna un 50% a "p" y un 50% a "q".
“2024, Año de Felipe Carrillo Puerto, Benemérito del Proletariado, Revolucionario y Defensor del
Mayab”
El resultado de nuestro tamaño de muestra sería: 1065.2, y tendría que ser
redondeado pues estamos hablando de personas.

Ejemplo de cómo calcular el tamaño de muestra infinita

Si necesitas calcular el tamaño de muestra de una población desconocida, donde


el investigador necesite un nivel de confianza del 95%, un margen de error del 3%
y se desconoce la probabilidad “p” del evento que se está estudiando, sigue la
siguiente fórmula:

N=Tamaño de muestra buscado

N=Tamaño de la poblacion

Z=Parametros estadisticos que depende del nivel de confianza (NZ)

e= Error de estimación máximo aceptado

p= probabilidad de que ocurra el evento estudiado

q=(1-p) =probabilidad de que no ocurra el evento estudiado

Donde "Z" es el intervalo de confianza al cuadrado, en este caso se pide que sea
del 95%, lo que indica que sería 1,96 al cuadrado, y cómo no sabemos la
probabilidad de que ocurra el evento, "p" y "q" sería 50%. Entre el margen de error
al solicitado al cuadrado. El resultado sería 1067,11, que también lo debemos
redondear.

Para calcular el número de participantes que necesitas en tu próxima investigación


de manera más rápida y fácil te invitamos a usar nuestra calculadora de
muestra para que agilices este proceso.

MÉTODOS DE MUESTREO.
“2024, Año de Felipe Carrillo Puerto, Benemérito del Proletariado, Revolucionario y Defensor del
Mayab”
El muestreo es una técnica de selección de miembros individuales o de un
subconjunto de la población para hacer inferencias estadísticas a partir de ellos y
estimar las características de toda la población.

También es un método conveniente en cuanto al tiempo y eficaz en función de los


costos y, por lo tanto, constituye la base de cualquier diseño de investigación. Las
técnicas de muestreo pueden utilizarse en un programa informático de encuestas
de investigación para una derivación óptima.

Por ejemplo, si un fabricante de medicamentos desea investigar los efectos


secundarios adversos de un medicamento en la población del país, es casi
imposible llevar a cabo un estudio de investigación en el que participen todos.
Para ello, el investigador elige tener una muestra de personas de cada grupo
demográfico para luego investigar, dándole una retroalimentación indicativa sobre
el comportamiento del medicamento.

Existen dos métodos de muestreo: El muestreo probabilístico y el no


probabilístico:

Muestreo probabilístico: El muestreo probabilístico es una técnica de muestreo


en la que un investigador establece una selección de unos pocos criterios y elige
al azar a los miembros de una población. Todos los miembros tienen la misma
oportunidad de formar parte de la muestra con este parámetro de selección.

Muestreo no probabilístico: En el muestreo no probabilístico, el investigador


elige al azar a los miembros de la investigación. Este método de muestreo no es
un proceso de selección fijo o predefinido. Esto dificulta que todos los elementos
de una población tengan las mismas posibilidades de ser incluidos en una
muestra.

Muestreo probabilístico

La técnica del muestreo probabilístico consiste en seleccionar a los elementos de


la muestra de manera aleatoria, es decir, todos tienen la misma probabilidad de
ser elegidos.
“2024, Año de Felipe Carrillo Puerto, Benemérito del Proletariado, Revolucionario y Defensor del
Mayab”
Esta es una condición indispensable para que el muestreo se considere
probabilístico, todos los elementos de la población estadística deben poder ser
escogidos y, además, deben tener la misma posibilidad de ser seleccionados.

Muestreo aleatorio simple.

La técnica del muestreo aleatorio simple otorga a cada elemento de la población


estadística la misma probabilidad de ser incluido en la muestra del estudio. De
manera que los individuos de la muestra se seleccionan simplemente al azar, sin
utilizar ningún otro criterio.

Para simular al azar existen varios métodos, pero actualmente se suele hacer
mediante programas informáticos como el Excel, ya que permiten ahorrar mucho
tiempo.

Muestreo sistemático.

En el muestreo sistemático primero se selecciona un elemento de la población


aleatoriamente, y luego se seleccionan el resto de elementos de la muestra
utilizando un intervalo fijo.

De manera que en el muestreo sistemático, una vez hemos seleccionado al azar


el primer individuo de la muestra, tenemos que contar tantos números como el
intervalo deseado para coger el siguiente individuo de la muestra. Y vamos
repitiendo el mismo procedimiento sucesivamente hasta tener tantos individuos en
la muestra como el tamaño muestral que se quiere obtener.

Muestreo estratificado

En la técnica del muestreo estratificado primero se divide la población en estratos


(grupos) y luego se selecciona aleatoriamente unos individuos de cada estrato
para formar toda la muestra del estudio. Así que habrá como mínimo un integrante
de cada estrato en la muestra.
“2024, Año de Felipe Carrillo Puerto, Benemérito del Proletariado, Revolucionario y Defensor del
Mayab”
Los estratos deben ser grupos homogéneos, es decir, los individuos de un estrato
tienen unas características propias que los diferencian de los otros estratos. Por lo
tanto, un individuo solo puede estar en un único estrato.

Muestreo no probabilístico

En el muestreo no probabilístico se seleccionan a los individuos basándose en el


criterio subjetivo de los investigadores. Por lo tanto, en el muestreo no
probabilístico no todos los elementos de la población tienen la misma probabilidad
de ser escogidos para la muestra, ya que la selección no es aleatoria. Esta
característica distingue el muestreo no probabilístico del muestreo probabilístico.

B) DATOS AGRUPADOS Y NO AGRUPADOS.


 Datos agrupados

Los datos agrupados son aquellos que se han clasificado en categorías o clases,
tomando como criterio su frecuencia. Esto se hace con la finalidad de simplificar el
manejo de grandes cantidades de datos y establecer sus tendencias.

Una vez organizados en estas clases por sus frecuencias, los datos conforman
una distribución de frecuencias, de la cual se extrae información de utilidad a
través de sus características.

Características de la distribución de frecuencias

Frecuencia

Como hemos visto, la frecuencia es el número de veces que se repite un dato. Y


para facilitar los cálculos de las propiedades de la distribución, tales como la
media y la varianza, se definen las siguientes cantidades:

–Frecuencia acumulada: se obtiene sumando la frecuencia de una clase con la


frecuencia acumulada anterior. La primera de todas las frecuencias coincide con la
del intervalo en cuestión, y la última es el número total de datos.
“2024, Año de Felipe Carrillo Puerto, Benemérito del Proletariado, Revolucionario y Defensor del
Mayab”
–Frecuencia relativa: se calcula dividiendo la frecuencia absoluta de cada clase
entre el número total de datos. Y si se multiplica por 100 se tiene la frecuencia
relativa porcentual.

-Frecuencia relativa acumulada: es la suma de las frecuencias relativas de cada


clase con el acumulado anterior. La última de las frecuencias relativas acumuladas
debe ser igual a 1.

Para nuestro ejemplo, las frecuencias quedan así:

Estatura en cm frecuencia Frecuencia Frecuencia Frecuencia


relativa acumulada acumulada
relativa
155-159 6 0.06 6 0.06
160-164 14 0.014 20 0.2
165-169 14 0.47 67 0.67
170-174 47 0.28 95 0.95
175-179 5 0.05 100 1
N=100

 Datos no agrupados

En este artículo encontrarás qué son los datos no agrupados en estadística, un


ejercicio resuelto de datos no agrupados y, además, cuáles son las diferencias
entre los datos agrupados y los datos no agrupados.

¿Qué son los datos no agrupados?

En estadística, los datos no agrupados son aquellos datos que no se agrupan,


sino que se estudian por separado. Es decir, cuando los datos no están agrupados
se analiza cada valor del conjunto de datos individualmente.

En general, los datos se agrupan cuando la variable es continua o cuando


tenemos muchos valores para analizar. Por lo tanto, cuando los datos siguen una
variable discreta y no tenemos una cantidad de datos demasiado grande, no es
necesario agrupar los datos en intervalos.
“2024, Año de Felipe Carrillo Puerto, Benemérito del Proletariado, Revolucionario y Defensor del
Mayab”
Ejemplo de datos no agrupados

Una vez hemos visto la definición de datos no agrupados, pasamos ahora a


resolver un ejemplo con este tipo de datos estadísticos para entender mejor

5\ 4\ 7\ 9\ 10\ 6\ 7\ 4\ 8\ 3

6\ 9\ 8\ 5\ 6\ 4\ 6\ 2\ 4\ 7

En este caso se trata de una variable discreta porque solo puede haber números
enteros, por lo que no es necesario agrupar los datos en intervalos.

Por lo tanto, simplemente tenemos que contar las veces que aparece cada valor y
anotarlo en una tabla:

C) EJERCICIOS DE CASOS PRÁCTICOS DE DISTRIBUCIÓN DE


FRECUENCIAS

Concepto y los elementos de la distribución de frecuencias:

Cuando se realiza la definición de las muestras en una investigación, esta puede


ser aún muy grande y aplicar una encuesta puede determinar gran cantidad de
datos, que deben ser organizados para luego ser analizados.

Es importante tomar en consideración que, su construcción depende de variables


discretas o continuas, ya que el procedimiento varía de una a otra.
“2024, Año de Felipe Carrillo Puerto, Benemérito del Proletariado, Revolucionario y Defensor del
Mayab”
Adicionalmente, se requiere tomar las consideraciones necesarias para
categorizar los datos y así, de esta forma se contabilicen los datos que
correspondan a cada una de las categorías.

La distribución de frecuencias es también es conocido como tablas de frecuencia y


de acuerdo con Triola (2013) "Indica cómo un conjunto de datos se divide en
varias categorías (o clases) al alistar todas las categorías junto con el número de
calores de los datos que hay en cada una." (p. 47)

 Clase: Una clase o intervalo es un rango en el cual se distribuyen los datos


que te tienen características en común.
 Límites de clase: Existen dos tipos la primera es el límite inferior de la
clase y la segunda es el límite superior de la clase. Los límites de clase
inferiores son las cifras más pequeñas que pueden pertenecer a las
diferentes clases y los límites de clase superiores son las cifras más
grandes que pueden pertenecer a las diferentes clases.
 Amplitud: Corresponde a la resta entre el límite superior y el límite inferior.
Se recomienda que todos los anchos de clase sean iguales para que exista
una homogeneidad.
Valor m á x−Valor min
Ac =
N ° de clases
 Marca de clase: Son los puntos medios de las clases. Se calcula
realizando la suma entre el límite superior y el límite inferior, para luego
dividirla entre dos.
. +¿ L í minf .
M c =L í m ¿
2
 Frecuencias: Se realizan las tablas de frecuencia por las siguientes
razones:
a) Es posible resumir un conjunto de grandes datos. Resultando muy útil, puesto
que, si son estudios de grandes magnitudes, resulta un procedimiento muy
extenuante para el análisis posterior.
“2024, Año de Felipe Carrillo Puerto, Benemérito del Proletariado, Revolucionario y Defensor del
Mayab”
b) Se logra cierta comprensión sobre la naturaleza de los datos, es decir, al
realizar la tabla se logra comprender el comportamiento de los datos para
poder categorizarlos.
c) Se tiene una base para construir gráficas. Ya que a partir de esto se pueden
realizar gráficos de barras, de pasteles, histogramas, entre otros, que facilitan
el análisis. Cabe resaltar que los softwares estadísticos que realizan gráficas
con base en las tablas de frecuencias.
 Frecuencia absoluta: Corresponde a la cantidad de datos que cumplen
con la característica de la clase. Es decir, que se encuentran dentro del
intervalo de la clase o que son parte de la categoría. El principio básico de
la frecuencia absoluta corresponde a un simple conteo, por lo que requiere
de un análisis minucioso para no cometer errores. La suma de todas las
casillas en la columna de frecuencia absoluta debe ser igual al total de
personas en el estudio.
 Frecuencia relativa: Una frecuencia relativa es una proporción o un
porcentaje que representa que tan representativa es la frecuencia absoluta
con respecto al total de encuestados. El principio básico de una frecuencia
relativa corresponde al cálculo de la proporción o razón entre la frecuencia
absoluta y el total, tal y como se expresa en la siguiente fórmula:
frec .absoluta
FR=
total
 Frecuencia relativa porcentual: Ya si se desea calcular en porcentaje se
realiza:
frec .absoluta
FR= ∗100
¿ t al
Cabe resaltar que no hace falta colocar ambos cálculos en una sola tabla, por lo
que depende del investigador cual utilizar. La suma de todas las frecuencias
relativas debe ser 1, más por errores de redondeo puede ser ligeramente
menor. Si se tiene en porcentaje la suma debe ser 100%, con la misma
consideración.
“2024, Año de Felipe Carrillo Puerto, Benemérito del Proletariado, Revolucionario y Defensor del
Mayab”
 Frecuencia acumulada: "La frecuencia acumulada de una clase es la
suma de las frecuencias absolutas para esa clase y todas las clases
anteriores." (Triola, 2013, p. 49) Su mayor utilidad es verificar que todos los
datos se encuentran contemplados dentro de la tabla.
Ejercicio N° 1: Pulsaciones de hombres y mujeres
Los médicos utilizan el pulso cardiaco para evaluar la salud de los pacientes.
Cuando el pulso tiene una frecuencia demasiado baja o demasiado elevada, esto
podría indicar que existe algún problema médico, ya sea Infección o
deshidratación. Se realiza un estudio, con una muestra a conveniencia, con 40
hombres y 40 mujeres, de manera que se tomen el pulso en un minuto y se
recolectaron los siguientes datos.
Mujeres
76 72 88 60 72 68 80 64 68 68 80 76 68 72 96 72 68 72 64 80
64 80 76 76 76 80 104 88 60 76 72 72 88 80 60 72 88 88 124 64

Hombres
68 64 88 72 64 72 60 88 76 60 96 72 66 64 60 64 84 76 84 88
72 66 68 64 60 68 60 60 66 84 72 84 88 66 64 66 66 60 64 72

Con base en la tabla anterior se puede observar que los datos se encuentran en
una tabla, tal y como fueron recolectados, sin embargo, se puede realizar una
tabla de frecuencias, que permita resumir la información. Para ello se define
frecuencia como el número de elementos que cumplen la condición de la categoría
que se propone. Se presenta una tabla de frecuencia como ejemplo de esta.

Pulso Frecuencia
60-69 34
70-79 22
80-89 19
90-99 2
100-109 1
110-119 0
120-129 1
En la tabla se puede notar que las categorías serían las que se encuentran en la
columna de la izquierda (pulso). Y los datos que se encuentran en la columna de
“2024, Año de Felipe Carrillo Puerto, Benemérito del Proletariado, Revolucionario y Defensor del
Mayab”
la derecha corresponde a la cantidad de datos, en la tabla original, que cumplen la
condición de la categoría.

 Las clases serían: 60-69, 70-79, 80-89, 90-99, 100-109, 110-119, 120-129.
Una vez definidas los siguientes puntos se evidenciará el procedimiento para
calcularlas.
 Los límites inferiores serían: 60, 70, 80, 90, 100, 110, 120.
 Los límites superiores serían: 69, 79, 89,99, 109, 119, 129.
 Se tienen datos discretos, pues no se contabilizan 69,5 pulsaciones. Por lo
que, en las clases 60-69 y 70-79, entre los números 69 y 70 no se encontrará
un dato de los del estudio, por lo que estas serían las fronteras de la clase.
 El cálculo de la primera marca de clase estaría dado por:

69+60
M c= =64.5 , las siguientes serían: 74.5, 84.5, 94.5, 104.5, 114.5, 124.5.
2

 Se denota claramente que la anchura es: 69 − 60 = 9 y se le suma el 69 que


también cuenta dentro de la clase, por lo que el ancho es de 10.

Tabla de frecuencia:
Pulsaciones
60 - 69
70 - 79
80 - 89
90 - 99
100 - 109
110 - 119
120 - 129
Para completar la segunda columna de la tabla de frecuencias, llamada
frecuencia absoluta, se tiene:

Mujeres
76 72 88 60 72 68 80 64 68 68 80 76 68 72 96 72 68 72 64 80
64 80 76 76 76 80 104 88 60 76 72 72 88 80 60 72 88 88 124 64

Hombres
68 64 88 72 64 72 60 88 76 60 96 72 66 64 60 64 84 76 84 88
72 66 68 64 60 68 60 60 66 84 72 84 88 66 64 66 66 60 64 72
“2024, Año de Felipe Carrillo Puerto, Benemérito del Proletariado, Revolucionario y Defensor del
Mayab”
De 60 a 69 hay 35 datos De 100 a 109 hay 1 dato
De 70 a 79 hay 22 datos De 110 a 119 hay 0 datos
De 80 a 89 hay 19 datos De 120 a 129 hay 1 dato
De 90 a 99 hay 2 datos
De esta forma se tiene que la tabla de frecuencias se completa de la
siguiente manera:
Frecuencia
Pulsaciones
Absoluta
60 - 69 35
70 - 79 22
80 - 89 19
90 - 99 2
100 - 109 1
110 - 119 0
120 - 129 1
Total 80

Para determinar la tabla de frecuencia relativa, usamos la formula expresada


en la investigación:

frec .absoluta
FR=
total

Frecuencia Frecuencia
Pulsaciones
Absoluta Relativa
FR=35/80=0.4375
60 - 69 35
FR=22/80=0.275
70 - 79 22
FR=19/80=0.2375
80 - 89 19
FR=2/80=0.025
90 - 99 2
FR=1/80=0.0125
100 - 109 1
110 - 119 0 0
FR=1/80=0.0125
120 – 129 1
Total 80 1
“2024, Año de Felipe Carrillo Puerto, Benemérito del Proletariado, Revolucionario y Defensor del
Mayab”
Para determinar la tabla de frecuencia acumulada se registra de la siguiente
manera:

2 6
FR= =0.0953 FR= =0.2857
21 21

4 2
FR= =0.1904 FR= =0.0953
21 21

7
FR= =0.333
21

De esta forma se puede calcular la siguiente columna de la tabla de frecuencias.

Cantidad Frecuencia Frecuencia


de hijos Absoluta Relativa
0 2 0.0953
1 4 0.1904
2 7 0.3333
3 6 0.2857
4 2 0.0953
Total 21 1
Para ejemplificar se coloca la tabla con la frecuencia porcentual.

Cantidad Frecuencia Frecuencia


de hijos Absoluta Relativa
0 2 9.53
1 4 19.04
2 7 33.33
3 6 28.57
4 2 9.53
Total 21 100%
Se procede a realizar el cálculo de la frecuencia acumulada, que corresponde a la
suma de la frecuencia absoluta de cada categoría y las anteriores.

4+2=6

2+4+7=13

1+4+7+6=19
“2024, Año de Felipe Carrillo Puerto, Benemérito del Proletariado, Revolucionario y Defensor del
Mayab”
1+4+7+6+2=21

Cantidad Frecuencia Frecuencia Frecuencia


de hijos Absoluta Relativa Acumulada
0 2 0.0953 2
1 4 0.1904 6
2 7 0.3333 13
3 6 0.2857 19
4 2 0.0953 21
Total 21 1

Ejercicio N° 3: Salario de trabajadores


Se realiza un estudio con 40 trabajadores de una empresa, con respecto al salario
recibido por semana. Los datos se presentan en la siguiente tabla (los datos están
en miles de colones.)

90 62 102 85 92 106 110 95 105 112

108 86 110 68 118 99 98 74 91 80

80 100 79 93 93 104 77 106 98 73

95 85 91 83 67 119 108 115 74 88

Con los datos propuestos, obtendremos una tabla de frecuencia:

Claramente el estudio trabaja con variable continua, por lo que se iniciará con la
construcción de las clases, por medio de los pasos detallados.

I. Se decide trabajar con 6 clases.

II. Se realiza el cálculo del ancho de la clase, para ello se Identifica el dato
mínimo y el dato máximo.

𝑚𝑖𝑛 = 62 y 𝑚𝑎𝑥 = 119

Ahora se aplica la fórmula.


“2024, Año de Felipe Carrillo Puerto, Benemérito del Proletariado, Revolucionario y Defensor del
Mayab”
119−62
Ac = =9.5 ≈ 10
6

Por lo que el ancho de clase será de 10.

III. Ahora se realiza la escogencia del límite inferior de la clase, para ello tomamos
en consideración al 𝑚𝑖𝑛 = 62, por lo que se elige como límite inferior al 60.
IV. Al límite Inferior se le aplica el ancho de clase para ver los demás límites en las
otras clases.

60+10=70 90+10=100

70+10=80 100+10=110

80+10=90

En ese punto nos detenemos, pues 𝑚á𝑥 = 119

V. Realizamos la construcción de las clases, para este caso se utilizarán


intervalos.

Salarios por semana


[60, 70[
[70, 80[
[80, 90[
[90, 100[
[100, 110[
[110,120[
Ahora se procede con el conteo de elementos por cada una de las clases, es
decir, la frecuencia absoluta.
Salarios Frecuencia
por semana Absoluta
[60, 70[ 3
[70, 80[ 5
[80, 90[ 7
[90, 100[ 11
[100, 110[ 8
[110,120[ 6
Total 40
“2024, Año de Felipe Carrillo Puerto, Benemérito del Proletariado, Revolucionario y Defensor del
Mayab”

Después de realizado el conteo de la frecuencia absoluta, se realiza el cálculo de


la frecuencia relativa, siendo esta la división entre la frecuencia absoluta.

3 7 8
FR= =0.075 FR= =0.175 FR= =0.2
40 40 40

5 11 6
FR= =0.125 FR= =0.275 FR= =0.15
40 40 40

Así, completando la tabla de frecuencias se tiene lo siguiente:

Salarios Frecuencia Frecuencia


por semana Absoluta Relativa
[60, 70[ 3 0.075
[70, 80[ 5 0.125
[80, 90[ 7 0.175
[90, 100[ 11 0.275
[100, 110[ 8 0.200
[110,120[ 6 0.150
Total 40 1
se realiza el cálculo de la frecuencia acumulada.

3+5=8

3+5+7=15

3+5+7+11=26

3+5+7+11+8=34

3+5+7+11+8+6=40

Se debe recordar que la frecuencia acumulada debe dar por resultado final, la
cantidad total de personas en el estudio.

Se presenta la tabla final y corresponde a la solución final del ejemplo.


“2024, Año de Felipe Carrillo Puerto, Benemérito del Proletariado, Revolucionario y Defensor del
Mayab”
Salarios Frecuencia Frecuencia Frecuencia
por semana Absoluta Relativa Acumulada
[60, 70[ 3 0.075 3
[70, 80[ 5 0.125 8
[80, 90[ 7 0.175 15
[90, 100[ 11 0.275 26
[100, 110[ 8 0.200 34
[110,120[ 6 0.150 40
Total 40 1

Ejercicio N° 4: Plantas atacadas por hongos


Se visitaron 25 empresas citrícolas de una cierta zona y en cada una se anotó la
cantidad de plantas atacadas por un cierto hongo, de lo cual resultaron los
siguientes datos:

15 20 25 15 18
16 17 18 20 18
18 18 19 16 17
19 16 17 17 17
19 18 19 18 15
a) ¿Qué tipo de datos son estos?

Como la variable son la cantidad de plantas atacadas por un hongo, se tiene que
la variable es de tipo discreta.

b) Construya una tabla de frecuencias correspondiente a este ejercicio.

Se realizan las catearías, al ser pocos datos, no tiene sentido hacer clases por lo
que serán 15, 16, 17, 18, 19, 20 y 25. Se calculará la frecuencia absoluta.

Cantidad Frecuencia
Plantas Absoluta
15 3
16 3
17 5
18 7
19 4
20 2
“2024, Año de Felipe Carrillo Puerto, Benemérito del Proletariado, Revolucionario y Defensor del
Mayab”
25 1
Total 25
Después se calcula la frecuencia relativa, en cada una.

3 7 1
FR= =0.12 FR= =0.28 FR= =0.04
25 25 25

3 4
FR= =0.12 FR= =0.14
25 25

5 2
FR= =0.20 FR= =0.08
25 25

De esta forma, la tabla con la frecuencia relativa quedaría de la siguiente forma:

Cantidad Frecuencia Frecuencia


Plantas Absoluta Relativa
15 3 0.12
16 3 0.12
17 5 0.20
18 7 0.28
19 4 0.14
20 2 0.08
25 1 0.04
Total 25 1

Por último, la tabla de la frecuencia cumulada queda de la siguiente forma:

Cantidad Frecuencia Frecuencia Frecuencia


Plantas Absoluta Relativa Acumulada
15 3 0,12 3
16 3 0,12 6
17 5 0,20 11
18 7 0,28 18
19 4 0,14 22
20 2 0,08 224
25 1 0,04 25
Total 25 1

Ejercicio N° 5: Licencias por enfermedad


“2024, Año de Felipe Carrillo Puerto, Benemérito del Proletariado, Revolucionario y Defensor del
Mayab”
El gerente de personal de una compañía registró el número de días que sus 50
empleados habían tomado como licencia por enfermedad.

10 35 12 8 44 6 15 20 5 7
5 11 17 8 4 7 25 9 2 10
12 12 3 10 9 3 5 16 31 9
0 4 7 11 3 18 2 10 6 22
2 9 8 29 6 4 7 10 0 1

a) Identificar la variable y su clasificación.

La variable es la cantidad de días por licencia de enfermedad y su clasificación es


discreta.

b) Construir una tabla de frecuencia apropiada a estos datos.

Se realizan las categorías, al ser muchos datos, se realizarán intervalos.

 Valor mínimo: 0
 Valor máximo: 44
 Número de clases: 3
44−0
 Ancho de clase: Ac = =14.66 ≈ 15
3
 Los intervalos serán:

Intervalos
0 - 15
16 - 30
31 - 45
Seguidamente se calculará la frecuencia absoluta.

Cantidad de días por Frecuencia


licencia de enfermedad Absoluta
0 – 15 40
16 – 30 7
31 – 45 3
“2024, Año de Felipe Carrillo Puerto, Benemérito del Proletariado, Revolucionario y Defensor del
Mayab”
Total 50
Después se calcula la frecuencia relativa, en cada una.

40 7 3
FR= =0.80 FR= =0.14 FR= =0.06
50 50 50

De esta forma, la tabla con la frecuencia relativa quedaría de la siguiente forma:

Cantidad de días por licencia Frecuencia Frecuencia


de enfermedad Absoluta Relativa
0 – 15 40 0.80
16 – 30 7 0.14
31 – 45 3 0.06
Total 50 1

Por último, la frecuencia acumulada:

40

40 + 7 = 47

40 + 7 + 3 = 50

De esta forma quedaría la tabla de frecuencia completa.

Cantidad de días por Frecuencia Frecuencia Frecuencia


licencia de enfermedad Absoluta Relativa Acumulada
0 – 15 40 0.80 40
16 – 30 7 0.14 47
31 – 45 3 0.06 50
Total 50 1

D) INVESTIGAR Y REALIZAR UN EJEMPLO PRÁCTICO DE CADA UNA DE


LAS SIGUIENTES GRÁFICAS:
 Histograma: Un histograma se obtiene construyendo sobre unos ejes
cartesianos rectángulos cuyas áreas son proporcionales a las frecuencias
de cada intervalo.
“2024, Año de Felipe Carrillo Puerto, Benemérito del Proletariado, Revolucionario y Defensor del
Mayab”
Sobre el eje de abscisas se representan dos intervalos, el anterior al
primero y el posterior al último, que no tienen valores en ellos.
Ejemplo práctico: Para este caso, usaremos de ejemplo las tablas de
frecuencias como es el caso del ejercicio número 3, la cual nos habla sobre
el salario de los trabajadores y de acuerdo a su tabla de frecuencias
tenemos que:
Salarios Frecuencia Frecuencia Frecuencia
por semana Absoluta Relativa Acumulada
[60, 70[ 3 0.075 3
[70, 80[ 5 0.125 8
[80, 90[ 7 0.175 15
[90, 100[ 11 0.275 26
[100, 110[ 8 0.200 34
[110,120[ 6 0.150 40
Total 40 1
Para obtener con determinación el histograma, procedemos a modificar la
tabla con los respectivos datos:

Clase/Salario Frecuencia Marca de Frecuencia


por semana absoluta(fi) clase(Xi) acumulada(Fi)
[60-70) 3 100 3
[70-80) 5 110 8
[80-90) 7 130 15
[90-100) 11 145 26
[100-110) 8 160 34
[110-120) 6 175 40
Y posteriormente obtenemos nuestro histograma:
“2024, Año de Felipe Carrillo Puerto, Benemérito del Proletariado, Revolucionario y Defensor del
Mayab”

Histograma de frecuencias
12

10

0
100 110 130 145 160 175

Polígono de frecuencias: Otra forma de representar los datos es el polígono


de frecuencias, que es la poligonal que resulta de unir, con segmentos, los
puntos medios de las bases superiores de los rectángulos de un histograma
de frecuencias. Además, completaremos la poligonal, uniendo los puntos
medios del intervalo anterior al primero de nuestra muestra y posterior al
último de nuestra muestra.
Ejemplo práctico: De la actividad anterior del histograma, se realiza la
grafica con los mismos datos obtenidos de la tabla de frecuencias,
quedando así nuestro polígono de frecuencias:

 Histograma y polígono de frecuencia


12
Ojiva:
10

0
100 110 130 145 160 175

Llamamos ojiva al polígono de frecuencias acumuladas. Se obtiene uniendo


“2024, Año de Felipe Carrillo Puerto, Benemérito del Proletariado, Revolucionario y Defensor del
Mayab”
con segmentos los puntos cuyas coordenadas son: la abscisa
correspondiente al extremo superior de cada clase y la ordenada
correspondiente a la frecuencia acumulada (relativa o absoluta) hasta dicha
clase.
Ejemplo práctico: De acuerdo a la tabla de frecuencia usada para el
histograma, se toman los mismos datos de los que se está hablando, en
este caso se está hablando sobre los salarios de los trabajadores por
semanas quedando nuestra gráfica de ojiva de la siguiente manera:

Salario de los trabajadores


45

40
35
Frecuencia acumulada

30
25
20
15
10
5
0
[6 0 -7 0 ) [7 0 -8 0 ) [8 0 -9 0 ) [9 0 -1 0 0 ) [1 0 0 -1 1 0 ) [1 1 0 -1 2 0 )
Salario por semana

Pareto: Una variante importante de los diagramas de barras es el diagrama de


Pareto. Este diagrama tiene un uso muy amplio, sobre todo, por su valor
para realizar comparaciones.
Las categorías están ordenadas de modo tal que en la parte izquierda
aparezca la categoría con mayor frecuencia, seguida por la segunda mayor
frecuencia y así, sucesivamente. Este tipo de diagramas debe su nombre al
economista italiano V. Pareto.
Ejemplo práctico: En un estudio realizado por el Instituto del hierro y el
acero de Estados Unidos durante el año 1992, se analizó las cantidades (en
“2024, Año de Felipe Carrillo Puerto, Benemérito del Proletariado, Revolucionario y Defensor del
Mayab”
miles de toneladas) de importaciones de acero, en distintos países como se
muestra en la siguiente tabla:
Países Frecuencia simple Frecuencia simple Frecuencia simple
xi absoluta relativa relativa porcentual
fi fri fri %
Bélgica y Luxemburgo 1247 0,3041 30,41 %
Japón 1072 0,2615 26,15 %
Alemania 460 0,1122 11,22 %
Canadá 367 0,0895 8,95 %
Francia 299 0,0729 7,29 %
Reino Unido 250 0,0610 6,10 %
Otros 405 0,0988 9,88 %
n = 4100 1,0000 100,00 %

Representar mediante un diagrama de barras (Pareto) las principales


fuentes de importaciones de acero en Estados Unidos durante 1992.

Principales fuentes de importaciones de acero en Estados Unidos durante 1992


1400
12 4 7

1200 10 7 2
(en miles de toneladas)

1000
Cantidad de acero

800
460
405
36 7
400 29 9
250
600

200

Reino Unido
Alemania
Luxemburgo

Canadá

Francia
Otros
Bélgica y

Japón

P aíses
 Pastel: También conocido como gráficos de sectores, se utilizan para
representar variables cualitativas, indicando la proporción en que cada uno
de sus valores se presenta.
Ejemplo práctico: De acuerdo a la tabla anterior que habla sobre la
importación de acero en Estados Unidos de otros países en el año 1992,
podemos obtener los mismos datos con una nueva gráfica, que es la gráfica
de los pasteles, teniendo así dicha grafica de la siguiente manera:
Principales fuentes de importaciones de acero en Estados Unidos durante 1992

10%

6% Bélgica y Luxemburgo
31%
Japón

7%
Alemania
“2024, Año de Felipe Carrillo Puerto, Benemérito del Proletariado, Revolucionario y Defensor del
Mayab”
 Tallo y hoja: El gráfico de tronco y hojas (también llamado gráfico de
tallo y hojas) fue descrito por Tukey.
Para realizar este gráfico, basta seguir los siguientes pasos:
 Primero se ordenan los datos de menor a mayor.
 Se apartan uno o más dígitos de cada dato, según el número de filas
que se desea obtener, en general no más de 15, empezando por la
izquierda. Cada valor diferente de estos dígitos apartados, se lista uno
debajo del otro, trazando a la derecha de los mismos una línea vertical.
Éste es el tronco.
 Para cada dato original se busca la línea en la que aparece su ‘tronco’.
Los dígitos que nos quedaban los vamos escribiendo en la fila
correspondiente de forma ordenada.
Ejemplo práctico: Se desea analizar cuánto demora un procesador X en guardar
un archivo de cierto tamaño. Los tiempos, en segundos, que se recopilaron fueron
veinticinco y están dados en la siguiente tabla:
0,8 2,2 0,7 2,6 3,9
2,4 1,2 0,2 0,5 1,2
1,4 3,7 0,4 0,9 1,2
2,1 1,9 0,5 3,8 0,7
1,6 1,4 2,6 0,9 1,5
Entonces, los pasos a seguir son los siguientes:
1. Los datos ordenados de menor a mayor son:
0,2 0,4 0,5 0,5 0,7
0,7 0,8 0,9 0,9 1,2
1,2 1,2 1,4 1,4 1,5
1,6 1,9 2,1 2,2 2,4
2,6 2,6 3,7 3,8 3,9
2. Observamos que la parte entera de los números son: 0, 1, 2 y 3. Esto nos
permite dividir cada número en tronco (la parte entera) y hojas (la parte
decimal). Luego, listamos los números que son troncos de arriba abajo y
dibujamos una línea vertical.
“2024, Año de Felipe Carrillo Puerto, Benemérito del Proletariado, Revolucionario y Defensor del
Mayab”

0,2 0,4 0,5 0,5 0,7


0,7 0,8 0,9 0,9 1,2
1,2 1,2 1,4 1,4 1,5
1,6 1,9 2,1 2,2 2,4
2,6 2,6 3,7 3,8 3,9
0
1
2
3

3. A continuación, para cada dato original, vamos escribiendo, ordenadamente,


en el renglón correspondiente al tronco (parte entera), cada una de las hojas
(parte decimal). Si alguno se repite, se escribe tantas veces como aparezca.
Completando así el gráfico de tronco y hojas.
4. Si desea se puede completar el diagrama de tronco y hojas con columnas que
indiquen la cantidad de valores que se presentan en cada tronco.
Troncos Hojas Frecuencia Frecuencia relativa
0 2 4 5 5 7 7 8 9 9 9 0.36
1 2 2 2 4 4 5 6 9 8 0.32
2 1 2 4 6 6 5 0.20
3 7 8 9 3 0.12
n = 25 1.00

 Barras: Los gráficos más usuales para variables cualitativas son los
gráficos de barras, que pueden ser verticales u horizontales.
Ejercicio práctico: De acuerdo al ejercicio de las importaciones de acero
en Estados Unidos por diferentes países, podemos sacar de igual manera
las tablas de frecuencia con las gráficas de barras verticales u horizontales,
quedando de la siguiente manera: En un estudio realizado por el Instituto
del hierro y el acero de Estados Unidos durante el año 1992, se analizó las
cantidades (en miles de toneladas) de importaciones de acero, en distintos
países como se muestra en la siguiente tabla:
Países Frecuencia simple Frecuencia simple Frecuencia simple
xi absoluta relativa relativa porcentual
fi fri fri %
“2024, Año de Felipe Carrillo Puerto, Benemérito del Proletariado, Revolucionario y Defensor del
Mayab”
Bélgica y Luxemburgo 1247 0,3041 30,41 %
Japón 1072 0,2615 26,15 %
Alemania 460 0,1122 11,22 %
Canadá 367 0,0895 8,95 %
Francia 299 0,0729 7,29 %
Reino Unido 250 0,0610 6,10 %
Otros 405 0,0988 9,88 %
n = 4100 1,0000 100,00 %
Mediante los datos de la tabla, se obtienen las gráficas de barras
horizontales como se muestran a continuación:

Principales fuentes de importaciones de acero en Estados Unidos durante 1992


E) REALIZAROt ros
2 CASOS PRÁCTICOS
40 5
DE MEDIDAS DE TENDENCIA
R ein o U n id o 25 0

Fra n c ia 29 9

Ca n a d á 36 7

A lem a n ia 46 0

10 7 2

Bé lg ic a y L u xem b u rg o 12 4 7

0 2 00 40 0 600 800 1000 1 2 00 1 4 00


C an tid ad d e acero

( en m iles de toneladas)

CENTRAL, LOCALIZACIÓN Y DISPERSIÓN.


Las medidas de tendencia central suelen llamarse promedios, y son el ‘valor típico’
en el sentido de que se emplea a veces para representar todos los valores
individuales de un conjunto de datos. Es decir, las medidas de tendencia central
dan un valor típico o representativo de un conjunto de datos.

La tendencia central de un conjunto de datos es la disposición de éstos para


agruparse ya sea alrededor del centro o de ciertos valores numéricos.

Hay varias medidas de tendencia central, con propiedades particulares que las
hacen ‘típicas’ en alguna forma única.

Las más frecuentemente utilizadas son la media aritmética, la mediana y la moda.

Media Aritmética

 La media aritmética de las observaciones x 1, x2, ..., xn es el promedio


aritmético de éstas.
“2024, Año de Felipe Carrillo Puerto, Benemérito del Proletariado, Revolucionario y Defensor del
Mayab”
 La media aritmética es el valor que tomaría la variable si estuviera
uniformemente repartida entre todos los individuos que forman la muestra
(corresponde al concepto de centro de gravedad en Física).

 La media aritmética considera todos los datos. Sin embargo, debido a que
todas las observaciones se emplean para el cálculo, el valor de la media
puede afectarse de manera desproporcionada por la existencia de valores
extremos.

 Cuando usemos el término media, nos referimos a la media aritmética.

Mediana

La mediana es, como su nombre lo indica, el valor medio o valor central de un
conjunto de observaciones.

Cuando todas las observaciones se ordenan en forma creciente, la mitad de


éstas es menor que este valor y la otra mitad es mayor.

Si el número de observaciones, n es impar, la mediana es el valor de la


observación que se encuentra a la mitad del conjunto ordenado. Si n es impar la
mediana es el valor de la observación que ocupa el lugar (n+1)/2.

Si el número de observaciones, n es par se considera la mediana como el


promedio aritmético, de los valores de las observaciones que ocupan los lugares
n/2 y (n+2)/2 del conjunto ordenado.

Por ejemplo:

En el conjunto de datos: 5, 3, 8, 2, 7, deberíamos ordenar los datos, o sea, 2, 3, 5,


7, 8, y observar cuál es el valor que está en el medio. Luego, diremos que 5 es la
mediana de este conjunto de datos.

En el conjunto de datos: 5, 7, 8, 1, deberíamos ordenar los datos, o sea, 1, 5, 7, 8,


y observar cuál es el valor que está en el medio. Pero no hay un único valor
central porque hay un número par de elementos, entonces, diremos que la
“2024, Año de Felipe Carrillo Puerto, Benemérito del Proletariado, Revolucionario y Defensor del
Mayab”
mediana es el valor promedio entre los dos valores centrales, es decir, entre 5 y 7.
Luego, 6 es la mediana de este conjunto de datos.

En el cálculo de la mediana la existencia de valores extremos no afecta su valor.

Modo, Moda o Valor Modal

 La moda, modo o valor modal de un conjunto de observaciones es el valor


de las observaciones que ocurre con mayor frecuencia en el conjunto.

 El modo es la única medida de tendencia central que puede ser calculada


para variables cualitativas nominales.

 El valor de la moda no se ve afectada por la existencia de valores


extremos.

 Puede suceder que en una serie de datos haya más de una moda. En tal
caso se denomina bimodal, trimodal o multimodal, según el número de
modas que presente.

Ejercicio 1.- Tratamientos de datos agrupados:

Las siguientes son las alturas, en centímetros, de sesenta alumnos universitarios:

150 160 161 160 160 172 162 160 172 151
161 172 160 169 169 176 160 173 184 172
160 170 153 167 167 175 166 173 169 178
170 179 175 174 160 174 149 162 161 168
170 173 156 159 154 156 160 166 170 169
163 168 171 178 179 164 176 163 182 162
“2024, Año de Felipe Carrillo Puerto, Benemérito del Proletariado, Revolucionario y Defensor del
Mayab”
∑ xi−fi
Media aritmética: X = i
n

Datos individuales:

xi fi Fi 168 2 32
149 1 1 169 4 36
150 1 2 170 4 40
151 1 3 171 1 41
153 1 4 172 4 45
154 1 5 173 3 48
156 2 7 174 2 50
159 1 8 175 2 52
160 9 17 176 2 54
161 3 20 178 2 56
162 3 23 179 2 58
163 2 25 182 1 59
164 1 26 184 1 60
166 2 28 n=60
167 2 30

Media Aritmética.

∑ xi−fi 149.1+ …+166.2+…+184.1 9990


i
x= = = =166.55 cm
n 60 60

Mediana.

La mediana es el valor promedio entre 167 cm y 168 cm:

x=167.50 cm

Moda.

El cálculo de la oda para datos individuales es sencillo, basta con buscar el valor
de la variable que presente la máxima frecuencia absoluta (fi).

Mo=160
“2024, Año de Felipe Carrillo Puerto, Benemérito del Proletariado, Revolucionario y Defensor del
Mayab”

Ejemplo 2.-

De la producción diaria de una máquina se eligió una muestra de 100 baterías que
se probaron para ver cuánto tiempo operarían en una lámpara medida en horas y
los resultados fueron los siguientes.

28 14 30 47 33 21 17 22 31 20
36 16 13 22 34 27 11 17 43 41
31 39 48 40 41 11 20 23 27 29
12 12 32 43 35 31 40 31 17 29
17 14 19 23 46 40 27 28 31 35
20 17 39 42 41 50 30 17 46 31
11 33 36 37 19 17 22 36 47 17
49 16 37 43 42 41 22 17 19 20
35 17 25 36 39 30 40 36 36 38
23 23 13 16 46 40 22 23 21 39
El número de intervalos es igual a la raíz cuadrada de todos los datos (frecuencias
de datos agrupados).

√100 = 10

Recuerda que si el resultado es un número no exacto se debe de aproximar.

Hallamos el tamaño del intervalo Frecuencias de datos agrupados

Tamaño del intervalo = 50 – 11

10

Tamaño del Intervalo = 39 = 3,9 Como el resultado es un número decimal 10


debemos de aproximar.

Por lo tanto, el tamaño del intervalo es de 4.


“2024, Año de Felipe Carrillo Puerto, Benemérito del Proletariado, Revolucionario y Defensor del
Mayab”
A partir del dato menor comenzamos a sumar el tamaño del intervalo, es decir
11+4=15; 15+4=19; 19+4=23; y así sucesivamente hasta tener la cantidad de
intervalos, en este caso 10.

Intervalo (Horas)
11-15
15-19
19-23
23-27
27-31
31-35
35-39
39-43
43-47
47-51
TOTAL

Hallamos la frecuencia absoluta (ni) contando cuantas veces se repiten los


números para cada intervalo.

Interv Frecuen
alo cia
(Hora Absolut
s) a (ni)
11-15 9
15-19 16
19-23 16
23-27 4
27-31 13
31-35 7
35-39 13
39-43 14
43-47 5
47-51 3
TOTA 100
L

Hallamos la frecuencia relativa fi, dividiendo cada una de las frecuencias absolutas
entre el total de datos.

Int Frec Frec


“2024, Año de Felipe Carrillo Puerto, Benemérito del Proletariado, Revolucionario y Defensor del
Mayab”
erv uen uen
alo cia cia
(H Abs Rela
ora olut tiva
s) a (fi)
(ni)
11- 9 0,09
15
15- 16 0,16
19
19- 16 0,16
23
23- 4 0,04
27
27- 13 0,13
31
31- 7 0,07
35
35- 13 0,13
39
39- 14 0,14
43
43- 5 0,05
47

Hallamos el porcentaje multiplicando la frecuencia relativa por 100.

I Fr Fr P
n ec ec or
t ue ue ce
e nc nc nt
r ia ia aj
v A Re e
al bs lat %
o ol iv
( ut a
H a (fi)
o (ni
r )
a
s
)
1 9 0,0 9
1- 9
1
5
“2024, Año de Felipe Carrillo Puerto, Benemérito del Proletariado, Revolucionario y Defensor del
Mayab”
1 16 0,1 16
5- 6
1
9
1 16 0,1 16
9- 6
2
3
2 4 0,0 4
3- 4
2
7
2 13 0,1 13
7- 3
3
1
3 7 0,0 7
1- 7
3
5
3 13 0,1 13
5- 3
3
9
3 14 0,1 14
9- 4
4
3
4 5 0,0 5
3- 5
4
7
4 3 0,0 3
7- 3
5
1
T 10 1 10
O 0 0
T %
A
L

Hallamos la marca de clase Mi, sacando el promedio de cada uno de los


intervalos, es decir, sumando los dos intervalos y luego dividiéndolos entre dos.

I F F P M
n re re o a
“2024, Año de Felipe Carrillo Puerto, Benemérito del Proletariado, Revolucionario y Defensor del
Mayab”
t c c r r
e u u c c
r e e e a
v n n n
a ci ci ta d
l a a je e
o A R %
b el C
( s at l
H ol iv a
o ut a s
r a (fi e
a (n )
s i) (
) M
i
)
1 9 0, 9 1
1 0 3
- 9
1
5
1 1 0, 1 1
5 6 1 6 7
- 6
1
9
1 1 0, 1 2
9 6 1 6 1
- 6
2
3
2 4 0, 4 2
3 0 5
- 4
2
7
2 1 0, 1 2
7 3 1 3 9
- 3
3
1
3 7 0, 7 3
1 0 3
- 7
3
“2024, Año de Felipe Carrillo Puerto, Benemérito del Proletariado, Revolucionario y Defensor del
Mayab”
5
3 1 0, 1 3
5 3 1 3 7
- 3
3
9
3 1 0, 1 4
9 4 1 4 1
- 4
4
3
4 5 0, 5 4
3 0 5
- 5
4
7
4 3 0, 3 4
7 0 9
- 3
5
1
T 1 1 1
O 0 0
T 0 0
A %
L

Multiplicamos la frecuencia absoluta por la marca de clase (ni*Mi), este dato es


necesario para luego hallar las medidas de tendencia central.

I F F P MF
n r r o a r
t e e r r e
e c c c c c
r u u e a u
v e e n e
a n n t d n
l c c a e c
o i i j i
a a e Ca
( A R % l A
H b e a b
o s l s s
“2024, Año de Felipe Carrillo Puerto, Benemérito del Proletariado, Revolucionario y Defensor del
Mayab”
r o a e o
a l ti l
s u v ( u
) t a Mt
a (f i a
( i) ) p
n o
i) r
M
a
r
c
a
d
e
c
l
a
s
e
(
n
i*
M
i)
1 9 0 9 1 1
1 , 3 1
- 0 7
1 9
5
1 1 0 1 1 2
5 6 , 6 7 7
- 1 2
1 6
9
1 1 0 1 2 3
9 6 , 6 1 3
- 1 6
2 6
3
2 4 0 4 2 1
3 , 5 0
- 0 0
2 4
7
2 1 0 1 2 3
7 3 , 3 9 7
“2024, Año de Felipe Carrillo Puerto, Benemérito del Proletariado, Revolucionario y Defensor del
Mayab”
- 1 7
3 3
1
3 7 0 7 3 2
1 , 3 3
- 0 1
3 7
5
3 1 0 1 3 4
5 3 , 3 7 8
- 1 1
3 3
9
3 1 0 1 4 5
9 4 , 4 1 7
- 1 4
4 4
3
4 5 0 5 4 2
3 , 5 2
- 0 5
4 5
7
4 3 0 5 4 1
7 , 9 4
- 0 7
5 3
1
T 1 1 1 2
O 0 0 8
T 0 0 6
A % 0
L

Por último, para terminar nuestra tabla hallamos la frecuencia absoluta acumulada
que es el primer dato e irle sumando sucesivamente cada dato de la frecuencia
absoluta ni.

Interva Frecuenc Frecuenc Porcenta Marc Frecuenc Frecuenc


lo ia ia je % a de ia ia
(Horas Absoluta Relativa Clas Absoluta Absoluta
) (ni) (fi) e por Acumula
(Mi) Marca de da (Ni)
clase
(ni*Mi)
“2024, Año de Felipe Carrillo Puerto, Benemérito del Proletariado, Revolucionario y Defensor del
Mayab”
11-15 9 0,09 9 13 117 9
15-19 16 0,16 16 17 272 25
19-23 16 0,16 16 21 336 41
23-27 4 0,04 4 25 100 45
27-31 13 0,13 13 29 377 58
31-35 7 0,07 7 33 231 65
35-39 13 0,13 13 37 481 78
39-43 14 0,14 14 41 574 92
43-47 5 0,05 5 45 225 97
47-51 3 0,03 3 49 147 100
TOTAL 100 1 100% 2860
Para hallar las medidas de tendencia central vamos a realiza los siguientes
procedimientos:

Moda:

( ¿−( ¿−1 ) )∗ai


Mo=Li+
( ¿−( ¿−1 ) ) + ( ¿−( ¿+1 ) )

( 16−9 )∗4
Mo=15+
( 16−9 ) +(16−16)

7∗4
Mo=15+
7+0

28
Mo=15+
7

Mo=15+ 4

Mo=1 9

Media aritmética:

2860
x=
100

x=28.6 0

Mediana o valor central:

N
−( ¿−1 )∗ai
2
Me=Li+
¿
“2024, Año de Felipe Carrillo Puerto, Benemérito del Proletariado, Revolucionario y Defensor del
Mayab”
100
−45∗4
2
Me=27+
13

50−45∗4
Me=27+
13

5∗4
Me=27+
13

20
Me=27+
13

Me=27+ 1.53

Me=28.5 3

Ejemplo 1.- Localización

A modo de ejemplo, calcularemos el primer cuartil (Q1), el octavo decil (D8) y el


percentil 43 (P43) en el ejemplo de las estaturas de los estudiantes universitarios.

Primer cuartil (Q1)

La posición del primer cuartil es ºQ1 = 1.(n+1)/4 = 1.(60+1)/4 = 15,25º


“2024, Año de Felipe Carrillo Puerto, Benemérito del Proletariado, Revolucionario y Defensor del
Mayab”
Como el valor 15,25 no existe, se realiza interpolación lineal entre los valores
correspondientes a las posiciones 15º y 16º:

Posición Valor
15º  160
0,25 15,25º  Q1 x
1 16º  160 0

Interpretación: Significa que el 25% de las estaturas de los estudiantes


universitarios observados son inferiores o iguales a 160 cm y el 75% restante son
mayores o iguales a 160 cm.

Octavo decil (D8)

La posición del octavo decil es ºD8 = 8.(n+1)/10 = 8.(60+1)/10 = 48,8º

Como el valor 48,8 no existe, se realiza la interpolación lineal entre los valores
correspondientes a las posiciones 48º y 49º:

Luego, el octavo decil toma el valor 173,8 cm.

D8 = 173,80 cm

Interpretación: Significa que el 80% de las estaturas de los estudiantes


universitarios observados son inferiores o iguales a 173,80 cm y el 20% restante
son mayores o iguales a 173,80 cm.

Percentil 43 (P43)

La posición del percentil 43 es ºP43 = 43.(n+1)/100 = 43.(60+1)/100 = 26,23º


“2024, Año de Felipe Carrillo Puerto, Benemérito del Proletariado, Revolucionario y Defensor del
Mayab”
Como el valor 26,23 no existe, se realiza la interpolación lineal entre los valores
correspondientes a las posiciones 26º y 27º:

Luego, el percentil 43 es el valor 164,46 cm.

P43 = 164,46 cm

Interpretación: Significa que el 43% de las estaturas de los estudiantes


universitarios observados son inferiores o iguales a 164,46 cm y el 57% restante
son mayores o iguales a 164,46 cm.

Ejercicio 2.-

En Colombia es creciente la contratación del teletrabajador, se realizó una


consulta sobre la edad a la que comienzan a laborar un total de 20
teletrabajadores.

22 58 24 50 29 52 57 31 30 41
44 40 46 29 31 37 32 44 49 29

Media.

775
Me= =38.7 5
20

Moda.

Mo=2 9

Mediana.
“2024, Año de Felipe Carrillo Puerto, Benemérito del Proletariado, Revolucionario y Defensor del
Mayab”
37+ 40
Med = =38. 5
2

Cuartil 1.

Q 1= ( 100
25
)∗20=5
29+30
Q 1= =29. 5
2

Cuartil 3.

Q 3= ( 100
75
)∗20=1 5
46 +49
Q 3= =47.5
2

Percentil.

P 32= ( 100
32
)∗20=6.4 ≈ 7
P 32=31
“2024, Año de Felipe Carrillo Puerto, Benemérito del Proletariado, Revolucionario y Defensor del
Mayab”

Ejercicio 1.- Dispersión.

Retomaremos el ejemplo de las estaturas de los alumnos universitarios, en primer


lugar, como datos individuales y luego como datos agrupados.

150 160 161 160 160 172 162 160 172 151
161 172 160 169 169 176 160 173 184 172
160 170 153 167 167 175 166 173 169 178
170 179 175 174 160 174 149 162 161 168
170 173 156 159 154 156 160 166 170 169
163 168 171 178 179 164 176 163 182 162

Datos individuales.

xi fi Fi xi fi Fi
149 1 1 168 2 32
150 1 2 169 4 36
151 1 3 170 4 40
153 1 4 171 1 41
154 1 5 172 4 45
156 2 7 173 3 48
159 1 8 174 2 50
160 9 17 175 2 52
161 3 20 176 2 54
162 3 23 178 2 56
163 2 25 179 2 58
164 1 26 182 1 59
166 2 28 184 1 60
167 2 30 n=60

Rango.

R= Xmáx – Xmín = 184 cm – 149 cm = 35 cm.

Varianza.
“2024, Año de Felipe Carrillo Puerto, Benemérito del Proletariado, Revolucionario y Defensor del
Mayab”
∑ ¿¿
2 i
s= =¿ ¿
n−1

Desviación estándar.

s= √∑ ¿¿¿¿
i

Coeficiente de Variación.

s 8.14 cm
CV = = =0.0489 CV %=4.89 %
x 166.55 cm

Ejercicio 2.-

Un pediatra obtuvo la siguiente tabla sobre los meses de edad de 50 niños de su


consulta en el momento de andar por primera vez. Calcular la varianza.

El producto de la variable por su frecuencia absoluta para calcular la


media.
“2024, Año de Felipe Carrillo Puerto, Benemérito del Proletariado, Revolucionario y Defensor del
Mayab”

El producto de la variable al cuadrado por su frecuencia absoluta para


calcular la varianza y la desviación típica.

9 1 9 81
10 4 40 400
11 9 99 1089
12 16 192 2304
13 11 143 1859
14 8 112 1568
15 1 15 225
50 610 7526

BIBLIOGRAFÍA.
“2024, Año de Felipe Carrillo Puerto, Benemérito del Proletariado, Revolucionario y Defensor del
Mayab”

Estadística, P. Y. (2023, 12 agosto). Tipos de variables (estadística). Probabilidad


y Estadística. https://www.probabilidadyestadistica.net/tipos-de-variables-
estadistica/

Tamaño de la muestra. Qué es y cómo calcularla. | QuestionPro.


(s. f.). https://www.questionpro.com/es/tama%C3%B1o-de-la-
muestra.html#que_es_tama%C3%B1o_de_muestra

Tamaño de la muestra. (s. f.). https://explorable.com/es/tamano-de-la-muestra

Ortega, C. (2023, 14 junio). Métodos de muestreo: Ejemplos y usos.


QuestionPro. https://www.questionpro.com/blog/es/metodos-de-muestreo/

Estadística, P. Y. (2023a, julio 29). Técnicas de muestreo. Probabilidad y


Estadística. https://www.probabilidadyestadistica.net/tecnicas-de-muestreo/

Estadística, P. Y. (2022c, junio 23). Datos no agrupados. Probabilidad y


Estadística. https://www.probabilidadyestadistica.net/datos-no-agrupados/

Benites, L. (2021, 13 septiembre). Datos agrupados / Datos no agrupados:


definición, ejemplos. Statologos. https://statologos.com/datos-agrupados/

También podría gustarte