Estadistica Glosario 3

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 8

Como conceptos nuevos o como repaso deben rescatar:

• Medidas de tendencia central: Las medidas de tendencia central son medidas


estadísticas que pretenden resumir en un solo valor a un conjunto de valores.
Representan un centro en torno al cual se encuentra ubicado el conjunto de los datos.
Las medidas de tendencia central más utilizadas son: media, mediana y moda.

◦ Media Aritmética (en un conjunto de datos numéricos): La definimos como el


valor característico de la serie de datos resultado de la suma de todas las observaciones
(X1+X+X3…) dividido por el número total de datos (N).

Estos cálculos se pueden simbolizar:

Visto desde un punto de vista más conceptual, la media aritmética es el centro de los
datos en el sentido numérico, ya que intenta equilibrarlos por exceso y por defecto. Es
decir, si sumamos todas las diferencias de los datos a la media es cero.

◦ Mediana (en un conjunto de datos numéricos): Otra medida de tendencia central es


la mediana. La mediana es el valor de la variable que ocupa la posición central, cuando
los datos se disponen en orden de magnitud. Es decir, el 50% de las observaciones tiene
valores iguales o inferiores a la mediana y el otro 50% tiene valores iguales o superiores
a la mediana.

Si el número de observaciones es par, la mediana corresponde al promedio de los dos


valores centrales. Por ejemplo, en la muestra 3, 9, 11, 15, la mediana es (9+11)/2=10.

◦ Moda (en un conjunto de datos numéricos o categóricos): La moda de una


distribución se define como el valor de la variable que más se repite. En un polígono de
frecuencia la moda corresponde al valor de la variable que está bajo el punto más alto
del gráfico. Una muestra puede tener más de una moda.

Ejemplo 1:
Ejemplo 2:

  

• Organización de frecuencias en variables numéricas continúas: En estadística, se


le llama distribución de frecuencias a la agrupación de datos en categorías
mutuamente excluyentes que indican el número de observaciones en cada categoría.
Esto proporciona un valor añadido a la agrupación de datos. La distribución de
frecuencias presenta las observaciones clasificadas de modo que se pueda ver el número
existente en cada clase.

-Intervalos de clase: Los intervalos de clase se emplean si las variables toman


un número grande de valores o la variable es continua.
Se agrupan los valores en intervalos que tengan la misma amplitud denominados clases.
A cada clase se le asigna su frecuencia correspondiente.

-Marca de clase (xn): La marca de clase es el punto medio de cada intervalo y es


el valor que representa a todo el intervalo para el cálculo de algunos parámetros.

Construcción de una tabla con Intervalos de clase

Consideremos los siguientes datos:

3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11,
13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13.

1º se localizan los valores menor y mayor de la distribución. En este caso son 3 y 48.

2º Se restan y se busca un número entero un poco mayor que la diferencia y que sea
divisible por el número de intervalos de queramos poner.

Es conveniente que el número de intervalos oscile entre 6 y 15.

En este caso, 48 - 3 = 45, incrementamos el número hasta 50/5 = 10 intervalos.

Se forman los intervalos teniendo presente que el límite inferior de una clase pertenece
al intervalo, pero el límite superior no pertenece intervalo, se cuenta en el siguiente
intervalo.
• Gráfica de frecuencias en variables numéricas continúas:

-Histogramas: Un histograma es una representación gráfica de una variable en


forma de barras. Se utilizan para variables continuas o para variables discretas, con
un gran número de datos, y que se han agrupado en clases. En el eje abscisas se
construyen unos rectángulos que tienen por base la amplitud del intervalo, y
por altura, la frecuencia absoluta de cada intervalo. La superficie de
cada barra es proporcional a la frecuencia de los valores representados

-Polígonos de frecuencias: Para construir el polígono de frecuencia se toma la marca


de clase que coincide con el punto medio

• Intervalo modal (o clase modal): El intervalo modal es el de mayor frecuencia


absoluta. Cuando tratamos con datos agrupados antes de definir la moda, se ha de
definir el intervalo modal. Siendo la frecuencia absoluta del intervalo modal las
frecuencias absolutas de los intervalos anterior y posterior, respectivamente, al intervalo
modal.

Lo más eficaz es ver un Ejemplo:


En la siguiente tabla tenemos ua distribución continua con intervalos de diferente
amplitud, en la que se han calculado ya las frecuencias normalizadas.

Podemos observar que el intervalo modal es el [40 - 45), al tener la mayor frecuencia
normalizada. Para determinar la Moda aplicamos interpolación y obtenemos:

• Medidas de dispersión: En estadística, las medidas de dispersión (también


llamadas variabilidad, dispersión o propagación) es el grado en que una distribución se
estira o exprime. Las medidas de dispersión se contrastan con la ubicación o
la tendencia central, y juntas son las propiedades más utilizadas de las distribuciones.
Son números que representan si la media aritmética es o no representativa a los datos.

Varianza y desviación estándar

La desviación sólo significa qué tan lejos de lo normal

-Desviación estándar

La desviación estándar (σ) mide cuánto se separan los datos.

La fórmula es fácil: es la raíz cuadrada de la varianza. Así que, "¿qué es la varianza?"

-Varianza

La varianza (que es el cuadrado de la desviación estándar: σ2) se define así:

Es la media de las diferencias con la media elevadas al cuadrado.

En otras palabras, sigue estos pasos:

1. Calcula la media (el promedio de los números)


2. Ahora, por cada número resta la media y eleva el resultado al cuadrado (la diferencia
elevada al cuadrado).
3. Ahora calcula la media de esas diferencias al cuadrado. (¿Por qué al cuadrado?)

Ejemplo

Tú y tus amigos habéis medido las alturas de vuestros perros (en milímetros):
Las alturas (de los hombros) son: 600mm, 470mm, 170mm, 430mm y 300mm.

Calcula la media, la varianza y la desviación estándar.

Respuesta:

600 + 470 + 170 + 430 + 300 1970

Media =    =    = 394

5 5

Así que la altura media es 394 mm. Vamos a dibujar esto en el gráfico:

Ahora calculamos la diferencia de cada altura con la media:


Para calcular la varianza, toma cada diferencia, elévala al cuadrado, y haz la
media:

2062 + 762 + (-224)2 + 362 + (-94)2 108,520

Varianza: σ2 =    =    = 21,704

5 5

Así que la varianza es 21,704.

Y la desviación estándar es la raíz de la varianza, así que:

Desviación estándar: σ = √21,704 = 147

Y lo bueno de la desviación estándar es que es útil: ahora veremos qué alturas


están a distancia menos de la desviación estándar (147mm) de la media:

Así que usando la desviación estándar tenemos una manera "estándar" de saber
qué es normal, o extra grande o extra pequeño.

Los Rottweilers son perros grandes. Y los Dachsunds son un poco menudos... ¡pero


que no se enteren!

*Nota: ¿por qué al cuadrado?


Elevar cada diferencia al cuadrado hace que todos los números sean positivos
(para evitar que los números negativos reduzcan la varianza)

Y también hacen que las diferencias grandes se destaquen. Por ejemplo


1002=10,000 es mucho más grande que 502=2,500.

Pero elevarlas al cuadrado hace que la respuesta sea muy grande, así que lo
deshacemos (con la raíz cuadrada) y así la desviación estándar es mucho más útil.

También podría gustarte