Medidas de Tendencia Central
Medidas de Tendencia Central
Medidas de Tendencia Central
Este nmero que, para tal fin, suele situarse hacia el centro de la distribucin de datos se denomina medida o parmetro de tendencia central o de centralizacin. Cuando se hace referencia nicamente a la posicin de estos parmetros dentro de la distribucin, independientemente de que sta est ms o menos centrada, se habla de estas medidas como medidas de posicin.1 En este caso se incluyen tambin los cuantiles entre estas medidas. Se debe tener en cuenta que existen variables cualitativas y variables cuantitativas, por lo que las medidas de posicin o medidas de tendencia se usan de acuerdo al tipo de variable que se esta observando, en este caso se observan variables cuantitativas Entre las medidas de tendencia central tenemos:
La media aritmtica (o simplemente media) La media aritmtica es el valor obtenido por la suma de todos sus valores dividida entre el nmero de sumandos. Por ejemplo, las notas de 5 alumnos en una prueba: nio nota 1 6,0 Primero, se suman las notas: 2 5,4 6,0+5,4+3,1+7,0+6,1 = 27,6 3 3,1 Luego el total se divide entre la cantidad de alumnos: 4 7,0 27,6/5=5,52 5 6,1 La media aritmtica en este ejemplo es 5,52 La media aritmtica es, probablemente, uno de los parmetros estadsticos ms extendidos.2 Se le llama tambin promedio o, simplemente, media. Propiedades de la media aritmtica 1. La suma de las desviaciones de todas las puntuaciones de una distribucin respecto a la media de la misma igual a cero.
La suma de las desviaciones de los nmeros 8, 3, 5, 12, 10 de su media aritmtica 7.6 es igual a 0: 8 7.6 + 3 7.6 + 5 7.6 + 12 7.6 + 10 7.6 = = 0. 4 4.6 2.6 + 4. 4 + 2. 4 = 0
2. La suma de los cuadrados de las desviaciones de los valores de la variable con respecto a un nmero cualquiera se hace mnima cuando dicho nmero coincide con la media aritmtica.
3. Si a todos los valores de la variable se les suma un mismo nmero, la media aritmtica queda aumentada en dicho nmero. 4. Si todos los valores de la variable se multiplican por un mismo nmero la media aritmtica queda multiplicada por dicho nmero. . Definicin de media aritmtica simple: La media aritmtica es el valor obtenido al sumar todos los datos y dividir el resultado entre el nmero total de datos. es el smbolo de la media aritmtica.
Ejemplo Los pesos de seis amigos son: 84, 91, 72, 68, 87 y 78 kg. Hallar el peso medio.
Media aritmtica para datos agrupados Si los datos vienen agrupados en una tabla de frecuencias, la expresin de la media es:
Mediana
MEDIANA (Me):es el valor que separa por la mitad las observaciones ordenadas de menor a mayor, de tal forma que el 50% de estas son menores que la mediana y el otro
50% son mayores. Si el nmero de datos es impar la mediana ser el valor central, si es par tomaremos como mediana la media aritmtica de los dos valores centrales.
Definicin de MODA
MODA (M0): es el valor de la variable que ms veces se repite, es decir, aquella cuya frecuencia absoluta es mayor. No tiene porque ser nica.
Li es el lmite inferior de la clase modal. fi es la frecuencia absoluta de la clase modal. fi--1 es la frecuencia absoluta inmediatamente inferior a la clase modal. fi-+1 es la frecuencia absoluta inmediatamente posterior a la clase modal. ai es la amplitud de la clase. Tambin se utiliza otra frmula de la moda que da un valor aproximado de sta:
El nmero de dis necesarios por 10 equipos de trabajadores para terminar 10 instalaciones de iguales caractersticas han sido: 21, 32, 15, 59, 60, 61, 64, 60, 71, y 80 das. Calcular la media, mediana, moda, varianza y desviacin tpica. SOLUCIN:
La media: suma de todos los valores de una variable dividida entre el nmero total de datos de los que se dispone:
La mediana: es el valor que deja a la mitad de los datos por encima de dicho valor y a la otra mitad por debajo. Si ordenamos los datos de mayor a menor observamos la secuencia: 15, 21, 32, 59, 60, 60,61, 64, 71, 80. Como quiera que en este ejemplo el nmero de observaciones es par (10 individuos), los dos valores que se encuentran en el medio son 60 y 60. Si realizamos el clculo de la media de estos dos valores nos dar a su vez 60, que es el valor de la mediana. La moda: el valor de la variable que presenta una mayor frecuencia es 60 MEDIA GEOMTRICA: de una cantidad arbitraria de nmeros (por decir n nmeros) es la raz n-sima del producto de todos los nmeros.
Propiedades El logaritmo de la media geomtrica es igual a la media aritmtica de los logaritmos de los valores de la variable. Solo es relevante la media geomtrica si todos los nmeros son positivos. Como hemos visto, si uno de ellos es 0, entonces el resultado es 0. Si hubiera un nmero negativo (o una cantidad impar de ellos) entonces la media geomtrica sera o bien negativa, o bien inexistente en los nmeros reales. En muchas ocasiones se utiliza su trasformacin en el manejo estadstico de variables con distribucin no normal. La media geomtrica es relevante cuando varias cantidades son multiplicadas para producir un total. Tasa de cambio La tasa de cambio o tipo de cambio supone qu cantidad de una moneda X puede comprarse con una moneda Y. Es decir, cuntos pesos argentinos necesito para comprar un dlar, por ejemplo. Se trata, por lo tanto, de la relacin cambiaria entre dos monedas de distintos pases. La tasa de cambio puede ser real o nominal. Medidas de Dispersin
Las medidas de tendencia central tienen como objetivo el sintetizar los datos en un valor representativo, las medidas de dispersin nos dicen hasta que punto estas medidas de tendencia central son representativas como sntesis de la informacin. Las medidas de dispersin cuantifican la separacin, la dispersin, la variabilidad de los valores de la distribucin respecto al valor central. Distinguimos entre medidas de dispersin absolutas, que no son comparables entre diferentes muestras y las relativas que nos permitirn comparar varias muestras. MEDIDAS DE DISPERSIN ABSOLUTAS VARIANZA ( s2 ): es el promedio del cuadrado de las distancias entre cada observacin y la media aritmtica del conjunto de observaciones.
Haciendo operaciones en la frmula anterior obtenemos otra frmula para calcular la varianza:
Si los datos estn agrupados utilizamos las marcas de clase en lugar de Xi. DESVIACIN TPICA (S): La varianza viene dada por las mismas unidades que la variable pero al cuadrado, para evitar este problema podemos usar como medida de dispersin la desviacin tpica que se define como la raz cuadrada positiva de la varianza
Para estimar la desviacin tpica de una poblacin a partir de los datos de una muestra se utiliza la frmula (cuasi desviacin tpica):
RECORRIDO O RANGO MUESTRAL (Re). Es la diferencia entre el valor de las observaciones mayor y el menor. Re = xmax - xmin MEDIDAS DE DISPERSIN RELATIVAS COEFICIENTE DE VARIACIN DE PEARSON: Cuando se quiere comparar el grado de dispersin de dos distribuciones que no vienen dadas en las mismas unidades o que las
medias no son iguales se utiliza el coeficiente de variacin de Pearson que se define como el cociente entre la desviacin tpica y el valor absoluto de la media aritmtica
CV representa el nmero de veces que la desviacin tpica contiene a la media aritmtica y por lo tanto cuanto mayor es CV mayor es la dispersin y menor la representatividad de la media.
Rango o recorrido. El rango o recorrido de una variable estadstica es la diferencia entre el mayor y el menor valor de la variable. Esta medida tiene el inconveniente de que slo depende de los valores extremos de la variable. Ejemplos: 1) Rango = 8 0 = 8. 2) Rango = 725 425 = 30. Varianza: La varianza de una variable estadstica es la media aritmtica de los cuadrados de las desviaciones respecto a la media. Se representa por .
Ejemplos: 1)
. . .
Desviacin tpica: La desviacin tpica de una variable estadstica es la raz cuadrada positiva de la varianza. Se representa por Ejemplos: 1) . 2)
Propiedades de la desviacin tpica 1 La desviacin tpica ser siempre un valor positivo o cero, en el caso de que las puntuaciones sean iguales. 2 Si a todos los valores de la variable se les suma un nmero la desviacin tpica no vara. 3 Si todos los valores de la variable se multiplican por un nmero la desviacin tpica queda multiplicada por dicho nmero. 4 Si tenemos varias distribuciones con la misma media y conocemos sus respectivas desviaciones tpicas se puede calcular la desviacin tpica total. Si todas las muestras tienen el mismo tamao:
Los cuantiles son valores de la distribucin que la dividen en partes iguales, es decir, en intervalos, que comprenden el mismo nmero de valores. Los ms usados son los cuartiles, los deciles y los percentiles. PERCENTILES: son 99 valores que dividen en cien partes iguales el conjunto de datos ordenados. Ejemplo, el percentil de orden 15 deja por debajo al 15% de las observaciones, y por encima queda el 85% CUARTILES: son los tres valores que dividen al conjunto de datos ordenados en cuatro partes iguales, son un caso particular de los percentiles: - El primer cuartil Q 1 es el menor valor que es mayor que una cuarta parte de los datos - El segundo cuartil Q 2 (la mediana), es el menor valor que es mayor que la mitad de los datos - El tercer cuartil Q 3 es el menor valor que es mayor que tres cuartas partes de los datos DECILES: son los nueve valores que dividen al conjunto de datos ordenados en diez partes iguales, son tambin un caso particular de los percentiles. Desviacion cuartilica
La desviacin cuartlica es la mitad de la distancia entre el tercer cuartil, Q3, y el primero, Q1. QD = [Q3 - Q1]/2 Ejemplo: Si el tercer cuartil = 24 y el primer cuartil = 10, cul es la desviacin cuartlica? La amplitud intercuartlica es 24 - 10 = 14; por lo tanto, la desviacin cuartlica es 14/2 = 7.
los datos y as, poder adaptar herramientas para el anlisis probabilstico. Adems, estas medidas comparan la forma que tiene la representacin grfica, bien sea el histograma o el diagrama de barras de la distribucin, con la distribucin normal. Las medidas de forma se dividen en medidas de Asimetra o Sesgo y medidas de Curtosis o Apuntamiento.
ASIMETRA
Esta medida nos permite identificar si los datos se distribuyen de forma uniforme alrededor del punto central (Media aritmtica). La asimetra presenta tres estados diferentes [Fig.5-1], cada uno de los cuales define de forma concisa como estn distribuidos los datos respecto al eje de asimetra. Se dice que la asimetra es positiva cuando la mayora de los datos se encuentran por encima del valor de la media aritmtica, la curva es Simtrica cuando se distribuyen aproximadamente la misma cantidad de valores en ambos lados de la media y se conoce como asimetra negativa cuando la mayor cantidad de datos se aglomeran en los valores menores que la media.
Ecuacin 5-9 Donde (g1) representa el coeficiente de asimetra de Fisher, (Xi) cada uno de los valores, ( ) la media de la muestra y (ni) la frecuencia de cada valor. Los resultados de esta ecuacin se interpretan:
(g1 = 0): Se acepta que la distribucin es Simtrica, es decir, existe aproximadamente la misma cantidad de valores a los dos lados de la media. Este valor es difcil de conseguir por lo que se tiende a tomar los valores que son cercanos ya sean positivos o negativos ( 0.5). (g1 > 0): La curva es asimtricamente positiva por lo que los valores se tienden a reunir ms en la parte izquierda que en la derecha de la media.
(g1 < 0): La curva es asimtricamente negativa por lo que los valores se tienden a reunir ms en la parte derecha de la media.
Desde luego entre mayor sea el nmero (Positivo o Negativo), mayor ser la distancia que separa la aglomeracin de los valores con respecto a la media. 2. CURTOSIS Esta medida determina el grado de concentracin que presentan los valores en la regin central de la distribucin. Por medio del Coeficiente de Curtosis, podemos identificar si existe una gran concentracin de valores (Leptocrtica), una concentracin normal (Mesocrtica) una baja concentracin (Platicrtica).
Ecuacion 5-10 Donde (g2) representa el coeficiente de Curtosis, (Xi) cada uno de los valores, ( ) la media de la muestra y (ni) la frecuencia de cada valor. Los resultados de esta frmula se interpretan:
(g2 = 0) la distribucin es Mesocrtica: Al igual que en la asimetra es bastante difcil encontrar un coeficiente de Curtosis de cero (0), por lo que se suelen aceptar los valores cercanos ( 0.5 aprox.). (g2 > 0) la distribucin es Leptocrtica (g2 < 0) la distribucin es Platicrtica