Medidas de Dispersion

Descargar como ppt, pdf o txt
Descargar como ppt, pdf o txt
Está en la página 1de 27

Análisis de Datos

Prof. José Leonardo


Síntesis Descriptiva
Se refiere a la transformación de los datos
en bruto en una forma muy resumida que
facilitará su comprensión e interpretación.

Medidas de
Medidas de dispersión
tendencia central

Distribuciones de
frecuencia

Distribución de
porcentajes
Medidas de tendencia central vs.
Medidas de dispersión.

Las medidas de tendencia central tienen como


objetivo el sintetizar los datos en un valor
representativo, las medidas de dispersión nos
dicen hasta que punto estas medidas de
tendencia central son representativas como
síntesis de la información.

Las medidas de dispersión cuantifican la


separación, la dispersión, la variabilidad de los
valores de la distribución respecto al valor
central.
Medidas de Dispersión
Se utilizan para conocer la distancia de los
valores de la variable a un cierto valor
central. Permiten identificar la
concentración de los datos en un cierto
sector del recorrido de la variable.

Varianza Desviación Estándar, y el Rango.


Desviación estándar y
Varianza

Se utilizan para hacer generalizaciones


estadísticas a partir de la muestra y
aplicarlas a la población de donde se
extrajeron.
• La varianza: es la desviación cuadrada
de la media. Nunca puede ser negativa.
• La desviación estándar es la raíz
cuadrada de la varianza.
Desviación Estandar
(S)
Es una medida de la cantidad típica en la que los valores
del conjunto de datos difieren de la media. Es la medida
de dispersión más utilizada, se le llama también
desviación típica.

• La desviación estándar es siempre un valor no


negativo S será siempre > 0 por definición. Cuando S
= 0 è X = xi (para todo i).

• Es la medida de dispersión óptima por ser la más


pequeña.

• La desviación estándar toma en cuenta las


desviaciones de todos los valores de la variable .
Varianza (S2)
La varianza es una medida de dispersión relativa a algún
punto de referencia. Ese punto de referencia es la media
aritmética de la distribución.

Más específicamente, la varianza es una medida de que


tan cerca, o que tan lejos están los diferentes valores de
su propia media aritmética.

• Cuando más lejos están las Xi de su propia media


aritmética, mayor es la varianza.

• Cuando más cerca estén las Xi a su media menos es la


varianza.

• S siempre un valor no negativo, que puede ser igual o


distinta de 0. Será 0 solamente cuando Xi= X

• La varianza es la medida de dispersión cuadrática


Desviación
Estándar (S)

Mayor valor del coeficiente Mayor dispersión de


los datos del desvío estándar con respecto
a su media

Menor valor del coeficiente Menor dispersión de


los datos del desvío estándar (Mayor
Homogeneidad)
Desviación
Estándar (S)

Para Datos Aislados Para Datos Agrupados

_ _

S (X  X) 2

S  f (X  X) 2

n 1 n 1
Desviación Estándar
(S) _
Para Datos Aislados
S 
( X  X ) 2

n 1
Edades de 7 personas encuestadas
X X–X (X - X) 2
10 10 -15,7= - 5,7 32,49
14 14-15,7= -1,7 2,89
15 15 -15,7= -0,7 0,49
16 16 -15,7= 0,3 0,09 57,43
S 3,09
18 18 -15,7= 2,3 5,29 7 1
18 18 -15,7= 2,3 5,29
19 19 -15,7= 3,3 10,89
2
Total 57,43 S = 9,57
Desviación Estándar
(S) _

Para Datos Agrupados


S  f ( X  X )2
n 1
Calificaciones de 23 personas encuestadas
2 2
X F X–X (X - X) f (X - X)
17 2 17 -14= 3 9 18
16 3 16 -14= 2 4 12
15 4 15 -14= 1 1 4
14 5 14 -14= 0 0 0
13 4 13 -14= -1 1 4
12 3 12 -14= -2 4 12
11 2 11 -14= 3 9 18
Total 23 68

68 2

S 1,76 S = 3,1
23  1
Rango (R)
Rango: Es la más elemental de las
medidas, consiste simplemente en la
distancia entre los dos valores
extremos.

Es la diferencia entre el dato mayor y el


dato menor.

R = X máx. - X mín.
Rango (R)
Por Ejemplo:

1. Un estudio sobre las marcas de


afeitadoras arrojó que en un individuo
logró apenas 6 afeitadas con una marca,
mientras que otro logró afeitarse 14
veces con otra marca, así el intervalo es
de 14 - 6 con una diferencia de 8
afeitadas que representa el rango.

2. Numero de Comerciales de refrescos


que recuerdan los estudiantes de
Mercadeo II son: R=7
Resumen de fórmulas
Tabulación y Gráficas

Plan de tabulación:
tabulación Disposición
ordenada de datos en una
tabla u otro formato resumido.

Síntesis Gráfica:
Gráfica Resumir los
resultados de la investigación
en una forma gráfica.
Diseñando las tablas de reporte

• Enumérelas en secuencia

• No use numerales romanos

• El título debe indicar el contenido

• Etiquete las filas y las columnas


claramente

• Use formatos estándares y


convencionales
Diseñando las tablas de reporte

• Evite llenar demasiado las tablas

• Haga cada una auto explicativa

• Asegúrese que es limpia, simple y


ordenada

• Prueba las tablas en algunas personas


para asegurarse de que sean claras

• Inclúyalas después del texto de


referencia
Creando Gráficos

• Enumérelos en secuencia

• Cree y use un formato estándar para


figura similares

• Los títulos deben indicar que


representan las barras y líneas

• Añada etiquetas de valor si las


cantidades no se muestran localizadas
Creando Gráficos

• Haga cada figura lo mas explicativa


posible

• Incluya profundidad, sombras y color


solo si esto no distrae

• Haga que alguien las revises para saber


si son claras

• Incluya las figuras después del texto de


ser posible
Síntesis
Gráfica
Los tres tipos más comunes son:
Diagramas de sectores (Tortas),
Diagrama de barras o histogramas.
Diagrama de Sectores
(Tortas)
Se evidencia la contribución de cada parte a un total

Grafico 1. Sexo de la muestra analizada

28%
Femenino
Femenino
Masculino
72%

Masculino
Grafico 5. Nivel de Instrucción

Secundaria

23% 9%
9% TSU
Postgrado

59%
Universitaria
Diagrama de Barras
(Histogramas)
Grafico 7. Lugar donde prefieren tomar whisky
25

20 23%

15 18% 18%

10 12% 11%
9%
% %
5
4% 4%
1%
0
Cafés Fiestas Laborales P laya Casa Disco Casino Concierto Club
Grafico 9. Activos/ Servicios que posee
73% Internet
99% Celular
73% Telf. fijo
90% Computadora
Sirve para comparar datos 16% Lavaplatos

entre diferentes 92% Microonda

segmentos. 85%
77%
Secadora
DVD
56% VHS
100% TV

0 20 40 60 80 100 120
Diagrama de Barras
(Histogramas)
Se utilizan rectángulos separados, que tienen como base a cada uno
de los datos y como altura la frecuencia de ese dato.

Ejemplo: Vacunas aplicadas a una población de reses en el


Edo. Apure.
Polígonos de Frecuencia

El polígono de frecuencias es una representación gráfica


de la distribución de frecuencias que resulta
esencialmente equivalente al histograma y se obtiene
uniendo mediante segmentos los centros de las bases
superiores de los rectángulos del histograma.
Polígonos de Frecuencia
Acumuladas u Ojiva

La misma idea de unir los centros de las bases superiores


de los rectángulos de la distribución del histograma de
frecuencias acumuladas, da lugar al polígono de
frecuencias acumuladas u ojiva.
Diagrama Línea

Por lo general se usan para mostrar un mismo


tipo de dato y su evolución (valor de la acción
y el tiempo, número de ventas y precio).
Ejercicio
MEDIDAS TENDENCIA CENTRAL (Media, Mediana, Moda).
DESCRIPTIVAS DISPERSION (Rango, Desviacion Estandar, Varianza)

Hallar la Media, Mediana, Moda, Rango,


Desviación Estándar y la Varianza de la
siguiente serie de datos, que representan las
edades de un subgrupo de 13 estudiantes de la
clase de Mercadeo II de UNITEC Guacara.
23, 19, 18, 23, 20, 22, 21, 20, 25, 23, 24, 22,
18
Desviación Estándar Varianza.
_

(X  2 2
X) Es el cuadrado de la desviación estándar = S
S
n 1

También podría gustarte