Diagrama de Caja
Diagrama de Caja
Diagrama de Caja
Es una representacin grfica que permite establecer simetra o asimetra de una distribucin
se necesita valor mximo, valor mnimo, Q1, Q2, Me y Q3 representacin grafica basada en
cuartiles que ayuda a ilustrar un conjunto de datos para elaborarlo
Elaboracin:
Es una representacin grfica formada por una caja rectangular en la cual los lados ms largos
nos muestran el recorrido intercuartlico, esta caja rectangular se divide por un segmento
vertical en la cual nos da a conocer la posicin de la mediana y su relacin con el primer y
tercer cuartil ya que el segundo cuartil coincide con el valor de la mediana
En la grfica rectangular se ubican en una escala sobre un segmento en la cual sus extremos
estn los valores mximos y mnimos de la variable cuyas lneas que sobresalen son
denominadas bigotes y tienen un lmite de prolongacin de tal manera que si un valor no se
encuentre en el rango determinado es identificado y marcado individualmente.
Ejemplo:
Q1 Me Q3
V. min---------------------------------------------------------------------------- v. mx.
30 35 40 45 50 55 60 65 70 75 80 85 90
Interpretacin:
El diagrama anterior nos muestra que el 50 % central de ejecutivos percibe ingresos entre
51,31 y 74,3 miles de dlares, la diferencia entre los ingresos de es 22,9 miles de dlares,
equivalente a la Q3-Q1 que corresponden al rango interctuartlico. Esta distribucin representa
una asimetra negativa representada de dos formas en distribucin.
1. De acuerdo con la lnea punteada, ser asimetra negativa puesto que la distancia
entre Q1 y el Valor minino es mayor que la distancia entre Q3 y el valor mximo es
mayor a la distancia entre Q3, dicho de otra forma, el 25% de los datos menores a Q1
se encuentran ms dispersos que el 25% de los datos mayores a Q3
2. Desde otro punto de vista, la distribucin ser tambin asimtricas negativa puesto
que la distancia de Me a Q1 estn ms dispersos que los de Me a Q3, de igual forma
podemos establecer que el nmero de ejecutivos que tienen ingresos entre 51,31 y
65,7 miles de dlares, es igual al nmero de ejecutivos que tienen entre 65,7 y 74,3
miles de dlares.
Rango intercuartlico
Se dice que es una estimacin estadstica de la dispersin de una distribucin de datos y busca
la diferencia entre el tercer y el primer cuartil. Adems se puede decir que esta medida busca
eliminar valores que estn muy alejados y es muy recomendable cuando la medida de
tendencia central que se utiliza es la mediana ya que es poco tolerable a irregularidades que
se presenta en los extremos.
Rango Intercuartilico
Q1 Q2 Q3
25% 25% 25% 25%
2 = 3 Q3 =3/4n =0,75*12=9
18, 20, 20, 24, 32, 32, 32, 48, 49, 53, 59, 63
Q1 Q3
Q1=(20+24)/2= 22 aos Q3=(49+53)/2= 51 aos
R=51-22=29 aos
Interpretacin:
A partir desde los 22 aos hasta los 51 aos se ubica el 50% central de la distribucin.
29 aos de edad es la distancia existente en el 50% central de la distribucin.
Lim,I: lmite inferior del intervalo que contiene al primer cuartil (Fr% supera al 25%)
N: total de casos
Fi-1: frecuencia acumulada absoluta de la clase anterior a la que contiene el primer cuartil
Li - Ls xm fi fr(%) FI Fr(%) Ai
0-5 2,5 14 50 14 50 5
5-10 7,5 8 28 22 78 5
10-20 15 3 11 25 89 10
20-42 31 3 11 28 100 22
28 100
( )
= + =
( )
= + = ,
Rango intercuartlico:
Diagrama de dispersin
El diagrama de dispersin nos permite analizar si existe alguna relacin entre dos variables, es
una herramienta grfica para facilitar una mejor visin de los datos de interpretarlos, adems
simplificada el anlisis complejo en situaciones cmicas y da una mejor comunicacin tambin
nos brinda mayor informacin que una anlisis matemtico de correlacin y nos da la
oportunidad de posibilidades y alternativas para un estudio.
1. Se debe elaborar una teora vlida con una relacin entre dos variables.
2. Se debe obtener los pares de datos que correspondan a las dos variables.
3. Se deben determinar los valores mximo y mnimo para cada una de las variables.
4. Ubicar en que eje irn cada una de las variables.
5. Graficar en el eje horizontal y vertical.
6. Se debe marcar en el diagrama de dispersin los ares de datos.
7. Se debe incluir la informacin relevante en el grfico.
8. Interpretar los resultados.
El diagrama de dispersin es muy importante para estudiar las relaciones de causa y efecto
que vienen de una causa que no se posee informacin y es muy difcil de medir por lo tanto no
sirve para actuar de una manera ms simple en los procesos que son complejos. Pero hay que
tener en cuenta que las relaciones que existen no son causa de otra.
La utilizacin del diagrama de dispersin es muy ocupada para ensayar teoras y buscar sus
causas, buscar soluciones y obtener resultados de su calidad.
Ejemplo:
Un equipo busca analizar las causas de los frecuentes errores en las facturas. El nmero de
datos a rellenar variaba segn el tipo de factura. Un miembro dio la idea de simplificar las
facturas que son muy complicadas, lo que segn el criterio genera la mayora de errores. El
equipo investigara en primer lugar la teora en la que el nmero de errores en una factura
dependa de la cantidad de datos a incluir en la misma. El equipo tomo los datos relativos a los
meses ltimos y los represent en un Diagrama de Dispersin.
Errores de facturas
15
13
. . .
Nro. de errores de factura
11
. .
9
. . ...
7
. . ..
5
. . .
3
. . . . . . . .
0
5 10 15 20 25 30
Tabla de contingencias:
Es una manera muy til que sirve para clasificar los autos mediante un recuento traspasando
los valores a una tabla de contingencia, dicha tabla se divide en celdas en las cuales figuran
probabilidades y es una de las formas de manera ms comn para resumir datos categricos
cuyo inters se basa en que si existe alguna relacin entre una variable (fila) y otra
variable(columna) para calcular la intensidad de esa asociacin sea as X y Y dos variables
categricas e I y J respectivamente y se pueden clasificar como categoras
Se le conoce con el nombre de tabla de contingencia gracias al autor Pearson que dio su
nombre 1904, tambin se le conoce como una tabla de clasificacin cruzada.
Ejemplo
Se va a sortear un viaje a Italia entre los 120 mejores usuarios de una agencia de autos.los
cuales 65 son mujeres, 80 estn casados y 45 son mujeres casadas. Se pide:
1. Cul es la probabilidad de que le toque el viaje a un hombre soltero?
2. Si del ganador se sabe que es casado, cul ser la probabilidad de que sea una mujer?
Hombres Mujeres
Casados 45 80
Solteros 65 120
Bibliografa:
http://www.estadisticaparatodos.es/taller/graficas/cajas.html
http://www.fder.edu.uy/contenido/rrii/contenido/curricular/estadistica/010102.pdf
http://www.universoformulas.com/estadistica/descriptiva/rango-intercuartilico/
http://www.fundibeq.org/opencms/export/sites/default/PWF/downloads/gallery/methodo
logy/tools/diagrama_de_dispersion.pdf
http://www.vitutor.com/pro/2/a_14.html
UNIVERSIDAD DE CUENCA
CARRERA MARKETING
Trabajo de:
Estadstica
Profesor:
Javier vila
Temas:
Diagrama de caja
Rango Intercuartilico
Diagrama de dispersin
Tabla de contingencias
Realizado por:
Byron Campoverde
Jos Vinueza
UNIVERSIDAD DE CUENCA
CARRERA MARKETING
Trabajo de:
Estadstica
Profesor:
Javier vila
Temas:
Diagrama de caja
Rango Intercuartilico
Diagrama de dispersin
Tabla de contingencias
Realizado por: