Diagrama de Caja

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 9

Diagrama de caja

Es una representacin grfica que permite establecer simetra o asimetra de una distribucin
se necesita valor mximo, valor mnimo, Q1, Q2, Me y Q3 representacin grafica basada en
cuartiles que ayuda a ilustrar un conjunto de datos para elaborarlo

Elaboracin:

Es una representacin grfica formada por una caja rectangular en la cual los lados ms largos
nos muestran el recorrido intercuartlico, esta caja rectangular se divide por un segmento
vertical en la cual nos da a conocer la posicin de la mediana y su relacin con el primer y
tercer cuartil ya que el segundo cuartil coincide con el valor de la mediana

En la grfica rectangular se ubican en una escala sobre un segmento en la cual sus extremos
estn los valores mximos y mnimos de la variable cuyas lneas que sobresalen son
denominadas bigotes y tienen un lmite de prolongacin de tal manera que si un valor no se
encuentre en el rango determinado es identificado y marcado individualmente.

Ejemplo:

Ingresos de 60 ejecutivos de Marketing

V. mx. : 90 Q1: 51,31 Q3: 74.3

V. min. : 31 Me: 65,7

Q1 Me Q3

V. min---------------------------------------------------------------------------- v. mx.

30 35 40 45 50 55 60 65 70 75 80 85 90

Interpretacin:

El diagrama anterior nos muestra que el 50 % central de ejecutivos percibe ingresos entre
51,31 y 74,3 miles de dlares, la diferencia entre los ingresos de es 22,9 miles de dlares,
equivalente a la Q3-Q1 que corresponden al rango interctuartlico. Esta distribucin representa
una asimetra negativa representada de dos formas en distribucin.

1. De acuerdo con la lnea punteada, ser asimetra negativa puesto que la distancia
entre Q1 y el Valor minino es mayor que la distancia entre Q3 y el valor mximo es
mayor a la distancia entre Q3, dicho de otra forma, el 25% de los datos menores a Q1
se encuentran ms dispersos que el 25% de los datos mayores a Q3
2. Desde otro punto de vista, la distribucin ser tambin asimtricas negativa puesto
que la distancia de Me a Q1 estn ms dispersos que los de Me a Q3, de igual forma
podemos establecer que el nmero de ejecutivos que tienen ingresos entre 51,31 y
65,7 miles de dlares, es igual al nmero de ejecutivos que tienen entre 65,7 y 74,3
miles de dlares.

Rango intercuartlico

Se dice que es una estimacin estadstica de la dispersin de una distribucin de datos y busca
la diferencia entre el tercer y el primer cuartil. Adems se puede decir que esta medida busca
eliminar valores que estn muy alejados y es muy recomendable cuando la medida de
tendencia central que se utiliza es la mediana ya que es poco tolerable a irregularidades que
se presenta en los extremos.

El rango intercuartlico no se indica la dispersin en el sin cuento porciento central de la


distribucin y su clculo es diferente tanto para datos originales como para datos agrupados

Rango Intercuartilico

Q1 Q2 Q3
25% 25% 25% 25%

P25 P50 P75

Para datos originales:

Frmula del Rango intercuartlico: IQR= Q3-Q1


Edades:
20, 49, 59, 18, 32, 32, 63, 24, 20, 32, 53, 48

Q1 = 1/ 4n = 0,25 *12 = 3 Q3 =3/4n =0,75*12=9

2 = 3 Q3 =3/4n =0,75*12=9
18, 20, 20, 24, 32, 32, 32, 48, 49, 53, 59, 63

Q1 Q3
Q1=(20+24)/2= 22 aos Q3=(49+53)/2= 51 aos

R=51-22=29 aos

Interpretacin:

A partir desde los 22 aos hasta los 51 aos se ubica el 50% central de la distribucin.
29 aos de edad es la distancia existente en el 50% central de la distribucin.

Para datos agrupado:



( )

= , +
x Ai

Lim,I: lmite inferior del intervalo que contiene al primer cuartil (Fr% supera al 25%)

N: total de casos

Fi-1: frecuencia acumulada absoluta de la clase anterior a la que contiene el primer cuartil

Fi: frecuencia absoluta simple de la clase que contiene al primer cuartil

Ai: amplitud el intervalo que contiene al primer cuartil

Distribucin de pases segn porcentaje de la poblacin de 15 y ms aos de edad analfabeta,


Amrica Latina y el Caribe. Ao 2 0 1 0

Li - Ls xm fi fr(%) FI Fr(%) Ai
0-5 2,5 14 50 14 50 5
5-10 7,5 8 28 22 78 5
10-20 15 3 11 25 89 10
20-42 31 3 11 28 100 22
28 100


( )
= + =


( )
= + = ,

RI = 9,4 2,5 = 6,9


Rango o recorrido:

Su ventaja es que es fcil de calcular, adems posee una interpretacin intuitiva y su


desventaja es que es muy general y solo nos da una leve idea de la amplitud de variacin en
puntajes extremos y descarta los valores intermedios de la distribucin.

Rango intercuartlico:

Tiene la ventaja de un clculo fcil y no sufre la influencia de sus valores extremos y su


desventaja es que solo mide la dispersin en el centro de distribucin y tambin mide slo la
distancia entre Q3 y Q1 y no la forma en la que estn distribuidos los datos.

Diagrama de dispersin

El diagrama de dispersin nos permite analizar si existe alguna relacin entre dos variables, es
una herramienta grfica para facilitar una mejor visin de los datos de interpretarlos, adems
simplificada el anlisis complejo en situaciones cmicas y da una mejor comunicacin tambin
nos brinda mayor informacin que una anlisis matemtico de correlacin y nos da la
oportunidad de posibilidades y alternativas para un estudio.

Para realizar un diagrama de dispersin es necesario seguir una serie de pasos:

1. Se debe elaborar una teora vlida con una relacin entre dos variables.
2. Se debe obtener los pares de datos que correspondan a las dos variables.
3. Se deben determinar los valores mximo y mnimo para cada una de las variables.
4. Ubicar en que eje irn cada una de las variables.
5. Graficar en el eje horizontal y vertical.
6. Se debe marcar en el diagrama de dispersin los ares de datos.
7. Se debe incluir la informacin relevante en el grfico.
8. Interpretar los resultados.

El diagrama de dispersin es muy importante para estudiar las relaciones de causa y efecto
que vienen de una causa que no se posee informacin y es muy difcil de medir por lo tanto no
sirve para actuar de una manera ms simple en los procesos que son complejos. Pero hay que
tener en cuenta que las relaciones que existen no son causa de otra.

Anlisis de un diagrama de dispersin

1. Elaborar una teora vlida con la relacin entre dos variables.


2. Levantamiento de datos y construccin del diagrama.
3. Identificar y clasificar la correlacin
4. Realizar un anlisis y buscar explicaciones.

La utilizacin del diagrama de dispersin es muy ocupada para ensayar teoras y buscar sus
causas, buscar soluciones y obtener resultados de su calidad.
Ejemplo:

Errores en las facturas

Un equipo busca analizar las causas de los frecuentes errores en las facturas. El nmero de
datos a rellenar variaba segn el tipo de factura. Un miembro dio la idea de simplificar las
facturas que son muy complicadas, lo que segn el criterio genera la mayora de errores. El
equipo investigara en primer lugar la teora en la que el nmero de errores en una factura
dependa de la cantidad de datos a incluir en la misma. El equipo tomo los datos relativos a los
meses ltimos y los represent en un Diagrama de Dispersin.

Numero de datos de la Numero de errores en


factura factura
8 3
15 2
15 5
12 4
10 7
25 2
20 3
17 9
18 3
23 4
27 1
8 0
18 6
20 1
18 0
15 7
26 1
20 5
10 2
10 3
9 5
13 3
20 9
23 10
20 12
23 12
20 8
13 9
24 0
13 0
13 1
23 6
15 6
22 9
24 8
19 6
12 12
27 1
12 2
17 4

Errores de facturas

15

13
. . .
Nro. de errores de factura

11
. .
9
. . ...
7
. . ..
5
. . .
3
. . . . . . . .
0
5 10 15 20 25 30

El diagrama de dispersin no pareca confirmar la teora en la relacin del nmero de das


respecto a la cantidad de errores.

Tabla de contingencias:

Es una manera muy til que sirve para clasificar los autos mediante un recuento traspasando
los valores a una tabla de contingencia, dicha tabla se divide en celdas en las cuales figuran
probabilidades y es una de las formas de manera ms comn para resumir datos categricos
cuyo inters se basa en que si existe alguna relacin entre una variable (fila) y otra
variable(columna) para calcular la intensidad de esa asociacin sea as X y Y dos variables
categricas e I y J respectivamente y se pueden clasificar como categoras

Se le conoce con el nombre de tabla de contingencia gracias al autor Pearson que dio su
nombre 1904, tambin se le conoce como una tabla de clasificacin cruzada.

Ejemplo

Se va a sortear un viaje a Italia entre los 120 mejores usuarios de una agencia de autos.los
cuales 65 son mujeres, 80 estn casados y 45 son mujeres casadas. Se pide:
1. Cul es la probabilidad de que le toque el viaje a un hombre soltero?

2. Si del ganador se sabe que es casado, cul ser la probabilidad de que sea una mujer?

Hombres Mujeres
Casados 45 80
Solteros 65 120

Hombres Mujeres Total


Casados 35 45 80
Solteros 20 20 40
Total 505 65 120

P(hombre soltero)= 20/120 = 1/6

P(mujer/ casada)=45/80= 0,5625

Bibliografa:

http://www.estadisticaparatodos.es/taller/graficas/cajas.html

http://www.fder.edu.uy/contenido/rrii/contenido/curricular/estadistica/010102.pdf

http://www.universoformulas.com/estadistica/descriptiva/rango-intercuartilico/

http://www.fundibeq.org/opencms/export/sites/default/PWF/downloads/gallery/methodo
logy/tools/diagrama_de_dispersion.pdf

http://www.vitutor.com/pro/2/a_14.html
UNIVERSIDAD DE CUENCA

FACULTAD DE CIENCIAS ECONOMICAS

CARRERA MARKETING

Trabajo de:

Estadstica

Profesor:

Javier vila

Temas:

Diagrama de caja

Rango Intercuartilico

Diagrama de dispersin

Tabla de contingencias

Realizado por:

Juan Pablo Avils

Byron Campoverde

Jos Vinueza
UNIVERSIDAD DE CUENCA

FACULTAD DE CIENCIAS ECONOMICAS

CARRERA MARKETING

Trabajo de:

Estadstica

Profesor:

Javier vila

Temas:

Diagrama de caja

Rango Intercuartilico

Diagrama de dispersin

Tabla de contingencias

Realizado por:

Juan Pablo Avils

También podría gustarte