Bidimensional Separata 6

Descargar como doc, pdf o txt
Descargar como doc, pdf o txt
Está en la página 1de 17

ESTADÍSTICA DESCRIPTIVA

DISTRIBUCIONES BIDIMENSIONALES

Aníbal P.SIFUENTES DAMIAN

DEPARTAMENTO ACADEMICO DE MATEMATICA Y


ESTADÍSTICA

FACULTAD DE CIENCIAS
Universidad Nacional “José Faustino Sánchez Carrión”
HUACHO - PERU- 2008
CONTENIDO

INTRODUCCION ………………………………………………………. 1

I. VRIABLE ESTADÍSTICA BIDIMENSIONAL ………………… 2

I.1. Definición ………………………………………………………… 2

II. PRESENTACIÓN: TABLAS ESTADÍSTICAS


BIDIMENSIONALES DE VARIABLES CUANTITATIVAS ….. 3

2.1. Distribuciones marginales ………………………………………… 4


2.2. Medidas de tendencia central en distribuciones
Bidimensionales ……………………………………………………. 5
2.3. Medidas de dispersión: varianzas, desviación estándar
y covarianza ………………………………………………………. 5

III. PRESENTACIÓN: TABLAS ESTADÍSTICAS


BIDIMENSIONALES DE VARIABLES CUALITATIVAS …… 12

IV. BIBLIOGAFIA ……………………………………………………. 15

ii
INTRODUCCION

En el presente documento, pongo a vuestra consideración una técnica


estadística descriptiva, denominada Distribuciones Bidimensionales, el cual consiste en
estudiar dos variables o características de las unidades de análisis en la población o
muestra. Las variables pueden ser cualitativas, cuantitativas o mixtas.

El objetivo de este tema expuesto en el presente documento consiste en poner


en consideración al lector todos los procedimientos de cómo se elaboran las tablas
estadísticas bidimensionales y a su vez como se interpretan. También se dan las pautas
de como calcular e interpretar las medidas de tendencia central, de dispersión y la
covarianza, la cual indica de qué manera están relacionadas las variables
bidimensionales. Así mismo abordamos la tabla bidimensional de variables
cualitativas, la cual también toma el nombre de Tabla de Contingencia”.

El contenido se presenta en cuatro partes (I, II, III) muy simplificadas e


interrelacionadas.

Espero las sugerencias de los lectores, para el mejoramiento de este pequeño


documento que va dirigido sobre todo a los estudiantes y profesionales de nivel
superior.

Aníbal P. SIFUENTES DAMIAN


I. VARIABLE ESTADÍSTICA BIDIMENSIONAL

I.1. Definición

Consiste en estudiar las características de cada individuo o elemento. Si asociamos


a cada característica bajo estudio una variable, digamos X e Y respectivamente,
tendremos el para ordenado (X,Y) de variables, denominado “variable estadística
bidimensional”.

La variable estadística bidimensional (X,Y) se puede clasificar según la naturaleza


de sus variables, en: cualitativas, cuantitativas discretas y cuantitativas continuas;
obteniéndose los siguientes tipos de distribuciones bidimensionales, con:

a) Dos caracteres cualitativos: por ejemplo, nivel educacional y religión.

b) Un carácter cualitativo y otro cuantitativo: Estos pueden ser:

i) Uno cualitativo y otro cuantitativo discreto: por ejemplo, nivel


educacional y número de hijos de las personas.

ii) Uno cualitativo y otro cuantitativo continuó: por ejemplo, edad y estado
civil de las personas.

c) Dos caracteres cuantitativos. Estos pueden ser:

i) Los dos cuantitativos discretos: por ejemplo, número de horas extras


trabajadas y número de accidentes de trabajo.

ii) Uno discreto y el otro continúo: por ejemplo, número de horas extras
trabajadas y edad de la persona.

iii) Los dos contiguos: por ejemplo, estatura y peso de las personas.

El tema central del estudio en distribuciones bidimensionales, es:


 El estudio descriptivo de las distribuciones bidimensionales, como son: la
presentación de tablas estadísticas bidimensionales, la representación gráfica,
la descripción numérica, etc.
 El estudio de la relación (asociación) entre las variables: análisis de
correlación y análisis de regresión.
2
II. PRESENTACIÓN: TABLAS ESTADÍSTICAS BIDIMENSIONALES DE
VARIABLES CUANTITATIVAS.

Sea (X, Y) una variable estadística bidimensional tal que los distintos valores que
toman X e Y son:

: Las r modalidades o valores de la variable X

: Las s modalidades o valores de la variable Y

Una distribución bidimensional de frecuencias es un arreglo de los valores


observados , de la variable
bidimensional (X;Y), con sus respectivas frecuencias, en una tabla de doble
entrada de la forma:

TABLA Nº 01: .......................................HUACHO.............................


Y
X

FUENTE:

Donde:
i: denota las filas y j: denota las columnas

: Frecuencia absoluta simple del par (xi,yj), es el número de veces que aparece
repetido el par (xi,yj), para todo i=1,2, ... , r y j = 1,2, ... , s

3
= : total de pares con primera componente y se llama

frecuencia marginal del valor

= : total de pares con segunda componente y se llama

frecuencia marginal del valor

: Número total de pares observados

Nota: A veces es necesario usar las frecuencias relativas.

: Frecuencia relativa simple del par (xi,yj), para todo i=1,2, ... , r y

j = 1,2, ... , s

2.1. Distribuciones marginales

La tabla representada con la variable X y sus frecuencias marginales, se


denomina distribución marginal de la variable X, y similarmente la que
representa a la variable y sus frecuencias marginales recibe el nombre de
distribución marginal de la variable Y. Las distribuciones marginales
obtenidas de la tabla bidimensional son:

4
Frecuencia marginal de x

TOTAL n

Frecuencia marginal de y
Y

TOTAL n

2.2. Medidas de tendencia central en distribuciones bidimensionales

Media marginal de X:

Media marginal de Y:

2.3. MEDIDAS DE DISPERSION: VARIANZAS Y COVARIANZA

2.3.1. Varianzas

Varianza marginal de X

Fórmula práctica:

5
Varianza marginal de Y

2.3.2. La covarianza.

Esta medida descriptiva bidimensional trata de expicar la relación que existe


entre dos variables cuantitativas.

Fórmula práctica:

Si:
i) , Las variables se relacionan de una manera
directamente proporcional, es decir, si la variable X aumenta, la
variable Y también aumenta o viceversa.
ii) , Las variables se relacionan de una manera
inversamente proporcional, es decir, si la variable X disminuye, la
variable Y aumenta o viceversa.
iii) , Las variables no se relacionan. Es decir que las
variables so independientes.

Ejemplo:

De una población de 200 fábricas se seleccionó una muestra de 20 fábricas,


se seleccionó, obteniéndose información respecto al número de trabajadores
(X) y respecto a su producción (Y) en TM, como sigue:

6
X 10 15 12 11 18 14 10 13 15 16 17 12 18 14 13 16 17 15 11 18
Y 6 8 7 9 8 6 7 10 10 8 8 7 9 6 7 8 9 10 5 8

a) Construir la distribución de frecuencias completa. Interprete


algunas frecuencias.
b) Determine las frecuencias marginales
c) Calcule e interprete:

SOLUCIÓN:
a)
1. FRECUENCIAS ABSOLUTAS
Frecuencia Absoluta Simple: nij
TABLA N° 02: DISTRIBUCIÓN DE FÁBRICAS, POR PRODUCCIÓN,
SEGÚN N° DE TRABAJADORES
Y
5 6 7 8 9 10 ni. Ni.
X
10 1 1 2 2
11 1 1 2 4
12 2 2 6
13 1 1 2 8
14 2 2 10
15 1 2 3 13
16 2 2 15
17 1 1 2 17
18 2 1 3 20
n.j 1 3 4 6 3 3 20 …..
N.j 1 4 8 14 17 20 ….. …..

Interpretacion(ejercicio para el estudiante):

2. FRECUENCIAS RELATIVAS

Frecuencia Relativa simple:

Propiedad:

7
TABLA N° 04: DISTRIBUCIÓN DE FÁBRICAS, POR PRODUCCIÓN,
SEGÚN N° DE TRABAJADORES
Y
X 5 6 7 8 9 10 hi . Hi.

10 0,05 0,05 0,10 0,10


11 0,05 0,05 0,10 0,20
12 0,10 0,10 0,30
13 0,05 0,05 0,10 0,40
14 0,10 0,10 0,50
15 0,05 0,10 0,15 0,65
16 0,10 0.10 0,75
17 0,05 0,05 0,10 0,85
18 0,10 0,05 0,15 1,00
h.j 0,05 0,15 0,20 0,30 0,15 0,15 1,00 …..
H.j 0,05 0,20 0,40 0,70 0,85 1,00 ….. …..

Interpretacion(ejercicio para el estudiante):

Frecuencia Relativa simple porcentual:

TABLA N° 05: DISTRIBUCIÓN DE FÁBRICAS, POR PRODUCCIÓN,


SEGÚN N° DE TRABAJADORES
Y
X 5 6 7 8 9 10 hi . Hi.

10 5 5 10 10
11 5 5 10 20
12 10 10 30
13 5 5 10 40
14 10 10 50
15 5 10 15 65
16 10 10 75
17 5 5 10 85
18 10 5 15 100
h.j 5 15 20 30 5 15 100 …..
H.j 5 20 40 70 85 100 ….. …..
Interpretacion(ejercicio para el estudiante):

8
b) Distribución de frecuencias marginales:
Está representado por: ni. y n.j

Distribución marginal de X

X ni.
10 2
11 2
12 2
13 2
14 2
15 3
16 2
17 2
18 3
TOTAL 20

Distribución marginal de Y

Y n.j
5 1
6 3
7 4
8 6
9 3
10 3
TOTAL 20

c) Calculo de:
Calculo de la media aritmética y varianza de la distribución
marginal de X.

X ni. X* ni. X2*ni.


10 2 20 200
11 2 22 242
12 2 24 288
13 2 26 338
14 2 28 392
15 3 45 675
16 2 32 512
17 2 34 578
18 3 54 972
TOTAL 20 285 4197

Media de la variable marginal de X:

9
Interpretación:
: significa que el número promedio de trabajadores de
las fábricas es de 14 aproximadamente.

Varianza de la variable marginal de X:

6,7875

Interpretación:
La dispersión de los trabajadores de las fabricas es de
aproximadamente de 7 trabajadores al cuadrado.

Desviación estándar de la variable marginal de X

Interpretación:
La dispersión de los trabajadores de las fabricas es de
aproximadamente de 3 trabajadores.

Calculo de la media aritmética y varianza de la distribución


marginal de Y.

Y n.j Y* ni. Y2*ni.


5 1 5 25
6 3 18 108
7 4 28 196
8 6 48 384
9 3 27 243
10 3 30 300
TOTAL 20 156 1256

Media de la variable marginal de Y:

10
Interpretación:
: significa que la producción promedio de las fábricas es
de 8 toneladas métricas aproximadamente.

Varianza de la variable marginal de Y:

Interpretación:
La dispersión de la producción de las fabricas es de
aproximadamente de 2 toneladas métricas al cuadrado.

Desviación estándar de la variable marginal de Y

Interpretación:
La dispersión de la producción de las fabricas es de
aproximadamente de 1 tonelada métrica.

Calculo de la covarianza de distribución bidimensional de la


variable (X,Y)
Usamos la información original para calcular esta medida:

Interpretación:

11
Como , significa que el número de
trabajadores y la producción en toneladas métricas en las fábricas
se relacionan de una manera directamente proporcional, es decir,
si se aumenta el número de trabajadores, la producción también
aumenta.

III. PRESENTACIÓN: TABLAS ESTADÍSTICAS BIDIMENSIONALES DE


VARIABLES CUALITATIVAS

Estas tablas se denominan tablas de contingencia o tablas de datos categóricos. La


tabla de contingencia es una tabla de doble entrada, donde en cada casilla figurará
el número de casos o individuos que poseen un nivel de uno de los factores o
características analizadas y otro nivel del otro factor analizado. La tabla de
contingencia se define por el número de atributos o variables que se analizan
conjuntamente y el número de modalidades o niveles de los mismos.

Así por ejemplo la siguiente tabla se refiere al sexo y a los hábitos de fumar de las
personas distribuidos de la siguiente manera:

SEXO
FUMA
HOMBRE MUJER MARGINAL
SI 65 58 123
NO 43 67 110
MARGINAL 108 125 233

Interpretacion:
= número de observaciones que tienen el atributo i y j

= número de individuos que tienen el atributo i (marginal i)

= número de individuos que tienen el atributo j (marginal j)

En esta tabla se puede observar en primer lugar que de los 233 individuos de los
que se tiene información 108 son hombres y 125 son mujeres. Asimismo se sabe

12
que 123 de ellos fuman y 110 no. La tabla de contingencia nos permite tener
información cruzada sobre ambas variables: de los 108 hombres, 65 fuman y 43
no, mientras que en el caso de las mujeres, 58 fuman y 67 no.

El ejemplo propuesto es una tabla de contingencia 2x2, ya que tiene dos atributos
(FUMA Y SEXO) y cada uno de ellos tiene dos niveles. Si quisiéramos analizar
conjuntamente tres variables cualitativas, como por ejemplo, Fumar, Sexo y Edad,
y esta última variable convertida en variable cualitativa ordinal tuviera tres niveles
(<20 años, de 20 a 40 años, >40 años), obtendríamos tres tablas como la anterior,
una para cada modalidad de edad y la tabla de contingencia tendría una dimensión
322.

A partir de la tabla de contingencia se puede además analizar si existe alguna


relación de dependencia o independencia entre los niveles de las variables
cualitativas objeto de estudio. El hecho de que dos variables sean independientes
significa que los valores de una de ellas no están influidos por la modalidad o nivel
que adopte la otra.

13
Ejercicios

1. Proponga una tabla de contingencia de variables cualitativas relacionados con


su especialidad. Interprételo

2. En una encuesta realizada en una población se obtuvo la siguiente información,


con relación al número de habitantes (X) y dormitorios (Y) en una muestra de
50 viviendas.
HABITANTES 6, 3, 5, 5, 8, 5, 6, 5, 4, 2, 8, 4, 2, 2, 3, 3, 3, 5, 3, 3, 5, 3, 5, 2, 3
DORMITORIOS 2, 2, 2, 2, 3, 2, 2, 2, 1, 1, 4, 3, 1, 1, 1, 2, 1, 2, 1, 1, 2, 2, 2, 1, 1,

HABITANTES 4, 3, 6, 4, 2, 6, 4, 4, 4, 4, 4, 3, 4, 4, 4, 4, 6, 3, 4, 4, 5, 5, 4, 8, 2
DORMITORIOS 2, 1, 3, 1, 1, 3, 1, 2, 1, 1, 1, 1, 1, 1, 1, 2, 1, 2, 1, 2, 2, 2, 2, 4, 1

Se pide:
a) Construir una tabla bidimensional de frecuencias absolutas y relativas.
b) Determine las frecuencias acumuladas absolutas y relativas. Interprételos.
c) Hallar las medias y varianzas marginales. Interprételos.
d) Hallar la covarianza.

14
IV. BIBLIOGRAFIA

1. AVILA ACOSTA, Roberto 1997. "Estadística elemental". Editorial Estudios y


Ediciones. Lima.
2. BERENSON, Mark L./ 1996."Estadística Básica en Administración Conceptos y
LEVINE, David M. Aplicaciones”. Sexta Edición. Edit. Prentice Hall
México.
3. CORDOVA ZAMORA, Manuel 2009. "Estadística Descriptiva e Inferencial". Tercera
Edición. Edit. Moshera R. L. Lima - Perú.
4. GARCIA ORE, Celestino. 2002. "Métodos Estadísticos en la Evaluación
Educacional".
Edit. MACRO . EIRL. Lima-Perú. Edit. Concytec.
Perú.
5. GUERRERO G. Vierer M. 1989. "Estadística para Estudiantes de Economía y otras
Ciencias Sociales. 1ra Edición Fondo de Cultura.
Económica. México.
6. LEVIN, Richard/RUBIN, David s. 1999. "Estadística para Administradores". Sexta Edición.
Prentice Hall. México
7. MOYA CALDERON. Rufino 1991."Estadística Descriptiva Conceptos y aplicaciones".
Primera Edición. Edit. San Marcos Lima - Perú.

15

También podría gustarte