Guia 1 Estadistica Sena

Descargar como ppsx, pdf o txt
Descargar como ppsx, pdf o txt
Está en la página 1de 63

SERVICIO NACIONAL DE APRENDIZAJE

SENA

GUIA BASICA DE ESTADSTICA


DESCRITIVA

Instructor: FRANKILL SALAZAR LAMILLA


E-mail: [email protected]

ESTADISTICA DESCRIPTIVA
GUIA N2
Introduccin a la Estadstica,
Fenmenos, Poblacin, Muestra y
Tipos de Variables

La Estadstica
Es la rama de las matemticas que se va a encargar de

Recopilar, Organizar, y Procesar datos con el fin de inferir


las caractersticas de la poblacin objetivo.

La Estadstica Descriptiva

Trata del recuento, ordenacin y clasificacin de los


datos obtenidos por las observaciones.

Se construyen tablas y se presentan grficos que


permiten simplificar los datos obtenidos.

Se calculan parmetros estadsticos. Se limita a realizar


deducciones directas de los datos y parmetros
obtenidos
4

Fenmeno Determinstico

Un fenmeno determinstico es aquel en que se obtiene siempre el


mismo resultado bajo las mismas condiciones iniciales.

La relacin causa-efecto se conoce en su totalidad. Por ejemplo,


todos los fenmenos que siguen las leyes de la fsica clsica, como
puede ser la cada de un cuerpo.

Ejemplos:

Si se lanza una pelota hacia arriba, sabemos que tiene que caer.

Si se lanza un trozo de hielo en el agua, este se derretir.

Si el agua se calienta a 100C esta se evaporara.

Fecha del cumpleaos.

Nombre del prximo mes.

Fenmeno no Determinstico

Un fenmeno no determinstico es aquel que bajo el mismo


conjunto aparente de condiciones iniciales, puede presentar
resultados diferentes, es decir, no se puede predecir el resultado
exacto de cada experiencia particular.

Este tipo de fenmeno es opuesto al fenmeno determinista, en el


que conocer todos los factores de un experimento nos hace
predecir exactamente el resultado del mismo.

Ejemplos:

Si se lanza una moneda esta puede caer cara o sello.

El lanzamiento de los dados, pudiendo salir el 1,2,3,4,5 o 6

Los nmero premiados de los juegos de azar.

Poblacin

Todo estudio estadstico esta referido a un conjunto o coleccin de


persona o cosas . Este conjunto de personas o cosas es lo que se
denomina POBLACIN.

Las personas o cosas que forman parte de esta poblacin se


denominan ELEMENTOS . En sentido estadstico este elemento
puede ser algo tangible como una persona , automvil o casa, por
ejemplo, o algo ms abstracto como temperatura, voto, intervalo de
tiempo.

A su vez cada elemento de la poblacin puede ser objeto de estudio


estadstico. Si consideramos a una persona, se puede distinguir los
siguientes caracteres o cualidades: sexo, edad, nivel de estudio,
profesin, peso, color de ojos, estatura, etc. Se puede estudiar uno
o ms aspectos de cada elemento de la poblacin. 7

Clasificacin de la Poblacin

La poblacin segn su tamao puede ser de dos tipos:

Poblacin Finita: Cuando el nmero de elementos que la forma es


finito.

Ejemplo: Si estudiamos el precio de la vivienda en una ciudad, la


poblacin ser el total de las viviendas de dicha ciudad.

Ejemplo: El nmero de alumnos en un centro educacional.

Poblacin Infinita: Cuando el nmero de elementos que la forma es


infinito o tan grande que pudiera considerarse infinito.

Ejemplo: Si se realizara un estudio de todos los productos que


existen en el mercado.

Ejemplo: Un estudio astronmico en base a todas las estrellas del


universo.
8

Muestra

En un estudio estadstico no se trabaja con todos los


elementos de la poblacin, sino que se realiza sobre un
subconjunto de ella.

Este subconjunto puede ser una muestra, cuando se toma


un determinado nmero de elementos de la poblacin, sin
que en principio tengan nada en comn.

La muestra debe obtener toda la informacin deseada


para tener la posibilidad de extraerla, esto slo se puede
lograr con una buena seleccin de la muestra y un trabajo
muy cuidadosos y de alta calidad en la recogida de los
datos.
9

Tipos de Variable y Clasificacin

10

Variables

Los caracteres de un elemento pueden ser de


diferentes tipos, por lo cual las variables se pueden
clasificar en dos grandes clases:

Variables cualitativas o atributos: Las cuales no se


pueden medir numricamente. Ejemplo: nacionalidad,
color de piel, sexo, etc.

Variables cuantitativas: Tienen valor numrico.


Ejemplo: Estatura, edad, precio producto, etc.
11

Variables

Tambin se pueden clasificar, a su vez en:

Variables unidimensionales: Slo recogen informacin


sobre una caracterstica. Ejemplo: edad de los alumnos de
una clase.

Variables bidimensionales: Recogen informacin sobre


dos caractersticas de la poblacin. Ejemplo: edad y
altura de los alumnos de una clase.

Variables pluridimensionales: Recogen informacin sobre


tres o ms caractersticas. Ejemplo: edad, altura y peso
de los alumnos de una clase.
12

Variables Cuantitativas

Las variables cuantitativas se pueden clasificar en:

Variables discretas: Slo pueden tomar valores enteros


(1, 2, 8, -4, etc.). Ejemplo: nmero de hermanos
(puede ser 1, 2, 3....,etc., pero nunca podr ser 3,5

Variables continuas: Pueden tomar cualquier valor real


dentro de un intervalo. No se pueden expresar
mediante un nmero entero. Ejemplo: la velocidad de
un vehculo puede ser 80,3 km/h, 94,57 km/h...etc.
13

Variables Cuantitativas

La escala de Intervalo:

1.

Posee una unidad de medida constante y arbitraria.

2.

Posee un cero arbitrario, es decir no indica la ausencia de la


caracterstica que se esta midiendo.

3.

Prevalece la relacin de orden mayor que (>). La diferencia entre


los valores tiene significado.

4.

Entre los valores de las variables solo es posible realizar la suma y la


resta de como operaciones aritmticas.

EJEMPLOS:

1.

La temperatura de una ciudad medida en grados Celsius o Fahrenheit.

2.

La altura de las ciudades tomando como referencia el nivel del mar.

3.

El rendimiento acadmico medido en una escala de 0 a 20.


14

Variables Cuantitativas

La escala de Razn:

1.

Posee una unidad de medida constante y arbitraria.

2.

Posee un cero absoluto, es decir indica la ausencia de la caracterstica


que se esta midiendo. Este cero tiene significado.

3.

Prevalece la relacin de orden mayor que (>). El cociente entre ellos


tiene significado.

4.

Se puede realizar todas las operaciones aritmticas entre los valores de


las variables.

EJEMPLOS:

1.

Edad.

2.

Peso.

3.

Estatura

4.

Tiempo invertido por un estudiante en realizar una prueba.


15

Variables Cualitativas

ESCALA NOMINAL.

1.

Se clasifican a los sujetos en categoras, mutuamente


excluyentes y totalmente exhaustivas, tal que todos los
sujetos clasificados en la misma categora son equivalentes
respecto a la variable que se esta midiendo.

2.

Solo tiene sentido en la relacin de igualdad desigualdad.


Solo clasifica las variables.

3.

Se pueden usar nmeros, letras o smbolos para identificar a


cada categora de variable.

4.

No se puede realizar ninguna operacin aritmtica en esta


escala.
16

Variables Cualitativas

ESCALA NOMINAL.

Soltero
Masculino M
GENERO

Casado

ESTADO CIVIL

Femenino F
Viudo

Divorciado

17

Variables Cualitativas

ESCALA ORDINAL.

1.

Se usa cuando es posible establecer una relacin de


orden entre las distintas categoras de la variable.
Prevalece la relacin de orden mayor que (>)

2.

Se pueden usar letras o nmeros para identificar cada


categora de la variable. Los nmeros o letras usados
deben reflejar el orden de la categora.

3.

No se puede realizar operaciones aritmticas entre los


nmeros asignados a las distintas categoras. Estos
nmeros solo reflejan una relacin de orden.
18

Variables Cualitativas

ESCALA ORDINAL.
1

Preescolar
Educacin Bsica
NIVEL DE
INSTRUCCIN

Mala
2

Regular

CALIDAD DE
UN SERVICIO

Media y diversificada 3 Buena

Superior

Excelente

19

Poblacin, Muestra y Variable

20

Tipos de Frecuencias,
Representacin Grfica y Variables
Discretas.

Tablas de Frecuencia Variable Cualitativa

La muestra es el sub-conjunto de nuestro universo o


poblacin y del cual se recopilan nuestros datos. Es
necesario que la muestra sea representativa.

Se debe tener presente que la muestra esta conformada por


N elementos.

Uno de los primeros pasos es la tabulacin de resultados, es


decir, recoger la informacin de la muestra resumida en un
tabla en que cada valor de la variable se le asocian
determinados nmeros que representan el nmero de veces
que ha aparecido, su proporcin con respecto a otros
valores de la variable, etc.
22

Tipos de Frecuencia

FRECUENCIA ABSOLUTA: La frecuencia absoluta de una


variable estadstica, definida Xi, es el numero de veces que
aparece en la muestra dicho valor de la variable.

Se representa por: ni

FRECUENCIA RELATIVA: La frecuencia relativa esta influida


por el tamao de la muestra, es directamente proporcional. Si
la muestra es muy grande, para poder comparar se requiere
utilizar la frecuencia relativa, la cual es el cociente entre la
frecuencia absoluta y el tamao de la muestra.

Se representa por: fi= ni/N (en algunos textos y/o ejercicios


como hi)
23

Ejemplo

Se realiz una encuesta a 419 personas, en relacin a la


adquisicin de un cierto bien.

Los siguientes datos reflejan las respuestas de las personas


encuestadas a la pregunta comprara usted un computador?

a)

Qu tanto por ciento de las personas no responden?

b)

Qu tanto por ciento de las personas comprara un


computador?
24

Solucin

a)

El porcentaje de personas que no responden : 0,1098 x


100 = 10,98%

b)

b. El porcentaje de personas que respondieron si :


0,6993 x 100 = 69,93%
25

Representacin Grfica

Uno de los grficos ms utilizados para representar


variables cualitativas es el grfico sectorial o circular.

Para construir este grfico, se utiliza una circunferencia,


cuyo crculo se divide en sectores tales que sus medidas
angulares centrales y, por lo tanto la superficie del sector
circular sean proporcionales a las magnitudes de los
valores de la variable que representan.

Al total le corresponde el crculo completo, es decir los


360 de la circunferencia y por proporciones, se encuentra
el nmero de grados que le corresponde a cada parte.
26

Ejemplo

27

Representacin Grfica

Grfico de barras: Es aquel en el cual el fenmeno que


se estudia queda representado por una serie de
rectngulos, barras o paraleleppedos, los cuales pueden
dibujarse horizontalmente o verticalmente.

Este grfico se utiliza para representar variables de tipo


cualitativo o cuantitativo discreto.

Ejemplo: Confeccionar grfico de barras, con respecto a


la siguiente tabla de distribucin de frecuencias:
28

Representacin Grfica

29

Representacin Grfica

El Pictograma: Se caracteriza este grfico por figuritas que


representan cierta cantidad (por ejemplo 1%). Cada valor
de la variable lleva tantas figuritas como sea su frecuencia

1.

Cada fila de figuritas, debe llevar el rtulo que la


identifica. Si fuera necesario, se agrega una leyenda
explicativa.

2.

Se debe usar la misma figurita para todo el grfico.

3.

El tamao y el color de las figuritas debe ser el mismo en


todo el grfico.

30

Representacin Grfica
4.

Debe indicarse
claramente cunto
representa cada figurita,
y en qu unidades.

5.

Rotular el grfico,
especificando qu
muestra. Asimismo, si
fuera posible indicar la
fuente de los datos.

6.

Evitar trazados en 3D,


que suelen interferir la
informacin.

31

Tabla de frecuencia para variable discreta

Sean x1 , x2 , x3 ..............xm los m diferentes


valores de la variable.

Frecuencia absoluta: Se denomina frecuencia absoluta


al nmero de veces que se repite un valor de la
variable en el conjunto de observaciones.

Frecuencia relativa: Se denomina frecuencia relativa


al cociente de la frecuencia absoluta y el nmero tota
de observaciones n.
32

Tabla de frecuencia para variable discreta

Frecuencia absoluta acumulada: Se llama Frecuencia


Absoluta Acumulada, a la suma acumulativa trmino a
trmino de las frecuencias absolutas.

El ltimo trmino de las Frecuencias Absolutas


acumuladas es n.

Frecuencia relativa acumulada: Se llama Frecuencia


Relativa Acumulada, a la suma acumulativa trmino a
trmino de las frecuencias relativas.

El ltimo trmino de las Frecuencias Relativas


Acumuladas es 1.
33

Ejemplo de Variable Discreta

a)

En un packing se examin un lote de 30 cajas de


duraznos para exportacin. El nmero de duraznos en
mal estado en cada caja es el siguiente.

Construir tabla de distribucin de frecuencias.


34

Ejemplo de Variable Discreta


b)

Cuantas cajas tienen 2 o 3 duraznos en mal estado?


5 + 8=13 Cajas

c)

Qu tanto por ciento de las cajas tiene a lo ms 1


durazno en mal estado?
10 + 23,33 = 33,33%

35

Ejemplo de Variable Discreta

Se dispone de la siguiente informacin sobre el nmero de


personas activas (trabajan) en 25 familias:

a)

Qu tipo de variable es?

b)

Construir Tabla de Distribucin de Frecuencias

c)

Qu tanto por ciento de las familias tienen 2 o ms personas


activas?

d)

Que tanto por ciento de las familias tienen entre 2 y 3 personas


activas?
36

Ejemplo de Variable Discreta


a)

Variable Discreta

b)

Tabla

c)

68%

d)

40%
37

Representacin Grfica

Los grficos ms adecuados, para representar una


variable numrica discreta son:

1.

Diagrama de tallo y hojas

. Un

procedimiento semi- grfico (tabular y grfico) de


presentar la informacin para datos cuantitativos,
especialmente til cuando el nmero de observaciones es
pequeo (menor a 50)

38

Construccin Tallo y Hoja

Para datos con un solo dgito, el tallo queda constituido


por los distintos valores de la variable, ordenados de
menor a mayor, de arriba hacia abajo.

Las hojas quedan representadas por tantos ceros como


sea su frecuencia:

Ejemplo: si el 7 se repite 4 veces, se escribe

39

Construccin Tallo y Hoja

Para datos con dos dgitos, escribir a la izquierda de la


lnea los dgitos de las decenas, que forman el tallo, y a
la derecha las unidades que sern hojas.

Ejemplo: El nmero 72 se escribe.

40

Construccin Tallo y Hoja

Para datos con tres dgitos el tallo estar formado por los
dgitos de las centenas y decenas, que se escribirn a la
izquierda, separados de las unidades que sern las hojas.

Ejemplo: El nmero 754 se escribe

41

Construccin Tallo y Hoja

Los siguientes datos representan los ingresos semanales


(en dlares) de un grupo de trabajadores.
114, 125, 114, 124, 143, 152, 133, 113, 178, 127, 135, 161, 126, 134, 147,
132

42

Representacin Grfica
2.

Grfico de Segmento

. Para

representar grficamente las distribuciones de


frecuencias absolutas (o relativas), se ubican en el
eje horizontal, los valores de las variables y se
levantan sobre cada uno de ellos, un segmento
vertical de longitud igual a la frecuencia absoluta (o
relativa) correspondiente a cada valor x.

43

Ejemplo

Dada la siguiente tabla de distribucin, construir grfico de


segmentos, utilizando frecuencias absolutas

44

ESTADSTICA

Tablas de Frecuencia para Variables


Continuas, Representacin Grfica y
Tabla de Contingencia

Tabla de frecuencia Variable Continua

Si la variable que se esta midiendo es de tipo


continuo (puede tomar cualquier intervalo
determinado por los nmeros reales), no tiene
sentido el tabularla para cada una de las
observaciones dado que es muy improbable que
variable bajo estudio tome el mismo valor durante el
experimento.

Recorrido: Es el campo de variacin de la variable.


Recorrido = X mx X mn
46

Tabla de frecuencia Variable Continua

El nmero y tamao de los intervalos, dependen de la cantidad de datos


de la muestra y de su recorrido.

El nmero de intervalos debe cumplir con dos condiciones: resumir la


informacin y conservar el detalle de la muestra.

Los intervalos puede ser cerrado- cerrado,

cerrado- abierto

47

Tabla de frecuencia Variable Continua

Definiciones:

1.

Clases: Consisten en intervalos de valores ordenados en forma


accedente y descendente y que cubren todos los valores
disponibles. El nmero de clases se denota K

2.

Limites de clases: Son los extremos de las clases. El valor menos


se denomina limite inferior (Li) y le valor mayor limite superior
(Ls). Puede ser abierto ( ) o cerrado [ ].

3.

Amplitud de clase: Se obtiene hallando la diferencia entre los


limites de clases. Se denota C.
48

Tabla de frecuencia Variable Continua


4.

Marca de clase: Es el punto medio de las clases, es decir, la


semisuma del Ls y Li.

Las clases deben tener el misma Amplitud.

Amplitud = C = (Mx. - VMn) / K


.

Donde K es el nmero de clases

En caso de no saber cuantas clases se deben tener (K) ni la


amplitud de estas, se utiliza la Regla de Sturges.

K = (1 + 3,322 Log n)
49

Ejemplo

Los siguientes datos indican el nmero de minutos que


ocuparon sus asientos 20 clientes de una cafetera.

Construir tabla de distribucin de frecuencias, utilizando intervalo


cerrado abierto. Calcular el nmero de intervalos utilizando la
expresin [1+ 3,3log n]

Qu tanto por ciento de clientes ocuparon sus asientos 32 minutos o


ms?

Qu tanto por ciento de los clientes ocuparon sus asientos entre 28 y


menos de 36 minutos?
50

Solucin

1.

45%

2.

60%

51

Representacin Grfica
1.

Histograma

. Consiste

en un conjunto de rectngulos con: bases en


el eje x, centros en las marcas de clases y longitudes
iguales a los tamaos de los intervalos de clases.

. Si

los intervalos de clases tienen todos la misma


amplitud, las alturas de los rectngulos son
proporcionales a las frecuencias de clase.

52

Representacin Grfica

53

Ejemplo

Dada la siguiente tabla de distribucin, graficar


histograma.

54

Representacin Grfica
2.

Polgono de Frecuencia

. Es

un grfico de trazos de la frecuencia de clase con


relacin a la marca de clase. Puede obtenerse
conectando los puntos medios de las partes
superiores de los rectngulos del histograma.

. Ejemplo:

Realizar el polgono de frecuencia de la


tabla anterior.

55

Representacin Grfica

56

Representacin Grfica
3.

Ojiva:

Al igual que el histograma y el polgono de


frecuencias es representar distribuciones de
frecuencias de variables cuantitativas continuas,
pero slo para frecuencias acumuladas.

En el eje horizontal se considera los limites de clase.


Limites inferiores Ojiva mayor
Limites superiores Ojiva menor
57

Representacin Grfica

Ojiva Mayor

Ojiva Menor
58

Representaciones Grficas

59

Tabla de Contingencia 2 x 2

Sirve para analizar la relacin de dependencia o


independencia entre dos variables cualitativas o una
cualitativa y otra cuantitativa, es necesario estudiar su
distribucin conjunta o tabla de contingencia.

1.

Permite organizar la informacin contenida en un experimento


cuando sta es de carcter bidimensional, es decir, cuando
est referida a dos factores.

2.

A partir de la tabla de contingencia se puede adems analizar


si existe alguna relacin de dependencia o independencia
entre los niveles de las variables objeto de estudio.
60

Tabla de Contingencia 2 x 2

Para identificar relaciones de dependencia entre variables


cualitativas se utiliza un contraste estadstico basado en el
estadstico X2 (Chi-cuadrado), cuyo clculo nos permitir
afirmar con un nivel de confianza estadstico determinado
si los niveles de una variable cualitativa influyen en los
niveles de la otra variable nominal analizada.

61

Tabla de Contingencia 2 x 2

Considerando un grado de confianza del 95%, esto implica un


= 0,05.

Ho: El sexo de la persona no es un facto determinante en que


la persona fume. Son independientes.

H1: El sexo de la persona es un facto determinante en que la


persona fume. Son dependientes.

Obtencin del grado de libertad para X2 (Chi-cuadrado):


Grados de libertad: (r-1)*(c-1),

Grados de libertad: (2-1)*(2-1)=1

Valor tabla = 3,84

r: filas; c: columnas

62

Tabla de Contingencia 2 x 2

Si el resultado es menor a 3,84 no se rechaza Ho

Si el resultado es mayor a 3,84 se rechaza Ho


63

También podría gustarte