Estadistica Basica Guia
Estadistica Basica Guia
Estadistica Basica Guia
Contaduría Pública
Bogotá 2018
1
Introducción
2
ESTADISTICA BASICA
UNIDAD 1
1. Conceptos Generales:
Ejemplo:
3
En una encuesta realizada en el país a más de 10 departamentos se informo que en el
país existen más de un 10% de personas aun damnificadas por el invierno. Un 60% no
tuvo ningún tipo de emergencia y un 30% en riesgo por nuevas inundaciones.
Ejemplo:
Mm
a) Pequeña
b) Grande
4
6. Defina variable y diga cuántos tipos de variable maneja la estadística,
dé tres ejemplos de cada una:
Definición de variable
Variable cualitativa
El estado civil, con las siguientes modalidades: soltero, casado, separado, divorciado y
viudo.
Variable cuantitativa
Variable discreta
Una variable discreta es aquella que toma valores aislados, es decir no admite
valores intermedios entre dos valores específicos. Por ejemplo:
5
Variable continua
Una variable continua es aquella que puede tomar valores comprendidos entre
dos números. Por ejemplo:
En la práctica medimos la altura con dos decimales, pero también se podría dar con
tres decimales.
UNIDAD 2
ESTADISTICA DESCRIPTIVA.
6
Estos datos cualitativos pueden recogerse utilizando instrumentos como: grabación de
entrevistas individuales, videos de observaciones de eventos particulares, testimonios
escritos de las personas con respecto al tema a investigar, fotografías, historias de
vida, documentos escritos como: actas, recortes de prensa.
Datos cualitativos aquellos mas difíciles de manejar estadísticamente pero que pueden
decir un poco mas acerca de temas con muchas variables...
1. Frecuencia Absoluta:
FREC
VARIABLE ABSOL
3 3
4 4
5 7
7 2
8 7
10 5
12 2
7
FREC ABSOLUTA
8
7
6
5
4
3
2
1
0
3 4 5 7 8 10 12
Frecuencia Acumulada:
30
25
20
15 Series1
10
0
3 4 5 7 8 10 12
8
4. Construir una frecuencia con intervalos de clase apropiada:
FRECUENCIA DE INTERVALOS
1,720 - 1,725
1,725 - 1,730
1,730 - 1,735
1,735 - 1,740
1,740 - 1,745
1,745 - 1,750
a. Histograma.
CLASE FRECUENCIA
1,720 - 7,730 12
1,730 - 1,740 40
1,740 - 1,750 8
1,750 - 1,760 0
HISTOGRAMA
45
40
35
30
25
20
15
10
5
0
1,720 - 7,730 1,730 - 1,740 1,740 - 1,750 1,750 - 1,760
9
altura igual a la frecuencia acumulada, dando una altura cero al extremo
inferior del primer intervalo y siendo constante a partir del extremo superior
del último.
POLIGONO FCIA
1.750
1.745
1.740
1.735
1.730
Series1
1.725
1.720
1.715
1.710
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23
10
DISTRIBUCION DE FCIA RELATIVA
9
40
35
30
25
20
15
10
0
1,720 - 7,730 1,730 - 1,740 1,740 - 1,750 1,750 - 1,760
11
POLIGONO DE FRECUENCIA RELATIVA
70
60
50
40
30
20
10
1.744
1.724
1.725
1.726
1.727
1.728
1.729
1.730
1.731
1.732
1.733
1.734
1.735
1.736
1.737
1.738
1.739
1.740
1.741
1.742
1.743
1.745
1.746
f. Distribución de Frecuencia Acumulada: Una distribución de frecuencias
acumulada se usa para determinar cuántos o qué proporción de los valores de
los datos es menor o mayor que cierto valor.
FRECUENCIA ACUMULADA
45
40
35
30
25
20
15
10
0
1.729
1.742
1.724
1.725
1.726
1.727
1.728
1.730
1.731
1.732
1.733
1.734
1.735
1.736
1.737
1.738
1.739
1.740
1.741
1.743
1.744
1.745
1.746
12
g. Distribución acumulada en Porcentajes: La frecuencia relativa
acumulada o frecuencia porcentual acumulada es la frecuencia acumulada
dividida por la frecuencia total.
FRECUENCIA PORCENTUAL
14%
12%
10%
8%
6%
4%
2%
0%
1.745
1.724
1.725
1.726
1.727
1.728
1.729
1.730
1.731
1.732
1.733
1.734
1.735
1.736
1.737
1.738
1.739
1.740
1.741
1.742
1.743
1.744
1.746
h. Ojiva: Su objetivo, al igual que el histograma y el polígono de frecuencias es
representar distribuciones de frecuencias de variables cuantitativas continuas,
pero sólo para frecuencias acumuladas
70
OJIVA
60
50
40
30
20
10
i. Ojiva de Porcentajes:
13
OJIVA PORCENTUAL
14%
12%
10%
8%
6%
4%
2%
0%
1.724
1.725
1.726
1.727
1.728
1.729
1.730
1.731
1.732
1.733
1.734
1.735
1.736
1.737
1.738
1.739
1.740
1.741
1.742
1.743
1.744
1.745
1.746
6. Ventajas de:
a. Media;
1. Es el centro de gravedad de toda la distribución, representando a todos
los valores observados..
2. Todos los valores son incluidos en el cómputo de la media
3. Es una medida muy útil para comparar dos o más poblaciones
b. Mediana:
1. En su cálculo intervienen todos los valores de la distribución.
2. Es el centro de gravedad de toda la distribución, representando a todos
los valores observados.
c. Moda:
1. La moda se puede determinar en todos los tipos de mediciones (nominal,
ordinal, de intervalos, y relativa).
2. La moda tiene la ventaja de no ser afectada por valores extremos.
14
7. Calcular:
a. Media Aritmética:
6,1-12 2
12,1-15 14
15,1-20 5
20,1-28 3
28,1-36 7 Ni-1
36,1-40 16 Ni
40,1-50 3 Ni-1
La sumatoria da: -9.11/50= -0.23, por tanto seria la media Aritmética seria el -
0.18.
b. Mediana Aritmética: Según los datos anteriores la media seria -1 por que es el
valor central, al momento de ordenar los datos de forma ascendente..
d. Tercer Decil:
50*3 15
10
D3= 60 15-16 -1 0,2*10= -2 58
5 5
e. Segundo Cuartil:
50*2 25
4
60+ (25-16) 0,9 *10 69
15
10
f. Percentil Sesenta:
50*60 30
100
70+30-21 9 3*10 30+70 100
3 3
R/ Con lo anterior podemos decir que el percentil es 100
16
b. Mediana cubica: La media cúbica es una medida derivada de la media
aritmética y consiste en obtener el valor del lado que tiene el cubo media de
un conjunto de n cubos.
mediana cubica
NI Yi Yi(3) Yi (3)Ni
14 30 27000 378000
16 40 64000 1024000
18 30 27000 486000
8 25 15625 125000
10 10 1000 10000
10 10 1000 10000
76 2033000
2033000/76= 26750
x1 = 5 x2 = 3 x3 = 1 x4 = 6 x5 = 10
VARIANZAS DE
DISTRIBUCION
5+3+1+6+10 25 5
5 5
(5-5)º+(3-5)ª+(1-5)ª+(6-
5)º+(10-5)º = 46 9,2
5 5
En este ejercicio la varianza seria 9.2
12. Una muestra de 70 datos da para cierta variable una media de 120 y una
desviación típica de 6, otra semejante, pero de 30 observaciones, da para la
misma variable una media de 125 y una desviación típica de 5. Si se reúnen las
dos muestras formando una sola de 100 datos, ¿cuál será su media y su
desviación típica?
R/ 70+30/2 = 50
(70-50)º+(30-50)º= 400 º= 20
17
2
R/ En el ejercicio anterior podemos decir que su media es 50 y su desviación típica
20.
13. Con los siguientes datos no agrupados, calcular la desviación media y mediana:
x1 = 5 x2 = 3 x3 = 1 x4 = 6 x5 = 10
5+3+1+6+10= 25/5= 5
(5-5)+(3-5)+(1-5)+(6-5)+(10-5) = 0
5
R/ Realizando el ejercicio anterior y siguiendo la formula la media y mediana me queda
en cero.
8. La siguiente distribución de frecuencias se refiere al número de compradores de un
determinado producto, en 30 barrios de clase media en Bogotá.
130 3
148 6
160 5
220 3
280 2
320 4
400 7
Desviación Media:
3+6+5+3+2+4+7/7= 4.28
(3-4)+(6-4)+(5-4)+(3-4)+(2-4)+(4-4)+(7-4)= 0.42
7
R/ La desviación media seria 0.42
Coeficiente de Variación:
148/130*100= 42.83%
220/160*100= 67.65%
320/280*100= 62.97%
18
c) Si la empresa considera que el número de compradores por barrio es el doble,
¿Cuál será la nueva varianza y el coeficiente de variación?
260+296+320+440+560+640+800= 473
(260-473)º+(296-473)º+(320-473)º+(440-473)º(560-473)º+(640-473)º(800-473)º=
UNIDAD 3
REGRECION Y CORRELACION
1. Nombrar tres ejemplos de fenómenos económicos y comerciales que puedan
ser analizados mediante la regresión.
R/ Para hallar índices de precios al consumidor
Para realizar pronósticos comerciales y económicos
Para hallar los ingresos promedio de trabajadores.
2. Construir una recta que aproxime los datos de la tabla 1) y hallar una
ecuación para esa recta: Tabla 1.
X= 1 3 4 6 8 9 11 14 = 56
Y= 1 2 4 4 5 7 8 9 = 40
19
9
8
7
6
5
4
2
1
1 3 4 6 8 9 14
XY= (1)(1)*(3)(2)*(4)(4)*(6)(4)*(8)(5)*(9)(7)*(11)(8)*(14)(9)=
1+6+16+24+40+63+88+126 = 364
SS= (XY) =∑XY - ∑X∑y = 364-(56)(40) = 84
H 8
Ss(x) = ∑xº -(∑x)*2 = 624-(56)2 = 232
8
Ss(y)= ∑y2- (∑y)2 = 256 – ( 40)2 = 56
8
Pendiente : SS(XY) = 84 = 0.36_____b
SS(X) 132
= 40-(0.36-56) = 2.48
3.
Xº Yº
1 1
9 4
16 16
36 16
64 25
81 49
121 64
VARIABLE
196 81 DEPENDIENTE
VARIABLES
INDEPENDIENTES
20
4. La tabla 2, presenta las notas de dos exámenes de Biología, X e Y, de
10 estudiantes.
PRIMER SEGUNDO
ESTUDIANTES EXAMEN X2 EXAMEN Y2
1 6 36 8 64
2 5 25 7 49
3 8 64 7 49
4 8 64 10 100
5 7 49 5 25
6 6 36 8 64
7 10 100 10 100
8 4 16 6 36
9 9 81 8 64
10 7 49 6 36
70 520 75 587
10 . .
9 . .
8 . . .
7 . .
6
5
4 5 6 7 8 9 10 X
Pendiente:
N 10
Xy = (6)(8)+(5)(7)+(8)(7)+(8)(10)+(7)(5)+(6)(8)+(10)(10)+(4)(6)+(9)(8)+(7)(6) =
48+35+56+80+35+48+100+24+72+42= 540
n 10
21
n 10
N 30
N 10
Ecuación: Y = 0.5x +4
∑x = 10 =7
N 70
∑y = 75 = 7.5
N 10
Centroide: (7,7,5)
b.
10 . .
9 . .
8 . . .
7 . .
6
5
4 5 6 7 8 9 10 X
22
c.
10 . .
9 . .
8 . . .
7 . .
6
5
4 5 6 7 8 9 10 X
d.
10 . .
9 . .
8 . . .
7 . .
6
5
4 5 6 7 8 9 10 X
5. R= 15 = 15 = 0.60
√30.24.5 27.11
Aproximadamente un 40%
23
b) Una dependencia indirecta
Unidad 4
SERIES E INDICES
15 15
15
15
15
100
18%
24
3. . Con los siguientes datos referentes al número de unidades vendidas (dadas en
miles) se pide: a) Ajustar una parábola tomando como origen a 1999 y estimar el valor
de ^y09.
X = Unidad Vendida
Y= x*2 +x +10
x 1 2 3 4 5 6 7 8 9
y 12 16 22 30 40 52 66 82 100
100
82
66
52
40
30
22
16
12
1 2 3 4 5 6 7 8 9
Un índice para 2003 revela un aumento del 20% respecto al año anterior. En 2004
alcanzó a 174, es decir presenta un incremento anual del 18%. Calcular los índices de
2002 y 2003.
2003 = 20%
2002 = 22%
2003 = 21%
25
Bibliografía:
Mendenhall; Estadística para las ciencias sociales. Editorial Educativa, 1987, México.
Pagina web:
www.monografias.com
26