Presentacion ESTADISTICA I PDF
Presentacion ESTADISTICA I PDF
Presentacion ESTADISTICA I PDF
ESTADÍSTICA DESCRIPTIVA
JUSTIFICACIÓN DE LA ASIGNATURA EN
EL PLAN DE ESTUDIOS
La estadística es una herramienta fundamental
en la formación profesional de Ciencias
Administrativas, Publicidad y mercadeo, Gestión
Comercial y Financiera etc; los contenidos de
esta asignatura contribuyen al desarrollo de una
actitud crítica, metódica e investigativa,
mediante la aplicación de conocimientos y
herramientas estadísticas que contribuyan a la
toma de decisiones confiables en estudios
investigativos de corte cuantitativo y cualitativo.
1
03/05/2018
LOS PROPÓSITOS
• Adquirir un conocimiento preciso de las bases necesarias
de la Estadística Descriptiva y de las probabilidades para su
aplicación en la vida profesional, como herramienta
determinante en la toma de decisiones.
• El curso de Estadística I pretende desarrollar en los
estudiantes las competencias propias del área, para poder
realizar un análisis estadístico básico como la media, la
varianza y la desviación estándar a partir de un conjunto de
datos dado, al igual podrá describir probabilísticamente
una distribución de datos, identificando el tipo de variable
(discreta o continua).
• Adquirir las destrezas para la formulación de problemas
que requieren la administración de datos.
• Aplicar con sentido los paquetes computacionales para
abordar un problema en el ambiente de la Estadística
(EXCEL)
LA ESTADÍSTICA
2
03/05/2018
HISTORIA DE LA ESTADÍSTICA
Historia.
DIVISIÓN DE LA ESTADÍSTICA
• Estadística • Estadística
Descriptiva Inferencial
3
03/05/2018
ESTADÍSTICA DESCRIPTIVA:
ESTADÍSTICA INFERENCIAL:
• Se deriva de muestras, de observaciones
hechas sólo acerca de una parte de un
conjunto numeroso de elementos y esto
implica que su análisis requiere de
generalizaciones que van más allá de los
datos. La Estadística Inferencial investiga
o analiza una población partiendo de una
muestra tomada.
4
03/05/2018
MÉTODO ESTADÍSTICO
• El conjunto de los métodos que se utilizan para medir las
características de la información, para resumir los valores
individuales, y para analizar los datos a fin de extraerles el
máximo de información, es lo que se llama métodos
estadísticos. Los métodos de análisis para la información
cuantitativa se pueden dividir en los siguientes siete pasos:
1. Definición del problema.
2. Recopilación de la información existente.
3. Obtención de información original.
4. Clasificación.
5. Presentación.
6. Análisis.
7. Toma de decisiones.
APLICACIÓN DE LA ESTADÍSTICA
• La estadística prácticamente se puede
utilizar en todas las actividades del ser
humano, donde se presenta con mayor
incidencia es en: Economía, Agricultura,
Informática, Prevención de Riesgos,
Control de Medio Ambiente, Química
Analítica, Medicina, Ingeniería,
Psicología, etc.
5
03/05/2018
DEFINICIONES BÁSICAS
• LA POBLACIÓN: es el conjunto de todos los elementos
sobre los que se quiere realizar un estudio estadístico.
• LA MUESTRA: es una parte representativa de la población
que se elige para hacer el estudio estadístico.
• VARIABLE: Característica de la población que se analiza en
el estudio estadístico. Hay dos tipos de variables
estadísticas:
Cuantitativas, (variables) son los que se pueden
expresar con números (estatura de todas la personas
de la U.) se pueden describir por medio números.
Cualitativas, (atributos) son los que no se pueden
expresar con números (el estado civil, el sexo, la raza,
etc.) se pueden describir por medio de palabras.
VARIABLES CUANTITATIVAS
• Datos Discretos: Son aquellos que surgen por el
procedimiento de conteo. Es decir, los datos
discretos toman valores enteros (ej., el número
de hijos por familia; el número de automóviles
que pasan por una avenida en una hora, etc.).
6
03/05/2018
EJERCICIOS
1. Clasifique, como cualitativos o cuantitativos
(discretos o continuos), los siguientes caracteres
estadísticos estudiados en los coches de cierta
marca:
a) Modelo de coche
b) Color de su carrocería
c) Potencia de su motor
d) Consumo medio en 100 km
e) Número de piezas
EJERCICIOS
2. Clasifique, como cualitativos o cuantitativos
(discretos o continuos), los siguientes
caracteres estadísticos estudiados en una
fábrica de tornillos:
a) La producción diaria de tornillos.
b) Las longitudes de los tornillos.
c) El color de los tornillos.
d) Las anchuras de los tornillos.
7
03/05/2018
¿QUÉ ES UN DATO?
• Dato es una representación simbólica (numérica,
alfabética, etc.), un atributo o una característica
de una entidad. El dato no tiene valor semántico
(sentido) en sí mismo, pero si recibe un
tratamiento (procesamiento) apropiado, se
puede utilizar en la realización de cálculos o toma
de decisiones. Es de empleo muy común
prácticamente en cualquier disciplina científica.
• Un Conjunto de datos es una colección de datos
normalmente tabulada. Por cada elemento (o
individuo) se indican varias características.
8
03/05/2018
DISTRIBUCIÓN DE FRECUENCIAS
• Es un método para clasificar, organizar y
resumir datos.
SÍMBOLOS:
𝑁 = 𝑇𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛
𝑛 = 𝑇𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎
𝑋𝑖 = 𝐼𝑑𝑒𝑛𝑡𝑖𝑓𝑖𝑐𝑎 𝑒𝑙 𝑣𝑎𝑙𝑜𝑟 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑑𝑜 𝑖
𝑛𝑖 = 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎. 𝐸𝑙 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑣𝑒𝑐𝑒𝑠 𝑞𝑢𝑒 𝑠𝑒 𝑟𝑒𝑝𝑖𝑡𝑒 𝑐𝑎𝑑𝑎 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒.
TABLAS DE FRECUENCIAS
• Variables discretas:
Ejemplo: En un estudio con un grupo de 2.000 personas
que habían sido tratadas psicológicamente por problemas
de ansiedad, se desea preguntar a las mismas, cuántas
veces habían sufrido un ataque de ansiedad desde que
terminó el tratamiento recibido. Pero no se quiere
realizar una investigación exhaustiva, por lo cual se
selecciono una muestra de 20 personas. El resultado de
esta encuesta, se anota a continuación:
9
03/05/2018
10
03/05/2018
TABLAS DE FRECUENCIAS
• Variables continuas:
Tomamos como ejemplo una muestra de 20
alumnos a fin de conocer su peso en kilos:
1 67,9 6 56,4 11 50,2 16 47,4
2 61,6 7 75,3 12 80,2 17 78,7
3 64,4 8 65,8 13 68,5 18 43,5
4 62,6 9 72,3 14 61,1 19 59,0
5 47,2 10 58,3 15 68,8 20 99,5
11
03/05/2018
LA REGLA DE STURGES
Consiste en obtener una primera aproximación de
cuántas clases debe tener la serie de clases y
frecuencias mediante la raíz cuadrada del número
de elementos. Ejemplo: se tienen 72 salarios de una
empresa, la raíz cuadrada de 72 es 8.49, la
sugerencia inicial será utilizar 9 clases para construir
las demás clases según el número de datos. Los
salarios máximo y mínimo 179.2 y 74.65, lo que da
una diferencia (rango) de 104.55. Y como la regla de
Sturges indica 9 clases, cada una debe medir
aproximadamente 104.55/9 = 11.61 que
redondeado a 12 si es una variable de tipo discreta.
12
03/05/2018
Ejercicio
• En un barrio de Bogotá, en el año 2012, se entrevistó a
un cierto número de mujeres casadas nacidas entre los
años 1935 y 1944 y se les preguntó a qué edad
contrajeron matrimonio. A continuación se muestran
los datos correspondientes a 50 de estas mujeres:
Realizar tablas de frecuencias, con 6 intervalos.
15 17 25 15 16 11 15 13 12 10
15 14 16 14 17 13 14 20 29 19
16 18 10 18 12 11 20 34 13 22
19 14 17 16 16 15 12 24 25 9
21 15 13 23 24 10 10 16 14 18
13
03/05/2018
MEDIDAS DE TENDENCIA
CENTRAL
• Media (aritmética, ponderada, geométrica,
armónica)
• Mediana
• Moda
14
03/05/2018
MEDIA ARITMÉTICA
• Datos originales: El índice de tendencia central
más utilizado es la media. Se define como la
suma de los valores observados, dividida por
el número de ellas. Se representa con la X, en
mayúsculas , con una barra horizontal encima.
Datos originales:
14 25 14 8 22 14 14 14 13 21 15
MEDIA ARITMÉTICA
• Datos agrupados:
15
03/05/2018
LA MEDIANA
• La mediana de un conjunto de datos es un
valor tal, que cuando escribimos todos los
datos ordenados de menor a mayor ocupa el
lugar central de la lista ordenada. Si el número
de datos es impar, la mediana es el dato
central; si el número de datos es par, la
mediana es la media de los dos datos
centrales.
16
03/05/2018
X1= 27
X2= 38
X3= 23
Número par de observaciones. X4= 28
X5= 36
X6= 39
X7= 35
X8= 26
17
03/05/2018
CASO A
• Variables discretas
Ó
CASO B
CASO A
Ó
• Variables continuas
CASO B
EJERCICIOS
• Variables discretas, caso a:
Yj nj Nj
0 2 2
1 3 5
2 6 11
3 5 16
4 4 20
18
03/05/2018
EJERCICIOS
• Variables continuas, caso a:
Y´j-1 Y´j ni Ni
2,1 6 2 2
6,1 10 3 5
10,1 14 5 10
14,1 18 6 16
18,1 22 4 20
LA MODA
• La moda es el valor de la variable que más
veces se repite, y en consecuencia, en una
distribución de frecuencias, es el valor de la
variable que viene afectada por la máxima
frecuencia de la distribución.
19
03/05/2018
EJERCICIOS
• Datos originales:
14 25 14 8 22 14 14 14 13 21 15
EJERCICIOS
• Datos agrupados:
Variables discretas
Yj nj
0 2
1 3
2 6
3 5
4 4
20
03/05/2018
Variables continuas
Y´j-1 Y´j ni Yi
𝑑1
𝑀𝑂 = Ý𝑗−1 + 𝐶 2,1 6 2 4,05
𝑑1 + 𝑑2
6,1 10 3 8,05
10,1 14 5 12,05
14,1 18 6 16,05
18,1 22 4 20,05
Ý𝑗−1 =limite inferior de la clase modal (la clase que contiene la moda)
MEDIDAS DE POSICIÓN
• Las medidas de posición dividen un conjunto
ordenado de datos en grupos con la misma
cantidad de individuos.
21
03/05/2018
PERCENTIL
PERCENTIL
Datos originales, con los siguientes datos: 16, 10, 4,
8, 12, 10, 8, 20, 4, 13, 12, 22, 16, 26, 20. Hallar:
Primero y tercer cuartil
Cuarto y sexto decíl
El 30 y 90 percentil
Respuestas:
Q1=8; Q3=20
D4=10,8; D6=14,8
P30=9,6; P90=23,6
22
03/05/2018
PERCENTIL
• En la tabla siguiente se muestran los números de
acciones negociadas de cierta empresa (en
miles), en 50 días de operaciones. Determinar los
valores de los cuartiles, decíl 2, decíl 6, percentil
82 y 32.
23
03/05/2018
PERCENTIL
Tabla de frecuencia variable discreta.
Formulas:
𝐾∗𝑛 𝑌𝑗 + 𝑌𝑗−1
𝑁𝑗−1 = ; 𝑃𝑘 =
100 2
𝐾∗𝑛
𝑁𝑗−1 < ; 𝑃𝑘 = 𝑌𝑗
100
PERCENTIL
Yi ni
47 1
52 2
Calcular: Q1; 57 1
P40; Q2; Q3; 58
60
2
1
P60; P30; P90 65 1
66 2
71 2
72 1
73 1
96 1
24
03/05/2018
PERCENTIL
Cuando los datos están agrupados en una tabla
de frecuencias, y son datos continuos, se
calculan mediante la fórmula:
Y´j-1 Y´j ni Ni
3,1 8,1 14 14
8,1 13,1 15 29
13,1 18,1 8 37
18,1 23,1 6 43
23,1 28,1 7 50
28,1 33,1 10 60
25
03/05/2018
𝑋𝑀𝐴𝑋 = 𝑄3 + 1.5 𝑄3 − 𝑄1
EJERCICIO
• Analiza el siguiente diagrama de caja y bigotes
y calcula, a partir de él, los valores máximo y
mínimo, la mediana y los cuartiles.
26
03/05/2018
4,00 4,00
4,00
3,50
3,50 3,50
3,00
3,00 3,00
2,50
2,50 2,50
2,00
2,00 2,00
1,50
27
03/05/2018
EJERCICIO
• Analiza el siguiente diagrama de caja y bigotes.
Muestra los minutos que tarda en hacer efecto
un medicamento en una población. Interpreta la
información que presenta y responde a las
preguntas.
preguntas
¿A qué porcentaje de la población había hecho
efecto al cabo de 30 minutos?.
¿Al cabo de cuántos minutos había hecho efecto al
50 % de la población?.
¿Cuántos minutos tardó en hacer efecto al 100% de
la población?
¿A qué porcentaje había hecho efecto a los 55
minutos?.
¿Cuánto tardó en hacer efecto a las tres cuartas
partes de la población?
28
03/05/2018
EJERCICIO
• Con los siguientes datos graficar el diagrama
de caja y bigotes.
Y´j-1 Y´j ni Ni
3,1 8,1 14 14
8,1 13,1 15 29
13,1 18,1 8 37
18,1 23,1 6 43
23,1 28,1 7 50
28,1 33,1 10 60
EJERCICIO
En la siguiente tabla se presentan los días con índice de
contaminación en la ciudad de Bogotá. Graficar el
diagrama de caja para cada año.
2010 2011 2012
248 221 248
208 171 184
113 131 104
128 101 79
106 95 69
118 89 67
60 33 35
79 63 32
55 56 30
47 54 30
88 55 26
47 69 21
58 59 20
82 48 11
29
03/05/2018
EJEMPLO
Los siguientes datos son puntuaciones obtenidas por
50 estudiantes en una prueba psicológica; agrupar los
datos en 5 intervalos. Hallar media aritmética,
mediana, moda y el diagrama de caja y bigotes.
26 49 37 21 49 16 12 39 38 49
16 17 15 36 35 45 36 17 12 34
26 38 12 17 35 22 31 28 22 48
30 26 16 45 34 29 42 10 12 42
23 35 49 22 45 47 49 19 35 20
30
03/05/2018
Tallo Hojas ni
1 2 3 3 4 4 5 5 7
2 0 1 2 2 2 5 7 8 9 9
3 1 1 3 4 6 8 9 7
4 0 1 1 2 4 5 6
5 0 1 2 3
n= 32
31
03/05/2018
MEDIDAS DE DISPERSIÓN
• Las medidas de dispersión tratan de medir el grado de
dispersión que tiene una variable estadística en torno a
una medida de posición o tendencia central,
indicándonos lo representativa que es la medida de
posición. A mayor dispersión menor representatividad
de la medida de posición y viceversa.
32
03/05/2018
EJEMPLOS
• Una aseguradora vende 5 pólizas de seguros, sus
valores fueron 110, 145, 125, 95 y 150 dólares, hallar
la media, la varianza y la desviación estándar.
• Hallar la varianza y la desviación estándar de la variable
ansiedad, que siente una persona cuando se encuentra
mucha gente alrededor de ella, de una muestra de 7
personas. 9; 3; 10; 5; 9; 4; 9
• Calcular la varianza y la desviación estándar para la
variable “Tiempo empleado en completar un
laberinto” por una muestra de 20 ratas:
Tiempo (seg) ni
9 3
10 8
11 6
12 2
13 1
DESVIACIÓN ESTÁNDAR
• Desviación estándar: también llamada desviación típica, es
una medida de dispersión usada en estadística que nos dice
cuánto tienden a alejarse los valores puntuales del
promedio en una distribución. Específicamente, la
desviación estándar es "el promedio de la distancia de cada
punto respecto del promedio". Se suele representar por
una S o con la letra sigma, según se calcule en una muestra
o en la población.
• Una desviación estándar grande indica que los puntos están
lejos de la media, y una desviación pequeña indica que los
datos están agrupados cerca de la media.
POBLACIONAL
MUESTRAL
33
03/05/2018
COEFICIENTE DE VARIACIÓN
Ciudad A
X = 240.000
Sx = 3.300
Ciudad B
X = 150.000
Sx = 2.900
MEDIDAS DE ASIMETRÍA
• En una distribución simétrica se cumple que: X=Me=Mo. Ver figura
(c).
• Si en una distribución existen muy pocos valores altos respecto a los
demás, entonces la media aritmética se verá influenciada por éstos y
la asimetría es a la derecha o asimetría positiva o distribución con
sesgo positivo. En éstas condiciones: X>Me>Mo. Ver figura (a)
• Si en una distribución existen muy pocos valores bajos respecto a los
demás, entonces, la media aritmética se verá influenciada por éstos
y la asimetría será a la izquierda o asimetría negativa o distribución
con sesgo negativo. En estas condiciones: X< Me < Mo. Ver figura (b)
34
03/05/2018
𝑋 − 𝑀𝑜 3 𝑋 − 𝑀𝑒
𝑆𝐾 = 𝑜 𝑆𝐾 =
𝑆 𝑆
35
03/05/2018
EJEMPLO
• El tiempo utilizado para atender entrevistas de
unos aspirantes a empleo en una empresa, se
clasifican de acuerdo a la siguiente tabla.
NÚMERO DE
TIEMPO NECESARIO ENTREVISTAS
(ni)
1 12 20 6
2 21 29 9
3 30 38 14
4 39 47 72
5 48 56 95
n= 196
MEDIDAS DE CURTOSIS O
APUNTAMIENTO
• Curtosis o Apuntamiento es utilizado para mostrar el grado
apuntamiento o de concentración de los datos.
• En la medida en que los diferentes tramos de la variable
presenten frecuencias muy similares en todo su recorrido.
Esta situación contribuye a que la dispersión sea alta. Una
distribución con éstas características, se denomina
PLATICÚRTICA O ACHATADA.
36
03/05/2018
MEDIDAS DE CURTOSIS O
APUNTAMIENTO
• Por el contrario, si existe una cantidad muy
significativa de datos que se encuentran
concentrados en algún tramo de la variable,
entonces decimos que la distribución es
altamente concentrada o que tiene alta
curtosis. Una distribución de éstas
características se denomina LEPTOCÚRTICA
O APUNTADA.
MEDIDAS DE CURTOSIS O
APUNTAMIENTO
• Si la concentración es intermedia entre las dos
situaciones anteriores, se dice que la distribución es
MESOCÚRTICA o MODERADA CONCENTRACIÓN DE LOS
DATOS. Una distribución con esta característica es
propia de la distribución normal. Una manera de medir
el grado de curtosis, es mediante el coeficiente de
curtosis A4.
37
03/05/2018
COEFICIENTE DE CURTOSIS A4
Éste coeficiente, resulta del cociente existente entre el momento de
orden cuatro respecto a la media y la desviación estándar elevada a la
cuarta.
38
03/05/2018
39
03/05/2018
REGRESION LINEAL
• La regresión lineal simple es el método mediante
el cual se intenta hallar la ecuación de una línea
recta que describa la relación entre las dos
variables. En un Análisis de Regresión simple
existe siempre una variable respuesta o
dependiente (Y) y una variable explicativa o
independiente (X). El propósito es obtener una
función sencilla de la variable explicativa, que sea
capaz de describir lo más ajustadamente posible
la variación de la variable dependiente.
40
03/05/2018
41
03/05/2018
DIAGRAMA DE DISPERSIÓN
• Es la representación en un plano cartesiano de las
parejas de puntos de los datos de las variables
independiente y dependiente. De su observación
podemos estimar que o cual es mejor tipo de
ajuste que se puede hacer manualmente de estos
puntos en lo que llamamos ajuste de curvas por
el método de ajuste por mínimos cuadrados. En
el diagrama de dispersión se acostumbra colocar
en eje horizontal la variable independiente y en el
vertical la variable dependiente.
Ejemplo
42
03/05/2018
ECUACIONES
43
03/05/2018
EJEMPLO
COEFICIENTE CAPACIDAD
INTELECTUAL LECTORA
80 25
70 20
60 15
90 30
100 35
40 5
50 10
COEFICIENTE DE DETERMINACIÓN
• El coeficiente de determinación es el termino
que mide el poder explicativo del modelo de
regresión, es decir, la parte de la variación de
Y explicada por la variación de X. Se designa
como r2. El valor de este coeficiente varía
entre 0 y 1, ya que es imposible explicar mas
del 100%.; a mayor valor de r2 mayor poder
explicativo tendrá nuestro modelo .
44
03/05/2018
COEFICIENTE DE CORRELACIÓN
• La correlación mide la fuerza o grado de unión
entre las variables dependiente y la
independiente y para su medición utilizamos el
coeficiente de Pearson, comúnmente llamado
coeficiente de correlación. Este coeficiente de
correlación y el coeficiente de determinación
sirven para determinar la bondad de ajuste, es
decir, si el modelo encontrado es adecuado para
el análisis de regresión lineal. El coeficiente de
correlación es igual a la raíz cuadrada del
coeficiente de determinación y se designa con la
letra r, revela qué porcentaje del cambio en Y se
explica por un cambio en X.
FORMULA
45
03/05/2018
46
03/05/2018
EJERCICIO
• El gerente técnico del Acueducto de una ciudad,
desea establecer la relación entre el consumo
mensual domiciliario de agua y el tamaño de las
familias. Se recogió una muestra aleatoria con los
datos que se muestran en la tabla. Para los datos
de esta tabla desarrolle las siguientes tareas:
a) Dibuje un diagrama de dispersión
b)Determine manualmente la ecuación de
regresión, el coeficiente de determinación y el
coeficiente de correlación
47
03/05/2018
48