Probabilidad Y Etadística: Competencias Genéricas
Probabilidad Y Etadística: Competencias Genéricas
Probabilidad Y Etadística: Competencias Genéricas
ETADÍSTICA
Competencias genéricas
U1.
o Distribuciones de frecuencias
o Gráficas de barra
o Diagramas de pastel
o Histogramas
4
¿ Qué es la estadística?
La estadística descriptiva trata de describir y analizar algunos caracteres de los individuos de un grupo dado
sin extraer conclusiones para un grupo mayor.
Se suele hacer con ayuda de tablas y gráficos y con algunos parámetros estadísticos.
Ejemplo 1:
Se hace un estudio sobre los resultados académicos de los estudiantes de la ENST para compararlo con
estudios similares hechos para años anteriores.
Este estudio es estadística descriptiva pues se realiza sobre la totalidad de la población, es decir todos los
estudiantes.
5
La estadística inferencial: trabaja con muestras, y a partir de ellas tomar características de toda la población.
Es decir, que parte de propiedades generales que sólo se han verificado para casos particulares.
Por tanto es muy importante cómo se elige la muestra y qué grado de confianza se puede obtener en el
resultado obtenido.
Ejemplo 2:
Se realiza una encuesta a 50 alumnos de la ENST sobre sus preferencias en la lectura. Para conseguir
consecuencias válidas para el resto de la ENST.
Esto es estadística inferencial pues a partir de una muestra se desea obtener información sobre una característica
de toda la población, es decir, en la ENTS.
Conceptos básicos
Población:
• Es el conjunto total de sujetos sobre el que estamos realizando el estudio (niños, jóvenes,
adultos, etc.).
Ejemplo: Adolescentes de entre 12 y 16 años Sta. María Coapan.
Muestra
Individuo
8
Concepto básico: Variable
9
Conceptos básicos
• Ejemplo:
10
Ejercicio 1:
Los turistas extranjeros que arribaron a la ciudad de Tehuacán en el mes de marzo de 2019.
• Población:
• Muestra:
• Variable:
• Dato:
Respuestas: Los turistas extranjeros que arribaron a la ciudad de Tehuacán en el mes de
marzo de 2019.
• Población:
Todos los turistas extranjeros que arribaron a la ciudad de Tehuacán en el mes de marzo de 2019.
• Muestra:
100 turistas extranjeros que arribaron a la ciudad de Tehuacán en el mes de marzo de 2019.
• Variable:
País de procedencia, número de visitas, edad.
• Dato:
País de procedencia: Brasil Numero de Visitas: 2 Edad: 44
https://padlet.com/pue4r203001/dnebuq65prlbzwhs
8ojszvzz7j7pg0wg
Las variables pueden ser:
• Cuantitativa:
Sus valores son números.
Y pueden ser:
• Discretas.
* Presentan un número contable de valores
* Si los valores que puede tomar son aislados.
• Continuas.
* Si la variable puede tomar cualquier valor
dentro de un intervalo.
* Presentan un número incontable de valores.
• Cualitativas :
* Los valores que toman no son valores
numéricos sino cualidades.
a) Color favorito, lugar preferido para pasar las navidades, ciudad de nacimiento..
17
Importancia de la Estadística
18
Importancia de la Estadística
Organización para la Cooperación y el Desarrollo Económicos (OCDE)
http://www.oecd.org/centrodemexico/
https://www.compareyourcountry.org/pisa/country/mex?lg=es
19
• Las empresas pueden analizar tablas y
representar gráficos donde se refleje la
evolución que han sufrido los beneficios y las
pérdidas.
20
DEPORTES
• Pronosticar resultados de partidos.
• Analizar el rendimiento de un
jugador.
• Analizar si un equipo ha sido
defensivo u ofensivo (posesión del
balón, remates totales, faltas
cometidas, goles marcados, etc.).
21
EJEMPLOS DE TEMAS A TRABAJAR EN ESTADÍSTICA
22
RECUERDA
23
RECUERDA
Claro que sí, el hecho de tener o no decimales, no permite diferenciar a una variable discreta de
una continua.
Mucho cuidado, es muy común escuchar en la web la siguiente falsedad: si una variable
presenta decimales, entonces es continua, de lo contrario, es discreta.
¡Tremendo error!
Esto no tiene nada que ver con la definición de variables discretas y continuas.
24
La pregunta del millón de dólares
25
DISTRIBUCIÓN DE FRECUENCIA
• En cualquiera de los casos, la organización de los datos es uno de los primeros pasos en
el análisis de los datos.
26
DIAGRAMAS DE TALLO Y HOJA
27
DIAGRAMAS DE TALLO Y HOJA
• Los siguientes datos corresponden al Índice de
Masa Corporal (IMC) de los estudiantes del
Proyecto Jóvenes en Acción por un Ambiente PASO 4
Sano. PASO 3
Diagrama de Tallo – Hoja
PASO 2 18. 2 6 9
PASO 1 19. 3 9 18 269
20. 4 8 9 9 19 39
DATOS
21. 4 5 5 5 20 4899
22. 0 1 1 3 3 21 4555
18.2 22.1 25.6 18.6 22.3
26.2 18.9 22.3 26.2 19.3 23. 0 3 6 8 22 0113
23.0 26.9 19.9 23.3 27.2 24. 5 6 23 0336 688
20.4 23.3 27.2 20.8 23.6 25. 6 24 56
27.5 20.9 23.6 28.1 20.9 26. 2 2 9 25 6
23.8 29.4 21.4 23.8 30.8 27. 2 2 5 26 229
22.0 24.5 31.0 22.1 24.6 28. 1 27 225
31.0 29. 4 28 1
30. 8 29 4
31. 0 0 30 8
Datos Los dígitos de las 31 00
OJO:
hojas deben totalizar el El número de dígitos
en las hojas, deben
número de datos de la ser la totalidad de
muestra. hojas que se escriben
en la tabla
28
OTROS TIPOS DE DIAGRAMA DE TALLO Y HOJA
4 6 7
*4 2 3 7
7 3 2 4 6 7 5 0 2
3 6 5 0 2 *5 3 6
2 6 8 3 2 2 8 6 6 6 7 9 6 6 6 7 9
4 6 1 7 5 1 8 3 7 5 2 *6 2 6 8 3 2 2 8
0 8 2 7 5 1 8 3 7 5 2
*7 4 6 1
8 2
*8 0
ESPERANZA DE VIDA Tallo y hoja clasificado por otra variable
TALLO (dos hojas y un solo tallo)
29
OTROS TIPOS DE DIAGRAMA DE TALLO Y HOJA
La gráfica más sencilla para datos cuantitativos es la gráfica de puntos. Para un conjunto pequeño de
mediciones, por ejemplo el conjunto 2, 6, 9, 3, 7, 6, se puede simplemente graficar las mediciones como
puntos en un eje horizontal.
Para un conjunto grande de datos, como el de la figura 2), la gráfica de puntos puede ser nada informativa
y tediosa para interpretarse
Figura 1) Figura 2)
30
SIN PUNTO DECIMAL.
Solución:
Para crear el tallo y hoja, se puede dividir cada observación entre las
unidades y las decenas. El número a la izquierda es el tallo; el de la
derecha es la hoja. Entonces, para los zapatos que cuestan $65, el tallo es
6 y la hoja es 5. Los tallos, que van de 4 a 9, aparecen en la figura 1.10,
junto con las hojas para cada una de las 19 mediciones. Si indicamos que
la unidad de hoja es 1, el lector verá que el tallo y hoja 6 y 8, por ejemplo,
representan el número 68 registrado al dólar más cercano.
31
TABLAS DE FRECUENCIA
Los datos son ordenados de menor a mayor o viceversa colocándoles al lado el número de veces que se
repite cada dato (frecuencias).
• El primer paso, es determinar las características de la cantidad y el rango de variabilidad de los datos.
1. Si los datos son pocos y tienen poca variabilidad, bastará con sólo ordenarlos en una lista de datos.
2. Si los datos son muchos y con poca variabilidad, se pueden obtener las frecuencias sin agrupar los
datos en rangos.
3. Si los datos son muchos y con mucha variabilidad, entonces conviene hacer una tabla de frecuencias
con rangos de agrupación de los datos.
32
Tipo 1 Tipo 2 Tipo 3
Pocos datos y poca Muchos datos y poca Muchos datos y mucha
variabilidad variabilidad variabilidad
EDAD EDAD No. % EDAD No. %
5 5 3 3.9% 0-4 18 7.8
6 6 7 9.2%
5-9 25 10.9
7 7 15 19.7%
8 16 21.1% 10-14 30 13.0
7
10 8 10.5% 15-19 34 14.8
8
14 12 15.8% 20-24 37 16.1
10 17 9 11.8%
14 18 6 7.9% 25-29 29 12.6
17 30-34 36 15.7
18 TOTAL 76 100 35-39 21 9.1
18
3 / 76 = 3.9
TOTAL 230 100
Las frecuencias
de los datos es Cuando los datos son
Si son muchos datos, y son
la misma (uno) prácticamente los mismos, pero
diferentes mucho de ellos
para cada dato se repiten muchas veces,
(variabilidad), entonces conviene El rango de
de la lista conviene ordenarlos y colocar su
agruparlos datos y colocar la variabilidad, se
frecuencia
frecuencia para cada grupo. obtiene como la
diferencia del dato
con el máximo
valor y el dato con
R = 18 - 5 = 13 R = 18 -5 = 13 R = 39 -0 = 39
el mínimo valor.
R = Xmax - Xmin33
Por ejemplo de tabla de distribución tipo II:
34
EJERCICIO: Distribución de frecuencia
Paso a paso
1. Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas máximas:
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30,
30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29.
Frecuencia
• En la primera columna de la tabla colocamos la Variable ordenada Frecuencia Abs.
acumulada
variable ordenada de menor a mayor Xi fi Fi
• En la segunda anotamos la frecuencia absoluta 27
• En la tercera anotamos la frecuencia
28
29
acumulada: 30
31
32
33
34
35
EJERCICIO: Distribución de frecuencia
1. Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas máximas:
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30,
30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29.
n= número de datos
36
EJERCICIO: Distribución de frecuencia
Frecuencia relativa = frecuencia
1. Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas máximas: n
Porcentaje = (frecuencia relativa) x 100
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30,
30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29.
=1/31= 0.032
=2/31= 0.065
37
Frecuencias Frecuencias relativas
Frecuencia
Variable ordenada Frecuencia Abs. relativas acumulada
acumulada
(ni) ( Ni )
Xi fi Fi (fr%) (Fr% )
27 1 1 0.032 0.032
28 2 3 0.065 0.097
29 6 9 0.194 0.097 + 0.194= 0.290
30 7 16 0.226 0.290 + 0.226 = 0.516
31 8 24 0.258 0.774
32 3 27 0.097 0.871
33 3 30 0.097 0.968
34 1 31 0.032 1
38
EJERCICIO 2:
Distribución de frecuencia
Las notas de un examen de matemáticas de 30 alumnos de una clase son las siguientes:
5, 3, 4, 1, 2, 8, 9, 8, 7, 6, 6, 7, 9, 8, 7, 7, 1, 0, 1, 5, 9, 9, 8, 0, 8, 8, 8, 9, 5, 7.
39
En cuanto a las gráficas:
Tipos de graficas:
40
Cualitativas
41
Ejemplo
La cantidad de dinero gastada en el año fiscal 2005, por el Departamento Presupuestos de la SEP en varias categorías, se muestra en la tabla:
Gastos por categoría
Categoría Cantidad (miles de millones)
Construya una gráfica de pastel y una gráfica de barras para describir los datos. Compare las dos formas de presentación.
$150.00
5.5,1%
1% Operaciones y
$100.00 5.3,
65.7, 14% $127.50 , matenimiento
$50.00 27% Adquisiciones
$- 82.3, 17%
Investigacion y desarrollo
Grafica Lineal:
Los datos de una serie de tiempo se presentan con más efectividad en una gráfica de líneas con el
tiempo como eje horizontal. La idea es tratar de distinguir un patrón o tendencia que sea probable de
continuar en el futuro y luego usar ese patrón para hacer predicciones precisas para el futuro
inmediato.
43
En cuanto a las gráficas:
En el año 2025, el mayor de los “hijos de la explosión demográfica” (nacido en 1946) tendrá 79 años, y el mayor de los de la “Generación X”
(nacido en 1965) estará a dos años de ser elegible para el Seguro Social. ¿Cómo afectará esto a las tendencias del consumidor en los
siguientes 15 años? ¿Habrá suficientes fondos para los “hijos de la explosión demográfica” para recolectar prestaciones del Seguro Social?
La Oficina de Censos de Estados Unidos da proyecciones para la parte de la población norteamericana que tendrá 85 años y más en los
próximos años, como se muestra a continuación.
Construya una gráfica de líneas para ilustrar los datos. ¿Cuál es el efecto de prolongar y contraer el eje vertical de la gráfica de línea?
44
En cuanto a las gráficas:
45
En cuanto a las gráficas:
46
En cuanto a las gráficas:
7
Marcas de Frecuencia Frecuencia
Pesos (g)
clase absoluta acumulada
6
(100-110) 105 3 3
FRECUENCIA ABSOLUTA
POLIGONO DE
(110-120) 115 5 8
FRECUENCIA
5
(120-130) 125 6 14
(130-140) 135 4 18 4
(140-150) 2 20
Total 20 3
105
(GRAMOS) 145
47
En cuanto a las gráficas: OJIVA DE PESOS
20
(100-110) 105 3 3
(110-120) 115 5 8 14
(120-130) 125 6 14 12
(130-140) 135 4 18
10
(140-150) 145 2 20
8
Total 20
6
(GRAMOS)
48
En cuanto a las gráficas:
49
En cuanto a las gráficas:
En un albergue de animales, se registran los pesos de todos los cachorros que viven allí. Con ayuda
del histograma, indique cuantos cachorros viven en el albergue.
5
R = 17
4
3 4 5
2 3
2 2
1
1
0
0 1 2 3 4 5 6
50
En cuanto a las gráficas:
1 2 3 4 5
Cuantitativas continuas
Cualitativas y cualitativas discretas • Cantidades en intervalos
• Se unas para las variables continuas
• También para las variables discretas que
toman un gran numero de valores diferentes
es mejor agruparlos en intervalos
51
En cuanto a las gráficas:
Cualitativa
52
En cuanto a las gráficas:
También cuando tenemos una
variable cuantitativa discreta y
con pocos valores se puede
ocupar un diagrama de barras
53
INTERPRETACION DE GRAFICAS CON OJO CLINICO
Una vez creada una gráfica o gráficas, para un conjunto de datos, ¿qué se debe buscar al tratar de describir los datos?
Primero, verificar las escalas horizontales y verticales, de manera que haya claridad respecto a lo que se mide.
Examinar el lugar de la distribución de datos. ¿Dónde está el centro de distribución del eje horizontal? Si se comparan dos
distribuciones, ¿están centradas en el mismo lugar?
Examinar la forma de la distribución. ¿La distribución tiene un “pico”, un punto que es más alto que cualquier otro? Si es así, ésta es
la medición o categoría que se presenta con más frecuencia. ¿Hay más de un pico? ¿Hay un número aproximadamente igual de
mediciones a la izquierda y derecha del pico?
Buscar cualesquiera mediciones poco comunes o resultados atípicos. Esto es, ¿hay mediciones mucho mayores o menores que
todas las otras? Estos resultados atípicos pueden no ser representativos de los otros valores del conjunto. Es frecuente que las
distribuciones se describan según sus formas.
Definición Una distribución es simétrica si los lados izquierdo y derecho de la distribución, cuando se divide en el valor
medio, forman imágenes espejo. Una distribución está sesgada a la derecha si una proporción más grande de las
mediciones se encuentra a la derecha del valor pico. Las distribuciones sesgadas a la derecha contienen pocas
mediciones anormalmente grandes.
Una distribución está sesgada a la izquierda si una proporción mayor de las mediciones está a la izquierda del valor pico. Las
distribuciones sesgadas a la izquierda contienen pocas mediciones anormalmente grandes.
Una distribución es unimodal si tiene un pico; una distribución bimodal tiene dos picos. Las distribuciones bimodales representan a
veces una combinación de dos poblaciones diferentes del conjunto de datos.
54
EJERCICIOS DE TAREA
LA EDUCACIÓN FUNCIONA La educación funciona, según una instantánea dada en un informe a la
Construya una gráfica de tallo y hoja para estas 50 mediciones:
ciudad de Riverside por la Dirección de Educación del mismo condado. El promedio de ingresos
anuales para seis niveles diferentes de educación se muestra en la tabla:
a. ¿Qué métodos gráficos podría usted usar para describir los datos?
b. Seleccione el método del inciso a) que usted piensa describe mejor los datos.
c. ¿Cómo podría resumir la información mostrada en la gráfica respecto a niveles
educativos y salario?
RELIGIÓN ORGANIZADA Las estadísticas de las religiones del mundo son CALIFICACIONES DE EXAMEN Las calificaciones en un examen de 100 puntos se
aproximaciones muy vagas, dado que muchas religiones no dan seguimiento a registraron para 20 estudiantes:
sus miembros. Una estimación de estos números (en millones) se muestra en la
tabla siguiente.
55
HACIA DÓNDE VAN TODOS: MEDIDAS DE TENDENCIA CENTRAL
La letra griega mayúscula (8) pide sumar los términos que aparezcan a su derecha, empezando con el
número debajo de la sigma (i = 1) y terminando con el número arriba (i = n). No obstante, como las sumas
típicas en cálculos estadísticos se hacen casi siempre sobre el conjunto total de n mediciones, se puede
usar una notación más sencilla:
56
HACIA DÓNDE VAN TODOS: MEDIDAS DE TENDENCIA CENTRAL
Como es frecuente que las fórmulas estadísticas comprendan la suma de números o “sumarlos”, usamos
un símbolo para indicar el proceso de sumar. Suponga que hay n mediciones en la variable x y que las
llamamos x1, x2, …, xn. Para sumar las n mediciones, usamos esta notación abreviada:
57
EJEMPLO:
Trace una gráfica de puntos para las n 5 mediciones 2, 9, 11, 5, 6. Encuentre la media muestral y compare su
valor con lo que usted pudiera considerar el “centro” de estas observaciones en la gráfica de puntos.
Solución La gráfica de puntos parece estar centrada entre 6 y 8. Para hallar la media muestral, calcule:
Recuerde que las muestras son mediciones tomadas de una población más grande que en general es
desconocida. Un uso importante de la media muestral _ x es un estimador de la media poblacional
desconocida m. Los datos de peso al nacer en la tabla 1.9 son una muestra de una población más grande de
peso al nacer y la distribución se muestra en la tabla. La media de los 30 pesos al nacer es:
58
EJERCICIOS DE TAREA
59
EJERCICIOS DE TAREA
Ahora hay dos observaciones “de en medio”, vistas en la caja. Para hallar la mediana, escoja un valor a la
mitad entre las dos observaciones de en medio:
60
EJERCICIOS DE TAREA
Otra forma de localizar el centro de una distribución es buscar el valor de x que se presenta con la frecuencia más
alta. Esta medida del centro se denomina moda.
La moda por lo general se usa para describir conjuntos grandes de datos, mientras que la media y la
mediana se usan para conjuntos de datos grandes y pequeños
61