Clase Estadística
Clase Estadística
Clase Estadística
Introducción a la Estadística
¡La Estadística es una parte importante del proceso de
investigación!
Datos
Información
Roles de la Estadística dentro del Proceso de
Investigación
Continuas
Numéricas o
Cuantitativas
Discretas
Datos o
Variables Nominales
Categóricas o
Ordinales
Cualitativas
Binarias o
dicotómicas
Video
Variables de acuerdo a su Relación
Variable Independiente
(x)
Variable Dependiente
(y)
Ejemplo
Defina el tipo de cada variable del Ejemplo
1
Ejemplo 1: Base de datos de carros
Descripción de la base de datos
Estadística
Principios para la recolección y presentación de datos
Divisiones de la Estadística
Descriptiva Inferencial
Representan a un centro, en
torno al cual, se encuentra
distribuido el conjunto de los datos
Estas medidas sirven para resumir los datos
numéricamente
Medidas de tendencia central
Video
Para variables simétricas, el promedio determina
el centro de la distribución de los datos de una
muestra
Ejemplo del uso de promedio:
Otro ejemplo del uso del promedio:
Ejemplo práctico
El promedio se usa únicamente cuando las
distribuciones son simétricas, en las distribuciones
asimétricas se prefieren la mediana y la moda
La mediana es un solo valor del conjunto de datos
que mide la posición central del conjunto
La moda es el valor que tiene la mayor
frecuencia absoluta en un conjunto de datos
Video
Teorema del Límite Central
Excel
Gráficos para Variables Numéricas o
Cuantitativas
Histograma
Gráficos para Variables Categóricas
o Cualitativas
Gráfico de barras
Diagrama Circular o Pie
Medidas de Posición
Medidas de Posición
Cada vez que lanzamos una moneda, ¿cuáles son las posibilidades de
obtengamos cara?
Donde:
x(n): Es el mayor valor de la variable (max)
x(1): Es el menor valor de la variable (min)
Rango o amplitud, es la diferencia entre el mayor
y el menor valor observado de la variable
• Ejemplo:
2, 3, 5, 5, 8, 10, 12
El rango es 12-2 = 10
El rango es 10
Rango Inter-cuartilar (RQ)
•Indica la amplitud o diferencia entre el tercer y el primer cuartil de
una distribución
RQ = Q3 - Q1
Donde:
Q3: tercer cuartil
Q1: primer cuartil
Rango inter-cuartilar es la diferencia entre
los valores del 1er y 3er cuartil
Desviación Estándar (σ)
La desviación estándar cuantifica la variabilidad de
una muestra midiendo su dispersión alrededor de
la media
Desviación Estándar (σ)
•
Paso 2: Restar cada dato del promedio
Id Valor (x) (x – Xm)
1 5 -4.72
2 6 -3.72
3 7 -2.72
4 7 -2.72
5 8 -1.72
6 9 -0.72
7 11 1.28
8 12 2.28
9 13 3.28
10 14 4.28
11 15 5.28
Id Valor (x) (x – Xm) (x – Xm)^2
1 5 -4.72 22.2784
2 6 -3.72 13.8384
3 7 -2.72 7.3984
4 7 -2.72 7.3984
5 8 -1.72 2.9584
6 9 -0.72 0.5184
7 11 1.28 1.6384
8 12 2.28 5.1984
9 13 3.28 10.7584
10 14 4.28 18.3184
11 15 5.28 27.8784
•
Paso 5 dividir la sumatoria para n
118.1824/11 = 10.743
Paso 6 sacar la raíz cuadrada de la división
anterior
• 3.278
Ejemplo práctico
Ejemplo práctico
Ejemplo práctico
Ejemplo práctico
Ejemplos
Muestreo
Técnica para la selección de una muestra a partir de una población
estadística
Una población es la suma
de todos los elementos
que comparten algún
conjunto común de
características, y que
constituyen el universo
para los propósitos del
problema de la
investigación
Una muestra es un
subgrupo de la
población, que se
selecciona para participar
en el estudio
Al elegir una muestra, se
espera conseguir que sus
propiedades sean
extrapolables a la
población
Muestra
Representativa
Video
Técnicas de muestreo que
no usan procedimientos
de selección al azar, sino
que se basan en el juicio
personal del investigador
Procedimiento de muestreo
donde cada elemento de la
población tiene una
oportunidad probabilística fija
para ser elegido en la muestra
Técnicas de Muestreo No
Probabilístico
Técnica de muestreo no
probabilístico que busca
obtener una muestra de
elementos convenientes
Muestreo por
Juicio
Técnica de muestreo no
probabilístico, que es un muestreo
por juicio compuesto de dos etapas:
2. En la segunda etapa, se
seleccionan los elementos de la
muestra con base en la
conveniencia o el juicio
Muestreo Bola de Nieve
Técnica de muestreo no probabilístico en la cual se selecciona al azar al grupo inicial de encuestados. Los
encuestados posteriores se seleccionan con base en las referencias o la información proporcionada por
los encuestados iniciales. Este proceso puede realizarse en olas para obtener referencias de las referencias
Técnicas de Muestreo
Probabilístico
Técnica de muestreo
probabilístico donde cada
elemento tiene una probabilidad de
selección equitativa y conocida.
La muestra se extrae mediante un
procedimiento aleatorio del
marco de muestreo
Técnica de muestreo
probabilístico en que la
muestra se elige seleccionando
un punto de inicio aleatorio, para
luego elegir cada n elemento
en sucesión del marco de
muestreo
Técnica de muestreo probabilístico que
usa un proceso de dos pasos para
dividir a la población en estratos. Los
elementos se seleccionan de cada estrato
mediante un procedimiento aleatorio
Forma común de muestreo
estratificado en que los
conglomerados están formados
por áreas geográficas como
condados, manzanas, u otras
descripciones
Tamaño de la Muestra
Objetivo: Definir el proceso necesario para determinar el tamaño de la
muestra
¿Qué tamaño
tendrá una
muestra
representativa?
Número determinado de
sujetos que componen
la muestra extraída de
una población, necesarios
para que los datos
obtenidos sean
representativos de la
población
Permite
Se calcula
reducir costos
mediante la
o aumentar la
aplicación de
rapidez del
una fórmula
estudio
Fórmula
•Una fórmula muy extendida que orienta sobre el cálculo del tamaño de la
muestra para datos globales es la siguiente:
𝑁 ∗ 𝑍2 ∗ 𝑝 ∗ 𝑞
𝑛= 2 2
( 𝑁 − 1) ∗ 𝑒 + 𝑍 ∗ 𝑝 ∗ 𝑞
Símbolos y su Significado
Parámetro Estadístico
Error Muestreal (e)
Siempre se comete un
Es la diferencia entre un error, pero la naturaleza
estadístico y su parámetro de la investigación nos
correspondiente indicará hasta qué
medida podemos
cometerlo
Se expresa en
forma de porcentaje
(%)
Intervalo de Confianza (Z)
•Es una constante que depende del nivel de confianza que asignemos
•Una fórmula muy extendida que orienta sobre el cálculo del tamaño de la
muestra para datos globales es la siguiente:
𝑁 ∗ 𝑍2 ∗ 𝑝 ∗ 𝑞
𝑛= 2 2
( 𝑁 − 1) ∗ 𝑒 + 𝑍 ∗ 𝑝 ∗ 𝑞
𝑁 ∗ 𝑍2 ∗ 𝑝 ∗ 𝑞
Fórmula 𝑛=
( 𝑁 − 1 ) ∗ 𝑒 2+ 𝑍 2 ∗ 𝑝 ∗ 𝑞
•Donde:
n: tamaño de la muestra
N: tamaño de la población
Z: valor correspondiente al intervalo de confianza
e: error
p: probabilidad de que un elemento sea incluido
q: probabilidad de que un elemento no sea incluido (1-p)
Ejemplo
Ejemplo Ilustrativo:
•Solución:
•Se tiene N = 500
•Para el 95% de confianza Z = 1.96
•como no se tienen los demás valores se usará p = q = 0,5
•e = 5% = 0,05
Ejemplo Ilustrativo:
n=