Estadistica
Estadistica
Estadistica
Matias N. Lugo
MP 229.544
¿Qué es la estadística?
Estadística es la ciencia de:
• Recolectar
• Describir
• Organizar
Datos
• Interpretar
para transformarlos en información, para la
toma mas eficiente de decisiones.
SEGÚN LA INTERVENCIÓN DEL INVESTIGADOR
OBSERVACIONAL
EXPERIMENTAL
No existe intervención del
Siempre son prospectivos,
investigador; los datos reflejan la
analíticos y de nivel investigativo
evolución de la enfermedad,
“explicativo” (causa – efecto);
ajena a la voluntad del
además de ser “controlados”.
investigador.
Tipos de Estudio
Observacionales
Descriptivos Analíticos
Cohorte
Reporte de Un caso o Series de
Casos
• Describe las características de un paciente o un grupo de
pacientes con similares características.
• Generalmente describen un nuevo hallazgo.
• Representan casi un tercio de las publicaciones
• Permiten la generación de hipótesis
• Son la interface entre la practica clínica y la epidemiología
Reporte de Un caso o Series de
Casos
LIMITACIONES
• Generación de Hipótesis pero no para testear la validez o
causalidad de una asociación.
• Son las características de un solo o algunos individuos.
Ejemplo: la moda de la
distribución:
2, 3, 3, 4, 4, 4, 5, 5 Mo= 4
Mediana
Es el valor que ocupa el lugar central de todos
los datos cuando éstos están ordenados de menor
a mayor.
Se representa por Me.
Se puede hallar sólo para variables cuantitativas.
Ejemplo:
Para ambos conjuntos la Mediana es igual a 100. Los datos del conjunto 2 están
más dispersos con respecto a su media que los datos del conjunto 1.
Principales medidas de
dispersión
• El rango
• Rango Intercuartil
• La varianza
• La desviación estándar
RANGO
R = X máx – X min
Ejemplo
• Ante la pregunta sobre número de hijos por familia,
una muestra de 12 hogares, marcó las siguientes
respuestas:
2 1 2 4 1 3
2 3 2 0 5 1
• Calcule el rango de la variable
Solución
• El Rango es R =5 – 0 = 5
VARIANZA
Mide la distancia existente entre los valores de la serie y la media. Se
calcula como sumatoria de las diferencias al cuadrado entre cada valor y la
media, multiplicadas por el número de veces que se ha repetido cada valor.
La sumatoria obtenida se divide por el tamaño de la muestra.
FÓRMULA n
i
( x x ) 2
s2 i 1
n 1
La varianza siempre será mayor que cero. Mientras más se aproxima a
cero, más concentrados están los valores de la serie alrededor de la
media. Por el contrario, mientras mayor sea la varianza, más dispersos
están.
Ejemplo
2 1 2 4 1 3 2 3 2 0 5 1
21.6672
s2 1.9697
11
DESVIACIÓN ESTÁNDAR
Es una medida de dispersión usada en estadística que nos dice cuánto tienden a
alejarse los valores puntuales del promedio en una distribución.
Una desviación estándar grande indica que los puntos están lejos de la media, y una
desviación pequeña indica que los datos están agrupados cerca de la media.
(x i x )2
s i 1
n 1
Ejemplo
2 1 2 4 1 3 2 3 2 0 5 1
Una vez que hemos calculado la media y la varianza, sólo resta calcular la raíz
cuadrada de la varianza.
x 2.16
21.6672
s2 1.9697
11
S 1.9697 1.4034
Tipos de frecuencia
La frecuencia La frecuencia relativa es el
absoluta es el cociente entre la frecuencia
número de veces absoluta de un determinado
que aparece un valor y el número total de
determinado valor datos
en un estudio
estadístico.
Hora
Histograma
Un histograma es una representación gráfica
de una variable en forma de barras.
Se utilizan para variables continuas o para
variables discretas, con un gran número de datos,
y que se han agrupado en intervalos.
En el eje abscisas se construyen unos
rectángulos que tienen por base la amplitud del
intervalo, y por altura, la frecuencia absoluta de
cada intervalo.
La superficie de cada barra es proporcional a la
frecuencia de los valores representados.
Ejemplo
El peso de 65 personas adultas viene dado
por la siguiente tabla:
Distribución Binomial
Hay muchas situaciones donde se espera que
ocurra o no un evento específico. Éste puede
ser de éxito o fracaso sin dar paso a un punto
medio. Por ejemplo, en la producción de un
artículo, éste puede salir bueno o malo. Casi
bueno no es un resultado de interés. Para
situaciones como éstas se utiliza la distribución
binomial.
38
Distribución binomial
Para construir una distribución binomial es necesario conocer el número de
pruebas que se repiten y la probabilidad de que suceda un éxito en cada una
de ellas.
A.11.2
Distribución Binomial
1. La muestra se compone de un numero fijo de
observaciones (n)
41
Propiedades de la distribución
normal
Tiene forma de campana (es simétrica)
42
Fórmula de la Estandarización
Los elementos base para estandarizar los datos son los parámetros de
la Media Aritmética y la Desviación Estándar.
X
Z
Al estandarizar los datos de la población, la media se convierte en
0 y la desviación estándar en 1
43
Supongamos que los datos de una muestra van de 30
a 90 (en el plano cartesiano se traza la recta en una
escala de 10 en 10).
60 60 0
Para X 60 Z 0
10 10
45
Intervalos de confianza para los principales
parámetros
En este caso, en lugar de indicar simplemente un único valor como estimación
del parámetro, lo que haremos es ofrecer un intervalo de valores que sea
asumible con cierta probabilidad por el parámetro que queremos estimar.
-Intervalo de confianza: Es el intervalo de las estimaciones (probables) sobre el
parámetro.
-Límites de los intervalos de confianza: Son los dos valores extremos del
intervalo de confianza
Intervalos de confianza para los principales
parámetros
¿Cuán grande habrá de ser el intervalo de confianza?
Si decimos que el intervalo de confianza va de menos infinito a más infinito, seguro que
acertamos. Pero eso no es muy útil.
En una distribución normal tipificada, es muy fácil saber qué puntuación típica (z)
deja a la izquierda el 2.5% de los datos (-2 DS) y cuál deja a la izquierda el
97.5% de los datos (+2DS).
Es la frecuencia total de un evento que ocurre en una
poblacion determinada .
Representa la probabilidad real de una enfermedad,
accidente o muerte en un período determinado.
Incidencia y prevalencia
• La tasa de incidencia mide la probabilidad de que una persona sana
desarrolle enfermedad durante un periodo específico de tiempo
• Es decir, representa el número de casos nuevos de enfermedad en
una población durante un periodo de tiempo definido
• La tasa de prevalencia mide el número de personas en una población
que en un momento dado tienen la enfermedad
Incidencia y prevalencia
• Las fórmulas para calcular estas tasas son:
Ej: Probabilidad de ACV por tener HTA
Operaciones con
probabilidades
Regla de Multiplicación para dos Eventos Independientes
P(A y B) = P(A) * P(B)
57
Contraste de Hipótesis
Hipótesis Nula: (H0) es la que se quiere demostrar.
¡Gran
diferencia!
Muestra Rechazo la
aleatoria hipótesis
X 20 años
59
• Problema: ¿La osteoporosis está relacionada con el género?
• Solución:
H 0 : p 0.5
60
Riesgos al tomar decisiones
Ejemplo: Se juzga a un individuo por la presunta comisión de un delito
61
Tipos de error al tomar una decisión
Realidad
Inocente Culpable
Inocente
OK Error
Menos grave
Veredicto
Culpable Error OK
Muy grave
62
Tipos de error al contrastar
hipótesis
Realidad
H0 cierta H0 Falsa
No Rechazo H0
Correcto Error de tipo II
El tratamiento no tiene El tratamiento si tiene efecto
efecto y así se decide. pero no lo percibimos.
Probabilidad β
Verdaderos positivos
Sensibilidad (Se) =
Verdaderos positivos + falsos negativos (Total de enfermos)
ESPECIFICIDAD EN PRUEBAS
Especificidad. Es la capacidad de la prueba para dar resultados negativos
cuando un animal no está verdaderamente enfermo.
Verdaderos negativos
Especificidad (Es) =
Verdaderos negativos + Falsos positivos (Total sanos)
Valor predictivo negativo
Verdaderos positivos
Formula VPP =
Total de positivos
Riesgo relativo
Tasa de incidencia en el
grupo de los expuestos
RR =
Tasa de incidencia en el
grupo de los no expuestos
EJEMPLO Enfermedad Coronaria
Enfermos No Totales TI
Enfermos
HABITO Fumador 84 2 916 3 000 28 x
DE FUMAR 1000
No 87 4 913 5 000 17.4
Fumador x
1000
Totales 171 7 829 8 000
(a) (d)
OR = (b) (c)
EJEMPLO Cancer de endometrio
Uso de Presente 55 19 74
Estrógenos
No 128 164 292
Presente
55 X 164
OR = = 3.71
19 X 128
Gracias