Tema 1 Generalidades

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 18

Bioestadística

Dr. Raúl Colque Ibarra

1
Introducción a la
estadística

2
Definición
La Estadística es la Ciencia de la

• Sistematización, recolección, organizacion y


presentación de los datos referentes a un fenómeno que
presenta variabilidad o incertidumbre para su estudio
metódico, con objeto de

• deducir las leyes que rigen esos fenómenos,

• y poder de esa forma hacer previsiones sobre los mismos,


tomar decisiones u obtener conclusiones validas para
un grupo de elementos mayor a los estudiados.

3
Algunas utilidades de la Estadística

Descripción Diseño Test de hipótesis

✓Provee de resúmenes ✓Ayuda al diseño de


de datos. experimentos y ✓Evalúa hipótesis
estudios de campo. biológicas a través de
✓Ayuda a descubrir
tests, para verificar si
patrones o tendencias.
los patrones
✓Evalúa la magnitud y ✓Permite tomar observados son
dirección de los decisiones a priori consistentes con las
efectos sobre la utilidad de predicciones.
experimentales. algún experimento.

4
Pasos en un estudio estadístico
◼ Plantear hipótesis sobre una población
◼ Los fumadores tienen “más baja” laborales que los no fumadores
◼ ¿En qué sentido? ¿Mayor número? ¿Tiempo medio?

◼ Decidir qué datos recoger (diseño de experimentos)


 Qué individuos pertenecerán al estudio (muestras)
◼ Fumadores y no fumadores en edad laboral.
◼ Criterios de exclusión ¿Cómo se eligen? ¿Descartamos los que padecen
enfermedades crónicas?
 Qué datos recoger de los mismos (variables)
◼ Número de bajas
◼ Tiempo de duración de cada baja
◼ ¿Sexo? ¿Sector laboral? ¿Otros factores?
◼ Recoger los datos (muestreo)
 ¿Estratificado? ¿Sistemáticamente?

◼ Describir (resumir) los datos obtenidos


◼ tiempo medio de baja en fumadores y no (estadísticos)
◼ % de bajas por fumadores y sexo (frecuencias), gráficos,...

◼ Realizar una inferencia sobre la población


◼ Los fumadores están de baja al menos 10 días/año más de media que los no
fumadores.

◼ Cuantificar la confianza en la inferencia


 Nivel de confianza del 95% 5
 Significación del contraste: p=2%
Método científico y estadística

Plantear Diseñar
hipótesis experimento

Recoger
Obtener
datos
conclusiones
y analizarlos

6
Población y muestra
◼ Población (‘population’) es el conjunto sobre el que
estamos interesados en obtener conclusiones (hacer
inferencia).
 Normalmente es demasiado grande para poder
abarcarlo.

◼ Muestra (‘sample’) es un subconjunto suyo al que


tenemos acceso y sobre el que realmente hacemos las
observaciones (mediciones)
 Debería ser “representativo”
 Esta formado por miembros “seleccionados” de la
población (individuos, unidades experimentales).

7
Población y muestra

Muestra 2 Si tenemos un estudio


Población titulado:

Niveles de nicotina en sangre


de estudiantes de la
UAGRM, en la gestión 2020
Muestra 1

Población Muestra Variable


Estudiantes de la 100 estudiantes de Nivel de nicotina
UAGRM 5to semestre de medida en una
inscritos en la la carrera de muestra
gestión 2020. Auditoria. sanguínea.

8
Población y muestra
Poblaciones FINITAS e INFINITAS
❑ Finitas: aquellas que tienen un tamaño o cantidad conocido (Ej:
estudiantes de la UAGRM, pacientes del HUJ, etc.)
❑ Infinitas: aquellos cuyo tamaño no puede ser precisado (Portadores
de VIH en SC, consumidores de adelgazantes en la UAGRM)

PARAMETROS y ESTIMADORES
❑ Parámetros: Funciones obtenidos (promedio, por ejemplo) en base a
las características medibles de los elementos de una población.
❑ Estimadores (estadísticos): funciones obtenidas (promedio, por
ejemplo) sobre las características medibles de una muestra

 Parámetro

Población

x Estimador

9
Población y muestra
Cuando los datos obtenidos corresponden a toda la población, se dice que se
realiza un CENSO y si solo abarcamos una parte de esta, entonces
realizamos un MUESTREO

Veamos un ejemplo mas: Se realiza un muestreo de opinión para determinar si


las amas de casa de Santa Cruz, prefieren un detergente de una marca A con
relación a otra. Con este fin se entrevistan 2.000 amas de casa y entre ellos 1500
prefieren la marca A
a) ¿Qué constituye la muestra?
b) ¿Qué constituye la población?
c) ¿La población es finita o infinita?
d) La proporción de 75% de preferencia por la marca A (1500/2000) es un
parámetro o un indicador?

Respuestas:
a) Las 2.000 amas de casa entrevistadas
b) Las amas de casa de Santa Cruz
c) Por definición es finita, pero podría comportarse como una población
infinita
d) Es un indicador (si esta proporción se obtiene de todas las amas de Santa
Cruz, seria un parámetro) 10
Variables
◼ Una variable es una característica observable que varía entre los
diferentes individuos de una población. La información que
disponemos de cada individuo es resumida en variables.

◼ En los individuos de la población cruceña, de


uno a otro es variable (tipos de variable):
 El grupo sanguíneo
◼ {A, B, AB, O}  Var. Cualitativa
 Su nivel de felicidad “declarado”
◼ {Deprimido, Ni fu ni fa, Muy Feliz}  Var. Ordinal
 El número de hijos
◼ {0,1,2,3,...}  Var. Numérica discreta
 La altura
◼ {1,62 ; 1,74; ...}  Var. Numérica continua

11
Tipos de variables
◼ Cualitativas
Si sus valores (modalidades) no se pueden asociar naturalmente a
un número (no se pueden hacer operaciones algebraicas con ellos)

 Nominales: Si sus valores no se pueden ordenar


◼ Sexo, Grupo Sanguíneo, Religión, Nacionalidad, Fumar (Sí/No)

 Ordinales: Si sus valores se pueden ordenar


◼ Mejoría a un tratamiento, Grado de satisfacción, Intensidad del dolor

◼ Cuantitativas o Numéricas
Si sus valores son numéricos (tiene sentido hacer operaciones
algebraicas con ellos)

 Discretas: Si toma valores enteros


◼ Número de hijos, Número de cigarrillos, Num. de “cumpleaños”

 Continuas: Si entre dos valores, son posibles infinitos valores intermedios.


◼ Altura, Presión intraocular, Dosis de medicamento administrado, edad

12
De donde salen los datos?
◼ Registros rutinarios La gran mayoría de las
organizaciones lleva un registro organizado de la
operación díaria de sus actividades

◼ Encuestas Cuando no se dispone de información


necesaria en los registros rutinarios

◼ Experimentación Algunos datos, como la eficacia de


una tratamiento no pueden obtenerse a traves de
encuestas por lo que el investigador debe diseñar un
experimento para poder obtener las mismas

◼ Fuentes externas Informes ya publicados, banco de


datos disponibles, etc

13
◼ Es buena idea codificar las
variables como números para poder
procesarlas con facilidad en un
ordenador.
◼ Es conveniente asignar “etiquetas”
a los valores de las variables para
recordar qué significan los códigos
numéricos.
 Sexo (Cualit: Códigos arbitrarios)
◼ 1 = Hombre
◼ 2 = Mujer
 Raza (Cualit: Códigos arbitrarios)
◼ 1 = Blanca
◼ 2 = Negra,...
 Felicidad Ordinal: Respetar un
orden al codificar.
◼ 1 = Muy feliz
◼ 2 = Bastante feliz
◼ 3 = No demasiado feliz
◼ Se pueden asignar códigos a
respuestas especiales como
◼ 0 = No sabe
◼ 99 = No contesta...
◼ Estas situaciones deberán ser
tenidas en cuentas en el análisis.
Datos perdidos (‘missing data’)

14
◼ Aunque se codifiquen como números, debemos recordar
siempre el verdadero tipo de las variables y su significado
cuando vayamos a usar programas de cálculo estadístico.
◼ No todo está permitido con cualquier tipo de variable.

15
Técnicas de muestreo
◼ Cuando elegimos individuo de una población de estudio para
formar muestras podemos encontrarnos en las siguientes
situaciones:

 Muestreos probabilísticos
◼ Cuando todos los elementos de la población tienen la misma
probabilidad de ser elegidos para la muestra.
◼ Interesantes para usar estadística matemática con ellos.

 Muestreos no probabilísticos
◼ No se conoce la probabilidad.
◼ Son muestreos que seguramente esconden sesgos.
◼ En principio no se pueden extrapolar los resultados a la población.
 A pesar de ello una buena parte de los estudios que se publican usan
esta técnica. ¡Huff!

En general, las técnicas de inferencia estadística suponen que la


muestra ha sido elegida usando MUESTREO PROBABILÍSTICO!!!!
16
TECNICAS DE MUESTREO PROBABILISTICO

Se caracterizan porque las unidades elementales se seleccionan con


probabilidades conocidas, en dichas técnicas intervienen las leyes
probabilísticas. Estos tipos de muestreo pueden ser: aleatorio simple,
sistemático, estratificado y por conglomerados.

MUESTREO ALEATORIO SIMPLE.

Es el proceso por medio del cual se selecciona los elementos de una


población al azar, de modo que cada elemento tiene la misma probabilidad de
ser elegido:

Por ejemplo si se desea seleccionar una muestra de 52 trabajadores, una forma de


asegurarse de que todos los empleados de la población tienen las mismas posibilidades
de que se les elija consiste en escribir primero el nombre de cada empleado en un papel
y depositarlos todos en una caja. Después de mezclar todos los papeles, se efectúa la
primera selección tomando uno de la caja sin mirarlo. Se repite este proceso hasta
terminar de elegir la muestra de 52 empleados.

También se pueden utilizar programas informáticos o una Tabla de números aleatorios17


Un método más conveniente de seleccionar una muestra aleatoria consiste
en utilizar un número de identificación por cada empleado y una tabla de
números aleatorios. Como su nombre lo indica, estos números se generan
mediante un proceso aleatorio (calculadora, computadora,…). La
probabilidad de 0, 1, 2, …, 9 es la misma para cada dígito de un número. Por
consiguiente, la probabilidad de que se seleccione al empleado 011 es la
misma que tienen los empleados 722 o 382. Cuando se emplean números
aleatorios para seleccionar empleados, se elimina la influencia o sesgo del
proceso de selección.

18

También podría gustarte