LECTURA Estadística-2020-I
LECTURA Estadística-2020-I
LECTURA Estadística-2020-I
ESTADÍSTICA
CATEDRÁTICOS:
VÁLIDO PARA:
2020 - I
m
3#
Estadística
M
W: Raúl Corilla Melchor; Roly Quiñones Inga; Beruska Briceño Angulo
UNIDAD I:
ESTADÍSTICA Y
GENERALIDADES
Lecturas da ía semana 1:
OBLIGATORIOS
Objetivo:
Preguntas:
1. ¿Quien fundó la estadística como un mercader de mercería?
2. Que trataba el libro pequeño “ Natural and poísíieal observatiofís”
3. Quien acuñé finalmente la palabra estadística
4. Haga un comentario breve sobre la lectura
ANTECEDENTES HISTÓRICOS DE LA ESTADÍSTICA Y SUS
FUNCIONES
Hug® García Mansilfa
John Arbuthnot1
'www_history.mcs.st-andrews.ac.uk/history/pictDisplay/Arbuthnot.html
Estadística
Raúl Corilla Melchor; Roly Quiñones Inga; Beruska Briceño Angulo
Objetivo:
Preguntas:
5. ¿Qué se entiende por estadística?
6. ¿Cómo se llama el área de la cual los datos estadísticos son recopiiados?.
7. ¿Porqué es importante la estadística?
8. Haga un paralelo entre la estadística descriptiva e inferencias
ESTADÍSTICA GENERAL.
CONCEPTOS BÁSICOS
;QUE ES LA ESTADÍSTICA?
Sin embargo, el término tiene otros significados y la gente que no esta familiarizada con
la materia los desconoce. La estadística es una rama del conocimiento el campo de las
matemáticas aplicadas, que utiliza sus propios símbolos, términos, contenido, teoremas
y técnicas. Cuando se estudia la "estadística” normalmente se pretende dominar
algunas de estas técnicas.
Por ESTADÍSTICA debemos entender que son los métodos por medio de los cuales
podemos recolectar, organizar, presentar y analizar datos numéricos de un conjunto de
1
individuos permitiéndonos extraer conclusiones válidas y efectuar decisiones lógicas
basadas en dicho análisis.
DATOS ESTADÍSTICOS
La información cuantitativa apropiada para el análisis estadístico debe ser un conjunto (o
conjuntos) de números que muestren relaciones significativas. En otras palabras, los datos
Estadísticos son números que pueden ser comparados, analizados e interpretados.
Un número aislado que no se compara o que no muestra relación significativa con otro
número no es dato estadístico. Por ejemplo: Las edades de 1000 estudiantes son datos
estadísticos, puesto que las edades pueden ser comparadas y analizadas, y los
resultados de los análisis pueden ser interpretados.
El área de la cual tos datos estadísticos son recopilados, se le conoce como población
o universo.
Aún hay sectores aparentemente heterogéneos que las emplean. ¿Quién habría
supuesto que las estadísticas ayudaran a un erudito o a un investigador histórico a
determinar quien es el autor de obras en disputa? En este particular, creemos que el
ejemplo mas conocido es el del empleo de las estadísticas para establecer la prolongada
controversia sobre quien fue el autor de los ensayos literarios en los “Federalist Papers”.
En planos menores, se han hecho estudios estadísticos sobre el efecto que la luna llena
tiene la pesca de las truchas; sobre cual sería el tipo más adecuado del vaso para el
agua de los restaurantes; así como la estrategia óptima para juegos de destreza y azar,
tales como el bridge, los solitarios, el veintiuno, el béisbol, etc.
3
G L A S E S D E E S T A D ÍS T IC A
ESTADÍSTICA DESCRIPTIVA
Significado de Estadística
Ejemplo 1.1 : Supóngase que un profesor que calcula un promedio para una clase de
Historia. Como él está usando estadística para describir el
comportamiento de esa clase y no para hacer una generalización
acerca de varias clases, se puede decir que él está usando estadística
descriptiva. Los gráficos, las tablas y mapas que muestren datos en tal
forma que sean más fáciles de entender son ejemplos de estadística
descriptiva.
ESTADÍSTICA INFERENCIA!.
Y su significado
Ejemplos 1.3:
« El número de automóviles vendidos en un mes.
« El número de clientes esperando servicio en la caja de un
supermercado.
s El número de tubos electrónicos de T.V. producidos en una hora
determinada.
Ejemplo 1.4:
o La cantidad de energía eléctrica producida en una planta
hidroeléctrica en un día.
© El tiempo necesario para completar el ensamblaje de un artículo en
una planta. !
o La cantidad de petróleo bombeado cada hora en un pozo.
La estadística está desempeñando un importante papel ascendente en casi todas las facetas
del progreso humano. Anteriormente solo era aplicada a los asuntos del Estado, ahora su
influencia se extiende a la agricultura, biología, negocios, química, comunicaciones,
economía, educación, electrónica, medicina, física, ciencias políticas, psicología,
sociología, y otros campos de la ciencia. Este desarrollo de la estadística está ligada a los
métodos científicos en la toma, organización, presentación y análisis de los datos, tanto
para la deducción de conclusiones como para tomar decisiones razonables de acuerdo con
tales análisis.
6
Estadística
Raúl Corilla Melchor; Roly Quiñones Inga; Beruska Briceño Angulo
Lecturas de la semana 3:
OBLIGATORIOS
Preguntas:
9. ¿Qué se entiende por variable estadística?
10. ¿Cómo se clasifican ías variables?.
11. ¿Existen otras variables diferentes a la variable nominal y ordinal y cuáles son?
12. Haga un paralelo entre la variáble nominal y ordinal
- Características.
- Atributos.
- Rasgos.
- Cualidades.
Oe acuerdo con el tipo de medida que describe cada una de las variables,
éstas se clasifican en dos tipos que son:
1. Variables cualitativas.
2. Variables cuantitativas.
a) Nominales b) Ordinales
Definición
VARIABLE <
a) Discreta
CUANTITATIVA
V b) Continua
1. NOMINAL
Son variables numéricas cuyos valores representan una categoría o identifican un grupo de
pertenencia. Este tipo de variables sólo nos permite establecer relaciones de
igualdad/desigualdad entre los elementos de la variable. La asignación de los valores se realiza
en forma aleatoria por lo que NO cuenta con un orden lógico. Un ejemplo de este tipo de
variables es el Género ya que nosotros podemos asignarle un valor a los hombres y otro
diferente a las mujeres y por más machistas o feministas que seamos no podríamos establecer
que uno es mayor que el otro.
2. ORDINAL
Son variables numéricas cuyos valores representan una categoría o identifican un grupo de
pertenencia contando con un orden lógico. Este tipo de variables nos permite establecer
relaciones de igualdad/desigualdad y a su vez, podemos identificar si una categoría es mayor o
menor que otra. Un ejemplo de variable ordinal es el nivel de educación, ya que se puede
establecer que una persona con título de Postgrado tiene un nivel de educación superior al de
una persona con título de bachiller. En las variables ordinales no se puede determinar la
distancia entre sus categorías, ya que no es cuantificable o medible.
3. INTERVALO
Son variables numéricas cuyos valores representan magnitudes y la distancia entre los números
de su escala es igual. Con este tipo de variables podemos realizar comparaciones de
igualdad/desigualdad, establecer un orden dentro de sus valores y medir la distancia existente
entre cada valor de la escala. Las variables de intervalo carecen de un cero absoluto, por lo que
operaciones como la multiplicación y la división no son realizables. Un ejemplo de este tipo de
variables es la temperatura, ya que podemos decir que la distancia entre 10 y 12 grados es la
misma que la existente entre 15 y 17 grados. Lo que no podemos establecer es que una
temperatura de 10 grados equivale a la mitad de una temperatura de 20 grados.
4. RAZÓN
Las variables de razón poseen las mismas características de las variables de intervalo, con la
diferencia que cuentan con un cero absoluto; es decir, el valor cero (0) representa la ausencia
total de medida, por lo que se puede realizar cualquier operación Aritmética (Suma, Resta,
Multiplicación y División) y Lógica (Comparación y ordenamiento). Este tipo de variables
permiten el nivel más alto de medición. Las variables altura, peso, distancia o el salario, son
algunos ejemplos de este tipo de escala de medida.
Debido a la similitud existente entre las escalas de intervalo y de razón, SPSS las ha reunido en
un nuevo tipo de medida exclusivo del programa, al cual denomina Escala. Las variables de
escala son para SPSS todas aquellas variables cuyos valores representan magnitudes, ya sea que
cuenten con un cero (0) absoluto o no. Teniendo esto en cuenta discutiremos a continuación los
diferentes procedimientos estadísticos que se pueden utilizar de acuerdo al tipo de medida de
cada variable.
No todos los procedimientos estadísticos son realmente útiles para la totalidad de los niveles de
medida. Cada uno de los tipos de medida posee ciertas características, las cuales debemos tener
en cuenta en el momento de realizar un análisis descriptivo. En la tabla [5-2], encontrarás
algunos de los procedimientos que resultan ventajosos en los análisis descriptivos de los
diferentes niveles de medida. Es necesario aclarar que esta tabla es sólo una muestra de, las
medidas que se pueden emplear; en algunos textos de estadística aparecen tablas más amplias y
detalladas de los procedimientos.
Si nos fijamos en la tabla 5-2, notaremos que los niveles Nominal y Ordinal cuentan con los
mismos procedimientos de análisis, por lo que se agrupan como variables categóricas. A partir
de este punto cuando nos refiramos a las variables categóricas debemos recordar que se alude a
las variables de tipo Nominal y Ordinal.
Es importante resaltar que para los análisis descriptivos no hay una gran diferencia entre estos
dos tipos de variables, pero si existe diferencia en los análisis de Inferencia. Antes de conocer
como se efectúan estos procedimientos en SPSS, es necesario exponer las razones por las que
ciertos procedimientos no son de utilidad en algunos de los niveles de medida.
Para las variables que representan categorías o grupos de pertenencia, los principales
procedimientos estadísticos, que se pueden utilizar en su análisis descriptivo son las frecuencias
(Recuento), el Porcentaje, i&Moda, en algunos casos la mediana y los gráficos más favorables
son el de Sectores y el de Barras.
Si nos fijamos en los resultados notaremos que la Media toma el valor 1.2, el cual nos indica
que en promedio los encuestados cuenta con un género de (1.2). Este resultado no posee una
interpretación aplicable a la información de la variable, por lo que esta medida no es de utilidad
en el análisis descriptivo.
Si observamos la Mediana notaremos que toma el valor 1, que para el caso corresponde al
género Femenino, pero si en vez de 10 valores tuviéramos únicamente dos (1 y 2), la mediana
sería de (1.5), cuya interpretación no es aplicable a la información de la variable. La mediana se
puede utilizar cuando estamos trabajando con variables que contienen un elevado número de
categorías y su interpretación se debe manejar como un factor informativo para el investigador
y no como una medida representativa en el reporte.
Por último encontramos la Moda, la cual para el caso asume el valor 1 y nos indica que la
categoría con mayor frecuencia dentro de la variable es la correspondiente al género Femenino.
Las medidas de dispersión y distribución no son aplicables a este tipo de variables ya que sus
ecuaciones nos permiten determinar cómo se comportan los datos respecto a un punto central o
media. Si hallamos la desviación estándar para los datos del ejemplo, obtendríamos un valor de
0.42164, que nos indicaría que el promedio del género presenta una variación de ±0.42, cuyo
resultado no sería aplicable a la interpretación de la variable.
Este tipo de variables nos permite realizar análisis más profundos de los datos, aplicando una
gran variedad de medidas. Al contrario de las variables categóricas en este tipo de variables las
frecuencias no son de utilidad en los análisis descriptivos, debido a la gran cantidad de valores
que suele tomar. Supongamos que realizamos un sondeo de edad con una muestra de 500
personas, si generamos una tabla de frecuencias obtendríamos fácilmente unos 60 o 70 rangos
diferentes haciéndola muy extensa y poco informativa.
Para las variables de escala son más informativas la medidas como la media, la mediana, la
desviación estándar, la asimetría y otras más, a las cuales se les suele denominar Medidas de
Resumen.
Estadística
■.’iis'i Raúl Corilla Melchor; Roly Quiñones Inga; Beruska Briceño Angulo
'
Lecturas de 8a semana 4:
OBLIGATORIOS
a
Preguntas:
13. ¿Qué se entiende por variable estadística cuantitativa?
14. ¿Cómo se clasifican las variables cuantitativas?.
15. ¿Existen otras variables diferentes a la variable discreta y continua y cuáles son?
16 . Haga un paralelo entre la variable discreta y continua.
Debemos destacar que los problemas expuestos en esta sección son sacados de libros,
guías, internet o cualquier otra herramienta bibliográfica.
salón de clases
Religión
Salario mensual de una empresa
Clase social de los alumnos de la
UCAB
Números de la ruleta
Temperatura registrada en un mes
Código Postal
Cantidad de acciones vendidas en
la bolsa de valores
Edad
Escala de Medición: Son las escalas que se utilizan para clasificar más detalladamente las
variabJes las cuales se dividen en 4 niveles (nominal, ordinal, intervalo, razón)
« Escala Ordinal: Clasifica los datos en categorías que pueden ser jerarquizadas o
divididas en rangos, sin embargo no se puede determinar con precisión las
diferencias entre rangos. Existe la relación mayor o menor que entre las
categorías de la variable.
V
A
Calificación de un producto (muy bueno, bueno,
regular, malo, muy malo)
Puntuaciones en un test de inteligencia 1 X
Religión X
Número de estudiantes que le escriben a un X
desconocido por el chat
Clase soda! de los alumnos de la UCAB X
Número de estudiantes en un salón de clases X
Marca de Refrescos X
Temperaturas medidas en un laboratorio cada hora X
Distancia diaria recorrida por cada estudiante para ir de X
su casa a la UCAB
Tiempo que requiere un estudiante para responder un X
examen
Puntuación de los estudiantes en un examen X
Preferencia por cierta marca de refresco X
Parroquias a las que pertenecen los estudiantes que X
estudian en la UCAB
Cantidad de acciones vendidas en la bolsa de valores ■ ! X
Vida media de los bombillos (medido en horas) ; X
Escuelas a la que pertenecen los alumnos de la UCAB X
rz ,
UNIDAD II:
REPRESENTACIÓN GRÁFICA Y
MEDIDAS DE CENTRALIZACIÓN
1
1
OBJETIVO ESPECÍFICO
MÉTODOS GRÁFiCOS
Xj f¡
a favor 50%
en contra 40%
abstención 1 0%
I00
E je m p lo :
15 20 25 30 35 40 45 50 55 60 65
Clases
Tema: "CREACIÓN DE GRÁFICOS ESTADISTICOS EN EXCEL 2 013".
Objetivos
Distinguir los diferentes tipos de gráficos que posee Microsoft Excel 2 0 1 3 .
Crear gráficos estadísticos en hojas de cálculo.
Introducción.
E
n Microsoft O ffice Excel 2013, es fácil crear gráficos de aspecto profesional. Sólo con
seleccionar un tipo, un diseño y estilo de gráfico (opciones de fácil acceso en la nueva cinta de
opciones de Office Excel 2013), obtendrá resultados profesionales inmediatos cada vez que
cree un gráfico. Para hacerlo aún más sencillo, puede guardar sus gráficos favoritos 'cómo una
plantilla de gráfico que'podrá aplicar rápidamente cuando cree un nuevo gráfico.
E B SB 9
Cargar en pantalla el archivo Alm acen.xlsx, que al tenerlo en pantalla nos daremos cuenta que
posee varias hojas en la parte inferior. Primeramente nos iremos a la hoja llamada VENTAS.
Tipo: Columnas.
E s tilo : C o lu m n a a g r ip a d a eirá 3 © /
1. Vamos a seleccionar los datos desde la celda DEPTO hacia la derecha hasta ABRIL y después
hacia abajo hasta sombrear todos los números.
2. Clic en Insertar
3. Clic en Insertar gráfico de columnas:
4. Estilo: Columna agrupada en 3D
5. Modificarlo hasta que se vea así:
PRIM ER TR IM ESTRE 2014
U JSlhriw
Tipo: Circular.
Estilo: Circular 3D
1. Vamos a seleccionar los datos de las 2 columnas Sucursal y Zapatos incluyendo todos los números
de estas 2 columnas. j
2. Clic en Insertar ;
3. Clic en Insertar gráfico circular o de anillos:
4. Estilo: Circular en 3D 1
5. Modificarlo hasta que se vea así:
COM PRAS AL PROVEEDOR DE ZAPATOS
COMPRAS
SUCURSAL I ZAPATOS I CARTERAS I CINCHOS
CENTRO
A
PLAZA M UNDO
Tipo: Circular.
Estilo: Anillo.
1. Vamos a seleccionar los datos de las 2 columnas Sucursal y Cinchos pero por estar separadas
necesitamos utilizar la tecla CTRL para poderlas sombrear individualmente.
2. Clic en InsertaV
3. Clic en Insertdr gráfico circular o de anillos:
4. Estilo: Anillo j
5. Modificarlo hbsta que se vea así:
COMPRA DE CINCHOS AL MERCADO CENTRAL
Antes nos movemos a la hoja llamada NOTAS.
3 3 3 S !
1. Vamos a seleccionar los datos de las 4 columnas desde Estudiante hasta N ota3 de los primeros 5
alumnos.
2. Clic en Insertar
3. C lic en Insertar gráfico cuadro combinado:
4. Estilo: Columna agrupada - línea
5. M odificarlo hasta que se vea así:
1 8
VERONIKITA JUANITO
NOTAI
1. Vamos a seleccionar los datos de las 2 columnas de Estudiante y Promedio u tiliza n d o .^ tecla Ctrl
y sombrear todos los alumnos en ambas columnas.
2. Clic en Insertar #
3. Clic en Insertar gráfico radial
4. Estilo: Radial con marcadores •
5. M odificarlo hasta que se vea así:
JOSESiTO
H ü i :
1. Vamos a seleccionar los datos de las 3 columnas de Estudiante, N o ta l y Nota3 utilizando la tecla
Ctrl y sombrear los primeros 4 alumnos en ambas columnas.
2. Clic en Insertar
3. Clic en Insertar columna
4. Estilo: Columna apilada
5. M odificarlo hasta que se vea así:
6.5
ESTUDIANTE NOTAI NOTA2 NOTA3 PROMEDIO
6 MOT A3
o N O TAI
B l M l
Para el siguiente ejercicio necesitamos incluir una nueva columna después de la de PROMEDIO, se
llamara TOTAL
En ella necesitamos diseñar una fórmula que nos permita saber cuántos alumnos son APROBADOS y
para ello utilizaremos la formula condicional de SI. Digitaremos la siguiente formula debajo de la
palabra TOTAL.
GRAFIC08:
1. Vamos a seleccionar los datos de las 2 columnas
2. Clic en Insertar
3. Clic en Insertar G ráfico Circular
4. Estilo: Circular
5. M odificarlo hasta que se vea así:
ESTADO RESULTADO
RESULTADO DE LOS PROMEDIOS
APROBADOS
REPR03A0GS
I APROBADOS
I REPROBADOS
Antes casi terminando la práctica de hoy nos movemos a la hoja llamada ENCUESTA. Esta posee los
siguientes datos: i
A D U LTO S N IN O S
DEPARTAMENTO HOMBRES MUJERES DEPARTAMENTO VARONES HEMBRAS DEPARTAMENTO TOTALES
-AHUACHAPAN 241 AHUACHAPAN 24 AHUACHAPAN
SONSONÁTE • MI • 325 - ■ >1 5U N SO í Sa Ü-: .
'SANTA ANA . 245' _ 165 san ta ANA 25 .21 SANTA ANA
LA UBf P.fAO 2o'i; 325 ÍXUBHKTAO. •''' _ tó;. '_ ;S2; LA 1lili R IA !) ^
CHALA i -NANGO . 125,; 412 CHAIA T KNAN GO 37 12 CHALA [ENANCO
¿ABAÑAS 2S4:V ■ 321 CABANAS. 3i CABANAS' ^
IO IA L F S
Ü
1 1
Necesitamos obtener los totales de cada columna utilizando la función llamada =SUMA y en la tera
columna debemos obtener un TOTAL que es la suma de HOMBRES + MUJERES + VARONES
HEMBRAS de cada departamento. Si nos sale todo bien se parecerá así:
H H H H NINOS
DEPARTAMENTO HOMBRES MUJERES DEPARTAMENTO VARONES HEMBRAS DEPARTAMENTO TOTALES^
AHUACHAPAN _1S0 _ 2 4É AHUACHAFAN _ _,5
_S;_ _ '¿¿AM 'AHUACHAFAN m
SÖÄSONATF _ ^ T .^ 1 ~~ ' T .-» ? _____
SANT/VANA. ; s a n t a a ñ a .': S '^ H |p f ;; ?.fe
LÄ LIHÉr Ta »
CHALA fENANCiO __
' ¿S4
.^12r> _
"
_41 2
3? 5
CHALATCNANGO __ a _ 32 ¿2. ü s a k ¡M¡
IPBiES.,
Bueno hasta aquí llega esta práctica de gráficos estadísticos, esperando que hayamos aprendido
como crearlos y diseñarlos de manera profesional. N o se les olvide grabar su archivo cada 5 minutos.
Hasta la próxima.
Lecturas de la semana 6:
OBLIGATORIOS
Preguntas:
17. ¿Qué se entiende por medidas de tendencia central?
18. ¿la media aritmética y la mediana son estadísticos e qué se diferencian?, explique
19. ¿Qué es la moda, dar algunos ejemplos?
20. Identifique alguna casos prácticos de aplicación de moda, mediana y media
aritmética
• Media aritmética
• Media ponderada
• Media geométrica
• Media armónica
• Mediana
• Moda
Se debe tener en cuenta que existen variables cualitativas y variables cuantitativas, por lo que las
medidas de posición o medidas de tendencia se usan de acuerdo al tipo de variable que se está
observando, en este caso se observan variables cuantitativas.
La media aritmética
Artículo principal: Media aritmética
La media aritmética es el valor obtenido por la suma de todos sus valores dividida entre el
número de sumadores.
niño nota
1 6,0 -Primero, se suman las notas:
2 5,4 6,0+5,4+3,1+7,0+6,1 = 27,6
3 3,1 -Luego el total se divide entre la cantidad de alumnos:
4 7,0 27,6/5=5,52
5 6,1
La media aritmética es, probablemente, uno de los parámetros estadísticos más extendidos. Se le
llama también promedio o, simplemente, media.
D efinición formal
Dado un conjunto numérico de datos, x\, X2, xD, se define su media aritmética como
Esta definición varía, aunque no sustancialmente, cuando se trata de variables continuas, esto es,
también puede calcularse para variables agrupadas en intervalos.
Propiedades
Inconvenientes de su uso
Este parámetro, aún teniendo múltiples propiedades que aconsejan su uso en situaciones muy
diversas, tiene también algunos inconvenientes, como son:
La estatura media como resumen de una población homogénea (abajo) o heterogénea (arriba).
• Es una medida a cuyo significado afecta sobremanera la dispersión, de modo que cuanto
menos homogéneos sean los datos, menos información proporciona. Dicho de otro modo,
poblaciones muy distintas en su composición pueden tener la misma media.- Por
ejemplo, un equipo de baloncesto con cinco jugadores de igual estatura, 1,95 m,
evidentemente, tendría una estatura media de 1,95 m, valor que representa fielmente a
esta población homogénea. Sin embargo, un equipo de jugadores de estaturas más
heterogéneas, 2,20 m, 2,15 m, 1,95 m, 1,75 m y 1,70 m, por ejemplo, tendría también,
como puede comprobarse, una estatura media de 1,95 m, valor que no representa a casi
ninguno de sus componentes.
Media maestral
Esencialmente, la media muestral es el mismo parámetro que el anterior, aunque el adjetivo
"muestral" se aplica a aquellas situaciones en las que la media aritmética se calcula para un
subconjunto de la población objeto de estudio.
Moda
Artículo principal: Moda (estadística)
La moda es el dato más repetido de la encuesta, el valor de la variable con mayor frecuencia
absoluta. En cierto sentido la definición matemática corresponde con la locución "estar de
moda", esto es, ser lo que más se lleva.
Hablaremos de una distribución bimodal de los datos, cuando encontremos dos modas, es decir,
dos datos que tengan la misma frecuencia absoluta máxima. Cuando en una distribución de datos
se encuentran tres o más modas, entonces es multimodal. Por último, si todas las variables tienen
la misma frecuencia diremos que no hay moda.
Cuando tratamos con datos agrupados en intervalos, antes de calcular la moda, se ha de definir el
intervalo modal. El intervalo modal es el de mayor frecuencia absoluta.
La moda, cuando los datos están agrupados, es un punto que divide el intervalo modal en dos
partes de la forma p y c-p, siendo c la amplitud del intervalo, que verifiquen que:
Siendo la frecuencia absoluta del intervalo modal y y las frecuencias absolutas de los intervalos
anterior y posterior, respectivamente, al intervalo modal.
Las calificaciones en la asignatura de Matemáticas de 39 alumnos de una clase viene dada por la
siguiente tabla (debajo):
¡ Caiificaciones [ í 'j í ¡3 ¡4 ¡5 ¡6 [7 ¡8 ¡9;
Propiedades
Sus principales propiedades son:
• Cálculo sencillo.
• Interpretación muy clara.
• Al depender solo de las frecuencias, puede calcularse para variables cualitativas. Es por
ello el parámetro más utilizado cuando al resumir una población no es posible realizar
otros cálculos, por ejemplo, cuando se enumeran en medios periodísticos las
características más frecuentes de determinado sector social. Esto se conoce
informalmente como "retrato robot"
Inconvenientes
• Su valor es independiente de la mayor parte de los datos, lo que la hace muy sensible a
variaciones muéstrales. Por otra paite, en variables agrupadas en intervalos, su valor
depende excesivamente del número de intervalos y de su amplitud.
• Usa muy pocas observaciones, de tal modo que grandes variaciones en los datos fuera de
la moda, no afectan en modo alguno a su valor.
• No siempre se sitúa hacia el centro de la distribución.
• Puede haber más de una moda en el caso en que dos o más valores de la variable
presenten la misma frecuencia (distribuciones bimodales o multimodales).
Mediana
Artículo principal: Mediana (estadística)
La mediana es un valor de la variable que deja por debajo de sí a la mitad de los datos, una vez
que éstos están ordenados de menor a mayor.2 Por ejemplo, la mediana del número de hijos de
un conjunto de trece familias, cuyos respectivos hijos son: 3 , 4 , 2 , 3 ,2 , 1 ,1 , 2 ,1 , 1 ,2 , 1 y 1, es 2,
puesto que, una vez ordenados los datos: 1,1 ,1 ,1 ,1 , 1 ,2 , 2 ,2 , 2 ,3 , 3 ,4 , el que ocupa la
posición central es 2:
En caso de un número par de datos, la mediana no correspondería a ningún valor de la variable,
por lo que se conviene en tomar como mediana el valor intermedio entre los dos valores
centrales. Por ejemplo, en el caso de doce datos como los siguientes:
> 5 13 j
N A < nl2 <Ni = ATI9 < 19.5 < N2Q 5 6 19 = 19
N
00
Por tanto la mediana será el valor de la variable que ocupe el vigésimo lugar. En 6 9
nuestro ejemplo, 21 (frecuencia absoluta acumulada para Ai = 5) > 19.5 con lo ¡7 4 32 ¡
que Me = 5 puntos (es aconsejable no olvidar las unidades; en este caso como
estamos hablando de calificaciones, serán puntos) | 8 |4 36 j
9 2 38 j
La mitad de la clase ha obtenido un 5 o menos, y la otra mitad un 5 o más.
Ejemplo (N par)
Las calificaciones en la asignatura de Matemáticas de 38 alumnos de una clase viene dada por la
siguiente tabla (debajo):
Calificaciones 12 3 4 5 6 7 8 9
Número de alumnos 2 2 4 ¡5 6 i9 4 4 2 \
Cálculo de la Mediana:
Primero hallamos las frecuencias absolutas acumuladas Fi (ver tabla margen derecho).
Con lo cual la mediana será la media aritmética de los valores de la variable que ocupen el
decimonoveno y el vigésimo lugar.
Propiedades e inconvenientes
Las principales propiedades de la mediana son:-
Sus principales inconvenientes son que en el caso de datos agrupados en intervalos, su valor
varía en ñinción de la amplitud de estos. Por otra parte, no se presta a cálculos algebraicos tan
bien como la media aritmética.
™ Estadística Raúl Corilla Melchor; Roly Quiñones Inga; Beruska Briceño Angulo |
OBJETIVO ESPECÍFICO
© Ejemplo:
El color de ojos más frecuente en el curso es e l café, por eso decimos qué el color de ojos café es la
moda.
Vainilla • 6
Piña : 3
Pistacho : 2
V J
1) Dada el histograma y polígono de frecuencias donde se m uestra el número de pacientes con cáncer
gástrico y su rango de edad. Estimar el valor de la moda de la variable edad.
V
* Fuente hctp:;7www.monografias.com/
trabdiosSl/presefuacion-ddtos-
•estad il t ¡cos/presen cac ion- da tos-
estddist¡cos2.shtml )
18 - 20
22 - 24
2 6 - 28 1 , ■ _ • 3 4 -3 6
30 - 3 ;
' ',n
3 8 -4 0
' 4 2 -4 4
■
w" . r "'~ ,0
4 0 -4 8
rKL-
’ 5 0 -5 2 *
.
Edad
Oo
c
CU
Q_
c
a>
c
ro
CL
Q)
“O
ob
oa»
A LM ACEN 1 ALMACEN 2 A LM A C E N 3 A LM A C E N 4
Estadística Raúl Corilla Melchor; Roly Quiñones Inga; Beruska Briceño Angulo [
Lecturas d© !a semana 8:
¿Qué son y para qué sirve Bas medidas de posición
no central?
OBJETIVO ESPECÍFICO
_____________________ ^
b-
UNIVERSIDAD PERUANA LOS ANDES
ESCU ELA ACAD ÉM ICO PROFESIONAL DE DERECHO Y CIENCIAS POLÍTICAS
CUARTILES, DECILES Y PERCENTILES
Cuartiles.
Son valores de la variable que dividen los datos ordenados en cuartos; cada
conjunto de datos tiene tres cuartiles. El primer cuartil, Q x ,es un número tal
que a lo sumo 25% de los datos son menores en valor que Q¡ y a lo sumo 75%
un número tal que a lo sumo 75% de los datos son menores en valor que Q3 y
Lt a Qi a l s
Cada conjunto de datos tiene tres cuartiles que lo dividen en cuatro partes
iguales. El primer cuartil es ese valor debajo del cual clasifica el 25% de las
observaciones, y sobre el cual puede encontrarse el 75% restante. El segundo
cuartil es justo la mitad. La mitad de las observaciones están por debajo y la
mitad por encima; en este sentido, es lo mismo que la mediana. El tercer cuartil
es el valor debajo del cual está el 75% de las observaciones y encima del cual
puede encontrarse el 25% restante.
La determinación de los cuartiles con frecuencia es de utilidad. Por ejemplo
muchas escuelas de posgrados admitirán sólo a aquellos estudiantes que
estén en el 25% superior (tercer cuartil) de los candidatos. Las empresas, con
frecuencia, desean señalar las plantas cuyos deficientes registros de
producción los colocan por debajo del cuartil inferior. Con un poco de
imaginación es posible prever numerosos ejemplos en los cuales la
determinación de cuartiles puede ser de gran beneficio.
Deciles.
Son valores de la variable que dividen los datos ordenados en diez partes
iguales (9 divisiones).
10 % 10 % 10 % 10 % 10 % 10 % 10 % 10 % 10 % 10 %
L¡ D\ D2 D a D5 D6 D -j D% D9
Percentiles.
Son los valores de la variable que dividen un conjunto de datos clasificados en
100 subconjuntos iguales; cada conjunto de datos tiene 99 percentiles. El
1% 1% 1% 1% ... 1% 1% 1 %, 1%
Los deciles separan un conjunto de datos en 10 subconjuntos iguales, y los
percentiles en 100 partes. El primer decil es la observación debajo de la cual
se encuentra el 10% de las observaciones, mientras que el 90% restante se
encuentra encima de éste. El primer percentil es el valor debajo del cual se
encuentra el 1% de las observaciones, y el resto están encima de éste. Puede
aplicarse una interpretación similar al resto de deciles y percentiles. Todo
conjunto de datos tiene 9 deciles y 99 percentiles.
Un percentil y su ubicación en un arreglo ordenado se identifica mediante los
subíndices. Por ejemplo, el decimoquinto percentil se indica como P i5, y su
ubicación en la serie ordenada es L15.
Se asume que se desea calcular el percentil 25, P25, para las acciones de la
tabla. Se debe hallar el primero su ubicación en la serie ordenada.
25
i 25 = (50 + 1)
100
Los deciles separan un conjunto de datos en 10 subconjuntos iguales, y los
percentiles en 100 partes. El primer decil es la observación debajo de la cual
se encuentra el 10% de las observaciones, mientras que el 90% restante se
encuentra encima de éste. El primer percentil es el valor debajo del cual se
encuentra el 1% de las observaciones, y el resto están encima de éste. Puede
aplicarse una interpretación similar al resto de deciles y percentiles. Todo
conjunto de datos tiene 9 deciles y 99 percentiles.
Un percentil y su ubicación en un arreglo ordenado se identifica mediante los
subíndices. Por ejemplo, el decimoquinto percentil se indica como P-|5, y su
ubicación en la serie ordenada es L -i 5 .
Se asume que se desea calcular el percentil 25, P25, para las acciones de la
tabla. Se debe hallar el primero su ubicación en la serie ordenada.
¿25 = (S o + i ) ^
4
L25 = 12.75
3 10 19 27 34 38 48 56 67 74
Números de acciones
transadas en la Bolsa de 4 12 20 29 34 39 48 59 67 74
Valores de Nueva York (en 7 14 21 31 36 43 52 62 69 76
100’s)
9 15 25 31 37 45 53 63 72 79
10 17 27 34 38 47 56 64 73 80
El valor resultante de 12.75 decide que el percentil 25 está ubicado al 75% del
trayecto comprendido entre la doceava observación, que es 2 0 y la treceava
observación que es 21, es decir, P25 =20 + 0.75 (21-20) = 20.75.
¿35 = (50 + l ) ^
t 35 = 17.85
20
Deciles
Percentiles
Con relación a los percentiles pedidos, tendríamos que ubicar las posiciones
correspondientes como lo hicimos con los deciles. Para la posición del percentil
n 14
42 tendríamos la siguiente fórmula 42— = 42— = 5.88. Esto quiere decir que
100 100
daría ia posición del percentil buscado que en este caso es entre las posiciones
12 y la 13, más cerca de la primera. El resultado sería que el percentil 87 toma
el valor de 19.18.
Ejemplo 2.
Ejemplo: En la siguiente serie simple, que corresponde a la edad de los
trabajadores de una micro empresa: 33, 26, 66, 45, 28, 59, 33, 36, 26, 45, 62,
45, ordenar los datos y calcular los cuartiles uno, dos y tres, los deciles uno,
tres, cinco y nueve; y, los percentiles nueve, diez y cincuenta.
Solución.
Ordenamos los datos de mayor a menor:
26, 26, 28, 33, 33, 36, 45, 45, 45, 59, 62, 66
Cuartiles
Hallamos la ubicación del cuartil uno con la fórmula:
n+ l
0 ,=
4
Q\ = -— 7 — = 3.25
daría la posición del percentil buscado que en este caso es entre las posiciones
12 y la 13, más cerca de la primera. El resultado sería que el percentil 87 toma
el valor de 19.18.
Ejemplo 2.
Ejemplo: En la siguiente serie simple, que corresponde a la edad de los
trabajadores de una micro empresa: 33, 26, 66, 45, 28, 59, 33, 36, 26, 45, 62,
45, ordenar los datos y calcular los cuartiles uno, dos y tres, los deciles uno,
tres, cinco y nueve; y, los percentiles nueve, diez y cincuenta.
Solución.
Ordenamos los datos de mayor a menor:
26, 26, 28, 33, 33, 36, 45, 45, 45, 59, 62, 66
Cuartiles
Hallamos la ubicación del cuartil uno con la fórmula:
n+ l
e, - - ^ - 3 . 2 5
Lecturas de la semana 10
OBLIGATORIOS
Preguntas:
21. ¿Qué se entiende por medidas de dispersión?
22. ¿la varianza y la desviación estándar son estadísticos que miden la variabilidad de
los datos estudiados con respecto a la media?, explique
23. ¿Es la varíanza o la desviación estándar la que define la curva normal?
24. Haga un paralelo entre la varianza y la desviación estándar.
MEDIDAS DE DISPERSIÓN
3.1 Introducción
Las medidas de tendencia central no son suficientes para describir un conjunto de
valores de alguna variable estadística. Los promedios determinan el centro, pero nada
indican acerca de cómo están situados los datos respecto al centro.
En primer lugar se necesita una medida del nivel de la dispersión o la variabilidad de
los datos con respecto a su centro con la finalidad de ampliar la descripción de los datos o
de comparar dos o más series de datos.
En segundo lugar se necesita una medida del grado o nivel de la asimetría o la
deformación en ambos lados del centro de una serie de datos, con el fin de describir la
forma de la distribución de los datos. Esta medida se denomina índice de asimetría.
En tercer lugar se necesita una medida que nos permita comparar el apuntamiento o
curtosis de distribuciones simétricas con respecto a la distribución simétrica normal. Esta
medida se denomina índice de apuntamiento o curtosis.
Las estadísticas de asimetría y apuntamiento se incluyen en este capítulo de medidas de
variabilidad dada su poca importancia para tratarlos como un capítulo aislado. Por otro
lado, la forma de la distribución queda descrita por la ubicación de los promedios en la
distribución de frecuencias o por la ubicación de los cuartiles en una gráfica de caja.
Finalmente las medidas de curtosis son válidas sólo para distribuciones simétricas.
El lector debería correr paquetes de computo entre otros el MCEST para las
aplicaciones de este capitulo o usar una calculadora con aplicaciones estadísticas.
3.2 Medidas de dispersión o de variación
Las medidas de dispersión o variabilidad son números reales qu
nivel de separación de los datos con respecto a un valor central, qu
inedia aritmética.
Las principales medidas de dispersión son:
El rango.
El rango intercuartil,
La varianza,
La desviación estándar, y
El coeficiente de variación.
Cálculo de la varianza
1) Varianza de datos no agrupados
La varianza de » mediciones: xx,x 2,...,x„ de alguna variable i
media es x, es el número reai:
n
Z u -
2 Suma total de cuadrados de diferencias ~t
" # de datos n
EJEMPLO 3,1
Calcule la varianza y la desviación estándar de los 45 salarios quiñi
'el ejemplo 1.3
OLUCIÓN
n = 45 , t i , =2670$, í = = 59.333, Y x f =
/-i 45
uego, la varianza de los 45 salarios sin agrupar es el número:
n
Y fixm f
" n 45 45..
X (*< -n )2
a2 =— ---------- = ¿=!------ u2
N N p
Si formamos todas las muestras posibles de tamaño n y calculamos sus varianzas
utilizando la fórmula s„ = (*/ - x ) /n (método de población), resulta que la media
de todas estas varianzas vale:
n -1 ?
-----o .
n
Para que el promedio de todas las varianzas sea igual a a 2 se aplica la varianza
A»-i ~ ~ í ) 2/ ( " - 0 (método de muestra) que se obtiene de multiplicar a s2 por
« /(» -!). Por esta razón, algunos autores de esta materia definen la varianza (en
estadística descriptiva) con denominador n -1 .
Estas 2 varianzas se tratan en el capitulo 9 de estimación de parámetros.
3.2.4 Coeficiente de variación: Dispersión relati
Definición. El coeficiente de variación, denotado por CV, es una n
relativa (libre de unidades de medición), que se define como el cocii
estándar entre la media aritmética. Esto es,
CV =4r, o en%
x
El coeficiente o Indice de variación se utiliza para comparar la \
más series de datos que tengan medias iguales o diferentes o que
medida iguales o diferentes (por ejemplo, comparar la variabilidad d
medidos en kilogramos con la de otra serie de datos medidos en metros
Por dar un ejemplo, si las calificaciones en matemática I de dos
tienen ia misma desviación estándar igual a 14, no podemos concluir
tienen la misma variabilidad (salvo que tengan medias igual»).
Del mismo modo, si la desviación estándar de H1 es 2 y la de I
concluir que las notas de H2 son más dispersas que las de Hl. La varí
grupos depende, además, de sus medias.
En el primer caso, si se indica que la media del horario Hl es 16 y
H2 es 11, los coeficientes de variación respectivos son:
Valores estandarizados
Cuando se necesiten comparar valores observados' que pertenecen a diferentes
distribuciones de datos, las que difieren en su media aritmética o en su varianza, o difieren
en el tipo de unidad de medida (variables diferentes), entonces se estandarizan los valores
observados de la variable aplicando la variable “estandarizadora” o variable estándar Z.
Para una distribución de datos de variable X la variable estándar Z se define por:
EJEMPLO 3.4
Las calificaciones en un examen final de Matemáticas e Historia generaron las medias 13
y 17 y las desviaciones estándar 3 y 4 respectivamente. Si un alumno obtuvo 14 en
Matemáticas y 16 en Historia, ¿en cuál de los dos cursos tiene mejor rendimiento relativo?
SOLUCIÓN
El hecho de que tenga 16 en Historia y 14 en Matemáticas, no significa que tiene mejor
rendimiento en Historia.
Se deben calcular los rendimientos relativos con la puntuación estandarizada 2
14-13
En Matemáticas z = -------- = 0.333
3
1 —17
En Historia z = -------- -- -0.25
4
En consecuencia, el alumno tiene mejor rendimiento en Matemáticas ya que tiene
muyor rendimiento relativo en esa asignatura
6) Desigualdad de Chebyshev
Cualquiera sea la forma de la distribución (simétrica o asimét
observados de una variable X, el intervalo 3c+ Axín], dor
por lo menos
Sea = 25, s„t - 20, entonces la varianza global s 2x o s 2 es el número,
El hecho de que dos distribuciones pueden tener la misma media y la misma desviación
estándar, no garantiza que estas sean simétricas. Pueden diferir en el grado de asimetría.
Otro modo de describir la simetría o asimetría de la distribución de los datos es
aplicando una gráfica de cajas (Ver sección 3.5).
Existen varios métodos de medir la asimetría de la distribución de los datos, uno de
vhíos csel coeficiente o índice de asimetría de Pearson.
Definición. El índice de asimetría de Pearson es el número real
s
Como en distribuciones de marcada asimétría se verifica: x - Mo = 3
otra forma de expresar el índice de asimetría es:
A
.s 3 x (x - Me) .
----------------------
Lecturas de 8a semana 11
OBLIGATORIOS
Preguntas:
21. ¿Qué se entiende por medidas de coeficiente de variación?
22. ¿En un estudio social cuál es el límite entre la homogeneidad y heterogeneidad de
los datos en estudio?.
23. ¿Es el coeficiente de variación que nos indica cuan dispersos están los datos
estudiados?
24. Haga un cuadro comparativo entre la varianza y el coeficiente de variación .
INTRODUCCIÓN
C V = ^ (100%)
El coeficiente de variación sólo se debe calcular para variables con todos los
valores positivos. Todo índice de variabilidad es esencialmente no negativo.
Debemos trabajar con variables positivas para asegurarnos de que la media es
mayor a cero (recuerda que una división entre cero es una indeterminación).
precio del valor B es mucho más variable que el precio del valor A.
EJERCICIOS RESUELTOS
Ejemplo 1.
Con los siguientes datos: 21, 35, 36, 38 y 45 cuya media aritmética es 35 y su
desviación estándar 7.823, calcular el coeficiente de variación.
Solución.
7 871
CV = (100% ) = 22.35%
35
Ejemplo 2.
Después de haber registrado los datos correspondientes al peso y la estatura
de 40 varones, se asentaron en la siguiente tabla los resultados del cálculo de
la media y la desviación estándar.
Solución.
Debido a que tenemos estadísticos muéstrales, los dos coeficientes de
variación se obtienen de la siguiente manera:
(100% ) = 15.26%
Lecturas de Sa semana 12
OBLIGATORIOS
Preguntas:
¿Qué entiende por datos bidimensionales?
¿En un estudio social por ejemplo se pueden desarrollar estudios bidimensionales
como la talla y peso de los abogados que realizan investigación en el contexto
criminal, podría proponer otros casos de datos bidimensionales?.ejemplos
¿Es que casos concretos se aplica este tema en el campo de su carrera profesional?
Haga un cuadro bidimensional con problemas de carácter social.
0 Dependencia Funcional.
Cuando es posible predecir con exactitud los valores de una variable a partir de los de la otra,
se dice que ambas variables están en relación funcional. Dada la variable (X,Y) existirá una función
f(x) tal que y¡ = f(x,). Para cada valor de x se puede conocer el valor de y.
Ejemplo:
a) La altura desde la que cae un cuerpo y el tiempo que tarda en llegar al suelo está sujeto a la
ley de la gravedad. Siempre tarda lo mismo en recorrer el mismo espacio.
b) El precio de una tela es función del coste del metro de tela y del núm ero de metros.
6 Independencia o Incorrelación.
Cuando las dos variables no tienen ninguna relación entre ellas y podem os estudiarlas por separado.
Ejemplo:
a) La estatura y la nota de matemáticas.
b) La nota en selectividad y el núm ero de letras del nombre.
Lo prim ero que tenemos que resolver es como tabular los datos obtenidos en las observaciones.
Podemos construir una tabla de frecuencias, pero son mucho más prácticas las tablas de doble entrada
que reflejan los valores y frecuencias de las variables bidimensionales.
Ejemplo: Las notas en Lengua y en Idioma de los 30 alum nos de una clase en la última evaluación han
sido:
Lengua: 3, 7, 8, 7,5, 2, 5, 9 ,5 ,4 , 3, 5, 3, 6, 3, 8, 5, 7, 7, 6, 2,4, 9,4, 9 , 7, 6, 7,1, 7
Idiom a: 2, 6,10, 6, 4, 2, 5, 9, 5, 5, 2, 4,1, 5,1,10, 4, 7, 8, 4, 2, 5, 9, 5, 9, 8, 5, 7,0,7
Para el estudio de los resultados podem os disponer las
notas en una tabla de doble entrada, en la que junto a
los distintos resultados aparezcan sus frecuencias.
Obtenemos así la distribución de frecuencias de la
variable estadística bidimensional (X,Y), donde X
representa la nota en Lengua e Y la nota en Idioma de
los alumnos de la clase.
| 1
i
2
2 2
3
3 2 2
1 2
3
2
3
2
0
co
o
Total lo 1 2 4 4 5 2 ■ y i
1.3.-Distribuciones marginales
Se denom ina distribución marginal de una variable bidimensional a la distribución que se obtiene al
estudiar independientem ente cada variable.
Si tomamos la prim era columna y la última columna en la tabla anterior, obtenemos la distribución
0 1 2 3 4 5 6 7 8 9 10
1 2 4 0 3 7 3 3 2 3 2
1
M
O
2 3 4 5 6 7 8 9 10
x|
n 5, 1 0 I1 2 4 4 5 2 7 2 3 0
Con estas distribuciones podem os calcular los mismos parám etros estadísticos que calculamos para
las distribuciones unidimensionales.
r
I]
Las medias marginales son: x=-L-¡-
N
Varianzas marginales son:
X (*«• ~ * ) * ni
= ( x 2) - ( x ) = b 2) - ( y f
N N
Estadística Raúl Corilla Melchor; Roly Quiñones Inga; Beruska Briceño Angulo
UNIDAD IV:
INFERENCIA ESTADISTICA Y
PROBABILIDAD
OBJETIVO:
Reconocer y describir los eventos probabilísticas de experimentos
aleatorios representando los modelos de distribución porcentual a partir
de los datos haciendo uso en forma adecuada las diversas formas así
como el uso la tabla respecto a la distribución normal estándar, para
ejecución de prueba de hipótesis valorando en forma reflexiva su
importancia en trabajos de investigación y la vida diaria.
V _ _ _____________________ _ _ _ __________________ J
Preguntas:
¿Qué entiende por regresión lineal simple?
¿En un contexto social en qué casos por ejemplo se aplica estos
conceptos?.ejemplos
Proponga un ejemplo de aplicación en el contexto de tu carrera profesional
!
Jwau Carlos R ial® G.
o Generalidades
L a reg resión y los análisis de correlación n o s m uestran com o determ inar tanto la
n atu raleza com o la fu erza d e u n a relació n en tre dos variables
E l p rim er paso p ara determ inar si ex iste o n o u n a relación entre dos v ariables es
o b serv ar la grafica d e datos observados. E sta g rafica se llam a diagram a d e dispersión.
U n diagram a n o s puede d a dos tip o s de inform ación, visualm ente podem os b u sca r
p atro n es que nos indiquen que las v ariables están relacionadas. E ntonces si esto sucede,
p o d em os v er que tipo de linea, o ecuación d e estim ación, describe esta relación.
D iagram a d e dispersión
H asta el m om ento las líneas de reg resió n se colocaron a l ajustar las líneas visualm ente
en tre lo s puntos de datos, pero p a ra g raficar estas líneas d e u n a form a m ás p recisa
p o d em os u tilizar una ecuación q u e relaciona las dos variables m atem áticam ente.
L a ecu ació n p ara una línea recta d o n d e la variable dependiente Y esta d eterm in ad a p o r
la v arian za dependiente X es:
$ $
R e c ta d e re g re s ió n p o r el m é to d o d e laím im os c u a d ra d o s .
A h o ra que hem os visto com o determ inar la ecuación p ara u n a línea recta, pensem os
com o podem os calcu lar una ecuación p ara u n a lín ea d ibujada en m edio d e u n conjunto
d e p u ntos en u n diagram a de dispersión. P a ra esto debem os(m inim izar el erro r entre los
p u ntos estim ados e n la línea y los verdaderos p u n to s observados que se utilizaron p ara
trazarla.
P ara esto debem os introducir un nuevo sím bolo, p a ra sim bolizar los valores
individuales d e los puntos estim ados, esto es, aq u ello s puntos q u e caen en la lín ea de
estim ación. E n co n secuencia escribirem os la ecuación p ara la línea de estim ación com o
U n a form a en que podem os m edir el error d e nu estra línea de estim ación e s sum ando
to d as las diferencias, o errores, individuales entre los puntos observados y los puntos
estim ados.
Parece razonable que mientras más lejos este un punto de la línea e estimación, mas
serio seria el error, preferiríamos tener varios errores pequeños que uno grande. En
efecto, deseamos encontrar una forma de “penalizar” errores absolutos grandes, de tal
forma que podamos evitarlos. Puede lograr esto si cuadramos los errores individuales
antes de sumarlos. Con estos se logran dos objetivos:
Como estamos buscando la línea de estimación que minimiza la suma de los cuadrados
de los errores a esto llamamos método de mínimos cuadrados.
Los estadísticos han derivado dos ecuaciones que podemos utilizar para encontrar la
pendiente y ,1a intersección Y de la línea de regresión del mejor ajuste. La primera
Sfbnnyla;^culalap^¡^CTÍe>;f ; /; '■
o a = intersección en Y
Ahora que sabemos como calcular la linea de regresión, podemos verificar que tanto se
ajusta.
o a = intersección en Y
d e rn o r e stá n d a r d© S
Como se aplicaba en la desviación estándar, mientras más grande sea el error estándar
de estimación, mayor será la dispersión de los puntos alrededor de la línea de regresión.
De manera que inversa, si Se = 0, esperemos que la ecuación de estimación sea un
estimador perfecto de la variable dependiente. En este caso todos lo puntos deben caer
en la línea de regresión y no habría puntos dispersos.
Usaremos el error estándar como una herramienta de igual forma que la desviación
estándar. Esto suponiendo que los puntos observados están distribuidos normalmente
alrededor de la línea de regresión, podemos encontrar un 68% de los puntos en + 1 Se,
95.5% en + 2 Se y 99.7% de los puntos en + 3 Se. Otra cosa que debemos observar es
que el error estándar de la estimación se mide a lo largo del eje Y, y no
perpendicularmente de la línea de regresión.
Esta probabilidad nos indica que tanta confianza tenemos en que la estimación del
intervalo incluya al parámetro de la población. Una probabilidad mas alta significa mas
confianza. • ,
# .lúpai¿e»-Inferior-déíin^dqde'cGni^iuá
Podría pensarse que deberíamos utilizar un alto nivel de confianza, como 99% en todos
los problemas sobre estimaciones, pero en algunos casos altos niveles de confianza
producen intervalos de confianza alto por lo tanto imprecisos.
Debe tenerse un intervalo de confianza que vaya de acuerdo al tema que se este
estimando.
Si, en lugar decimos que estamos seguros en aproximadamente 95.5% de que el dato
real estaré dentro de + 2 errores estándar de la estimación d e. Podríamos calcular los
limites de este intervalo de la siguiente manera:
Debemos poner énfasis en que los intervalos de predicción son solo aproximaciones, de
hecho los estadísticos pueden calcular el error estándar exacto para la predicción Sp,
;usi^o/tá;fbnnülá: ''/’' ‘ 1 \
Análisis de correladó®
Los estadísticos han desarrollado dos medidas para describir la correlación entre dos
variables: el coeficiente de determinación y el coeficiente de correlación.
Coefficiemíe d©deteinmiimacBÓBii
© su propia media
Una correlación perfecta es aquella en que todos los valores de Y caen en la línea de
estimación, por lo tanto el coeficiente de determinación es 1
Un punto que debemos subrayar fuertemente es que r2 mide solo la fuerza de una
relación lineal entre dos variables. i
©ira imterpreiaciósa de r2
Hay una formula que nos ahorra muchos cálculos tediosos y esta es: ,
en la que:
d coeficiente de correlaciona
\
tel coeficiente de correlación es la segunda medida que podemos usar para describir que
también una variable es explicada por la otra. Cuando tratamos con muestras, el
coeficiente de variación de muestra se denomina como r y es la raíz cuadrada del
coeficiente de determinación de muestra:
Intersección Y .
Variable dependiente
Pendiente de la línea
Variable independiente
fy
Y -ít+ b X
* ..-#9 ■ !■
Estadística Raúl Corilla Melchor; Roly Quiñones Inga; Beruska Briceño Angulo |
Lecturas de ¡a semana 14
La distribución Normai
OBJETIVO ESPECÍFICO
• Estimación
• Pruebas de Hipótesis
Ejemplo.
Supóngase que un fabricante de lápices compra a un proveedor borradores
para pegarlos a los lápices. El fabricante tiene que decidir si cada lote de
borradores del proveedor es de calidad aceptable. Para ello necesita que
contenga el 15% o menos de borradores efectuosos.
Desde luego, no puede inspeccionar cada borrador del lote. Debido a esto,
obtiene una muestra de 20 borradores de cada lote y la inspecciona. Decide
que si hay 3 o menos borradores defectuosos en la muestra, aceptará un lote;
si hay más de 3 defectuoso rechazará el lote y lo de volverá al proveedor.
Sin embargo, si acepta un lote cuando éste contiene más del 15% de
borradores defectuosos, ha cometido un error. Por otra parte si rechaza un lote
cuando contiene menos del 15% de borradores defectuosos, también ha
cometido un error.
Un ejemplo es al dejar caer canicas por entre una serie clavos como lo muestra
la figura, al final del experimento con muchas canicas tendremos que las
canicas se han agrupado como se ve en la figura.
Ahora imaginemos que tiramos un dado 500 veces y tomamos el número total
de puntos de cada tirada, entonces decimos que N = 1, y las sumas de cada
tirada las distribuimos como en la figura. Ahora lo hacemos con 4 dados (N = 4),
y luego con 7 y con 10. Al final tendremos las siguientes distribuciones:
Ejemplo: Si estudiamos la altura de 40 alumnos y alumnas de una clase, observamos que vie
nen dadas por la siguiente tabla de frecuencias con su histograma asociado:
A medida que disminuimos la amplitud de los intervalos los saltos en el gráfico de la distribu
ción disminuyen y la curva asociada a la gráfica se aproxima a la función de densidad de la
distribución normal.
Existen distintas funciones de distribución teóricas, basadas en un modelo de comportamiento
observado en numerosas experimentos. Su aplicación a una población en estudio se puede
realizar siempre que esta cumpla las condiciones básicas planteadas en cada una.
Entre las funciones de distribución teóricas para variables aleatorias continuas tenemos la
"Distribución Normal" definida por dos parámetros, su media y su desviación típica -» N((i, a).
Mx>-PfX**)- f '— : ’ 11 1
A
La distribución normal es una curva con forma de campana que se caracteriza por:
• La distribución es simétrica respecto al valor de la media m.
• La variable puede tomar cualquier valor en el intervalo (- » , + ^).
• A medida que nos alejamos del valor de la media de la distribución m, la probabilidad de
los valores de la variable va decreciendo de igual forma a derecha e izquierda.
• La probabilidad de los valores que toma la variable van decreciendo de forma más o
menos rápida según el valor de la desviación típica o\
• Tiene dos puntos de inflexión en x,= |x - ct y x2- n. + <j .
Abel Martin y Rosana Álvarez Garda
• El área total encerrada bajo la curva es 1, lo que nos permite el uso de la función de dis
tribución para calcular las probabilidades de los diferentes valores que toma la variable.
¿Qué ocurre cuando se modifican los valores de la media m y la desviación típica s que
caracterizan una distribución normal?
La media determina la posición de la distribución:
Tipificación de la variable
La distribución normal viene determinada por los parámetros m y s, siendo necesaria una tabla
de probabilidades para cada normal N(jjl, <x), y sólo disponemos de las probabilidades tabu
ladas de la distribución normal N(0, 1). Rara poder calcular las probabilidades de cualquier
distribución normal de parámetros N(p., cr), debemos transformar la variable X que sigue esta
distribución en otra variable que llamamos Z que sigue una distribución normal N(0,1), a este
proceso se le conoce como tipificar la variable.
Para tipificar la variable X —* N(p., cr) lo primero que debemos hacer es conseguir que su media
(p.) sea cero.
El siguiente paso es lograr que el valor de la desviación típica sea 1, para ello debemos con
traer o expandir la campana que representa la distribución normal.
Estadística Raúl Corilla Melchor; Roly Quiñones Inga; Beruska Briceño Angulo
Lectoras de Sa semana 15
Valoración deS estad© nutricional
Autor: Cecilia Martínez Costa .
I
I
OBJETIVO ESPECÍFICO
e n tre e lla s un a c a u sa fre c u e n te e s la h ip ertro fia d e frecuencia, reg istro de in g esta co n p esad a de
ad en o id ea. a lim en to s d u ran te varios d ía s), es p rá c tic a m e n
b) E n ferm ed ad es q u e cu rsa n co n m ald ig estió n m a- te inviable en la c o n su lta p o rq u e req u iere m u ch o
labsorción: fibrosis q u ística, celiaq uía, in to leran liem po y n ecesita in fo rm atizació n . Sin em bargo,
cia a la proteína d e leche d e vaca, parasitosis (giar siem p re se p u ed e h acer un a ap ro x im ació n c o n la
d iasis). sín d ro m e d e in te stin o co rto , etc. h isto ria d ieté tic a preguntando q u é consum e habi
c) E n ferm ed ad es cró n icas q u e c onllevan un au m en tualm ente en las principales com idas del día, c a n
to del g a sto e n erg ético , d e las pérdidas y/o de los tid a d a p ro x im ad a , tip o y tex tu ra del a lim e n to y
req u erim ien to s: e n fe rm e d a d e s in flam ato rias del tom as entre horas, co m p letán d o lo con la frecu en
in testin o , e n ferm ed ad p u lm o n a r cró n ica, c a rd ió cia d iaria o sem an al de los p rin cip ales g ru p o s de
p a ta s , n e fro p atías, cán cer, etc. a lim en to s, a lim en to s p re fe rid o s o rec h a z a d o s y
su p lem en to s v itam ín ico s y m in erales. A l tiem p o
V A L O R A C IÓ N D E L E S T A D O D E q u e nos inform a so b re la ingesta aproxim ada, nos
N U T R IC IÓ N d a un a idea d e la co n d u c ta alim en ta ría y p e rm i
El uso inteligente de la anamnesis, exploracio te esta b lec e r reco m e n d ac io n e s dietéticas.
nes clínica y untrupométricu y ki selección de algu
nas pruebas complementarias constituye la forma más 2 . 1-ApU iración c lín ic a
eficaz de orientar un trastorno nutricional pora poder S iem p re hay q u e in sp e c c io n a r al niño d e s n u d o ,
instaurar prurito medidas terapéuticas y determinar pniquo es lo que m ás in fo rm a so b re la c o n stitu ció n v
aquellos casos que deben ser remitidos al centro de sobre la presencia de signos de organicidad. El so b re
referencia para sit evaluación más completa. p eso y la o b e sid a d so n fác ilm e n te d e le c tab le s. p ero
L a valo ració n del esta d o d e nutrición tiene co m o no a sí la desn u trició n , y a q ue h asta g rad o s a v an zad o s
o b jetivos: los n iñ o s pu ed en a p aren tar “ b u en asp ecto " vestid o s,
- C o n tro lar el crecim iento y estad o d e m a n d ó n del p o rq u e la ú ltim a g ra s a q u e se m o v iliz a e s la d e las
niño s an o identificando las alteraciones p o r ex ce bo las de B ichat. A l d esn u d arlo s y ex p lo ra rlo s p o d re
so o d efecto . m os d istin g u ir lo s n iñ o s co n stitu c io n a lm en te d e lg a
- D is tin g u ir el o rig e n p rim a rio o se c u n d a rio del d os d e a q u e llo s q u e e stá n p e rd ie n d o m asa c o rp o ra l
tra sto rn o n u tricio n al. co n a d e lg a z a m ie n to d e e x tre m id a d e s y g lú teo s, co n
L a s is te m á tic a d e la v a lo ra c ió n in c lu irá lo s piel lax a señal de fu sió n de) p a n íc u lo ad ip o so y m asa
sig u ien tes asp ecto s: m uscular. O tro asp ec to im p o rta n te es v alo rar la p re
i
I sen cia d e d isten sió n ab d o m in al h a lla z g o m uy su g e s
I . A n a m n e sis ! tiv o d e e n fe rm e d a d d ig e stiv a c o m o la celia q u ía . La
- Se obtendrán d atos a cerca de la fam ilia y d m edio ex p lo ra c ió n siste m a tiz a d a p e rm itirá d e te c ta r sig n o s
so cial (tra b a jo d e los p a d re s, p erso n a s q u e c u i carenciales específicos y los sosp ech o so s de en ferm e
dan del niño, n ú m ero de herhnanos. afecciones de dad. En niños m ayores se debe valorar siem pre el esta
los p a d re s y herm an o s). ] d io de d esarro llo p uberal.
- Antecedentes personales: S e d eb en c o n o c er c ir
cu n stan cias o curridas duraíite la gestación, m edi A tiln ip u m e lria
d as al n a c im ie n to y p ro g resió n en el lie.-npo. Se Perm ite valorar el tam año (crecim iento) y la com
p o n d rá esp ecial a ten ció n en los d alo s su eeren tcs p osición co rp o ral del niño. Es m uy útil siem p re que
d e p a to lo g ía o rg án ica ag u d a, cró n ica o de rep e se recojan bien las m ed id as y se in terp reten a d e cu a
tición, y en la sintom atología aco m pañante, sobre dam en te.
to d o a n iv el g astro in testin al.
- Encuesta dietética: E s fundam enta) para o rien tar 3.1. M e d id a s b á s ic a s
el origen d e un trastorno nutricional. Una encues Incluyen: peso, talla, p e rím etro cran eal, p e rím e
ta d e ta lla d a (re c u e rd o de 2 4 h o ras, cu estio n ario tro braquial y p lieg u e tricipital. E s fundam ental obte-
•vB Valoración del estado nutricional 3 15
A£¡*
F VBl VI. [minis nutnuim aks dcri\,idtis dil peso \ di Ij talla C akulu \ il.isilk anon
R elació n 0 índice C álculo
Relación peso/talla1 Curva percentilada / Puntuación z
lIMC lOMS, Cute): Hasta 5 años se clasifica igual que la relación peso/talla. En m ayores de 5 años:
- Normal: P15—P S 5 ( z 2 —I y s s + l )
- Sobrepeso > P85 (puntuación z > + 1), equivalente a un IM C de 25 kg/m ; a los 19 años:
- O besidad > P98 (puntuación z > +2), equivalente a un IM C de 30 kg/m ! a los 19 años.
Sobrepeso y obesidad deben valorarse ju n to al perím etro braquial y pliegue tricipital para distinguir exceso
de grasa o m asa m uscular.
- Subnutrición < P3 (z < -2 )
Cálenle de la puntuación Z: Valor antropom étrico real - M ediana (Percentil 50)
desviación estándar
Desviación estándar: S e obtiene a partir de las tablas originales, o a partir de los percentiles (para valores
superiores a P50 se calcula dividiendo el valor de la distancia P97 - P50 por 1.88; y para los inferiores a P50,
dividiendo la distancia P50 - P3 por 1.88.
E quivalencias: Percentil 97 = + 1.88; Percentil 50 = 0: Percentil 3 = - 1 .88
nerlos con la técnica y el instrum ental adecuados. Una L as estudios U vales es decir, los realizados en los dis
vez reco g id as las m edidas del niño, para in terp retar tintos países, son m uy úliies para co n o cer la situación
las. es n ecesario co n trastarlas con las de su s fam ilia ilc ese entorno determ inado, sin em bargo, su uso ¿>m o
res y con los p atro n es d e referencia, lo qu e se puede patrón com parativo no es deseable pues los dalos jesla-
h a c e r m ed ian te p e rc e n tile s o calc u lan d o p u n tu ac io d íslico s o b ten id o s (p erc e n tile s, e tc.) depen d en de la
nes Z (Tabla I). situación n u tricio n al de la p o b lació n estudiada! Así.
en los países co n gran p re v a le n c ia d e d e sn u trició n ,
3 .2 . P a tro n e s d e c re c im ie n to esta se in frav alo raría y el so b re p e so se sobrcválora-
L os están d ares de crecim ien to representan la d is rá, y en los países con gran núm ero de niños con sobre-
tribución de una m edida antropom étrica en u n a p obla p eso o b esid ad . o cu rrirá lo contrario.
ción y rellejan su estado de nutrición. C onstituyen una En n u estro país en tre otro s, se han d ifu n d id o en
h erram ien ta m uy útil p ara el seg u im ien to lo n g itu d i los últim os añ o s las tablas de O rb eg o zo (2004) y m ás
nal d e niños y p erm iten d e te c tar in d iv id u o s y/o g ru recientem ente, se ha publicado un estudio m uy am plio
p o s d e rie sg o n u tric io n a l. U n p atró n p u e d e c o n s ti (E stu d io esp añ o l 2 008 d e C a rra sc o sa y c o is, 2 008)
tu ir la “n o rm a” a a lcan zar si se elab o ra d e un a p o b la q u e p o n e en e v id e n c ia la g ra v e te n d e n c ia h a c ia la
c ió n n o rm o n u trid a o p u ed e ser solo una “referen cia" o b esid ad de los n iños e sp añ o les. S u in fo rm ació n es
del esta d o d e salu d de un a pob lació n (O M S , 1983). m uy v a lio sa pero al se r un a p o b lació n so b ren u trid a.
316 Protocolos diagnóstico-terapéuticos de Gastroenterologfa. Hepalologfa y Nutrición Pediátrica SEGHNP-AEP •
n o p arece reco m en d ab le utilizadlos para realizar co m v a d a : por el co n trario , un peso y /o talla e sta c io n a rio s
p a ra c io n es. C o m o p a tró n in te rn a c io n a l, se d isp o n e d eb e d e se r m o tiv o d e alarm a a u n q u e el n iñ o aú n se
d e la versión 2 0 0 0 del C D C (C e n te r for D isease C o n en cu en tre en p ercen tiles altos.
trol) d e niñ o s n o rte a m e ric a n o s. E n E uropa se ha e la
b o ra d o un p a tró n m u ltic é n trico p ero solo p ara niñ o s 3 .4 . C á lc u lo d e ín d ic e s
de 0 -5 añ o s (E u ro -G ro w th 2 0 0 0 ). R e c ien te m e n te la C o n las m ed id as d el p eso y talla se p u e d e n c a l
O M S ha d e sarro llad o y p ro p u esto unos nuev o s patro cu lar índices derivados que perm iten clasificar el esta
n es d e referencia in ternacional qu e incluyen las m edi d o de nutrició n , ev alu arlo en el tiem p o y c u a n ü fic a r
d as d e peso, longitud/estatura, p erím etro craneal, perí la resp u esta a las m ed id as tera p é u tic as. E n la T abla 1
m etro d el b ra z o y p lie g u e s tric ip ita l y su b e sc a p u la r se reco g en los ín d ices d e m ay o r a p lic a ció n p ráctica,
y lo s cálcu lo s d e la relació n p e so /talla y d el ín d ice de la fó rm u la de o b ten ció n y su s lím ites.
m a s a c o rp o ral (1M C ). In clu y e n d ato s de n iñ o s d e 0 - - L a re la c ió n p e s o /ta lla . S e v alo ra m ed ia n te per
5 a ñ o s alim en ta d o s c o n la c ta n c ia m aterna, p ro ced en c en tile s o calc u lan d o p u n tu ac io n e s Z . V alo ra la
tes d e d iv e rs o s p a ís e s d e l m u n d o . L o s d a to s se p re relación del p eso p ara la talla in d ep en d ien tem en
s e n ta n e n ta b la s o e n g rá fic o s ta n to d e p e rc e n tile s te d e la e d ad y es m uy ú til p a ra d e te c ta r p rec o z
c o m o d e p u n tu a c io n e s Z . P a ra el resto d e e d a d e s (5 - m en te la m aln u trició n a g u d a (Fig. 1).
19 años) h a c re a d o u n as n u ev as tablas to m an d o c o m o - ín d ic e d e m a s a c o r p o r a l (IM C ). In ic ia lm e n le
b a se lo s d a to s d e N C H S d e 1979 e n las q u e la o b e si se usó p a ra c la sific ar la so b re n u tric ió n y o b e si
d ad era m u y p o c o p re v a le n te y e n las qu e se c o n o ce dad en escolares y ad o lescen tes y a ctu alm en te ya
q u e se h a a lc a n z a d o la talla m áx im a p o r el fe n ó m e e stá n e s ta b le c id o s lo s lím ite s d e s u b n u tric ió n
n o d e la a c e le ra c ió n s e c u la r d el c re c im ie n to (d e b i (O M S , 2 0 0 6 ). E s m u y fácil d e c a lc u la r (k g /m : )
d o a las m e jo ra s n u tric io n a le s y del m ed io a m b ie n p ero c o m o varía co n la ed ad , d e b e in te rp re tarse
te). In clu y en p eso , talla e 1M C. A m b o s están a c ce si m ed ian te percen tiles o c alc u lan d o la p u n tu ació n
b le s en http://wH w.who.int/childgroulh/en/ y d is Z. Es im portante tener en cu en ta q u e c u an d o eslá
p o n en dé so ftw a re p a ra su c á lc u lo au to m ático lo q u e e lev ad o in d ica ‘ so b re p e so " q u e p u ed e ser d e b i
lo s h ace m u y fác ile s d e ap licar. d o a e x ceso de m asa g rasa (o b esid ad ) o a e x ceso
de m asa m ag ra (co n stitu ció n atlética). P ara d ife
3 .3 . V e lo c id a d d e c re c im ie n to y p e rfil d e ren ciarlo resulta m uy útil el p e rím etro del b razo
d e s a rro llo y el p lie g u e tric ip ita l, c o m o se e x p lic a e n las
Es muy importante valorar los cambios de una T ablas 1 y II.
medida a b lurgu del tiempo ya que una medida ais - O tro s. D u ran te m ucho tiem po se han usado p ara
lada tiene poco valor. Lus mediciones seriadas nos c la s ific a r el e s ta d o d e n u tric ió n lo s ín d ic e s d e
van a permitir: a) calcular su velocidad de crecimien W aterlow (porcentaje d el peso e stán d ar y p orcen
to, sobre todo de la talla y b) construir un perfil de taje d e talla p a ra la e d a d ) y lo s n u tric io n a le s de
desarrollo del niño. S h u k la y M c L a re n , p e ro a c tu a lm e n te y a n o se
L a s is te m á tic a d e re lle n a r lo s p e rc e n tile s e n la reco m ien d an p o r la d ific u lta d p a ra su cálcu lo y,
cartilla d e sa lu d con las m ed id as del peso, talla y p e rí so b re todo, d e in terp retació n .
m e tro c ra n e a l y h a c e r el s e g u im ie n to lo n g itu d in a l
d e c a d a n iñ o p e rm itirá e v id e n c ia r c u á l e s su can a! 4. E x p lo ra c io n e s c o m p le m e n ta ria s
de c recim ien to y d e te c tar c u á n d o d esv ía su p crcentil En la m ayor p arle d e cen tro s d e a ten ció n prim aria
habitual. E sto ap o rta una inform ación e x trao rd in aria se puede acceder a diversas exploraciones com plem en
m en te im p o rta n te p a ra in te rp re ta r el c re c im ie n to y tarias para valo rar la n u trición y el crec im ie n to , bien
esta d o de n u tric ió n d e un n iñ o . A sí co m p ro b a re m o s realizadas en el m ism o, o rem itidas a o tro s c o n certa
q u e hay n iños c o n stitu cio n alm en te p eq u eñ o s (en p er dos. C ad a p rofesional d eb e c o n o cer los m ecan ism o s
c e n tile s b a jo s ), q u e no d e b e n c a u sa r p re o c u p a c ió n habituales para su solicitud. U na form a esp ecialm en te
siem p re q u e la v elo cid ad de c recim ien to esté co n ser b en eficio sa es d isp o n e r d e c o n tacto e stre c h o co n los
■ Valoración del estado nutricional 3 17
Ai?
14- p95
12- ^ p50
11)- v-O ^ p?
£
! •-
6-
4-
2~
i i i i ■
■ i i i i
55 60 65 70 75 80 85 90
Longitud (ein)
bioeléctrica (B IA ). L a co n d u ctiv id ad eléctrica c orpo habrá qu e p en sar en la enferm edad inflam atoria y so li
ral total o T O B E C es un m étodo preciso e inocuo, pero c itar en p rim e r lu g ar reactan tes de fase aguda. O b v ia
a c tu alm en te su a p lic a b ilid a d e stá lim itad a p o r el cos m ente, si se d e te c ta a lg u n o d e esto s p ro ce so s d eb erá
to. L a in te rac ta n cia p o r in fra rro jo s, m éto d o m uy sen rem itirse el p aciente al cen tro de referencia p ara c o m
c illo y eco n ó m ic o , p recisa m a y o r valid ació n . p letar el d iag n ó stic o e in ic iar la terap éu tica.
L a d e n sito m e tría es u n a ex p lo ra c ió n q u e p erm i
te cu an tificar el c o n ten id o m in eral óseo, p o r lo qu e es B IB L IO G R A F ÍA
d e gran interés en niños con caren cias d ietéticas inten 1. Carrascosa A. Fernández JM. Fernández C, et ai. Estu
sas (trastornos d e la co n d u cta alim entaria) o co n enfer dio transversal español de crecimienlo 2008. Parte II:
m edades cró n icas (fibrósis qiiística; enferm edad infla valores de talla, peso e índice de masa corporal desde
el nacimiento a la talla adulta. An Pediatr (Bare) 2008:
m ato ria in testin al).
68: 552-69.
2. CDC. National C enter for Health Statistics 2000.
4.3. Radiografía del carpo
http://www.cdcVgrowthcharts/zscorc.
Es de p rim era im p o rta n c ia para v alo rar la m ad u
3. Cole TJ, el al. Establishing standard definition for child
rac ió n e sq u e lé tic a y re la c io n a rla co n la e d a d c ro n o overweight and obesity worldwide: lnternalional sur
ló g ica del n iñ o . El m éto d o m ás u tilizad o p a ra su lec vey. BMJ 2000; 320: 1240-3.
tura es la c om paración con el atlas de G reulich y Pyle. 4. Dibley MJ, Staehling N. Nieburg P, Trowbridge FL.
E s m u y ú til p a ra v a lo ra r n iñ o s d e ta m a ñ o c o rp o ra l Interpretation of z-scure anthropometric indicators deri
peq u eñ o q u e n o rep re se n ta n m as q u e v arian tes de la ved from the international gmwlb reference. Am J Clin
n o rm a lid a d : a sí p o r e je m p lo , en el re tra so c o n stitu Nutr 1987:46:749-62.
cional del crecí m iento, la m ad u ració n ó sea está retra 5. Euro-Growth. Haschke. Van't Hof MA, eds. J Pediatr
sa d a y c o rre s p o n d e a la e d a d -ta lla (e d a d a la q u e la Gastroenterol Nutr 2000:31 (.Suppl I).
talla del n iñ o e staría en el p erc e n til 50), sin em b arg o , 6. Garza C, De Onís M. An overview o f growth standards
en la talla b a ja fam iliar, v an aco rd e s la e d a d c ro n o ló and indicators and their interpretation. In: B aker S,
Baker RD, Davis AM, eds. Pediatric nutrition support.
g ic a y la m ad u ració n esq u elé tic a .
Boston: Jones and Bartlett Publishers; 2007. p. 1-13.
7. Hendricks K. Anthropometric evaluation. In: En: Baker
4.4. Exploraciones de enfermedades específicas S, Baker RD. Davis AM. eds. Pediatric nutrition sup
D u ra n te el s e g u im ie n to d el n iñ o si se so sp ec h a port. Boston: Jones and Bartlett Publishers; 2007. p.
q u e el tra sto rn o n u tricio n al es secu n d a rio se o rien ta 57-64.
rá el s c re e n in g d e las e n fe rm e d a d e s q u e s u g ie ra la 8. Martinez Costa C. Martínez Rodríguez L. Valoración
e x p lo ra c ió n , la e d ad y el d e te rio ro de las c u rv a s de del esladu nutricional. En: Comité de Nutrición de la
p eso y talla. S iem p re q u e se a so cie d iarrea cró n ica se AEP ed. Manual Práctico de Nutrición en Pediatría. I*
debe in v estig a r la p rese n c ia d e parásito s en las h eces ed. Madrid: Ergon; 2007. p. 31-9.
(Giurdici lambliít. Crxptosporidmm sp.)\ en niños con 9. Sobradillo B. Agirre A. Aresti U, et al. Curvas y tablas
de crecimiento I Estudio longitudinal y transversal). Ins
e n fe rm e d a d e s resp ira to ria s d e rep etició n , d e sm e d ro
tituto de Investigación sobre Crecimiento y Desarro
y heces m alo lie n te s se re a liz a rá tesi del su d o r p ara el llo. Bilbao: Fundación Faustino O itegozo; 2004.
despistaje d e la ftbrosis qiiística; en aquellos con deten
10. W HO M ulticentre Growth Reference Study Group.
ción de la c u rv a p o n d o estatu ral y d isten sió n ab d o m i W HO Child Growth Standard based on length/height,
nal se re a liz a rá n a n tic u e rp o s a n tie n d o m is io y an ti- weight, and age. Acla Paediatrica 2(X)6; Suppl 45(): 76-
tra n sg lu ta m in a sa tisu lar p a ra d e te c ta r la e n ferm ed ad 85. Estándares disponibles en http://w w w .w ho.int/
celíaca; en esco la re s y ad o le sc e n te s con d esn u trició n childgrowth/en/.
Estadística Raúl Corilla Melchor; Roly Quiñones Inga; Beruska Briceño Angulo |
Lecturas de !a semana 16
Probabilidades
OBJETIVO ESPECÍFICO
PROBABILIDAD
Ejemplo: el resultado probable de una rifa; cuál será el equipo ganador de fútbol en el
próximo campeonato; qué cara quedará arriba al lanzar un dado; si llueve o no llueve
mañana; el tiempo que tardará un árbol en alcanzar 3m de altura etc.
Ejemplos:
1.- Experimento: Se lanza una moneda y se observa la cara superior (es decir, lo que
“cae”).
Í2 = {s, a }
Ejemplo
Experimento: Se lanza un dado común y se observa la cara superior.
= {1, 2, 3, 4, 5, 6 }
Evento A: el número que “cae” es par. A = {2, 4, 6 }
Evento B: el número que “cae” es primo. B = {1, 2, 3, 5 }
Ejemplo: '
Experimento: Se lanza una moneda tres veces.
Evento compuesto: D: Que salgan dos soles; D = { (S,S,S), (S,S,A), (S,A,S), (A ,S,S)},
Ya que los eventos aleatprios son subconjuntos del conjunto Q, espacio muestral, se
pueden aplicar las conocidas operaciones con conjuntos, a los eventos, como son la
unión, la intersección y la diferencia de eventos.
Q ---------- X \
i
Dos eventos A y B son mutuamente exclusivos, cuando no pueden ocurrir
simultáneamente, es decir, A n B = 0, lo que ocurre en la fig. 1.
¡
Ejemplo: Experimento: Se lanza un dado.
Espacio muestral = total de caras en que puede caer el dado, o sea seis formas de
interés:
£2 = {1,2,3,4,5,6 }, N(Q) = 6
Sean A, B, C los eventos: A: Que caiga un número impar = { 1 , 3 , 5 } , N(A) = 3
B: Que caiga un número mayor de 2 y menor que 5 = {3, 4}, N(B) = 2
C: Que caiga un número par = { 2 , 4 , 6 } , N(C) = 3
a).- Unión:
Probabilidad Clásica
N (0)
Ejemplo:
Experimento: Se lanza una moneda tres veces.
4
Evento D: Que salgan dos soles; P(D) =
8
g
Evento F: Que salgan entre 0 y 3 soles; P(F) = - = 1
8
Cómo puedes observar, una función de probabilidad tiene las siguientes verdades
básicas o axiomas.
Definición
Ejemplo
En cierta ciudad, las mujeres representan el 50% de la población y los hombres el otro
50%. Se sabe que el 20% de las mujeres y el 5% de hombres están sin trabajo. Un
economista estudia la situación de empleo, elige al azar una persona desempleada. Si
la población total es de 8000 personas, ¿Cuál es la probabilidad de que la persona
escogida sea?:
48
b).- Intersección:
c).- Diferencia:
A - B = ={1,3, 5 } - { 3 , 4 } = { 1, 5} , N(A- B) = 2
d).- Complemento:
Ac = {2, 4, 6} = C N( Ac) = N(C) = 3
Ejemplo:
La regularidad estadística en el experimento del lanzamiento de monedas, indica que
las frecuencias relativas del evento: que salga sol {s }, se tiende a estabilizar
aproximadamente en 0.5= 1/2. ¡
Ejemplo:
Lecturas de la Remana 17
Prueba de Hipótesis
Autor: Samuel Signini Prado
I
I
OBJETIVO ESPECÍFICO
Identificar los estadígrafos de la prueba de hipótesis y su
procedimiento en la investigación jurídica.
6.1 INTRODUCCIÓN
Los métodos estudiados en el capítulo anterior usan la información proporcionada por los
estadísticos niuestrales para estimar con cierta probabilidad el valor de un parámetro
poblacional. En éste capítulo se introducirá lá prueba de hipótesis que es un enfoque diferente.
En éste caso, se supone a priori el valor del parámetro y sobre la base de la información
obtenida en una muestra se somete a prueba la suposición, para luego tomar con cierta
probabilidad, la decisión de rechazar o no rechazar la hipótesis. En éste punto es importante
señalar que la expresión “no rechazar” pudiera ser sustituida por “aceptar”, sin embargo antes
de hacerlo es necesario atender cuidadosamente algunas explicaciones que se darán más
adelante. La prueba de hipótesis también conocida como docimasia o contrastación de
hipótesis es uno de los métodos estadísticos más usados en las ciencias naturales por ser un
procedimiento que le proporciona al investigador un criterio objetivo para tomar decisiones
con base a un número limitado de observaciones. Frecuentemente el biólogo tiene que decidir:
a) al comparar magnitudes de propiedades físicas, químicas o biológicas en dos o más
condiciones o categorías, como es el caso de confrontar el valor medio de la presión arterial en
personas pertenecientes a dos grupos etarios; b) al valorar los efectos de diferentes niveles de
algún factor ambiental como la temperatura, la humedad, el contenido de oxígeno sobre algún
proceso, característica o propiedad de un organismo; y c) al relacionar dos o más variables,
como la intensidad lumínica y la tasa fotosintética. En éste capítulo y en los siguientes se
trataran varios procedimientos para probar hipótesis que dan respuesta a este tipo de
problemas o a otros similares,
i
Antes de estudiar las distintas etapas y casos de las que consta el procedimiento para la prueba
de hipótesis, consideraremos un ejemplo que servirá para mostrar los fundamentos del proceso
de docimasia y la toma de decisiones.
E jem plo 6.1. Con el propósito de determinar el efecto de una nueva dieta sobre el desarrollo
de ratones de laboratorio un investigador necesita formar varios grupos de ratones recién
nacidos todos con un mismo peso. De manera que conforma varios lotes de 36 ratones con un
peso aproximado a los 30 g. Para verificar si los grupos son homogéneos en cuanto al peso,
vuelve a pesar cuidadosamente los 36 ratones de cada grupo y le calcula el valor promedio y la
desviación estándar. El investigador sabe que al ser el peso una variable aleatoria y por estar
trabajando con una muestra es difícil que cada grupo tenga un peso promedio exactamente
igual a 30 g, alinque si bastante aproximado a éste valor. Sin embargo el investigador se
encuentra ante una disyuntiva: a) sí el valor promedio de peso para cada grupo se considera
como una simple desviación fortuita de los 30 g dada la variabilidad característica de las
muestras aleatorias, no hay necesidad de reorganizar el grupo, y b) si el valor medido esta
verdaderamente desviado del valor esperado de 30 g es necesario reorganizar el grupo
sustituyendo los ratones causantes de la desviación.
A fin de tener un criterio objetivo que le ayude a tomar la mejor decisión, el investigador
establece como prem isa que el peso promedio p de la población de donde provienen los pesos
de los ratones es de 30 g. Si es cierto que p = 30 es de esperar que el valor promedio del grupo
o muestra x sea muy cercano a dicho valor y su probabilidad de ocurrencia sea alta. Si esto
sucede se acepta la hipótesis y se considera que la desviación del peso promedio de la muestra
con respecto a la m edia esperada, x - p, es producto de la naturaleza aleatoria de la variable
peso, siendo innecesario reorganizar el grupo de ratones. Pero aún siendo cierto que p = 30,
es posible qüe los 36 ratones-tengan un peso promedio alejado del peso esperado de 30 g, lo
cual es improbable, En éste caso, el investigador puede aceptar que p = 30 y considerar que
ocurrió un hecho poco probable o alternativamente decidir que en lugar de haber sucedido
algo poco probable considerar que el valor de la media poblacional es menor a 30 (p < 30).
Ilustremos la situación anterior en forma real y supongamos que el investigador encontró que
uno de los grupos dio como resultado un promedio de 29.3 g con una desviación de 2 g. De
acuerdo a lo dicho anteriormente, para poder tomar la decisión de reorganizar o no el grupo de
ratones, se debe proceder á determinar si 29.3 ocurre con una probabilidad alta o baja teniendo
como hipótesis que p = 30. Como el peso promedio observado es menor a 30 se debe proceder
a hallar la P ( X < 3 0 ) . Para tal fin tenemos que saber como es la distribución de la media
muestral. Aunque desconocemos la distribución de la variable peso promedio, como el tamaño
de la muestra es grande (n = 36) se puede afirmar, de acuerdo al Teorema del Límite Central,
que dicha variable sé distribuye normalmente con media igual a 30 y desviación igual a
S j = 2 / -v/36 = 0.33. Por lo tanto la probabilidad buscada será:
Pero veamos que habría ocurrido si el valor de la media muestral hubiese sido más próximo a
30, por ejemplo 29.9. En éste caso la probabilidad de que ocurra un valor igual o menor a 29.9
sería:
El valor de Z a la izquierda del cuái se encuentra el 0.05% del área de la distribución d e .
probabilidades de la media muestral es -1.64, por lo tanto, si se despeja x de la expresión
anterior se tiene que,
x - M x + z (0 05) [ s j J ñ ) = 3 0 + ( - 1 .64)(2 / V36) = 30 - 0 .5 4 12 = 29,46
En el procedimiento usado para resolver el problema del Ejemplo 6.1 se pueden identificar
varias etapas fundamentales, las cuales se pueden reordenar e identificar en la forma siguiente:
1. Formulación de hipótesis
2. Especificación de un valor de probabilidad crítico o nivel de significación.
3. Elección de un estadístico de la muestra y de su distribución para someter a prueba las
hipótesis.
4. Establecimiento de una zona de rechazo para Ho.
5. Cómputos necesarios. ¡
6. Decisión. i
En lo que sigue nos permitiremos dos concesiones: supondremos que- todas las variables
usadas siguen una distribución normal y la mayoría de las veces usaremos la media
poblacional fi como ejemplo del parámetro a docimar.
F orm ulación de hipótesis. Por lo general toda investigación en el campo de las ciencias
naturales se inicia a partir de una hipótesis la cual es una explicación tentativa que se da a un
hecho observado. La misma puede surgir a partir de una teoría general que explica cierta
realidad a la cual pertenece el fenómeno observado, o por la experiencia propia o de otros
investigadores, o por simple intuición. Ahora bien, en la formulación de cualquier hipótesis
está implícita una hipótesis alternativa. Por ejemplo, se puede plantear como hipótesis de
investigación que el ejercicio constante disminuye el nivel de colesterol en el plasm a
sanguíneo, pero asociada a esta hipótesis existe otra premisa alterna que se opone, en éste
caso la alternativa sería que el ejercicio constante no disminuye el nivel de colesterol en el
2 9 .9 -3 0
P ( X < 29.9) = P (Z < = P ( Z < - 0.3) = 0.382
2/V36
z - x~Mx
SJ 4 ñ
plasma sanguíneo. Estas hipótesis de investigación para poderse someter a prueba deben
concretarse en términos cuantitativos, transformándose en hipótesis estadísticas. Para el
ejemplo anterior, se puede proponer como hipótesis estadística que bajo cierto programa de
ejercicio la tasa prom edio de disminución de la concentración del colesterol será mayor a 30
unidades. Consecuentemente existe una hipótesis estadística alternativa que en este caso
plantea que con el ejercicio la tasa promedio de disminución del colesterol será igual a 30
unidades. De manera que las hipótesis de investigación se derivan de las teorías que se están
probando y las hipótesis estadísticas hacen factible su contrastación.
En forma general las hipótesis estadísticas son afirmaciones que involucran una propiedad de
la distribución probabilística de la variable aleatoria que se está estudiando, propiedades como
son la media (n), la varianza ( a 2), un valor de proporción (rc) o la forma de la distribución. De
modo que el primer paso en un proceso de decisión es formular las hipótesis estadística, las
cuales reciben el nombre de hipótesis nula (H0} e hipótesis alternativa (H |). La hipótesis nula
se dice que es una hipótesis simple, porque es una afirmación de igualdad con un valor
especifico, mientras que las hipótesis alternativa se dicen que es compuesta porque puede
asumir diferentes valores.
Si se representa un parámetro poblacional por letra griega 0 y con 0O un valor cualquiera del
parámetro, la forma genérica de la hipótesis nula sería una igualdad entre el parámetro y un
valor específico del mismo,
Ho: 0 = 0O
Por su parte la hipótesis alternativa se puede representar con una de las tres posibilidades
siguientes:
0>0O
Hf. 0 < 0O
0 ^ 0O
La expresión 0 > 0Ose interpreta como que el parámetro 0 puede asumir cualquier valor mayor
a 0Oy se dice que la prueba de hipótesis es de una cola a la derecha. Por su parte 0 < 0O indica
que el parámetro 0 puede ser cualquier valor menor a 0O y la prueba de hipótesis se llama de
una cola a la izquierda. Finalmente 0 i- 0O representa la posibilidad que el parámetro 0 asuma
cualquier valor diferente (mayor o menor) al valor 0oy la prueba de hipótesis se denomina de
dos colas. Más adelante, cuando se trate lo referente al establecimiento de la zona de decisión,
se aclarará la razón de esta nomenclatura.
Para el caso del ejemplo del programa de ejercicios y la disminución del nivel de colesterol en
la sangre, las hipótesis se pueden plantear de la manera siguiente:
Hipótesis nula H0 : |i = 30
Hipótesis alternativa : Hf. p > 30
Especificación del nivel de significación. Cualquier decisión dentro del proceso de prueba de
hipótesis lleva asociado cierto riesgo de fallar. Es decir que siempre existe la posibilidad de
tomar una decisión equivocada, sólo que en este tipo de prueba se tiene la ventaja de conocer
de antemano la probabilidad de equivocarse. En la Tabla 6.1 se muestran las posibles
consecuencias de tom ar una decisión con relación a la hipótesis nula.
DECISION
CONDICION REAL Rechazar Ho No Rechazar Ho
Ho cierta W flÊ Ê Ê ^ Acierto
Ho falsa
A c ie r i0
Ejem plo‘6.2. Un biólogo sospecha que debido a la escasez de alimento que hay en un río, la
talla promedio de las truchas adultas que viven en el mismo no alcanza el tamaño mínimo de
pesca permitido que es de 25 cm. Si se comprueba la sospecha del investigador se prohibirá la
pesca de truchas en ese río. de lo contrario no se tomará ninguna medida.
Puesto que el planteamiento que quiere probar el biólogo es que la talla promedio de las
truchas es menor al valor mínimo permitido, las hipótesis a probar deben ser las siguientes:
H0 : |a = 25
H ,: fj. < 25
Ejemplo 6.3. Se quiere saber si una nueva droga es eficaz como tratamiento del SIDA. Para
lo cual a un grupo de paciente se le aplica un tratamiento con la droga.
La eficacia de la droga implica que la mayoría de los pacientes, es decir que más de la mitad
de los pacientes a los cuales se les aplicó el tratamiento con la droga, respondieron
positivamente a la enfermedad. Si se considera que n es la proporción de la población de
pacientes para los cuales la droga es eficaz, las hipótesis que se deben someter a prueba serán j
las siguientes:
Hu : n = 0.5 i
H,: n > 0.5 1
El especialista sospecha que el contenido de proteína total no es el mismo en los dos grupos de
pacientes, lo cual implica que el valor de esta variable para el grupo problema puede ser
mayor, menor o igual al grupo de referencia, por lo tanto las hipótesis a probar deben ser las
siguientes:
H0 : (J. = 7.0 Hr. p. ^ 7.0
Pero también una minoría de observaciones '
puede no caer en la zona de aceptación a pesar
que Ho sea cierta, provocando que se tome una
decisión errada, aunque se tiene a favor que
se conoce la magnitud de ese error. Por
ejemplo cuando se define una zona de
aceptación donde se espera caigan el 95% de
las observaciones si Ho es cierta, también se
está determinando que en un 5% de los casos
se puede cometer una equivocación al
rechazar Ho cuando de hecho es cierta. Es
decir que la probabilidad de cometer una falla
es igual a 0.05. Este tipo de error se llama
b)
Error Tipo 1 (Tabla 6.1) y su probabilidad se
identifica con la letra a (Figura 6.6a).
También se puede cometer un error si se
acepta H 0 cuando de hecho es falsa. Esto
sucede cuando una observación cae dentro de
la zona de aceptación de Ho, siendo otra
hipótesis H[ la verdadera (Figura 6.6b). En
este caso la observación muestra! 0 queda
dentro de la zona de aceptación de Ho, pero
siendo verdadera H |. Este tipo de error se Figura 6.6
conoce como Error Tipo 11 (Tabla 6.1) y su
probabilidad se identifica con la letra
p (Figura 6.6b)
Como se puede notar tanto a como p son probabilidades condicionadas. Los valores de ambos
errores no pueden calcularse en un sentido absoluto. Para calcular a es necesario asumir que
Ho es cierta y para calcular p se asume que H| es cierta.
En cualquier prueba de hipótesis lo más conveniente será que ambos tipos de errores sean lo
más pequeño posible, pero esto no es fácil de lograr, porque al intentar disminuir uno el otro
aumenta proporcionalmente (Figura 6.7).
\ Aumenta a / : \ Aumenta 0 /
\ ^ Disminuye 0 / jé \ Disminuye a ^ /
ík . ^PílÍlÍh
Figura 6.7
Afortunadamente al incrementar el tamaño n de la muestra es posible disminuir la
probabilidad de com eter el Error Tipo 11, manteniendo constante la probabilidad de cometer el
Error Tipo 1. En la Figura 6.8 se muestra como al aumentar el tamaño de la muestra se reduce
la varianza de las distribuciones e igualmente el valor de P, mientras que el valor de a se
mantiene en 0.05.
De acuerdo a lo visto hasta ahora, sería lógico concluir que es necesario conocer la magnitud
con la cual ambos errores operan en una prueba de hipótesis. Lamentablemente, esto sólo es
posible para el Error Tipo 1. Debido a la naturaleza del procedimiento, al formular una
hipótesis nula no sólo se supone el valor de un parámetro, sino que se presume la ubicación de
la distribución de probabilidades del estadístico de prueba. La consecuencia de esto es que
puede fijarse un valor de a y establecerse la respectiva región de rechazo de Ho. Esto no es
posible para el caso del Error Tipo II. Aun cuando se rehace Ho se desconoce el valor de la
hipótesis alternativa y por lo tanto la ubicación de la distribución probabilística del estadístico
de prueba, no pudiéndose fijar el valor de p.
Por tales razones en toda prueba de hipótesis una vez que se han formulado la hipótesis se fija
el valor de a con el cual se cuantiflca el riesgo que se esta dispuesto a correr al rechazar una
hipótesis nula cierta. El valor de a se conoce como nivel de significación, término con el cual
se quiere destacar que cualquier estadístico cuya probabilidad de ocurrencia sea igual o menor
al valor de a , mantiene una diferencia tan grande con el valor del parámetro supuesto que se
puede concluir que no pertenece a la distribución con la cual se está trabajando y por lo tanto
asegurar que H() es falsa y otra hipótesis es la verdadera.
Comúnmente los niveles de significación a usados son 0.05, 0.01 y 0.001. El grado de
importancia de la significación se califica de distintas formas dependiendo de donde se ubique
el valor de probabilidad del estadístico.
• Si 0.05 > P( 9 ) > 0.01 se dice que la prueba de hipótesis es significativa (*).
• Si 0.01 > P (0 ) > 0.001 se dice que la prueba de hipótesis es muy significativa (**).
• Si 0.001 > P ( é ) se dice que la prueba de hipótesis es altamente significativa (***).
También dentro de los textos científicos se suele presentar el resultado de una prueba
estadística indicando el nivel de significación a o el rango de probabilidad dentro del cual se
ubica el estadístico de prueba, Ejemplo: "... la densidad de insectos no mostró relación con
los valores acumulados de precipitación (rs = 0.14; p < 0.05)... ".
Selección del estadístico de pru eb a. Para poder someter a prueba las hipótesis formuladas, es
necesario usar alguna propiedad o estadístico de las muestras que esté relacionado con el
parámetro objeto de la inferencia. Estas propiedades muéstrales reciben el nombre genérico de
estadísticos de prueba. En la Tabla 6.3 se muestran algunos parámetros y sus estadísticos de
prueba correspondiente.
Varianza ( a 2) s2
Proporción (n) p
Sin embargo, por razopes prácticas, muchas veces los estadísticos de prueba no se usan en su
forma original sino con otras formas equivalentes o derivadas (Tabla 6.4)
Tabla 6.4. Estadísticos de prueba para algunos parámetros poblacionales.
z = (x-ft)/((r/y[ñ)
M edia (|a) X
z = (x-/l)/(s/y[ñ)
t = {x-¿l)/(s/y[ñ)
Z = (x2 - x , ) - ( j U 2 - f i x) l +
/ \ n2 «1
T = (x2 - x l) - { ^ 2 -Mi) } — + —
/ \«2 n \
La utilidad de estos y otros estadísticos de prueba se verá cuando se traten particularmente las
pruebas de hipótesis para algunos parámetros.
Establecer una zona de aceptación para Ho. Una vez conocido el estadístico de prueba a
utilizar, así como su distribución, es necesario definir en la distribución del estadístico
muestral una zona de aceptación y una zona de rechazo de la hipótesis nula. La zona de
aceptación de Ho está formada por todos los valores del estadístico de prueba con una
probabilidad de ocurrencia mayor al establecido en el nivel de significación.. Por el contrario
la zona de rechazo está formada por todos los valores del estadístico de prueba cuya
probabilidad de ocurrencia es igual o menor al valor establecido en el nivel de significación.
La zona de rechazo a diferencia de la zona de aceptación y dependiendo de la hipótesis
alternativa planteada puede estar orientada en diferentes direcciones a lo largo del eje de
valores de la variable aleatoria.
Zona de rechazo a la derecha: esta formada por todos los valores del estadístico de prueba
0 ubicados a la derecha del parámetro 0 cuya probabilidad de ocurrencia es menor a la del
nivel de significación. Esta zona se especifica cuando Hi: 0 > 0o y la docimasia se llama
prueba de una cola a la derecha (Figura 6.9A)