Tarea Estadistica

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 56

Variable estadística

Una variable es una característica que al ser medida en diferentes individuos es susceptible
de adoptar diferentes valores.
Existen diferentes tipos de variables:

Según la medición
Variables cualitativas
Son las variables que expresan distintas cualidades, características o modalidad. Cada
modalidad que se presenta se denomina atributo o categoría y la medición consiste en una
clasificación de dichos atributos. Las variables cualitativas pueden ser dicotómicas cuando
sólo pueden tomar dos valores posibles como sí y no, hombre y mujer o son politómicas
cuando pueden adquirir tres o más valores. Dentro de ellas podemos distinguir:
• Variable cualitativa ordinal o variable cuasicuantitativa: La variable puede
tomar distintos valores ordenados siguiendo una escala establecida, aunque no es
necesario que el intervalo entre mediciones sea uniforme, por ejemplo: leve,
moderado, grave.
• Variable cualitativa nominal: En esta variable los valores no pueden ser
sometidos a un criterio de orden como por ejemplo los colores o el lugar de
residencia.
Variables cuantitativas
Son las variables que se expresan mediante cantidades numéricas. Las variables
cuantitativas además pueden ser:
• Variable discreta: Es la variable que presenta separaciones o interrupciones en la
escala de valores que puede tomar. Estas separaciones o interrupciones indican la
ausencia de valores entre los distintos valores específicos que la variable pueda
asumir. Ejemplo: El número de hijos (1, 2, 3, 4, 5).
• Variable continua: Es la variable que puede adquirir cualquier valor dentro de un
intervalo especificado de valores. Por ejemplo la masa (2,3 kg, 2,4 kg, 2,5 kg, ...) o
la altura (1,64 m, 1,65 m, 1,66 m, ...), que solamente está limitado por la precisión
del aparato medidor, en teoría permiten que siempre exista un valor entre dos
variables.

Según la influencia
Según la influencia que asignemos a unas variables sobre otras, podrán ser:
Variables independientes
Son las que el investigador escoge para establecer agrupaciones en el estudio, clasificando
intrínsecamente a los casos del mismo. Un tipo especial son las variables de control, que
modifican al resto de las variables independientes y que de no tenerse en cuenta
adecuadamente pueden alterar los resultados por medio de un sesgo.
Es aquella característica o propiedad que se supone ser la causa del fenómeno estudiado.
En investigación experimental se llama así a la variable que el investigador manipula.
Variables dependientes
Son las variables de respuesta que se observan en el estudio y que podrían estar
influenciadas por los valores de las variables independientes.
Hayman (1974 : 69) la define como propiedad o característica que se trata de cambiar
mediante la manipulación de la variable independiente.
La variable dependiente es el factor que es observado y medido para determinar el efecto
de la variable independiente.
Otras
Variable interviniente
Son aquellas características o propiedades que de una manera u otra afectan el resultado
que se espera y están vinculadas con las variables independientes y dependientes.
Variable moderadora
Según Tuckman: representan un tipo especial de variable independiente, que es secundaria,
y se selecciona con la finalidad de determinar si afecta la relación entre la variable
independiente primaria y las variables dependientes.

ESCALAS DE MEDICION
“Si hubiese una escala para medir la amistad, nos dariamos cuenta que amigos hay muy
pocos ”Le Thierre
C
omo sabemos las características personales como estatura , edad, gènero, habilidades,
tamaños de un determinado grupo se los conoce como variables, sabemos que existe una
gama muy diferenciada de variables de las cuales se pude extrapolar diferentes escalas para
ser medibles, , la aplicaciòn de la bioestadistica para medir característica y valores tanto
cualitativos como cuantitativos a través de la utilizaciòn de escalas que permitan medir de
mejor manera un resultado obtenido.
MEDICION DE VARIABLES
Antes que una variable sea tratada estadisticamente debe ser observada/medida para
un conjunto de unidades observacionales, las unidades observacionales son aquellos
entidades que se observan, cuando las observaciones se cuantifican ( es decir se
expresan numèricamente) se dice que los numeros son medibles, una mediciòn es una
observaciòn que se expresa físicamente ò en forma numèrica, es decir cuando se le
otorga un valor determinado según su magnitud.
De lo anteriormente mencionado podemos deducir que existen diferentes formas de medir
variables, algunas se las puede medir directamente por ejemplo la temperatura, la tensiòn
arterial, la inteligencia, y otros en forma indirecta, como el grado de aprovechamiento de
una determinada asignatura, la eficiencia, eficacia, el amor , ser romàntico, ser buen ò mal
estudiante, etc.
Algunos de esos mètodos de evaluaciòn ò de mediciòn de variables (escalas) podrìan
arrojar datos nùmericos u otros podrìan ser expresados en palabras, de esto depende la
credibilidad de la investigaciòn basada en la exactitud, conveniencia, y significado de las
mediciones que podrìan ser el origen de las conclusiones, recomendaciones y acciones ,
fruto de la resoluciòn del fenòmeno ò problema. Una ves que agrupamos estas
caracterìsticas de los individuos ò de los elementos observados ( variables) en categorìas ò
en grupos ò clases, esta agrupaciòn de caracterìstica comunes ò similares nos permite
clasificarlas en :

CLASIFICACION DE LAS ESCALAS


Las Escalas al igual que las variables se clasifican en cualitativas y cuantitativas, al mismo
tiempo se sub dividen en:
“ CARLOS CUENTA ESCALAS “
Cualitativas :
• Escala nominal ò clasificatoria
• Escala ordinal
Cuantitativas:
• Escala discreta ò discontinua
• Escala concreta ò continua
 Otras escalas:
• Escala cronològica
• Escala intervalar
• Escala de razòn

ESCALA NOMINAL Ò CLASIFICATORIA


Este tipo de variables no presentan un ordenamiento previo, màs al contrario es arbitraria,
de ahì que se haya ideado tres paràmetros para entender mejor este tipo de escala; variable,
escala y diferencia , por ejemplo
• Variable : PROFESION
• Escala : INGENIERO
MEDICO
ABOGADO
ENFERMERO
ODONTOLOGO
• Diferencia : No existe diferencia entre los profesionales,
Otros ejemplos :
Variable : DEPARTAMENTOS DE BOLIVIA
Escala : La paz
Cochabamba
Oruro
Potosì
Tarija
Beni
Diferencia : Ninguna .
Variable : Sexo
Escala : Masculino
Femenino
Diferencia : Ninguna .
Variable : Estado civil
Escala : Soltero
Casado
Divorciado
Viudo
Uniòn estable
Diferencia : Ninguna .

ESCALA ORDINAL
Las variables susceptibles de ser medidas siguiendo un ordenamiento (orden), formada por
una clase mutuamente excluyentes, que se agrupan de acuerdo a un orden pre asignado. Por
ejemplo
• Variable : GRADO DE INSTRUCCION
• Escala : PRIMARIAS
SECUNDARIA
SUPERIOR
POST SUPERIOR
• Diferencia : Existe diferencia entre diferentes niveles de la escala entre los
estudiantes de grado primario con los de nivel superior existe no solo años de
experiencia, sino conocimiento. ,
Otros ejemplos :
1. Variable : GRADO DE MILITAR y/o POLICIAL
Escala : SOLDADO
SARGENTO
SUBOFICIAL
OFICIAL
GENERAL
Diferencia : Existe diferencia entre los grados jeràrgicos no solo en
años de experiencia sino en años de estudio.
Variable : JERARQUIA FAMILIAR
Escala : HIJO MENOR
HIJO MEDIO
HIJO MAYOR
MADRE Ò PADRE
PADRE Ò MADRE
Diferencia : Existe diferencia entre los grados jeràrgicos de la familia no
solo en años de experiencia sino en edad.
ESCALA DISCRETA Ò DISCONTINUA
Se dice que si la variable medida es susceptible a ser contada, se puede construir una escala
discreta, formada por números ENTEROS con incrementos fijos, donde las fracciones no
son consideradas, para esto, se debe considerar la magnitud de los nùmeros expuestos. Por
ejemplo:
• Variable : NUMERO DE HIJOS
Escala : 1 HIJO
2 HIJOS
3 HIJOS
4 HIJOS
• Amplitud : Entre 4 y 1 hijos , existe una amplitud de 3 hijos
Otros ejemplos :
Variable : NUMERO DE VISITAS
Escala : De 1 a 3 visitas
De 4 a 6 visitas
De 7 a 9 visitas
De 10 a 12 visitas
Amplitud : Entre 1 y 3 , existe una amplitud de 2
Variable : NUMERO DE CARIES DENTAL
Escala : De 1 a 3 caries
De 4 a 6 caries
De 7 a 9 caries
Amplitud : Entre 1 y 3 caries , existe una amplitud de 2 caries
ESCALA CONCRETA Ò CONTINUA
Cuando uno cuenta con variables de tipo cuantitativo continuo o concreto se pude utilizar
este tipo de escala, cuyo requisito es èl de poder presentar nùmeros relativos ò racionales
(fraccionados, porcentuales y/o decimales) siendo esta mediciòn aproximada. Por ejemplo:
Variable : ESTATURA
Escala : 1,65 m.
1,66 m.
1,67 m.
1,68 m.
1,69 m.
Amplitud : Entre 1,65 y 1,69 m. , existe una amplitud de 0,5m
Otros ejemplos :
Variable : PESO EN GRAMOS
Escala : 6,5 Kg
7,5 Kg
8,5 Kg
9,5 Kg
Amplitud : Entre 6,5 y 9,5 kg , existe una amplitud de 4,0 kg.
Variable : TIEMPO EN HORAS
Escala : 1,10 hrs.
2,10 hrs.
3,10 hrs.
4,10 hrs.
Amplitud : Entre 1,10 y 4,10 horas , existe una amplitud de 4 horas.
ESCALA DICOTOMICA
Es aquella escala que presenta tan solo dos opciones para medir la variable, siendo esta
variable de tipo cualitativo ò cuantitativo dependiendo de la informaciòn ò resultado que se
busque, por ejemplo:
• Variable preferencia por un equipo de Futbol (football)
• Escala de mediciòn : Bolivar y Wilsterman
• Respuesta : Bolivar ò Wilsterman
Otro ejemplo :
• Variable . sexo de un estudiante de UDABOL
• Escala de mediciòn : Masculino ò femenino
• Respuesta : Masculino ò femenino
ESCALA CRONOLÒGICA
Es un tipo de escala cuantitativa contìnua, se la utiliza para estudiar algunos fenòmenos en
funciòn al tiempo, algunos autores la tratan como si fuera una escala de variable
independiente, permite conocer un determinado fenòmeno a travès del tiempo , es decir
permite un seguimiento temporalizado (en el pasado, en el presente ò en el futuro).
• Variable . Cambios físico de Marìa Gordales
• Escala de mediciòn : al 1 año
5 años
25 años
50 años
75 años
100 años
• Respuesta : descripciòn de las alteraciones físicas durante su vida
Otro ejemplo :
El seguimiento de un determinada enfermedad por ejemplo el SIDA Ó EL SIDNA, donde
se podrìa realizar un seguimiento por memorizado de las patologìas que se producen a raíz
de este fenòmeno.
ESCALA INTERVALAR
Las categorìas se ordenan en unidades igualmente espaciadas , siendo posible medir las
diferencias relativas en cada punto de la escala , no EXISTE EL CERO ABSOLUTO,
tenemos como ejemplo:
• Variable : Medición de la temperatura corporal,
• Escala : Grados centigrado ò Celcius (37º)
• Diferencia : La hace los nùmero mayores ò menores de 37 º

ESCALA DE RAZÒN
En esta escala SI EXISTE EL CERO ABSOLUTO y la magnitud de diferencia entre los
valores nùmericos entre sì por ejemplo :
Variable : RELACIÒN ENTRE LAS EDADES
Escala : Juan recien nacido (0 años)
Josè 9 años ( 9añosmàs )
Joaquin 18 años ( 9 años que José y 18 años màs que Juan )
CUESTIONAMIENTO
 Indique cuales son las características comunes de un a escala de medición , fundamente
su respuesta
 La clasificaciòn de escalas desde el punto de vista cuantitativo se fundamenta en ,
responda esta afirmación fundamentando con un ejercicio
Por que consideramos a las escalas cualitativas las más importantes entre las usadas por
estadistica
 Ejemplifique cada una de las escalas de medición
Por que son consideradas especiales las escalas de medición de razón e intervalar

Muestra estadística
En estadística una muestra estadística (también llamada muestra complicada o
simplificada muestra) es un subconjunto de casos o individuos de una población
estadística.
Las muestras se obtienen con la intención de inferir propiedades de la totalidad de la
población, para lo cual deben ser representativas de la misma. Para cumplir esta
característica la inclusión de sujetos en la muestra debe seguir una técnica de muestreo. En
tales casos, puede obtenerse una información similar a la de un estudio exhaustivo con
mayor rapidez y menor coste (véanse las ventajas de la elección de una muestra, más
abajo).
Por otra parte, en ocasiones, el muestreo puede ser más exacto que el estudio de toda la
población porque el manejo de un menor número de datos provoca también menos errores
en su manipulación. En cualquier caso, el conjunto de individuos de la muestra son los
sujetos realmente estudiados.
El número de sujetos que componen la muestra suele ser inferior que el de la población,
pero suficiente para que la estimación de los parámetros determinados tenga un nivel de
confianza adecuado. Para que el tamaño de la muestra sea idóneo es preciso recurrir a su
cálculo.

Otras definiciones relacionadas


Espacio Muestral
El espacio muestral del que se toma una muestra concreta está formado por el conjunto de
todas las posibles muestras que se pueden extraer de una población mediante una
determinada técnica de muestreo.
Parámetro o Estadístico muestral
Un parámetro estadístico o simplemente un estadístico muestral es cualquier valor
calculado a partir de la muestra, como por ejemplo la media, varianza o una proporción,
que describe a una población y puede ser estimado a partir de una muestra. Valor de la
población.
Estimación
Una estimación es cualquier técnica para conocer un valor aproximado de un parámetro
referido a la población, a partir de los estadísticos muestrales calculados a partir de los
elementos de la muestra.
Nivel de confianza
El nivel de confianza de una aseveración basada en la inferencia estadística es una medida
de la bondad de la estimación realizada a partir de estadísticos muestrales.
Ejemplo
La descripción de una muestra, y los resultados obtenidos sobre ella, puede ser del tipo
mostrado en el siguiente ejemplo:
Dimensión de la población: ej. 222.222 habitantes
Probabilidad del evento: ej. Hombre o Mujer 50%
Nivel de confianza: ej. 96%
Desviación tolerada: ej. 5% Resultado
ej. X
Tamaño de la muestra: ej. 270
La interpretación de esos datos sería la siguiente:
• La población a investigar tiene 222.222 habitantes y queremos saber
cuántos son varones o mujeres.
• Estimamos en un 50% para cada sexo y para el propósito del estudio es
suficiente un 90% de seguridad con un nivel entre 90 - 5 y 90 + 5.
• Generamos una tabla de 270 números al azar entre 1 y 222.222 y en un
censo numerado comprobamos el género para los seleccionados.

Ventajas de la elección de una muestra


El estudio de muestras es preferible, en la mayoría de los casos, por las siguientes razones:
1. Si la población es muy grande (en ocasiones, infinita, como ocurre en
determinados experimentos aleatorios) y, por tanto, imposible de
analizar en su totalidad.
2. Las características de la población varían si el estudio se prolonga
demasiado tiempo.
3. Reducción de costos: al estudiar una pequeña parte de la población,
los gastos de recogida y tratamiento de los datos serán menores que si
los obtenemos del total de la población.
4. Rapidez: al reducir el tiempo de recogida y tratamiento de los datos, se
consigue mayor rapidez.
5. Viabilidad: la elección de una muestra permite la realización de
estudios que serían imposible hacerlo sobre el total de la población.
6. La población es suficientemente homogénea respecto a la característica
medida, con lo cual resultaría inútil malgastar recursos en un análisis
exhaustivo (por ejemplo, muestras sanguíneas).
7. El proceso de estudio es destructivo o es necesario consumir un artículo
para extraer la muestra (ejemplos: vida media de una bombilla, carga
soportada por una cuerda, precisión de un proyectil, etc.).

Descripción matemática de una muestra aleatoria


El uso de muestras para deducir fiablemente características de la población requiere que se
trate con muestras aleatorias. Si la muestra estadística considerada no constituye una
muestra aleatoria las conclusiones basadas en dicha muestra no son fiables y en general
estarán sesgadas en algún aspecto.
En términos matemáticos, dada una variable aleatoriaX con una distribución de
probabilidadF, una muestra aleatoria de tamaño N es un conjunto finito de N variables
independentes, con la misma distribución de probabildadF.1
Otra forma más intuitiva, de entender una muestra es considerar que una muestra es una
sucesión de N experimentos independientes de una misma cantidad. Es importante
diferenciar una muestra de tamaño N, o más exactamente un muestreo de tamaño N, del
resultado concreto de de los N experimentos (que como conjunto de valores fijos, en sí
mismo, no es una muestra). El concepto de muestra incluye de alguna manera el
procedimiento escogido para obtener los datos (es decir, si las variables aleatorias
consideradas son independientes entre sí, y si tienen la misma distribución).
En general, resulta muy difícil comprobar si una determinada muestra es o no aleatoria,
cosa que sólo puede hacerse considerando otro tipo de muestreos aleatorios robustos que
permitan decir si la primera muestra era aleatoria o no.

Población estadística
Población estadística, en estadística, también llamada universo o colectivo, es el conjunto
de elementos de referencia sobre el que se realizan las observaciones.

Población en epidemiología
En epidemiología una población es un conjunto de sujetos o individuos con determinadas
características demográficas, de la que se obtiene la muestra o participantes en un estudio
epidemiológico a la que se quiere extrapolar los resultados de dicho estudio (inferencia
estadística).
Población estadística
El número de elementos o sujetos que componen una población estadística es igual o
mayor que el número de elementos que se obtienen de ella en una muestra (n).
Tipos de población
Existen distintos tipos de poblaciones que son:
• Población base: es el grupo de personas designadas por las siguientes
características: personales, geográficas o temporales, que son elegibles
para participar en el estudio.
• Población muestreada: es la población base con criterios de
viabilidad o posibilidad de realizarse el muestreo.
• Muestra estudiada: es el grupo de sujetos en el que se recogen los
datos y se realizan las observaciones, siendo realmente un subgrupo de
la población muestreada y accesible. El número de muestras que se
puede obtener de una población es una o mayor de una.
• Población diana: es el grupo de personas a la que va proyectado dicho
estudio, la clasificación característica de los mismos, lo cual lo hace
modelo de estudio para el proyecto establecido.
queesta conformada por lo cuantico de un elemento.

Población y muestra
Dentro de una investigación es importante establecer cual es la población y si de esta se ha
tomado una muestra, cuando se trata de seres vivos, en caso de objetos se debe establecer
cual será el objeto, evento o fenómeno a estudiar. La Población:
Una población está determinada por sus características definitorias. Por lo tanto, el
conjunto de elementos que posea esta característica se denomina población o universo.
Población es la totalidad del fenómeno a estudiar, donde las unidades de población poseen
una característica común, la que se estudia y da origen a los datos de la investigación.

Entonces, una población es el conjunto de todas las cosas que concuerdan con una serie
determinada de especificaciones. Un censo, por ejemplo, es el recuento de todos los
elementos de una población.
Desde luego, es de fundamental importancia comenzar el estudio definiendo la población a
estudiar. Las poblaciones suelen ser muy numerosas, por lo que es difícil estudiar a todos
sus miembros; además de que esto no es posible, no es necesario. Es como si se quisiera
estudiar la composición química del agua de un río y para ello se intentará analizar todo el
agua que corre por su cauce, cuando solamente se puede tomar unas muestras para realizar
ese estudio y llegar a conclusiones generalizables con respecto a la composición química
del agua a todo el río.
Cuando se seleccionan algunos elementos con la intención de averiguar algo sobre una
población determinada, este grupo es definido como muestra. Cuando no es posible medir
cada uno de los individuos de una población, se toma una muestra representativa de la
misma. Por supuesto, se espera a través del estudio que lo que se averigüe en la muestra
sea cierto para la población en su conjunto. La exactitud de la información recolectada
depende en gran medida de la forma en que sea seleccionada la muestra.

La Muestra
Una muestra es un conjunto de unidades, una porción del total, que representa la conducta
del universo en su conjunto. Una muestra, en un sentido amplio, no es más que eso, una
parte del todo que se llama universo o población y que sirve para representarlo. Cuando un
investigador realiza en ciencias sociales un experimento, una encuesta o cualquier tipo de
estudio, trata de obtener conclusiones generales acerca de una población determinada. Para
el estudio de ese grupo, tomará un sector, al que se conoce como muestra.
La muestra descansa en el principio de que las partes representan al todo y, por tal, refleja
las características que definen la población de la que fue extraída, lo cual indica que es
representativa. Por lo tanto, la validez de la generalización depende de la validez y tamaño
de la muestra. Por lo tanto la selección y el tamaño de la muestrava a jugar un papel muy
importante en la investigación.
Tipos de muestras:
Muestras por conglomerados: esta técnica tiene utilidad cuando el universo o la
población que se requiere estudiar se encuentra subdividido en universos o poblaciones
menores de características similares al del universo o población total. Se procede a
subdividir la población en un número finito de conglomerados y, entre ellos, se pasa a
elegir algunos que serán los únicos que se investigarán; esta elección puede realizarse por
el método del azar simple o por el del azar sistemático. Una vez cumplida esta etapa, puede
efectuarse una, dentro de cada uno de los conglomerados elegidos, para llegar a un número
aún más reducido de unidades muestrales.

Ventaja: obvia la tarea de confeccionar el listado de todas las unidades del universo.
Desventaja: al efectuarse el muestreo en dos etapas, los errores muestrales de cada una se
van acumulando, lo que da un error mayor.

La técnica de conglomerados suele utilizarse cuando se quiere extraer muestras de los


habitantes de un conjunto geográfico amplio, por ejemplo, una gran ciudad o un conjunto
de pueblos, por lo que se procede a tomar cada pueblo o grupo de manzanas como un
conglomerado independiente. Igual se utiliza para conocer las reservas forestales y
marinas, para estudiar las estrellas y otros casos semejantes.

Muestras estratificadas
Este método supone que el universo puede desagregarse en sub � conjuntos menores,
homogéneos internamente pero heterogéneos entre sí. Cada uno de estos estratos se toma
luego como un universo particular, de tamaño más reducido, y sobre él se seleccionan
muestras según cualquiera de los procedimientos anteriores.

Por ejemplo, si se quisiera estudiar las actitudes políticas de los estudiantes de una
universidad, se podría subdividir en estratos de acuerdo con el tipo de estudios que cursen,
suponiendo que estas actitudes van a ser diferentes entre quienes siguen Ingeniería, Letras,
Medicina u otras carreras. Luego, se efectuaría un muestreo dentro de cada sub � universo
así definido para, finalmente, realizar un análisis integrando los resultados de todas las sub
� muestras.

Tanto en el muestreo estratificado como en el de conglomerados, la población se divide en


grupos bien definidos. Se usa el muestreo estratificado cuando hay una amplia variación
entre los grupos; el de conglomerados en el caso opuesto: cuando hay una variación
considerable dentro de cada grupo, pero los grupos son esencialmente similares entre sí. El
tamaño de la muestra también es importante ya que de esta va a depender si los resultados
del estudio podrán generalizarse o no.

Tipos de muestreo
Inferencia estadística
Estudia como sacar conclusiones generales para toda la población a partir del estudio
de una muestra, y el grado de fiabilidad o significación de los resultados obtenidos.
Muestreo probabilístico
Consiste en elegir una muestra de una población al azar. Podemos distinguir varios tipos
de muestreo:
Muestreo aleatorio simple
Para obtener una muestra, se numeran los elementos de la población y se seleccionan al
azar los n elementos que contiene la muestra.
Muestreo aleatorio sistemático
Se elige un individuo al azar y a partir de él, a intervalos constantes, se eligen los demás
hasta completar la muestra.
Por ejemplo si tenemos una población formada por 100 elementos y queremos extraer
una muestra de 25 elementos, en primer lugar debemos establecer el intervalo de selección
que será igual a 100/25 = 4. A continuación elegimos el elemento de arranque, tomando
aleatoriamente un número entre el 1 y el 4, y a partir de él obtenemos los restantes
elementos de la muestra.
2, 6, 10, 14,..., 98
Muestreo aleatorio estratificado
Se divide la población en clases o estratos y se escoge, aleatoriamente, un número de
individuos de cada estrato proporcional al número de componentes de cada estrato.

En una fábrica que consta de 600 trabajadores queremos tomar una muestra de 20.
Sabemos que hay 200 trabajadores en la sección A, 150 en la B, 150 en la C y 100 en la D.

Un muestreo puede hacerse con o sin reposición, y la población de partida puede ser
infinita o finita.
En todo nuestro estudio vamos a limitarnos a una población de partida infinita o a
muestreo con reposición.
Si consideremos todas las posibles muestras de tamaño n en una población, para cada
muestra podemos calcular un estadístico (media, desviación típica, proporción, ...) que
variará de una a otra.
Así obtenemos una distribución del estadístico que se llama distribución muestral.
EL MUESTREO POR SELECCIÓN INTENCIONADA O MUESTREO DE
CONVENIENCIA
Consiste en la elección por métodos no aleatorios de una muestra cuyas características sean
similares a las de la población objetivo. En este tipo de muestreos la “representatividad” la
determina el investigador de modo subjetivo, siendo este el mayor inconveniente del
método
ya que no podemos cuantificar la representatividad de la muestra.
Presenta casi siempre sesgos y por tanto debe aplicarse únicamente cuando no existe
alternativa. En algunos casos, especialmente cuando se requiere una estrecha colaboración
por parte de los ganaderos o veterinarios de campo, es la única opción para que el estudio
sea viable. Supongamos que queremos realizar un estudio longitudinal consistente en tomar
muestras de los animales de la explotación cada mes, o llevar diariamente unos registros
determinados de la granja, la mejor opción será realizar el estudio en granjas de confianza
que permitan las manipulaciones y tengamos garantías de que el trabajo se llevará a cabo
correctamente.
También puede ser útil cuando se pretende realizar una primera prospección de la
población
o cuando no existe un marco de la encuesta definido. Este tipo de muestreos puede incluir
individuos próximos a la media o no, pero casi nunca representará la variabilidad de la
población, que normalmente quedará subestimada.

EL MUESTREO ALEATORIO
En el muestreo aleatorio todos los elementos tienen la misma probabilidad de ser elegidos.
Los individuos que formarán parte de la muestra se elegirán al azar mediante números
aleatorios. Existen varios métodos para obtener números aleatorios, los más frecuentes son
la utilización de tablas de números aleatorios o generarlos por ordenador.
El muestreo aleatorio puede realizarse de distintas maneras, las más frecuentes son el
muestreo simple, el sistemático, el estratificado y el muestreo por conglomerqados.

Muestreo aleatorio simple.


Es el método conceptualmente más simple. Consiste en extraer todos los individuos al azar
de una lista (marco de la encuesta). En la práctica, a menos que se trate de poblaciones
pequeñas o de estructura
muy simple, es difícil de
llevar a cabo de forma
eficaz.
Ejemplo: Se pretende
determinar la prevalencia de
Maedi en una explotación de
250 ovejas: para ello se
deben examinar 61 animales
(se supone una prevalencia
del 30% y se desea una
precisión del 10% para un
nivel de confianza del 95%):
se obtienen 61 números Figura 1. Representación gráfica del muestreo
aleatorio simple.
).
Muestreo sistemático.
En este caso se elige el primer individuo al
azar y el resto viene condicionado por aquél.
Este método es muy simple de aplicar en la
práctica y tiene la ventaja de que no hace
falta disponer de un marco de encuesta
elaborado. Puede aplicarse en la mayoría de
las situaciones, la única precaución que debe
tenerse en cuenta es comprobar que la
característica que estudiamos no tenga una
periodicidad que coincida con la del
muestreo (por ejemplo elegir un día de la
semana para tomar muestras en un matadero,
ya que muchos ganaderos suelen sacrificar
un día determinado).
Ejemplo: En el caso anterior debemos tomar uno de cada cuatro animales (250/61); en
vez
de tomar 61 números aleatorios tomamos sólo uno (entre el uno y el cuatro), por ejemplo
el
número 3, de modo que tomaremos la oveja número 3, y a continuación cada cuarto
animal
(la 7, la 11, la 15 y así sucesivamente hasta llegar a la 247).
Muestreo aleatorio estratificado.
Se divide la población en grupos en función de un carácter determinado y después se
muestrea cada grupo aleatoriamente, para obtener la parte proporcional de la muestra. Este
método se aplica para evitar que por azar algún grupo de animales este menos representado
que los otros.
El muestreo estratificado tiene interés
cuando la característica en cuestión
puede estar relacionada con la variable
que queremos estudiar. Cuando se
realiza un muestreo cuya unidad sean
las granjas, la estratificación se aplica
frecuentemente en relación al tamaño
de granja o a la aptitud de los animales,
ya que muchas enfermedades presentan
prevalencias diferentes en función del
tamaño de la granja o a si se trata por
ejemplo de razas de aptitud lechera o
cárnica. Si la unidad son los animales,
se suele estratificar en función de la edad ya que ésta suele influir en muchas
enfermedades.
Ejemplo: La probabilidad de que una oveja esté infectada de Maedi está directamente
relacionada con la edad. En el ejemplo anterior, la explotación tiene el 44% de los
animales de menos de 2 años, el 28% de 3-4 años, el 18% de 5-6 y el 10% son animales de
más de seis años: el 44% de los 61 animales de la muestra (27 animales) se tomará al azar
Figura 2. Representación gráfica del
muestreo aleatorio sistemático.
x%
y%
z%
w%
x%
y%
z%
w
%
N
n
Figura 3. Representación gráfica del muestreo
aleatorio estratificado.
Rev. Epidem. Med. Prev. (2003), 1: 3-7
7
Tipos de muestreo
entre los de 1-2 años, el 28% entre los de 3-4 años y así sucesivamente (17, 11 y 6
animales
de los otros tres grupos). Este método evita que por casualidad (por azar) se tomen más
individuos de un grupo que de los demás y esto pueda condicionar el resultado.
Muestreo aleatorio por conglomerados.
Se divide la población en varios grupos de
características parecidas entre ellos y
luego se analizan completamente algunos
de los grupos, descartando los demás.
Dentro de cada conglomerado existe una
variación importante, pero los distintos
conglomerados son parecidos. Requiere
una muestra más grande, pero suele
simplificar la recogida de muestras.
Frecuentemente los conglomerados se
aplican a zonas geográficas.

Muestreo mixto.
Cuando la población es compleja, cualquiera de los métodos descritos puede ser difícil de
aplicar, en estos casos se aplica un muestreo mixto que combina dos o más de los
anteriores
sobre distintas unidades de la encuesta.
Ejemplo: se pretende determinar la prevalencia de una determinada infección en una
comarca: se dividen las explotaciones en tres grupos en función de su tamaño y se realiza
un muestreo estratificado, en las granjas que forman la muestra se realiza un muestreo
sistemático para elegir los individuos que se analizarán.
DATOS CUALITATIVOS Y
CUANTITATIVOS.
Conceptos Básicos:
Estadística:
La estadística es comúnmente considerada como una colección de hechos numéricos
expresados en términos de una relación sumisa, y que han sido recopilado a partir de otros
datos numéricos.
Kendall y Buckland (citados por Gini V. Glas / Julian C. Stanley, 1980) definen la
estadística como un valor resumido, calculado, como base en una muestra de observaciones
que generalmente, aunque no por necesidad, se considera como una estimación de
parámetro de determinada población; es decir, una función de valores de muestra.
"La estadística es una técnica especial apta para el estudio cuantitativo de los fenómenos de
masa o colectivo, cuya mediación requiere una masa de observaciones de otros fenómenos
más simples llamados individuales o particulares". (Gini, 1953.
Murria R. Spiegel, (1991) dice: "La estadística estudia los métodos científicos para
recoger, organizar, resumir y analizar datos, así como para sacar conclusiones válidas y
tomar decisiones razonables basadas en tal análisis.
"La estadística es la ciencia que trata de la recolección, clasificación y presentación de los
hechos sujetos a una apreciación numérica como base a la explicación, descripción y
comparación de los fenómenos". (Yale y Kendal, 1954).
Cualquiera sea el punto de vista, lo fundamental es la importancia científica que tiene la
estadística, debido al gran campo de aplicación que posee.
Población:
El concepto de población en estadística va más allá de lo que comúnmente se conoce como
tal. Una población se precisa como un conjunto finito o infinito de personas u objetos que
presentan características comunes.
"Una población es un conjunto de todos los elementos que estamos estudiando, acerca de
los cuales intentamos sacar conclusiones". Levin&Rubin (1996).
"Una población es un conjunto de elementos que presentan una característica común".
Cadenas (1974).
Ejemplo:
Los miembros del Colegio de Ingenieros del Estado Cojedes.
El tamaño que tiene una población es un factor de suma importancia en el proceso de
investigación estadística, y este tamaño vienen dado por el número de elementos que
constituyen la población, según el número de elementos la población puede ser finita o
infinita. Cuando el número de elementos que integra la población es muy grande, se puede
considerar a esta como una población infinita, por ejemplo; el conjunto de todos los
números positivos. Una población finita es aquella que está formada por un limitado
número de elementos, por ejemplo; el número de estudiante del Núcleo San Carlos de la
Universidad Nacional Experimental Simón Rodríguez.
Cuando la población es muy grande, es obvio que la observación de todos los elementos se
dificulte en cuanto al trabajo, tiempo y costos necesario para hacerlo. Para solucionar este
inconveniente se utiliza una muestra estadística.
Es a menudo imposible o poco práctico observar la totalidad de los individuos, sobre todos
si estos son muchos. En lugar de examinar el grupo entero llamado población o universo,
se examina una pequeña parte del grupo llamada muestra.
Muestra:
"Se llama muestra a una parte de la población a estudiar que sirve para representarla".
Murria R. Spiegel (1991).
"Una muestra es una colección de algunos elementos de la población, pero no de todos".
Levin&Rubin (1996).
"Una muestra debe ser definida en base de la población determinada, y las conclusiones
que se obtengan de dicha muestra solo podrán referirse a la población en referencia",
Cadenas (1974).
Ejemplo;
El estudio realizado a 50 miembros del Colegio de Ingenieros del Estado Cojedes.
El estudio de muestras es más sencillo que el estudio de la población completa; cuesta
menos y lleva menos tiempo. Por último se aprobado que el examen de una población
entera todavía permite la aceptación de elementos defectuosos, por tanto, en algunos casos,
el muestreo puede elevar el nivel de calidad.
Una muestra representativa contiene las características relevantes de la población en las
mismas proporciones que están incluidas en tal población.
Los expertos en estadística recogen datos de una muestra. Utilizan esta información para
hacer referencias sobre la población que está representada por la muestra. En consecuencia
muestra y población son conceptos relativos. Una población es un todo y una muestra es
una fracción o segmento de ese todo.
Muestreo:
Esto no es más que el procedimiento empleado para obtener una o más muestras de una
población; el muestreo es una técnica que sirve para obtener una o más muestras de
población.
Este se realiza una vez que se ha establecido un marco muestral representativo de la
población, se procede a la selección de los elementos de la muestra aunque hay muchos
diseños de la muestra.
Al tomar varias muestras de una población, las estadísticas que calculamos para cada
muestra no necesariamente serían iguales, y lo más probable es que variaran de una
muestra a otra.
Ejemplo;
Consideremos como una población a los estudiantes de educación del Núcleo San Carlos
de la UNESR, determinando por lo menos dos caracteres ser estudiados en dicha
población;
• Religión de los estudiantes
• Sexo.
Tipos de muestreo
Existen dos métodos para seleccionar muestras de poblaciones; el muestreo no aleatorio o
de juicio y el muestreo aleatorio o de probabilidad. En este último todos los elementos de
la población tienen la oportunidad de ser escogidos en la muestra. Una muestra
seleccionada por muestreo de juicio se basa en la experiencia de alguien con la población.
Algunas veces una muestra de juicio se usa como guía o muestra tentativa para decidir
como tomar una muestra aleatoria más adelante. Las muestras de juicio evitan el análisis
estadístico necesarios para hacer muestras de probabilidad.
Variables y Atributos:
Las variables, también suelen ser llamados caracteres cuantitativos, son aquellos que
pueden ser expresados mediante números. Son caracteres susceptibles de medición. Como
por ejemplo, la estatura, el peso, el salario, la edad, etc.
Según, Murray R. Spiegel, (1992) "una variable es un símbolo, tal como X, Y, Hx, que
puede tomar un valor cualquiera de un conjunto determinado de ellos, llamado dominio de
la variable. Si la variable puede tomar solamente un valor, se llama constante."
Todos los elementos de la población poseen los mismos tipos de caracteres, pero como
estos en general no suelen representarse con la misma intensidad, es obvio que las
variables toman distintos valores. Por lo tanto estos distintos números o medidas que
toman los caracteres son los "valores de la variable". Todos ellos juntos constituyen una
variable.
Los atributos también llamados caracteres cualitativos, son aquellos que no son
susceptibles de medición, es decir que no se pueden expresar mediante un número.
IUTIN (1997). "Reciben el nombre de variables cualitativas o atributos, aquellas
características que pueden presentarse en individuos que constituyen un conjunto.
La forma de expresar los atributos es mediante palabras, por ejemplo; profesión, estado
civil, sexo, nacionalidad, etc. Puede notar que los atributos no se presentan en la misma
forma en todos los elementos. Estas distintas formas en que se presentan los atributos
reciben el nombre de "modalidades".
Ejemplo;
El estado civil de cada uno de los estudiantes del curso de estadísticas I, no se presenta en
la misma modalidad en todos.
Formas de Observar la Población:
1. Atendiendo a la fuente se clasifican en directa o indirecta.
• Observación directa: es aquella donde se tienen un contacto directo con los
elementos o caracteres en los cuales se presenta el fenómeno que se pretende
investigar, y los resultados obtenidos se consideran datos estadísticos originales.
Para Ernesto Rivas González (1997) "Investigación directa, es aquella en que el
investigador observa directamente los casos o individuos en los cuales se produce el
fenómeno, entrando en contacto con ellos; sus resultados se consideran datos
estadísticos originales, por esto se llama también a esta investigación primaria".
Ejemplo; el seguimiento de la población agrícola por año, llevado en una determinada
granja.
• Observación Indirecta: es aquella donde la persona que investiga hace uso de
datos estadísticos ya conocidos en una investigación anterior, o de datos observados
por un tercero (persona o entidad). Con el fin de deducir otros hechos o fenómenos.
Ejemplo; si un investigador pretende estudiar la producción por años de una granja
avícola, en sus últimos cinco años de producción, tendría que hacer un seguimiento, a tal
fin recurriría a las observaciones que posee la oficina administrativa de la granja durante
estos cinco años, o dirigirse a la oficina de estadística, llevada en el ministerio de
producción y comercio (M.P.C) de la localidad donde está registrada dicha granja. Es de
notar que el investigador se vale de observaciones realizadas por terceros.
1. Atendiendo a la periodicidad, puede ser continua, periódica o circunstancial.
• Una observación continua; como su nombre lo indica es aquella que se lleva
acabo de un modo permanente.
Ejemplo: la contabilidad comercial, llevada en cuanto a compras, ventas y otras
operaciones que se van registrando a medida que van produciéndose.
• Una observación periódica; es aquélla que se lleva a cabo a través de períodos de
tiempo constantes. Estos períodos de tiempos pueden ser semanas, trimestres,
semestres, años, etc. Lo que debemos destacar es que los períodos de tiempo
tomados como unidad deben tomarse constantes en los posible.
Ejemplo; el registro llevado por la Oficinas de Control de Estudios de la UNESR, en
cuanto a la inscripción de los estudiantes por semestre.
• La observación circunstancial, es aquella que se efectúa en forma ocasional o
esporádica, esta observación hecha más por una necesidad momentánea, que de
carácter regular o permanente.
Ejemplo; la obtención de números de aulas utilizadas y no utilizadas en los colegios
pertenecientes al municipio San Carlos del Estado Cojedes.
1. Atendiendo a la cobertura; pueden ser exhaustiva, parcial o mixta
• Observación Exhaustiva. Cuando la observación es efectuada sobre la totalidad de
los elementos de la población se habla de una observación exhaustiva.
• Observación Parcial. Dados que las poblaciones en general son grandes, la
observación de todos sus elementos se ve imposibilitada. La solución para superar
este inconveniente es observar una parte de esta población.
• Observación Mixta. En este tipo de observación se combinan adecuadamente la
observación exhaustiva con la observación parcial. Por lo general, este tipo de
observaciones se lleva a cabo de tal manera que los caracteres que se consideran
básicos se observan exhaustivamente y los otros mediante una muestra; o bien
cuando la población es muy grande, parte de ella se observa parcialmente.
Censo:
Se entiende por censo aquella numeración que se efectúa a todos y cada uno de los
caracteres componentes de una población.
Para Levin&Rubin (1996) "Algunas veces es posible y práctico examinar a cada persona o
elemento de la población que deseamos describir. A esto lo llamamos una numeración
completa o censo. Utilizamos el muestre cuando no es posible contar o medir todos los
elementos de la población.
Si es posible listar (o enumerar) y observar cada elemento de la población, los censos se
utilizan rara vez porque a menudo su compilación es bastante difícil, consume mucho
tiempo por lo que resulta demasiado costoso.
Encuesta:
Se entiende por encuesta las observaciones realizadas por muestreo, es decir son
observaciones parciales.
El diseño de encuestas es exclusivo de las ciencias sociales y parte de la premisa de que si
queremos conocer algo sobre el comportamiento de las personas, lo mejor, más directo y
simple es preguntárselo directamente a ellas. (Cadenas, 1974).
Según Antonio Napolitano "La encuesta, es un método mediante el cual se quiere
averiguar. Se efectúa a través de cuestionarios verbales o escritos que son aplicados a un
gran número de personas".
Estadística Descriptiva:
Tienen por objeto fundamental describir y analizar las características de un conjunto de
datos, obteniéndose de esa manera conclusiones sobre las características de dicho conjunto
y sobre las relaciones existentes con otras poblaciones, a fin de compararlas. No obstante
puede no solo referirse a la observación de todos los elementos de una población
(observación exhaustiva) sino también a la descripción de los elementos de una muestra
(observación parcial).
En relación a la estadística descriptiva, Ernesto Rivas Gonzáles dice; "Para el estudio de
estas muestras, la estadística descriptiva nos provee de todos sus medidas; medidas que
cuando quieran ser aplicadas al universo total, no tendrán la misma exactitud que tienen
para la muestra, es decir al estimarse para el universo vendrá dada con cierto margen de
error; esto significa que el valor de la medida calculada para la muestra, en el oscilará
dentro de cierto límite de confianza, que casi siempre es de un 95 a 99% de los casos.
Estadística Inductiva:
Está fundamentada en los resultados obtenidos del análisis de una muestra de población,
con el fin de inducir o inferir el comportamiento o característica de la población, de donde
procede, por lo que recibe también el nombre de Inferencia estadística.
Según Berenson y Levine; Estadística Inferencial son procedimientos estadísticos que
sirven para deducir o inferir algo acerca de un conjunto de datos numéricos (población),
seleccionando un grupo menor de ellos (muestra).
El objetivo de la inferencia en investigación científica y tecnológica radica en conocer
clases numerosas de objetos, personas o eventos a partir de otras relativamente pequeñas
compuestas por los mismos elementos.
En relación a la estadística descriptiva y la inferencial, Levin&Rubin (1996) citan los
siguientes ejemplos para ayudar a entender la diferencia entre las dos.
Supóngase que un profesor calcula la calificación promedio de un grupo de historia. Como
la estadística describe el desempeño del grupo pero no hace ninguna generalización acerca
de los diferentes grupos, podemos decir que el profesor está utilizando estadística
descriptiva. Graficas, tablas y diagramas que muestran los datos de manera que sea más
fácil su entendimiento son ejemplos de estadística descriptiva.
Supóngase ahora que el profesor de historia decide utilizar el promedio de calificaciones
obtenidos por uno de sus grupos para estimar la calificación promedio de las diez unidades
del mismo curso de historia. El proceso de estimación de tal promedio sería un problema
concerniente a la estadística inferencial.
Los estadísticos se refieren a esta rama como inferencia estadística, esta implica
generalizaciones y afirmaciones con respecto a la probabilidad de su validez.
UNIDAD II
Medición de Caracteres
Medición
Existen diversas definiciones del termino "medición", pero estas dependen de los
diferentes puntos de vista que se puedan tener al abordar el problema de la cuantificación y
el proceso mismo de la construcción de una escala o instrumento de medición.
En general, se entiende por medición la asignación de números a elementos u objetos para
representar o cuantificar una propiedad. El problema básico está dado por la asignación un
numeral que represente la magnitud de la característica que queremos medir y que dicho
números pueden analizarse por manipulaciones de acuerdo a ciertas reglas. Por medio de la
medición, los atributos de nuestras percepciones se transforman en entidades conocidas y
manejables llamadas "números". Es evidente que el mundo resultaría caótico si no
pudiéramos medir nada. En este caso cabría preguntarse de que le serviría la físico saber
que el hierro tiene una alta temperatura de fusión.
Niveles o Escalas de mediciones
Escala Nominal:
La escala de medida nominal, puede considerarse la escala de nivel más bajo, y consiste en
la asignación, puramente arbitraria de números o símbolos a cada una de las diferentes
categorías en las cuales podemos dividir el carácter que observamos, sin que puedan
establecerse relaciones entre dichas categorías, a no ser el de que cada elemento pueda
pertenecer a una y solo una de estas categorías.
Se trata de agrupar objetos en clases, de modo que todos los que pertenezcan a la misma
sean equivalentes respecto del atributo o propiedad en estudio, después de lo cual se
asignan nombres a tales clases, y el hecho de que a veces, en lugar de denominaciones, se
le atribuyan números, puede ser una de las razones por las cuales se le conoce como
"medidas nominales".
Por ejemplo, podemos estar interesados en clasificar los estudiantes de la UNESR Núcleo
San Carlos de acuerdos a la carrera que cursan.

Carrera Número asignada a la categoría

Educación 1

Administración 2

Se ha de tener presente que los números asignados a cada categoría sirven única y
exclusivamente par identificar la categoría y no poseen propiedades cuantitativas.
Escala Ordinal:
En caso de que puedan detectarse diversos grados de un atributo o propiedad de un objeto,
la medida ordinal es la indicada, puesto que entonces puede recurrirse a la propiedad de
"orden" de los números asignándolo a los objetos en estudio de modo que, si la cifra
asignada al objeto A es mayor que la de B, puede inferirse que A posee un mayor grado de
atributo que B.
La asignación de números a las distintas categorías no puede ser completamente arbitraria,
debe hacerse atendiendo al orden existente entre éstas.
Los caracteres que posee una escala de medida ordinal permiten, por el hecho mismo de
poder ordenar todas sus categorías, el cálculo de las medidas estadísticas de posición, como
por ejemplo la mediana.
Ejemplo:
Al asignar un número a los pacientes de una consulta médica, según el orden de llegada,
estamos llevando una escala ordinal, es decir que al primero en llegar ordinal, es decir que
al primeo en llegar le asignamos el nº 1, al siguiente el nº 2 y así sucesivamente, de esta
forma, cada número representará una categoría en general, con un solo elemento y se puede
establecer relaciones entre ellas, ya que los números asignados guardan la misma relación
que el orden de llegada a la consulta.
Escalas de intervalos iguales:
la escala de intervalos iguales, está caracterizada por una unidad de medida común y
constante que asigna un número igual al número de unidades equivalentes a la de la
magnitud que posea el elemento observado. Es importante destacar que el punto cero en las
escalas de intervalos iguales es arbitrario, y no refleja en ningún momento ausencia de la
magnitud que estamos midiendo. Esta escala, además de poseer las características de la
escala ordinal, encontramos que la asignación de los números a los elemento es tan precisa
que podemos determinar la magnitud de los intervalos (distancia) entre todos los elementos
de la escala. Sin lugar a dudas, podemos decir que la escala de intervalos es la primera
escala verdaderamente cuantitativa y a los caracteres que posean esta escala de medida
pueden calculársele todas las medidas estadísticas a excepción del coeficiente de variación.
Ejemplo:
El lapso transcurrido entre 1998-1999 es igual al que transcurrió entre 2000-2001.
Escala de coeficientes o Razones:
El nivel de medida más elevado es el de cocientes o razones, y se diferencia de las escalas
de intervalos iguales únicamente por poseer un punto cero propio como origen; es decir
que el valor cero de esta escala significa ausencia de la magnitud que estamos midiendo. Si
se observa una carencia total de propiedad, se dispone de una unidad de medida para el
efecto. A iguales diferencias entre los números asignados corresponden iguales diferencias
en el grado de atributo presente en el objeto de estudio. Además, siendo que cero ya no es
arbitrario, sino un valor absoluto, podemos decir que A. Tiene dos, tres o cuatro veces la
magnitud de la propiedad presente en B.
Ejemplo:
En una encuesta realizada en un barrio de esta localidad se observó que hay familias que no
tienen hijos, otras tienen 6 hijos que es exactamente el doble de hijos que aquellas que
tienen 3 hijos.
Las variables y su medición:
Una variable es un símbolo, tal como X, Y, H, x ó B, que pueden tomar un conjunto
prefijado de valores, llamado dominio de esa variable. Para Murray R. Spiegel (1991) "una
variable que puede tomar cualquier valor entre dos valores dados se dice que es una
variable continua en caso contrario diremos que la variable es discreta".
Las variables, también llamadas caracteres cuantitativos, son aquellas cuyas variaciones
son susceptibles de ser medidas cuantitativamente, es decir, que pueden expresar
numéricamente la magnitud de dichas variaciones. Por intuición y por experiencia sabemos
que pueden distinguirse dos tipos de variables; las continuas y las discretas
Las variables continuas se caracterizan por el hecho de que para todo para de valores
siempre se puede encontrar en valor intermedio, (el peso, la estatura, el tiempo empleado
para realizar un trabajo, etc.)
Una variable es continua, cuando puede tomar infinitos valores intermedios dentro de dos
valores consecutivos. Por ejemplo, la estatura, el peso, la temperatura.
Para ver el gráfico seleccione la opción "Descargar" del menú superior
Ejemplo:
En el preescolar Blanca de Pérez, ubicado en la urbanización Monseñor Padilla de esta
ciudad se procedió a recoger las medidas de talla y peso de los niños que a este asisten.
Niño Peso Talla
José 18,300 1,15
Julio 20,500 1,20
Pedro 19,000 1,10
Luis 18,750 1,18
.Las variables discretas serán aquellas que pueden tomar solo un número limitado de
valores separados y no continuos; son aquellas que solo toman un determinado números de
valores, porque entre dos valores consecutivos no pueden tomar ningún otro; por ejemplo
el número de estudiantes de una clase es una variable discreta ya que solo tomará los
valores 1, 2, 3, 4... nótese que no encontramos valor como 1,5 estudiantes
UNIDAD III
Estadísticas Primarias
Datos Estadísticos:
Los datos estadísticos no son otra cosa que el producto de las observaciones efectuadas en
las personas y objetos en los cuales se produce el fenómeno que queremos estudiar. Dicho
en otras palabras, son los antecedentes (en cifras) necesarios para llegar al conocimiento de
un hecho o para reducir las consecuencias de este.
Los datos estadísticos se pueden encontrar de forma no ordenada, por lo que es muy difícil
en general, obtener conclusiones de los datos presentados de esta manera. Para poder
obtener una precisa y rápida información con propósitos de descripción o análisis, estos
deben organizarse de una manera sistemática; es decir, se requiere que los datos sean
clasificados. Esta clasificación u organización puede muy bien hacerse antes de la
recopilación de los datos.
Ejemplo:
Si se quiere conocer las características de los estudiantes del Núcleo San Carlos de la
UNESR, que solicitan préstamo a la biblioteca de dicha Universidad, la recolección de la
información debe clasificar a cada estudiante sobre la base de: Carrera que estudia, edad,
semestre de estudios, etc. Vemos pues que la clasificación marca la pauta de la clase de
datos que debe ser obtenido.
Clasificación de los datos
Los datos estadísticos pueden ser clasificados en cualitativos, cuantitativos, cronológicos y
geográficos.
Datos Cualitativos: cuando los datos son cuantitativos, la diferencia entre ellos es de clase
y no de cantidad.
Ejemplo:
Si deseamos clasificar los estudiantes que cursan la materia de estadística I por su estado
civil, observamos que pueden existir solteros, casados, divorciados, viudos.
Datos cuantitativos: cuando los valores de los datos representan diferentes magnitudes,
decimos que son datos cuantitativos.
Ejemplo:
Se clasifican los estudiantes del Núcleo San Carlos de la UNESR de acuerdo a sus notas,
observamos que los valores (nota) representan diferentes magnitudes.
Datos cronológicos: cuando los valores de los datos varían en diferentes instantes o
períodos de tiempo, los datos son reconocidos como cronológicos.
Ejemplo:
Al registrar los promedios de notas de los Alumnos del Núcleo San Carlos de la UNESR
en los diferentes semestres.
Datos geográficos: cuando los datos están referidos a una localidad geográfica se dicen
que son datos geográficos.
Ejemplo
El número de estudiantes de educación superior en las distintas regiones del país.
Fuentes de datos Estadísticos:
Los datos estadísticos necesarios para la comprensión de los hechos pueden obtenerse a
través de fuentes primarias y fuentes secundarias.
Fuentes de datos primarias: es la persona o institución que ha recolectado directamente
los datos.
Fuentes secundarias: son las publicaciones y trabajos hechos por personas o entidades que
no han recolectado directamente la información.
Las fuentes primarias más confiables, son las efectuadas por oficinas gubernamentales
encargadas de tal fin.
En la práctica, es aconsejable utilizar fuentes de datos primarias y en última instancia
cuando estas no existan, usar estadísticas de fuentes secundarias. Con este último tipo no
debemos pasar por alto que la calidad de las conclusiones estadísticas dependen en grado
sumo de la exactitud de los datos que se recaben. De anda serviría usar técnicas estadísticas
precisas y refinadas para llegar a conclusiones valederas, si estas técnicas no son aplicadas
a datos adecuados o confiables.
Cuando un investigador quiere obtener datos estadísticos relativo a un estudio que desea
efectuar, puede elegir entre una fuente primaria o en su defecto, una secundaria. O
recopilar los datos por sí mismo. La posibilidad mencionada en último termino podrá
deberse bien a la inexistencia de los datos o bien a que esto no se encuentran discriminados
en la forma requerida.
Ejemplo:
Si un investigador quiere conocer el número de alumnos repitientes en educación media,
clasificados por ciclos, para los últimos diez años, el investigador puede usar una fuente
primaria, tal como la memoria y cuenta el Ministerio de Educación cada año.
Método para la recolección de datos:
En estadística se emplean una variedad de métodos distintos para obtener información de
los que se desea investigar. Discutiremos aquí los métodos más importantes, incluyendo las
ventajas y limitaciones de estos.
La entrevistapersonal: los datos estadísticos necesarios para una investigación, se reúnen
frecuentemente mediante un proceso que consiste en enviar un entrevistador o agente,
directamente a la persona investigada. El investigador efectuará a esta persona una serie de
preguntas previamente escritas en un cuestionario o boleta, donde anotará las respuestas
correspondientes. Este procedimiento que se conoce con el nombre de entrevista personal,
permite obtener una información más veraz y completa que la que proporcionan otros
métodos, debido a que al tener contacto directo con la persona entrevistada, el
entrevistador podrá aclarar cualquier duda que se presente sobre el cuestionario o
investigación.
Otra ventaja es la posibilidad que tienen los entrevistadores de adaptar el lenguaje de las
preguntas al nivel intelectual de las personas entrevistadas.
Una de las desventajas de este método se debe a que si el entrevistador no obra de buena fé
o no tiene un entrenamiento adecuado, puede alterar las respuestas por las personas
entrevistadas.
Otra desventaja es su alto costo, ya que resulta bastante oneroso el entrenamiento de los
agentes o entrenadores y los supervisores de estos, sobre todo si se trata de una
investigación extensa.
Cuestionarios por correo: consiste en enviar por correo el cuestionario acompañado por el
instructivo necesario, dando en este no solo las instrucciones pertinentes para cada una de
las preguntas, sino también una breve explicación del objeto de la encuesta con el fin de
evitar interpretaciones erróneas.
Una de las ventajas es que tienen un costo muy inferior al anterior procedimiento, puesto
que no hay que incluir gastos de entrenamiento de personal, el único gasto sería el de
franqueo postal.
Dentro de las desventajas de este procedimiento podemos señalar que solo un porcentaje
bastante bajo de estos es devuelto, en algunos casos no estamos seguros de que los
formularios hayan sido recibidos por sus destinatarios y que hayan sido respondido por
ellos mismos. Lo que trae como consecuencia que la información se obtenga con una serie
de errores difíciles de precisar por el investigador.
Entrevista por teléfono: como lo indica su nombre, este método consiste en telefonear a la
persona a entrevistar y hacerle una serie de preguntas. Este método es bastante simple y
económico, ya que el entrenamiento y supervisión de las personas encargadas de efectuar
las preguntas es siempre fácil.
Entre las limitaciones que presenta este método podemos señalar el número de preguntas
que pueden formularse es relativamente limitado; además las investigaciones efectuadas
por este método tienen un carácter selectivo, debido a que muchas de las personas que
potencialmente podrían ser investigadas no posee servicio telefónico, por lo que quedan sin
la posibilidad de ser entrevistados.
Instrumentos para la recolección de datos:
Cuestionarios:
Cualquiera que sea el método por el que se decida el investigador para recabar
información, es necesario elaborar un estudio de preguntas.
Los cuestionarios en general, constan de las siguientes partes:
a. La identificación del cuestionario: nombre del patrocinante de la encuesta,
(oficial o privada), nombre de la encuesta, número del cuestionario, nombre del
encuestador, lugar y fecha de la entrevista.
b. Datos de identificación y de carácter social del encuestado: apellidos, nombres,
cédula de identidad, nacionalidad, sexo, edad o fecha de nacimiento, estado civil,
grado de instrucción, ocupación actual, ingresos, etc.
c. Datos propios de la investigación, son los datos que interesa conocer para
construir el propósito de la investigación.
Como es natural, estas partes, así como las preguntas, varían de acuerdo a la finalidad de la
encuesta. En algunos tipos de investigación, la parte referente a los datos personales es
eliminada por no tener ningún tipo de interés para el estudio.
Consideraciones que debemos tomar en cuenta:
• El cuestionario debe ser conciso; tratar en los posible de que con el menor número
de preguntas, se obtenga la mejor información.
• Claridad de la redacción; evitar preguntas ambiguas o que sugieran respuestas
incorrectas, por lo que deben estar formuladas las preguntas de la forma más
sencilla.
• Discreción: un cuestionario hecho a conciencia, no debe tener preguntas indiscretas
o curiosas, sobre datos personales que puedan ofender al entrevistado.
• Facilidad de contestación: se deben evitar, en lo posible, las preguntas de respuestas
libres o abiertas y también la formulación de preguntas que requieran cálculos
numéricos por parte del entrevistado.
• Orden de las preguntas: estas deben tener una secuencia y un orden lógico,
agruparlas procurando que se relacionen unas con otras.
Series o distribuciones estadísticas:
Anteriormente hemos señalado que la estadística, no se encarga del estudio de un hecho
aislado, sino que tienen por objeto de los colectivos. Pues bien cuando se realiza una
investigación se obtiene una masa de datos que deben ser organizados para disponerlos en
un orden, arreglo o secuencia lógica, con el fin de facilitar el análisis de los mismos esta
colección de datos numéricos obtenidos de la observación, que se clasifican y ordenan
según un determinado criterio, se denominan "series estadísticas", también conocidas como
"distribución estadística".
Clasificación de las series estadísticas:
1. Ejemplo:
Producción nacional de madera en Rola en m³
Rollizos (periodo 1993 – 1998)

Años Producción (m³ rollizos)

1993 1.161.061,454

1994 981.668,626

1995 1.087.926,142

1996 1.440.306,250

1997 1.618.075,000

1998 1.027.177,876

Fuente: MARN – D.G.S Recurso Forestal. 1999


CVG – PROFORCA
Es importante resaltar que cuando se trata de series temporales o cronológicas, se
debe especificar el instante o el periodo de tiempo a los que se refieren los
caracteres en estudio.
Cuando nos referimos a instantes de tiempo, por el hecho de que la observación se
hace en un momento específico de tiempo.
Ejemplo:
Plantaciones forestales ejecutadas a nivel nacional, al 31 de diciembre de cada año
entre 1997 – 2001.
2. Series temporales o cronológicas; estas se definen como una masa o conjunto de
datos producto de la observación de un fenómeno individual o colectivo,
cuantificable en sucesivos instantes o periodos de tiempo.
3. Series atemporales; cuando las observaciones de un fenómeno se hacen referidas
al mismo instante o intervalo de tiempo, nos encontramos ente una serie atemporal.
Aquí el tiempo no va incluido a cada observación, puesto que es el mismo tiempo
para todas ellas. Este tipo de observación proporciona una "visión instantánea" de
los fenómenos o caracteres de los componentes del colectivo en estudio.
Ejemplo:
Las notas de las participantes en la materia de estadística I en el periodo académico que
terminó en septiembre del 2001.
2.1) series de frecuencia; cuando realizamos un estudio de cada uno de los elementos que
componen la población o muestra bajo análisis, observamos que en general, hay un número
de veces en que aparece repetido un mismo valor de una variable, o bien repeticiones de la
misma modalidad de un atributo. Este número de repeticiones de un resultado, recibe el
nombre de frecuencia absoluta o simplemente frecuencia.
El procedimiento mediante el cual se realiza el conteo, para así determinar el número de
veces que cada dato se repite, recibe el nombre de tabulación.
Ejemplo:
Consideremos las edades de 20 niños, pertenecientes al Preescolar Blanca de Pérez,
ubicado en la urbanización Monseñor Padilla

56543

63454

34653

43646

Tabulando los datos tenemos


Niños distribuidos por edades:

Edad (variable) Nº de niños (Frecuencia)

3 5

4 6

5 4

6 5

Total = 20

Al agrupar los resultados de las observaciones en término de las veces que éstos se repiten,
da lugar a las llamadas "series de frecuencias" o distribuciones de frecuencias; las cuales se
dividen a su vez en series de frecuencia cualitativas y cuantitativas, según que los
caracteres de estudio se refieran a atributos o variables respectivamente.
2.2.1) Series de frecuencia acumulativa: son comúnmente llamadas series de frecuencia
de atributos o caracteres cualitativos y las formas de representar un atributo recibe el
nombre de modalidades.
Cuando se observan y se obtienen los elementos que deseamos estudiar con respecto a un
carácter de tipo cualitativo y se procede a agruparlos según las distintas modalidades que
toma el atributo, "frecuencia cualitativa".
Ejemplo:
Agrupamos los resultados obtenidos al observar los 35 estudiantes de la materia estadística
I, respecto a su estado civil.
Estudiantes de la materia Estadísticas I, clasificados por su estado civil.

Estado civil Nº de Estudiantes (frecuencia)

Solteros 18

Casados 12

Viudos 1

Divorciados 4

2.1.2) Series de frecuencias cualitativas: es el resultado del agrupamiento de los valores


que se repiten (frecuencia) al ser observada una variable.
Ejemplo:
Tomamos nuevamente los 35 estudiantes de la materia estadística I, respecto a su edad.

Edad (en años) Nº de estudiantes (frecuencia)

19 12

20 2

25 8

28 6

32 4

42 3

Total = 35

2.2) series especiales o geográficas: es aquella que está formada por los valores que toman
una variable en función del espacio geográfico.
Gráficos estadísticos
Los gráficos son medios popularizados y a menudo los más convenientes para presentar
datos, se emplean para tener una representación visual de la totalidad de la información.
Los gráficos estadísticos presentan los datos en forma de dibujo de tal modo que se pueda
percibir fácilmente los hechos esenciales y compararlos con otros.
Tipos de gráficos estadísticos
• Barras
• Líneas
• Circulares
• Áreas
• Cartogramas
• Mixtos
• Histogramas
Otros
• Dispersograma
• Pictogramas
Gráficos de barras verticales
(Llamados por algunos software de columnas)
Representan valores usando trazos verticales, aislados o no unos de otros, según la variable
a graficar sea discreta o continua. Pueden usarse para representar:

• una serie
• dos o más series (también llamado de barras comparativas)

Gráficos de barras horizontales


Representan valores discretos a base de trazos horizontales, aislados unos de otros. Se
utilizan cuando los textos correspondientes a cada categoría son muy extensos.
• para una serie
• para dos o más series
Gráficos de barras proporcionales
Se usan cuando lo que se busca es resaltar la representación de los porcentajes de los datos
que componen un total.

Las barras pueden ser:


• Verticales
• Horizontales

Gráficos de barras comparativas


Se utilizan para comparar dos o más series, para comparar valores entre categorías.
Las barras pueden ser:
• Verticales
• horizontales

Gráficos de barras apiladas


Se usan para mostrar las relaciones entre dos o más series con el total.
Las barras pueden ser:

• verticales
• horizontales
Gráficos de líneas
En este tipo de gráfico se representan los valores de los datos en dos ejes cartesianos
ortogonales entre sí.
Se pueden usar para representar:
• una serie
• dos o más series

Estos gráficos se utilizan para representar valores con grandes incrementos entre sí.

Gráficos circulares
Estos gráficos nos permiten ver la distribución interna de los datos que representan un
hecho, en forma de porcentajes sobre un total. Se suele separar el sector correspondiente al
mayor o menor valor, según lo que se desee destacar.
Se pueden ser:
• En dos dimensiones
• en tres dimensiones

Gráficos de Áreas
En estos tipos de gráficos se busca mostrar la tendencia de la información generalmente en
un período de tiempo.
Pueden ser:
• Para representar una serie
• para representar dos o más series
• en dos dimensiones
• en tres dimensiones.
Cartogramas
Estos tipos de gráficos se utilizan para mostrar datos sobre una base geográfica. La
densidad de datos se puede marcar por círculos, sombreado, rayado o color.

Gráficos Mixtos
En estos tipos de gráficos se representan dos o más series de datos, cada una con un tipo
diferente de gráfico. Son gráficos más vistosos y se usan para resaltar las diferencias entre
las series.
Pueden ser:
• en dos dimensiones
• en tres dimensiones.
Histogramas
Estos tipos de gráficos se utilizan para representa distribuciones de frecuencias. Algún
software específico para estadística grafican la curva de gauss superpuesta con el
histograma.

OTROS Gráficos
En esta categoría se encuentran la mayoría de los gráficos utilizados en publicidad. Se los
complementa con un dibujo que esté relacionado con el origen de la información a mostrar.
Son gráficos llamativos, atraen la atención del lector.
Dispersograma
Los dispersogramas
Son gráficos que se construyen sobre dos ejes ortogonales de coordenadas, llamados
cartesianos, cada punto corresponde a un par de valores de datos x e y de un mismo
elemento suceso.

Pictogramas
Los pictogramas son gráficos similares a los gráficos de barras, pero empleando un dibujo
en una determinada escala para expresar la unidad de medida de los datos. Generalmente
este dibujo debe cortarse para representar los datos.
Es común ver gráficos de barras donde las barras se reemplazan por dibujos a diferentes
escalas con el único fin de hacer más vistoso el gráfico, estos tipos de gráficos no
constituyen un pictograma.

Pueden ser:

• En dos dimensiones
• En tres dimensiones.
Conclusión
Hasta ahora sólo hemos utilizado unos tipos de gráfico muy comunes como el gráfico de
columnas por ejemplo. Sin embargo, hoy día Excel dispone de muchos más tipos de
gráficos.
Cada tipo de gráfico se diferencia de los demás por la clase de marcas de datos que utiliza.
Por ejemplo, el gráfico de columnas utiliza columnas como marcas de datos; el de círculos,
utiliza círculos; etc.
El motivo de que haya tantos tipos de gráficos diferentes no es solamente estético. Cada
uno de los tipos de gráficos está especialmente indicado para representar los datos de una
manera distinta. Por lo tanto, si quieres obtener la máxima eficacia al crear tus gráficos y
presentar tus datos de la mejor manera posible debes tener esto muy en cuenta; que cada
tipo de grafico esta destinado para una labor especifica.

Generalmente se parte de la información representada en tablas antes de de poder llevar a


cabo el aspecto gráfico. La representación más común utilizada en la estadística
descriptiva se encuentra la siguiente:

• Diagramas de barras. Se utiliza para representar datos cualitativos y cuantitativos,


con datos de tipo discreto. En el eje x se representan los datos ordenados en clases
mientras que en el eje y se pueden representar frecuencias absolutas o relativas.
• Histogramas.

Los histogramas de frecuencias son gráficas que representan un conjunto de datos que
se emplean para representar datos de una variable cuantitativa. En el eje horizontal o de
las abscisas se representan los valores tomados por la variable, en el caso de que los
valores considerados sean continuos la forma de representar los valores es mediante
intervalos de un mismo tamaño llamados clases. En el eje vertical se representan los
valores de las frecuencias de los datos. Las barras que se levantan sobre la horizontal y
hasta una altura que representa la frecuencia. Un punto importante en el manejo de la
información bajo el uso de histogramas es el hecho de poder comparar, bajo un proceso
en control, que a medida que se crecen las clase tiene aproximadamente la forma de
una campana centrada, que como veremos posteriormente, es la de una de las
distribuciones mas importantes conocidas como frecuencia normal o gaussiana.
• Polígono de frecuencias

Alternativo al histograma de frecuencias podemos representar la información a través de


los llamados polígonos de frecuencias. Estos se construyen a partir de los puntos medios de
cada clase. La utilización de los puntos medios o marcas de clase son llevados al escenario
gráfico mediante la utilización de los polígonos de frecuencias. Se construye uniendo los
puntos medios de cada clase localizados en las tapas superiores de los rectángulos
utilizados en los histogramas de las gráficas. Su utilidad se hace necesaria cuando desean
destacarse las variables de tendencia central, como son media, modas y medianas.
• Diagrama de sectores

Este tipo de diagramas puede ser de dos tipo, se puede considerar una figura geométrica en
la que la información se distribuye dentro de la figura como puede ser una dona o un anillo
en el que cada porción dentro de la figura representa la información porcentual del total de
datos. La segunda opción es la utilización de pasteles en los que una porción del pastel
determinada por sectores individuales la información para ese sector especifico.
• Cartogramas.

Son gráficos en los que se puede agrupar para una misma clase diferentes frecuencias, por
lo que se hace apropiado su uso cuando se desea analizar tres diferentes resultados
obtenidos, con diferentes frecuencias pero con una misma clase.
• Pirámides de población.

Este gráfico se construye utilizando pirámides para construir la representación de los datos
bajo cierta clase, la diferencia de información considerada entre cada clase será dada por el
tamaño de la pirámide. En ocasiones la frecuencia de cada clase se coloca en el extremo
superior de cada clase, sin embargo también, al igual que en las anteriores puede resultar
útil colocar información, como el porcentaje de información en la punta de cada pirámide.

• Diagramas lineales.

El diagrama lineal representa la información comparando las clases y frecuencias. En


cierta forma el polígono de frecuencias corresponde a un diagrama lineal, esto debido a
que se utilizan este tipo de diagramas para obtener la gráfica de la información. En otras
ocasiones la comparación de las clases son números con respecto a números, como el
ejemplo que se muestra a continuación. Los diagramas lineales suelen utilizarse para
destacar la dependencia entre dos variables, como veremos en le tema de dependencia
lineal.
• Pictogramas

El pictograma consiste en la utilización de símbolos utilizados para representar un conjunto


de datos, en el caso de la representación de datos individuales a través de barras hemos
utilizado los pictogramas, sin embargo en áreas especificas convendría analizar el conjunto
de datos.
HISTOGRAMAS

Histograma
En estadística, un histograma es una representación gráfica de una variable en forma de
barras, donde la superficie de cada barra es proporcional a la frecuencia de los valores
representados. En el eje vertical se representan las frecuencias, y en el eje horizontal los
valores de las variables, normalmente señalando las marcas de clase, es decir, la mitad del
intervalo en el que están agrupados los datos.
En términos matemáticos, puede ser definida como una función inyectiva (o mapeo) que
acumula (cuenta) las observaciones que pertenecen a cada subintervalo de una partición. El
histograma, como es tradicionalmente entendido, no es más que la representación gráfica
de dicha función.
Se utiliza cuando se estudia una variable continua, como franjas de edades o altura de la
muestra, y, por comodidad, sus valores se agrupan en clases, es decir, valores continuos.
En los casos en los que los datos son cualitativos (no-numéricos), como sexto grado de
acuerdo o nivel de estudios, es preferible un diagrama de sectores.
Los histogramas son más frecuentes en ciencias sociales, humanas y económicas que en
ciencias naturales y exactas. Y permite la comparación de los resultados de un proceso.

Tipos de histograma
• Diagramas de barras simples
Representa la frecuencia simple (absoluta o relativa) mediante la altura de la barra
la cual es proporcional a la frecuencia simple de la categoría que representa.
• Diagramas de barras compuesta
Se usa para representar la información de una tabla de doble entrada o sea a partir
de dos variables, las cuales se representan así; la altura de la barra representa la
frecuencia simple de las modalidades o categorías de la variable y esta altura es
proporcional a la frecuencia simple de cada modalidad.
• Diagramas de barras agrupadas
Se usa para representar la información de una tabla de doble entrada o sea a partir
de dos variables, el cual es representado mediante un conjunto de barras como se
clasifican respecto a las diferentes modalidades.
• Polígono de frecuencias
Es un gráfico de líneas que se usa para presentar las frecuencias absolutas de los
valores de una distribución en el cual la altura del punto asociado a un valor de las
variables es proporcional a la frecuencia de dicho valor.
• Ojiva porcentual
Es un gráfico acumulativo, el cual es muy útil cuando se quiere representar el rango
porcentual de cada valor en una distribución de frecuencias.
En los gráficos las barras se encuentran juntas y en la tabla los números poseen en el
primer miembro un corchete y en el segundo un parentesis, por ejemplo: (10-20]
Construcción de un histograma
• Paso 1
Determinar el rango de los datos. Rango es igual al dato mayor menos el dato menor.
• Paso 2
Obtener los números de clases, existen varios criterios para determinar el número de clases
(o barras) -por ejemplo la regla de Sturgess-. Sin embargo ninguno de ellos es exacto.
Algunos autores recomiendan de cinco a quince clases, dependiendo de cómo estén los
datos y cuántos sean. Un criterio usado frecuentemente es que el número de clases debe ser
aproximadamente a la raíz cuadrada del número de datos. Por ejemplo, la raíz cuadrada de
30 ( número de artículos) es mayor que cinco, por lo que se seleccionan seis clases.
• Paso 3
Establecer la longitud de clase: es igual al rango dividido por el número de clases.
• Paso 4
Construir los intervalos de clases: Los intervalos resultan de dividir el rango de los datos en
relación al resultado del PASO 2 en intervalos iguales.
• Paso 5
Graficar el histograma: En caso de que las clases sean todas de la misma amplitud, se hace
un gráfico de barras, las bases de las barras son los intervalos de clases y altura son la
frecuencia de las clases. Si se unen los puntos medios de la base superior de los rectángulos
se obtiene el polígono de frecuencias.

El histograma de una imagen representa la frecuencia relativa de los niveles de gris de la


imagen. Las técnicas de modificación del histograma de una imagen son útiles para
aumentar el contraste de imágenes con histogramas muy concentrados.
Sea u una imagen de tamaño NxN, la función de distribución del histograma es: Fu(l) =
(Numerodepixels(i,j)talesqueu(i,j) < = l) / N2

Ejemplos de otros tipos de representaciones gráficas: Hay histogramas donde se agrupan


los datos en clases, y se cuenta cuántas observaciones (frecuencia absoluta) hay en cada
una de ellas. En algunas variables (variables cualitativas) las clases están definidas de
modo natural, p.e sexo con dos clases: mujer, varón o grupo sanguíneo con cuatro: A, B,
AB, O. En las variables cuantitativas, las clases hay que definirlas explícitamente
(intervalos de clase).
Se representan los intervalos de clase en el eje de abscisas (eje horizontal) y las
frecuencias, absolutas o relativas, en el de ordenadas (eje vertical).
A veces es más útil representar las frecuencias acumuladas.
O representar simultáneamente los histogramas de una variable en dos situaciones distintas.
Otra forma muy frecuente, de representar dos histogramas de la misma variable en dos
situaciones distintas.
En las variables cuantitativas o en las cualitativas ordinales se pueden representar
polígonos de frecuencia en lugar de histogramas, cuando se representa la frecuencia
acumulativa, se denomina ojiva.
POLIGONOS DE FRECUENCIAS
Un polígono de frecuencias se forma uniendo los extremos de las barras de un diagrama
de barras mediante segmentos.
También se puede realizar trazando los puntos que representan las frecuencias y
uniéndolos mediante segmentos.
Ejemplo
Las temperaturas en un día de otoño de una ciudad han sufrido las siguientes variaciones:

Hor Temperat
a ura

6 7º

9 12°

12 14°

15 11°

18 12°

21 10°

24 8°
Polígonos de frecuencia para datos agrupados
Para construir el polígono de frecuencia se toma la marca de clase que coincide con el
punto medio de cada rectángulo de un histograma.

Ejemplo
El peso de 65 personas adultas viene dado por la siguiente tabla:
ci fi Fi

[50, 60) 55 8 8

[60, 70) 65 10 18

[70, 80) 75 16 34

[80, 90) 85 14 48

[90, 100) 95 10 58

[100, 110) 110 5 63


[110, 120) 115 2 65

65

Polígono de frecuencias acumuladas


Si se representan las frecuencias acumuladas de una tabla de datos agrupados se
obtiene el histograma de frecuencias acumuladas o su correspondiente polígono.
GRAFICA DE CAJA
Diagrama de caja
Diagrama de caja (Box-Plot).
Un diagrama de caja es un gráfico, basado en cuartiles, mediante el cual se visualiza un
conjunto de datos. Está compuesto por un rectángulo, la "caja", y dos brazos, los "bigotes".
Es un gráfico que suministra información sobre los valores mínimo y máximo, los cuartiles
Q1, Q2 o mediana y Q3, y sobre la existencia de valores atípicos y la simetría de la
distribución.

Cómo expresarlo gráficamente


+-----+-+
* o |-------| | |---|
+-----+-+

+---+---+---+---+---+---+---+---+---+---+---+---+
0 5 10 12
• Ordenar los datos y obtener el valor mínimo, el máximo, los cuartiles Q1, Q2 y Q3
y el Rango Inter Cuartilico (RIC)
En el ejemplo:
• Valor 7: es el Q1 (25% de los datos)
• Valor 8.5: es el Q2 o mediana (el 50% de los datos)
• Valor 9: es el Q3 (75% de los datos)
• Rango Inter Cuartilico RIC (Q3-Q1)=2
• Para dibujar los bigotes, las líneas que se extienden desde la caja, hay que calcular
los límites superior e inferior, Li y Ls, que identifiquen a los valores atípicos.
Para ello se calcula cuándo se consideran atípicos los valores. Son aquellos
inferiores a Q1-1.5*RIC o superiores a Q3+1.5*RIC.
En el ejemplo:
• inferior: 7-1.5*2=4
• superior: 9+1.5*2=12
Ahora se buscan los últimos valores que NO son atípicos, que serán los extremos
de los bigotes.
• En el ejemplo: 5 y 10
• Marcar como atípicos todos los datos que están fuera del intervalo (Li, Ls).
En el ejemplo: 0.5 y 3.5
• Además, se pueden considerar valores extremadamente atípicos aquellos que
exceden Q1-3*RIC o Q3+3*RIC.
De modo que, en el ejemplo:
• inferior: 7-3*2=1
• superior: 9+3*2=15
Utilidad
• Proporcionan una visión general de la simetría de la distribución de los datos; si la
mediana no está en el centro del rectángulo, la distribución no es simétrica.
• Son útiles para ver la presencia de valores atípicos también llamados outliers.

También podría gustarte