Apuntes Sobre Estadistica

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 38

Apuntes sobre Estadstica

APUNTES SOBRE ESTADISTICA


(Borrador para correccin)

Hctor Medina Disla

Santo domingo, D. N.
Junio 2010

Elaborado por H. Medina Disla. Junio 2010.

Apuntes sobre Estadstica

I. INTRODUCCION
Estadstica: Es una metodologa cientfica que permite recolectar, organizar y
procesar datos que proporcionen informacin que sirvan de base
para la
toma de decisin. Por ejemplo aplicar una encuesta para conocer la preferencia
del electorado, aplicar un tratamiento especial a un grupo de personas y
observar el resultado, buscar datos sobre la matrcula estudiantil, u otro tema
en particular. En cambio, cuando hablamos de Estadsticas nos referimos a
un conjunto de medidas o indicadores que describen el comportamiento de
un fenmeno de inters en
un momento determinado. Por ejemplo, el
porcentaje de lectores que prefieren a un candidato en particular, el tiempo
necesario para realizar unas tarea, las unidades producidas diariamente por
una empresa, las ventas de una empresa, etc.
Es decir que las estadsticas representan el fin u objetivo que buscamos y
la Estadstica el medio para conseguirlo.
1.1

DIVISION DE LA ESTADISTICA

La Estadstica como metodologa cientfica se divide en dos ramas, la


Estadstica Descriptiva y la Estadstica Inferencial
Estadstica Descriptiva: Es un conjunto de mtodos y tcnicas que
permiten describir un conjunto especfico de datos. La Estadstica Descriptiva
como su nombre lo indica, describe un grupo particular. Sus principales
herramientas son.
1) Clculo de porcentaje y tasas
2) Presentacin tabular, (cuadros y tablas)
3) Presentacin grfica
4) Clculo de medidas de Medidas de Tendencia Central, (promedios)
5) Clculo de medidas de dispersin o variabilidad
6) Clculo de nmeros ndice.
7) Otras tcnicas descriptivas.
Estadstica Inferencial: Se refiere a un conjunto de mtodos y tcnicas que
permite obtener informacin acerca de una poblacin completa, con solo
estudiar una parte de ella (muestra). La Estadstica Inferencial nos permite
llevar los resultados obtenidos en una muestra a la poblacin. Sus principales
herramientas son: Clculo
de probabilidades, muestreo y distribucin
muestral, estimacin, prueba de hiptesis, anlisis de varianza, anlisis de
regresin y correlacin, otras.
1.2. Conceptos y Definiciones

Elaborado por H. Medina Disla. Junio 2010.

Apuntes sobre Estadstica


1. Poblacin: Es un conjunto de elementos con caractersticas parecidas o
similares y que son de inters para la realizacin de un estudio. En trminos
estadsticos una poblacin se define de acuerdo a lo que se desea investigar o
estudiar. Por ejemplo si queremos conocer el rendimiento escolar de los/as
nios/as de la educacin bsica, entonces nuestra poblacin va a estar
definida por la cantidad de nios/as inscrito en los curso de la educacin
bsica o si queremos evaluar la calidad de la produccin de una empresa,
nuestra poblacin estar formada por todas las unidades producidas por la
empresa durante el periodo de inters.
Muestra: Es un subconjunto de la poblacin que se toma para fines de
desarrollar una investigacin. Cuando un estudio se hace a partir de una
muestra, esta debe ser representativa y significativa.
Se dice que una muestra es representativa cuando los elementos que
componen dicha muestra contienen las mismas caractersticas
que los
elementos en la poblacin de la cual se tom dicha muestra, el concepto de
representatividad se refiere a los aspectos cualitativos de la muestra. Por
ejemplo si quisiramos conocer la preferencia poltica de los estudiantes de la
UASD una muestra sera representativa si en la misma se incluyen estudiantes
de todas las edades, de todas las carreras, de ambos sexo, de todos los centros
regionales, etc. de forma
tal que al observar la muestra es como si
observramos la poblacin en miniatura.
Por su parte el concepto de significacin tiene que ver con la cantidad de
elementos que conforma la muestra. En este sentido, no existe un nmero de
elementos especfico para que una muestra sea significativa, sino, que la
cantidad de elementos necesarios para que la muestra sea significativa vara
de acuerdo a la caractersticas de la poblacin. Si la poblacin a estudiar es
muy variable, se requerir de un mayor nmero de elementos para que la
muestra sea significativa que si la poblacin tiende a ser homognea, en cuyo
caso un muestra pequea puede ser significativa.
2. Parmetro: Es una medida de referencia la cual se calcula a partir de
datos de una poblacin completa. El parmetro se refiere a la medida de una
variable en la poblacin. Por ejemplo, cuando se aplican las Pruebas
Nacionales y se obtiene el promedio de las calificaciones, esta medida es un
parmetro de las calificaciones de los estudiantes.
3. Estimador o Estadgrafo: Es una medida calculada a partir de los datos
obtenidos en una muestra y se utiliza para estimar el valor del parmetro, ya
que en la mayora de los casos, se hace difcil y muy costoso conocer el valor
real o verdadero de la variable. Por ejemplo cuando se toma una muestra para
conocer la preferencia poltica de la poblacin, los porcentajes que se obtienen
a partir de la encuesta son estimadores del porcentaje de real de preferencia de
todos/as las votantes.

Elaborado por H. Medina Disla. Junio 2010.

Apuntes sobre Estadstica

1.3 FUENTES DE DATOS


Ya se ha dicho que la Estadstica es una metodologa cientfica que permite
obtener datos que al ser procesados se convierten en estadsticas o indicadores
relacionados a una o mltiples variables. Podemos decir entonces que el
quehacer de la Estadstica se centra en dar respuestas a una serie de
preguntas o interrogantes que surgen en un momento determinado sobre un
tema en particular, por ejemplo, Cul es la bebida gaseosa preferida por la
poblacin?, por qu las personas prefieren un banco en particular para
depositar sus ahorros?, qu porcentaje de la produccin est saliendo
defectuoso?, cul ser el nivel de precios para el prximo semestre?, Cmo
podemos motivar a los/as estudiantes?, cul mtodo de enseanza es ms
efectivo para lograr el aprendizaje en los/as estudiantes? y as sucesivamente.
Para dar respuestas a estas preguntas debemos recurrir a la bsqueda de
datos y en tal sentido debemos de responder a las siguientes preguntas cules
son las fuentes para obtener datos? O de donde obtendremos datos para dar
respuesta a nuestra pregunta?
En primer lugar vamos a clasificar las fuentes de datos atendiendo al origen de
los datos y en este sentido las fuentes de datos pueden ser primarias y
secundarias. Las fuentes de datos primarias son aquellas en las cuales los
datos son generados por quien o quienes realizan la investigacin, es decir que
son datos de primera mano, hechos a la medida como lo seala Dillon1, es
decir que las fuentes primarias se utilizan para cubrir una necesidad de
informacin especfica.
1.3.1 Fuentes primarias de datos
Las principales fuentes primarias de datos son el Censo, La Encuesta o
Estudios por Muestreo y Los Experimentos.
1. Censo: Es un tipo de investigacin en la cual se estudian todos los
elementos de una poblacin determinada. El censo tiene las ventajas de que
proporciona
informacin sobre una poblacin completa, con un bajo
margen de error y adems permite la ubicacin fsica de cada uno de los
miembros de la poblacin. Tiene la desventaja de que resulta muy costoso en
trminos econmicos, de tiempo y de materiales.
2. Estudios por Muestreo: Son estudios en los cuales solo se estudia una
parte de la poblacin, es decir una muestra. Los estudios por muestreo tienen
las ventajas de que proporcionan informacin til y confiable sobre una
1

William Dillon, Thomas J. Madden y Neil H. Firtle: La Investigacin de Mercados. Entornos de


Marketing

Elaborado por H. Medina Disla. Junio 2010.

Apuntes sobre Estadstica


poblacin en corto tiempo y adems resultan menos costosos que un censo.
Tienen las desventajas de que no proporcionan informacin sobre la ubicacin
fsica de de los elementos de una poblacin y de que si no se disea de manera
adecuada
puede
proporcionar
informacin
distorsionada
sobre
el
comportamiento del fenmeno que se est estudiando.
3. Experimentos: Son estudios especializados en los cuales un grupo de
elementos de la poblacin es sometido a un tratamiento o condicin especial y
los resultados obtenidos
con dicho tratamiento
se comparan con los
resultados de otro grupo que no ha sido sometido al tratamiento o con los del
mismo grupo cuando no ha sido sometido al tratamiento o condicin especial.
El grupo sometido al tratamiento recibe el nombre de grupo experimental y el
grupo con el cual se comparan los resultados recibe el nombre de grupo de
control.
El objetivo principal de los diseos experimentales es conocer el efecto que
tiene en la poblacin estudiada la exposicin de esta a un tratamiento o
condicin especial.
1.3.2 Fuentes secundarias de datos
Las fuentes secundarias son aquellas en las cuales los datos se encuentran
publicados en forma de reportes. Las fuentes de datos secundarias pueden ser
externas o internas. Las fuentes secundarias internas son aquellas en las
cuales los reportes son el resultado del registro de las actividades de quien
lleva a cabo la investigacin, en cambio las fuentes secundarias externas son
aquellas en las cuales los datos se encuentran en reportes o publicaciones
realizados por entidades ajenas a quien o quienes realizan la investigacin.
Las principales fuentes secundarias de datos son los registros internos de la
empresa y los reportes de datos de otras organizaciones o externos.
1. Registros internos de la organizacin: son fuentes secundarias de
datos y se refieren al conjunto de datos que se origina como resultado
del
registro continuo y sistemtico
de las actividades de una
organizacin.
2. Reportes de datos externos: es un conjunto de datos que pueden ser de
inters para dar respuesta a nuestras interrogantes y que han sido
generado por organizaciones o entidades externas a quien realiza la
investigacin.
Los registros externos como fuente de informacin tienen las ventajas de
que son de fcil acceso, tienen un costo ms bajo que las dems fuentes de
datos y adems estn disponibles en el momento requerido. Tienen la
desventaja de que quien realiza la investigacin
no dispone de los
mecanismos de control para garantizar la calidad y la confiabilidad de los

Elaborado por H. Medina Disla. Junio 2010.

Apuntes sobre Estadstica


datos incluidos en los reportes, as como el formato y la cantidad de datos
existentes no siempre se corresponde con los requeridos por el investigador.

1.4 VARIABLES Y SU CLASIFICACIN


Una Variable es una caracterstica que puede variar de un elemento a otro en
la poblacin estudiada. Ejemplos: peso corporal de las personas, tamao las
aulas universitarias,
estatura de las personas, nmero de asignaturas
cursadas por los estudiantes por semestre, etc.
Las variables se dividen en dos grupos: Cualitativas y Cuantitativas
Variables cualitativas: son aquellas variables que describen una cualidad o
atributo en el elemento
estudiado, estas variables responden la pregunta
cul?, ejemplos de estas variables pueden ser: religin que profesan los
dominicanos, partido poltico preferido, color de la piel, sexo de los y las
estudiantes, raza, carrera estudiada, etc.
Variables cuantitativas: son aquellas variables que describen una cantidad
en el elemento estudiado. Las variables cuantitativas responden la pregunta
cunto?, por ejemplo: nmero de estudiante por aula, venta diaria de una
empresa, nmero de hijos por familia, estatura de los estudiantes que cursan
estadstica en este semestre, etc.
Las variables cuantitativas
discontinuas o discretas.

se dividen en dos categoras: Continuas y

Variables cuantitativas continuas: son aquellas


variables cuantitativas
cuyos resultados pueden expresarse en nmeros fraccionarios o decimales.
Estas variables provienen de un proceso de medicin, por ejemplo
el nivel
de ingreso de las personas, consumo familiar, estatura de las personas, gasto
diario de los estudiantes, etc.
Variables cuantitativas discontinuas o discretas: son aquellas variables
cuantitativas cuyos resultados se expresan en nmeros enteros, es decir que
no admiten valores decimales. Las variables cuantitativas discontinuas o
discretas provienen de un proceso de conteo, por ejemplo nmero de
asignaturas por estudiante, nmero de estudiantes por aula, nmero de
personas que llega a un restaurante de comida rpida, etc.
Obsrvese que las variables cuantitativas continuas pueden expresarse en
nmero fraccionarios y las discretas o discontinuas se expresan en nmeros
enteros, por lo que, aunque en muchas ocasiones expresamos una variable en
nmero enteros, no significa que sea discreta, por ejemplo, el gasto en
transporte, mayormente lo expresamos en nmero entero, sin embargo, es una

Elaborado por H. Medina Disla. Junio 2010.

Apuntes sobre Estadstica


variable continua, pues el resultado admite valores fraccionarios, pero el
nmero de asignaturas cursada por ejemplo solo se expresa en nmero enteros
pues no admite valores fraccionarios.
1.5 MEDICION Y ESCALA DE MEDICIN
Daniel2 seala cuando la mayora de las personas escuchan o leen la palabra
medicin piensan en actividades tales como usar cintas mtricas para
determinar la longitud, anchura o circunferencia de algn objeto, pesar un
objeto o persona, y determinar el volumen de alguna sustancia como cuando
un cocinero mezcla las cantidades de ingredientes especficas de una receta. A
la palabra medicin, sin embargo, puede drsele una definicin ms cientfica
que la acostumbrada
En efecto la medicin va ms all de determinar cantidad, longitud, volumen o
cualquier otra medida de inters. En el mbito de la Estadstica cuando nos
referimos a medicin llegamos un poco ms profundo, as por ejemplo
hablamos de la medicin de la personalidad, de la medicin de los niveles de
tolerancia, los niveles de preferencia por un servicio o un producto, etctera.
Para el desarrollo de este curso enteremos por Medicin al proceso mediante el
cual se le asigna un numeral (nmero, letra o smbolo) a una variable. Por
ejemplo si estamos realizando una investigacin sobre las caractersticas de la
poblacin estudiantil podremos incluir variables como la edad, el sexo, el
nmero de asignaturas cursadas el gasto diario, percepcin sobre los servicios
de la biblioteca, las asignaturas ms preferidas y muchas otras variables.
En cada una de estas variables tendremos una medicin en cada uno de los
elementos estudiados, as por ejemplo, para la edad nos referiremos a los aos
cumplidos y por lo tanto tendremos medidas numricas, (23, 21, 19, 35,..),
para la variable sexo podramos asignarle un nmero por ejemplo uno para
masculino y dos para femenino o viceversa, pero de igual forma podramos
asignarle una letra, M para los masculinos y F para las femeninas o un smbolo
para diferenciar cada sexo, de la siguiente manera para los masculinos y
para las femeninas
De igual forma para la variable nmero de asignaturas de registrara el nmero
que representa la cantidad de asignaturas inscrita, por ejemplo, 3, 6, 5, 4,
y par la variable gasto tambin se registrara el nmero que representa el
monto del gasto diario, 100, 150, 60, 180, . y la variable relacionada con la
percepcin sobre los servicios de la biblioteca podemos asignarle una
calificacin desde cero a cinco, tomando el cero como una percepcin de los

Wayne W., Daniel & James C. Terrell: Estadstica para Administracin y Economa Tomo I. Editora
McGraw-Hill. 7. Edicin. Junio 2000.

Elaborado por H. Medina Disla. Junio 2010.

Apuntes sobre Estadstica


servicios como muy malos y cinco una percepcin de que los servicios son
excelentes.
Para la variable relacionada con las asignaturas ms preferidas, podramos
establecer un registro en orden de importancia, para que la persona estudiada
nos diga en orden de preferencia cuales son las asignaturas preferidas, en tal
sentido podramos establecer el primer lugar para la ms preferida, el segundo
para la segunda ms preferida y as, sucesivamente.
Lo que se quiere sealar es que hay diferente forma en como podemos
establecer la medicin para una variable, es decir que hay diferente tipo de
escala para medir una o mltiples variables, pudiendo entonces establecer una
definicin para la escala de medicin.
Escala de Medicin: Es la forma en como se mide una variable, es decir
que la escala de medicin es el proceso mediante el cual se le asigna un
numeral a cada variable. Existen cuatro tipos de escala de medicin:
nominal, ordinal, de intervalo y de razn o proporcin.
Escala Nominal: Es aquella escala de medicin en la cual los numerales
asignados a cada valor o atributo no representa ningn orden de jerarqua,
de importancia o preferencia. En este tipo de escala los numerales solo se
utilizan para identificar los valores o atributos de cada variable. Ej.: los
numerales o cdigos asignados a las variables cualitativas, los nmeros
asignados a los integrantes de un equipo bisbol, la matrcula estudiantil, etc.
Escala Ordinal: Es aquella escala en la cual los numerales se asignan a cada
variable de acuerdo a un orden de jerarqua, importancia o de preferencia.
En este tipo de escala, cada numeral
representa un tramo jerrquico, de
preferencia o de importancia. Ej.: los cdigos asignados a los cargos en una
empresa, preferencia de un producto segn su orden de importancia, el
nmero asignado a las placas de los vehculos oficiales, etc.
Tanto la escala ordinal como la nominal se usan en la medicin de variables
cualitativas.
Escala de Intervalo: Es una escala cuantitativa cuya caracterstica principal,
es que no parte de un cero absoluto, es decir que el punto a partir del cual se
empieza a medir es arbitrario. En este tipo de escala la presencia del cero
como de medida de la variable no representa ausencia de la variable. Ej.: Las
escalas usadas para medir la temperatura, la intensidad de un temblor de
tierra, coeficiente inteligente, etc.
Escala de Razn o Proporcin: Es una escala cuantitativa cuya caracterstica
principal es que el proceso de medicin de inicia a partir de un cero absoluto,
es decir, que la presencia del cero como medida de la variable significa la

Elaborado por H. Medina Disla. Junio 2010.

Apuntes sobre Estadstica


ausencia de esta. A este tipo de escala corresponden la mayora de las
variables con que trabajamos a diario, ejemplo, peso corporal, tamao de las
personas, consumo familiar, ventas de una empresa, distancia recorrida,
unidades producidas, distancia recorrida diariamente, etc.
1.6 PASOS DE UNA INVESTIGACIN ESTADSTICA
Cuando nos planteamos una interrogante sobre un tema en particular, nos
vemos en la necesidad de buscar datos que nos proporcionen las informaciones
necesarias para dar respuesta a dicha interrogante, este proceso de bsqueda
de datos conlleva la realizacin de una investigacin la cual requiere de cinco
pasos fundamentales3: planeacin, diseo de la investigacin, recoleccin de
datos, procesamiento y anlisis y presentacin de resultados.
Figura no. 1: Pasos de una investigacin

Diseo del
Estudio

Planeacin

Anlisis y
presentacin

Recoleccin
de datos
Procesamiento

Aunque estos pasos pueden y varan atendiendo a los criterios del investigador
en trminos generales estos pasos representan el proceso lgico de una
investigacin aunque reciban diferentes nombres. A continuacin se hace una
descripcin breve de cada uno de estos.
1. Planeacin: Es la fase en la cual se definen los aspectos administrativo y
operativos de la investigacin. Esta fase comprende entre otras actividades, el
establecimiento de los objetivos: general y especficos, alcance de la
investigacin, poblacin de estudio, presupuesto necesario, cronograma de
actividades y plan de anlisis o resultados esperados.
2. Diseo del estudio: En esta fase se define y se disea el instrumento de
recoleccin de datos (cuestionario, entrevistas, observacin, entre otros) y se
3

Ver a Lincoln L. Chao: Estadstica para las Ciencias Administrativas. Tercera Edicin. Editora
McGraw-Hill

Elaborado por H. Medina Disla. Junio 2010.

Apuntes sobre Estadstica


define adems, la metodologa a seguir para la aplicacin del instrumento de
recoleccin de datos.
3. Recoleccin de datos: Es la fase que requiere de ms tiempo y consiste en
la aplicacin del instrumento de recoleccin de datos definido en el diseo del
estudio de acuerdo a la metodologa establecida. En esta fase la persona a
cargo de la investigacin y su equipo de trabajo se lanzan al terreno para
recolectar los datos que una vez procesados darn respuestas a los objetivos de
la investigacin.
4. Procesamiento de datos: Es la fase en la cual se obtienen los cuadros y
tablas, as como las medidas o indicadores estadsticas que permiten describir
el comportamiento de la poblacin estudiada, as como dar respuestas a los
objetivos planteados en la fase de planeacin. La fase de procesamiento de los
datos conlleva cuatro actividades esenciales previas: Limpieza y organizacin
de los datos, codificacin, digitacin y edicin.
La limpieza y organizacin de los datos se refiera al proceso mediante el cual se
verifican la calidad de los datos obtenidos, se enumeran los instrumentos de
recoleccin de datos utilizados, verificacin del cumplimiento de las metas en
cuanto a la cantidad y calidad. La codificacin por su parte es la actividad que
permite asignar un cdigo numrico a cada respuesta del instrumento de
recoleccin de datos. Esto se hace con la finalidad de facilitar el proceso de
digitacin.
La digitacin es el proceso mediante el cual los datos son introducidos al
computador con el fin de que el procesamiento sea ms eficiente. La edicin por
su parte es un proceso de verificacin, es decir, con la edicin de los datos
verificamos que se haya digitado lo que realmente se ha respondido en el
instrumento de recoleccin de datos.
5. Anlisis y presentacin de resultados: Es la fase es la cual se analizan
los resultados obtenidos, estableciendo descripcin de la poblacin estudiada,
comparaciones y asociaciones entre variables, inferencias muestrales, entre
otras. En la fase de procesamiento y adems se dan a conocer los resultados
obtenidos en la investigacin.
Veamos un ejemplo relacionado con el proceso de investigacin. En el semestre
2006-1 de la UASD, el trabajo final de un grupo de estudiantes fue medir el
rendimiento, (tomando para ello el promedio de las calificaciones) de un grupo
de estudiantes tanto en las escuelas pblicas como en las escuelas privadas.
De esta forma la poblacin estaba definida, as como los objetivos del trabajo
de investigacin.

Elaborado por H. Medina Disla. Junio 2010.

10

Apuntes sobre Estadstica


Como se podrn imaginar, el presupuesto era pequeo y no predeterminado,
pero tengan por seguro que aquellas personas que no pasaron de curso se lo
encontraron ms costoso, pero bueno, ese no es el caso ahora.
El instrumento de recoleccin de datos fue un cuestionario, el cual se muestra
en la figura nmero dos y la metodologa consisti en tomar una muestra de
estudiantes de las escuelas pblicas y otra muestra en colegios privados.
El cuestionario utilizado como instrumento de recoleccin de datos se muestra
en la figura nmero dos de la pgina siguiente.
Figura no. 2. Instrumento de recoleccin de datos utilizado en el estudio
Universidad Autnoma de Santo Domingo
Estudio sobre el rendimiento escolar
Formulario de recoleccin de datos
1. Nombre y apellidos del estudiante __________________________
2. Edad ______

3. Sexo:

1. Masculino

2. Femenino

4. Con quien vive el estudiante _____________________________


5. Tipo de escuela:

1. Pblica

2. Privada

6. Condicin del estudiante:


1. Promovido
7. Calificacin en Matemticas ______
8. Calificacin en Espaol ______
9. Calificacin en Sociales ______
10. Calificacin en Naturales _____

2. Repitiente

La metodologa consisti en tomar una muestra de treinta estudiantes de la


escuela pblica y treinta de la escuela privada. La fuente de datos utilizada fue
el registro de cada estudiante en la escuela, procediendo a completar el
instrumento de recoleccin de datos diseado
A continuacin se presenta una muestra del instrumento de recoleccin de
datos completado durante la tercera fase del estudio. Por conveniencia las
respuestas se han subrayado de forma que se puedan identificar fcilmente.
Ntese que los cuestionarios no estn numerados y si lo estuvieran no
representan una jerarqua o importancia, sino que el numeral asignado es una
escala nominal.

Elaborado por H. Medina Disla. Junio 2010.

11

Apuntes sobre Estadstica

Figura no. 3: Instrumentos de recoleccin de datos completados


Universidad Autnoma de Santo Domingo
Estudio sobre el rendimiento escolar
Formulario de recoleccin de datos

Universidad Autnoma de Santo Domingo


Estudio sobre el rendimiento escolar
Formulario de recoleccin de datos

1. Nombre y apellidos del estudiante Rodolfo Pea

1. Nombre y apellidos del estudiante Ral Arias

2. Edad 15

2. Edad 12

3. Sexo: 1. Masculino

3. Sexo: 1. Masculino

2. Femenino

4. Con quien vive el estudiante: Con padre y madre


5. Tipo de escuela:

1. Pblica

2. Privada

2. Femenino

4. Con quien vive el estudiante: con ambos padres


5. Tipo de escuela:

1. Pblica

2. Privada

6. Condicin del estudiante:


1. Promovido 2. Repitiente
7. Calificacin en Matemticas 69
8. Calificacin en Espaol 75
9. Calificacin en Sociales 72
10. Calificacin en Naturales 71

6. Condicin del estudiante:


1. Promovido 2. Repitiente
7. Calificacin en Matemticas 67
8. Calificacin en Espaol 69
9. Calificacin en Sociales 64
10. Calificacin en Naturales 69

Universidad Autnoma de Santo Domingo


Estudio sobre el rendimiento escolar
Formulario de recoleccin de datos

Universidad Autnoma de Santo Domingo


Estudio sobre el rendimiento escolar
Formulario de recoleccin de datos

1. Nombre y apellidos del estudiante Paola Mocin

1. Nombre y apellidos del estudiante: Yordi Gonzlez

2. Edad 10

2. Edad 11

3. Sexo: 1. Masculino

2. Femenino

3. Sexo: 1. Masculino

4. Con quien vive el estudiante Ta


5. Tipo de escuela:

1. Pblica

2. Femenino

4. Con quien vive el estudiante: con la madre


2. Privada

6. Condicin del estudiante:


1. Promovido
7. Calificacin en Matemticas 80
8. Calificacin en Espaol 78
9. Calificacin en Sociales 76
10. Calificacin en Naturales 80

2. Repitiente

Universidad Autnoma de Santo Domingo


Estudio sobre el rendimiento escolar
Formulario de recoleccin de datos

5. Tipo de escuela:

1. Pblica

2. Privada

6. Condicin del estudiante:


1. Promovido
7. Calificacin en Matemticas 70
8. Calificacin en Espaol 68
9. Calificacin en Sociales 65
10. Calificacin en Naturales 65

2. Repitiente

Universidad Autnoma de Santo Domingo


Estudio sobre el rendimiento escolar
Formulario de recoleccin de datos

1. Nombre y apellidos del estudiante Ashley Ciprin

1. Nombre y apellidos del estudiante Vicente Meja

2. Edad 9 aos

2. Edad 13 aos

3. Sexo: 1. Masculino

2. Femenino

4. Con quien vive el estudiante ambos padres


5. Tipo de escuela:

1. Pblica

6. Condicin del estudiante:


1. Promovido
7. Calificacin en Matemticas 85
8. Calificacin en Espaol 80
9. Calificacin en Sociales 82
10. Calificacin en Naturales 78

2. Privada

2. Repitiente

Elaborado por H. Medina Disla. Junio 2010.

3. Sexo: 1. Masculino

2. Femenino

4. Con quien vive el estudiante con la madre


5. Tipo de escuela:

1. Pblica

6. Condicin del estudiante:


1. Promovido
7. Calificacin en Matemticas 65
8. Calificacin en Espaol 70
9. Calificacin en Sociales 78
10. Calificacin en Naturales 70

2. Privada

2. Repitiente

12

Apuntes sobre Estadstica


Universidad Autnoma de Santo Domingo
Estudio sobre el rendimiento escolar
Formulario de recoleccin de datos

Universidad Autnoma de Santo Domingo


Estudio sobre el rendimiento escolar
Formulario de recoleccin de datos

1. Nombre y apellidos del estudiante Cndida Beatriz

1. Nombre y apellidos del estudiante Manuel Fontana

2. Edad 11 aos

2. Edad 10 aos
2. Femenino

3. Sexo: 1. Masculino

4. Con quien vive el estudiante ambos padres


5. Tipo de escuela:

1. Pblica

6. Condicin del estudiante:


1. Promovido
7. Calificacin en Matemticas 83
8. Calificacin en Espaol 90
9. Calificacin en Sociales 89
10. Calificacin en Naturales 91

2. Privada

2. Repitiente

Universidad Autnoma de Santo Domingo


Estudio sobre el rendimiento escolar
Formulario de recoleccin de datos

3. Sexo: 1. Masculino

2. Femenino

4. Con quien vive el estudiante con una ta


5. Tipo de escuela:

1. Pblica

2. Privada

6. Condicin del estudiante:


1. Promovido
7. Calificacin en Matemticas 88
8. Calificacin en Espaol 90
9. Calificacin en Sociales 89
10. Calificacin en Naturales 85

2. Repitiente

Universidad Autnoma de Santo Domingo


Estudio sobre el rendimiento escolar
Formulario de recoleccin de datos

1. Nombre y apellidos del estudiante Charly Cepeda

1. Nombre y apellidos del estudiante Helena Parache

2. Edad 13 aos

2. Edad 11 aos

3. Sexo: 1. Masculino

2. Femenino

4. Con quien vive el estudiante ambos padres


5. Tipo de escuela:

1. Pblica

6. Condicin del estudiante:


1. Promovido
7. Calificacin en Matemticas 77
8. Calificacin en Espaol 78
9. Calificacin en Sociales 83
10. Calificacin en Naturales 78

2. Privada

2. Repitiente

3. Sexo: 1. Masculino

2. Femenino

4. Con quien vive el estudiante con ambos padres


5. Tipo de escuela:

1. Pblica

6. Condicin del estudiante:


1. Promovido
7. Calificacin en Matemticas 77
8. Calificacin en Espaol 72
9. Calificacin en Sociales 81
10. Calificacin en Naturales 65

2. Privada

2. Repitiente

Una vez agotada la tercera fase, la recoleccin de datos, nos dedicamos a


cuarta fase, el procesamiento de los datos, recordando que esta fase incluye la
organizacin, codificacin, digitacin y edicin, para luego obtener los cuadros
y tablas, as como las medidas estadsticas que nos permitan dar respuestas a
los objetivos planteados.
En el caso que nos ocupa para la organizacin podemos por ejemplo asignar un
nmero a cada instrumento completado. Para la codificacin, el trabajo se
reduce significativamente, ya que el instrumento diseado tiene cada pregunta
pre-codificada, por ejemplo, para el sexo se le asigna el nmero uno a los de
sexo masculino y el dos a las de sexo femenino, de igual forma a los y las
estudiantes de escuelas pblicas se le asigna el nmero uno y los y las de
colegios privados el nmero dos.
Sin embargo, en el caso de la pregunta relacionada a con quien vive el o la
estudiante, es recomendable establecer un cdigo numrico para las posibles
respuestas, ya que en el instrumento esta es una pregunta abierta. Los cdigos

Elaborado por H. Medina Disla. Junio 2010.

13

Apuntes sobre Estadstica


asignados son: el nmero uno para los y as que viven con ambos padres,
(padre y madre), el dos para los y las que viven solo con la madre, el tres para
los y las que viven solo con el padre y el cuatro para los y las que viven con
otro familiar.
La importancia de asignar un cdigo numrico es que el proceso de digitacin
se hace ms eficiente y se cometen menos errores. Un ejemplo se muestra a
continuacin con los dos primeros instrumentos
Figura no. 4: instrumentos de datos completados y codificados
Universidad Autnoma de Santo Domingo
Estudio sobre el rendimiento escolar
Formulario de recoleccin de datos
No. 1
Nombre y apellidos del estudiante Rodolfo Pea
Edad 15
Sexo: 1. Masculino
2. Femenino
Con quien vive el estudiante: 1
Tipo de escuela:
1. Pblica
2. Privada
Condicin del estudiante:
1. Promovido 2. Repitiente
7. Calificacin en Matemticas 69
8. Calificacin en Espaol 75
9. Calificacin en Sociales 72
10. Calificacin en Naturales 71
1.
2.
3.
4.
5.
6.

Universidad Autnoma de Santo Domingo


Estudio sobre el rendimiento escolar
Formulario de recoleccin de datos
No. 2
Nombre y apellidos del estudiante Ral Arias
Edad 12
Sexo: 1. Masculino
2. Femenino
Con quien vive el estudiante: 1
Tipo de escuela:
1. Pblica
2. Privada
Condicin del estudiante:
1. Promovido 2. Repitiente
7. Calificacin en Matemticas 67
8. Calificacin en Espaol 69
9. Calificacin en Sociales 64
10. Calificacin en Naturales 69
1.
2.
3.
4.
5.
6.

Como se muestra en la figura anterior, a la derecha aparece el nmero


asignado al instrumento y en la pregunta de con quien vive el o la estudiante
se ha asignado como respuesta el nmero uno ya que en ambos casos los
estudiantes viven con ambos padres.
Para la digitacin se podra colocar los datos en una matriz, colocando cada
variable en las columnas y cada fila para los elementos estudiados. En este
caso vamos a utilizar la hoja de clculo de Excel para la digitacin como se
muestra en la figura nmero cinco. (Es preciso aclarar que existen numerosos
programas en los que se puede hace la digitacin, se ha elegido el Excel por la
disponibilidad y facilidad del mismo)

Elaborado por H. Medina Disla. Junio 2010.

14

Apuntes sobre Estadstica


Figura no. 5: Ilustracin de la digitacin en Excel

El proceso de edicin de los datos sera imprimir los datos digitados y luego
verificar si el proceso de digitacin se ha hecho correctamente.
Una vez que se ha realizado el proceso de digitacin y edicin de los datos, se
procede a obtener los cuadros y tablas, as como las medidas estadsticas que
nos permitan dar respuesta a los objetivos del trabajo de investigacin, pero
sobre este particular volveremos a tratarlo en los captulos siguientes.

1.7 PRESENTACIN DE RESULTADOS


Una vez que se ha completado el proceso de investigacin con el anlisis de los
resultados, el paso siguiente consiste en presentar dichos resultados a la
entidad interesada. Para hacerlo existen cinco formas que describiremos
brevemente a continuacin:

Elaborado por H. Medina Disla. Junio 2010.

15

Apuntes sobre Estadstica

1. Presentacin oral: Cuando los resultados de la investigacin se presentan


en forma de discurso. Por ejemplo, muchas organizaciones, (empresas, partidos
polticos, ONG`s, entre otras) convocan a una rueda de prensa o a un
encuentro con el objetivo de dar a conocer los resultados de una investigacin
determinada.
La presentacin oral tiene la ventaja de que es fcil de preparar y su costo es
bajo, sin embargo, presenta la desventaja de que quien recibe la informacin va
olvidando los primeros datos en la medida en que se avanza con el suministro
de informacin.
2. Presentacin escrita: Es aquella en la cual los resultados de una
investigacin se presentan en un informe en forma de texto. La presentacin de
los resultados de una investigacin presentados en un informe, requieren de
una mayor formalidad y de un esfuerzo mayor. Un informe con los resultados
de una investigacin consta de seis partes esenciales.
2.1

Hoja y/o carta de presentacin: en esta parte se presenta de manera


formal los resultados de la investigacin.

2.2

ndice de contenido: en esta parte del informe se establece o describe la


ubicacin fsica de cada una de las partes contenidas en el informe.

2.3

Resumen ejecutivo: como lo indica su nombre, es un resumen que


contiene los principales resultados de la investigacin. Su objetivo
fundamental es describir el comportamiento de la poblacin estudiada
de manera rpida y precisa sin adentrarse en detalles.

2.4

Cuerpo del trabajo: En esta parte se describen de manera detallada


todos los resultados de la investigacin, incluye la presentacin de
cuadros, tablas, grfico, descripcin textual, as como el clculo de
medidas estadsticas.

2.5

Conclusiones: las conclusiones representan el juicio extrado de los


resultados de la investigacin. Se refieren a los puntos a los cuales llega
quien o quienes realizan el estudio despus de analizar de manera
detallada los resultados obtenidos. Las conclusiones dan respuestas a
las interrogantes establecidas y a los objetivos planteados en la fase de
planeacin.

2.6

Recomendaciones: se refiere al conjunto de sugerencias o curso de


accin que se sugieren seguir a partir de los resultados de la
investigacin.

Elaborado por H. Medina Disla. Junio 2010.

16

Apuntes sobre Estadstica


2.7 Anexos: en esta parte del informe se incluye toda informacin que sea
relevante para el estudio que se realiza y que por alguna razn no se incluy en
el cuerpo del trabajo, por ejemplo cuadros, copia del o los instrumentos de
recoleccin de datos utilizados, cronograma de actividades, fotografas, copias
de artculos, de leyes, entre otros.
3) Presentacin tabular: es aquella es la que los resultados de una
investigacin se presentan en forma de cuadros o tablas. Un cuadro o tabla
estadstica se compone de tres partes esenciales y una opcional.
3.1

Ttulo: en este se detalla de manera clara, precisa y lo ms corto


posible los datos incluidos en el cuadro. El ttulo es de vital importancia
a fin de edificar a la persona interesada sobre la informacin que se
presenta en el cuadro o la tabla de que se trate.

3.2

Cuerpo o armazn: es un arreglo matricial, (arreglo de filas y


columnas) en el cual se detallan los datos especificados en el ttulo. El
cuerpo o armazn est compuesto de dos partes:
3.2.1 La columna principal, en la cual se describe la variable o las
variables a presentar en el cuadro.
3.2.2 Las columnas secundarias, es las cuales se describen los valores
relacionados a cada valor o atributo de la variable.

3.3

Fuente: es la parte del cuadro en la cual se especfica el origen de los


datos presentados en dicho cuadro. La importancia de la fuente es que
al informar sobre el origen de los datos descrito en la tabla, permite, de
alguna manera, evaluar la calidad y confiabilidad de los mismos.

Nota aclaratoria: se utiliza para


especificar
cualquier
detalle
o
aclaracin referente a los datos
incluidos en el cuadro. Por ejemplo, en
el
cuadro
que
se
muestra
a
continuacin se podra incluir una
nota aclaratoria para indicar que solo
se incluyen a los estudiantes que
asistieron ese da a la clase o que
incluye a otros colados de otra seccin

Cuadro No: Sexo de los estudiantes


de Est-XXX, seccin XX

SEXO
MASCULINO
FEMENINO

No.
9
25

TOTAL

34

%
26.5
73.5
100.0

Fuente: Clase 17/01/2004

de la que se trate.

4) Presentacin grfica:
es aquella en la cual los resultados de una
investigacin se
presentan en forma de grfico. La importancia de la
presentacin grfica es que permite observar el comportamiento de una
variable sin entrar en detalles, solo con observar el cuadro.

Elaborado por H. Medina Disla. Junio 2010.

17

Apuntes sobre Estadstica

Se x o d e l o s e s t u d i a n t e s d e Es t -x x x , s e c c i n
00

26.5%

73.5%
MASCU LIN O

F EMEN IN O

Fuente: clase del 7/01/2004

Por ejemplo, al
observar un recibo
de la facturacin
de la electricidad,
se muestra un
grfico como el que
vemos a nuestra
derecha,
observamos como
ha
variado
el
consumo, si se ha
consumido ms o
se ha consumido
menos.

Comparacin mensual de su consumo


700
600
500
400
300
200
100
0
Abr May Jun Jul Ago Se p Oct Nov Dic Ene Fe b Mar Abr

Una presentacin grfica contiene los mismos elementos que un cuadro o


tabla, es decir: ttulo, cuerpo, fuente y nota aclaratoria.
5) Presentacin Mixta: es aquella en la cual quien o quienes realizan la
investigacin utilizan para la presentacin de los resultados del estudio dos o
ms formas de presentacin de datos.

Elaborado por H. Medina Disla. Junio 2010.

18

Apuntes sobre Estadstica


II. ORGANIZACIN Y PRESENTACIN DE LOS DATOS
2.1 ORGANIZACIN SIMPLE
El objetivo fundamental de la organizacin de los datos es conocer el
comportamiento y las caractersticas de las variables estudiadas, sin una
organizacin de los datos se hace un tanto difcil el anlisis de los mismos.
Supongamos que tenemos los datos relacionados con el rendimiento
acadmico de 133 estudiantes y los mismos se muestran en el recuadro
siguiente:
82.5
88.5
70.8
80.3
81.0
86.3
77.8
85.0
79.0
91.3
88.8
88.5
88.5
93.0
85.0
95.3
88.0
82.0
85.0

73.8
68.3
85.5
70.8
81.8
77.0
79.5
87.8
78.8
87.3
73.8
84.5
83.3
71.8
81.3
80.8
90.8
71.0
70.5

73.0
60.5
60.0
69.5
64.8
67.5
72.3
67.0
67.0
62.0
66.5
69.0
66.0
71.3
65.8
69.8
72.8
61.3
64.8

76.8
71.0
81.3
61.3
71.5
82.0
71.5
81.3
76.0
83.5
84.0
68.5
84.3
82.8
92.5
72.5
70.5
78.5
67.0

81.5
77.5
82.0
78.8
71.0
84.5
69.5
72.8
72.8
78.5
69.3
72.0
67.8
70.3
70.3
89.8
70.5
77.8
90.8

79.5
63.0
81.0
62.8
75.0
82.3
84.8
69.8
67.0
68.8
65.3
58.0
66.8
56.5
63.8
70.0
72.0
56.8
84.3

67.8
70.5
61.0
61.8
68.8
71.8
67.3
71.0
69.0
91.8
67.8
61.5
63.0
83.5
81.8
66.8
77.8
64.5
63.5

Como se puede observar, tenemos datos suficientes como para dar un


diagnstico sobre el rendimiento de los y las estudiantes, sin embargo, sin
una organizacin esto se hace poco aplicable. Una forma sencilla de iniciar
una exploracin de los datos, para conocer sus caractersticas es organizando
los mismos en orden ascendente como se ilustra a continuacin.
Este procedimiento no nos proporcionar mucha informacin sobre las
caractersticas relevantes de la variable, nos permite conocer por ejemplo cual
es el rendimiento mayor y el menor y permite adems observar si existe un
valor que se repita con una frecuencia mayor que los dems, etc.

Elaborado por H. Medina Disla. Junio 2010.

19

Apuntes sobre Estadstica


56.5
56.8
58.0
60.0
60.5
61.0
61.3
61.3
61.5
61.8
62.0
62.8
63.0
63.0
63.5
63.8
64.5
64.8
64.8

65.3
65.8
66.0
66.5
66.8
66.8
67.0
67.0
67.0
67.0
67.3
67.5
67.8
67.8
67.8
68.3
68.5
68.8
68.8

69.0
69.0
69.3
69.5
69.5
69.8
69.8
70.0
70.3
70.3
70.5
70.5
70.5
70.5
70.8
70.8
71.0
71.0
71.0

71.0
71.3
71.5
71.5
71.8
71.8
72.0
72.0
72.3
72.5
72.8
72.8
72.8
73.0
73.8
73.8
75.0
75.0
76.0

76.8
77.0
77.5
77.8
77.8
77.8
78.0
78.5
78.5
78.8
78.8
79.0
79.5
79.5
80.3
80.8
81.0
81.0
81.3

81.3
81.3
81.5
81.8
81.8
82.0
82.0
82.0
82.3
82.5
82.8
83.3
83.5
83.5
84.0
84.3
84.3
84.5
84.5

84.8
85.0
85.0
85.0
85.5
86.3
87.3
87.8
88.0
88.5
88.5
88.5
88.8
89.8
90.8
90.8
91.3
91.8
92.5

Ahora podemos fijarnos una idea ms acabada sobre el rendimiento de los y


las estudiantes de las escuelas pblicas y privadas, por ejemplo, observamos
que ms de un tercio tiene un rendimiento promedio inferior a los 70.0
puntos, que solo cinco de los 133 estudiantes estudiados tienen un
rendimiento superior a 90.0 puntos y as sucesivamente.
2.2 DISTRIBUCIONES DE FRECUENCIA
Los datos que provienen de un censo, una encuesta por muestreo, diseo
experimental y aquellos que provienen de fuente secundarias que no han sido
agrupados o condensados, como por ejemplo la revisin de un expediente
clnico, se presentan en la mayora de los casos en una Distribucin de
frecuencia, ya sea para una o para mltiples variables. Una distribucin de
frecuencia es un arreglo matricial, (arreglo de filas y columnas) donde se
presenta los valores o atributos de una variable y su respectivas frecuencias.
Antes de entrar en detalles sobre los diferentes tipos de distribuciones de
frecuencias, vamos a definir el concepto de frecuencia y los diferentes tipos de
frecuencias. La Frecuencia, en trminos estadsticos, se define como el
nmero de veces que se repite un dato u observacin. Por ejemplo, al observar
el sexo de 50 estudiantes de un curso de Estadstica, se observaron los datos
que se presentan en la tabla siguiente

Elaborado por H. Medina Disla. Junio 2010.

20

Apuntes sobre Estadstica

Tabla 1: Sexo de 50 estudiantes de un curso de Estadstica

M
F
M
F
F

F
F
F
F
F

F
F
F
F
M

F
M
F
F
F

M
F
M
F
F

F
F
M
F
F

F
F
F
F
F

M
F
M
F
F

F
F
F
F
F

F
M
F
F
M

Para estos datos, el dato masculino, (M) se repite 11 veces por lo tanto esa es
su frecuencia y el dato femenino, (F) se repite 39 veces, que es su frecuencia.
2.3 TIPOS DE FRECUENCIA
Existen cuatro tipos de frecuencias: la absoluta simple, la relativa simple, la
absoluta acumulada y la absoluta relativa acumulada.
2.3.1 Frecuencia absoluta simple, (fi): se define como el nmero de veces que
se repite un dato u observacin. Comnmente se le denomina con el nombre de
frecuencia. Por ejemplo, en el cuadro anterior el dato masculino tiene una
frecuencia absoluta simple de 11, mientras que el dato femenino presenta una
frecuencia absoluta simple de 39.
2.3.2 Frecuencia absoluta acumulada, (FA): consiste en la suma continua y
subsecuente de la
frecuencia absoluta simple. La frecuencia absoluta
acumulada expresa la cantidad de elementos que se encuentra por debajo de
un valor especfico.
2.3.3 Frecuencia relativa simple, (fr o %): consiste en expresar la frecuencia
absoluta simple, (fi) como una proporcin con aspecto al total de frecuencia.
2.3.4 Frecuencia relativa acumulada, (FRA o % acumulado): Expresa la
frecuencia absoluta acumulada, (FA) como un porcentaje con respecto al total
de frecuencia y representa la proporcin de elementos que se encuentran por
debajo de un valor determinado. La FRA se puede obtener de dos formas:
a) Sumando de manera continua y subsecuente la frecuencia relativa simple.
b) Dividiendo cada frecuencia absoluta acumulada entre el total de frecuencia.
2.4 Clase: Es un rango de valor en el cual se incluye un conjunto de datos que
para fines de anlisis se consideras homogneos.
Veamos un ejemplo sobre como se obtienen las diferentes frecuencias que
conforma una distribucin de frecuencia. Para la ilustracin vamos a tomar la
calificacin obtenida por 50 estudiantes en una prueba parcial de Estadstica,
los datos se ilustran en la tabla nmero dos a continuacin.

Elaborado por H. Medina Disla. Junio 2010.

21

Apuntes sobre Estadstica

Tabla 2: Calificacin obtenida por 50 estudiantes de Estadstica en una prueba


parcial
14
13
17
16
12

14
14
18
16
12

19
8
10
13
19

15
16
14
17
10

10
14
16
16
8

12
16
10
9
17

13
16
19
13
6

14
12
19
17
18

9
18
13
11
14

12
15
15
11
16

Para ordenar estos datos, lo primero que vamos a hacer es colocar en la


primera columna la variable, en este caso la calificacin obtenida, pero como
puede tomar mltiple valores, se clasifica en cinco categoras, la primer, los/as
que obtuvieron menos de 12 puntos, la segunda los/as estudiantes que
obtuvieron entre 12 y menos de 14 puntos, la tercera los/as estudiantes que
obtuvieron entre 14 y menos de 16 puntos, la cuarta clase est compuesta por
los/as estudiantes que obtuvieron entre 16 y menos de 18 puntos y la quinta
clase, est formada por aquellos/as estudiantes que obtuvieron entre 18 y 20
puntos.
De esta forma, la primera columna queda como se ilustra a continuacin:
Calificacin

12.0

12.0 13.9
14.0 15.9
16.0 17.9
18.0 20.0
TOTAL
El segundo paso es determinar la cantidad de estudiantes que cae dentro de
cada una de estas categoras o clases. Para esto, sencillamente se cuenta en la
tabla dos, la cantidad de calificaciones que est dentro de cada uno de los
lmites de cada categora o clase.
Para determinar la cantidad de datos en cada categora o clase se puede hacer
contando de manera directa cada valor o a partir de un proceso de conteo
detallado, colocando una raya, un punto o un smbolo en cada categora cada
vez que aparece un valor que se corresponda con esta.
Al observar los datos sueltos de la tabla dos, en la primera categora, las
calificaciones menores de 12 puntos, hay 11 estudiantes, con calificacin

Elaborado por H. Medina Disla. Junio 2010.

22

Apuntes sobre Estadstica


menor a 12 puntos. De igual forma se observa que hay 10 estudiantes con
calificacin entre 12 y menos de 14 puntos, igual cantidad, 10 estudiantes con
calificacin entre 14 y menos de 16 puntos.
De igual forma se observa que hay 12 estudiantes con calificacin entre 16 y
menos de 18 puntos y finalmente, siete estudiantes con calificacin entre 18 y
20 puntos. En la segunda columna de la distribucin se coloca la frecuencia de
cada clase o categora, por lo que la tabla quedara como se ilustra a
continuacin:
Calificacin

fi

12.0

11

12.0 13.9

10

14.0 15.9

10

16.0 17.9

12

18.0 20.0

TOTAL

50

A partir de esta frecuencia absoluta simple, se obtienen las dems frecuencias.


La frecuencia relativa, por ejemplo se obtiene al dividir cada frecuencia
absoluta entre el total de frecuencia. Si esta frecuencia se desea expresar como
un porcentaje, entonces se multiplica por 100. La primera frecuencia relativa
es [(11/50) x 100]= 22.0%, la segunda frecuencia relativa es [(10/50) x 100]=
20.0% y as sucesivamente, la tercera frecuencia relativa es [(10/50) x 100]=
20.0%, la cuarta frecuencia relativa es [(12/50) x 100]= 24.0% y la quinta y
ltima frecuencia relativa de esta distribucin es [(17/50) x 100]= 14.0% El
resultado de calcular cada una de la frecuencia relativa se muestra en la tabla
siguiente:
Calificacin

fi

12.0

11

22.0

12.0 13.9

10

20.0

14.0 15.9

10

20.0

16.0 17.9

12

24.0

18.0 20.0

14.0

TOTAL

Elaborado por H. Medina Disla. Junio 2010.

50 100.0

23

Apuntes sobre Estadstica


De igual forma, a partir de la frecuencia absoluta simple se obtiene la
frecuencia absoluta acumulada. Esta frecuencia es el resultado de sumar las
frecuencias absoluta simple de cada clase. En trminos generales, la frecuencia
absoluta acumulada de una clase o categora en particular es igual a la
frecuencia acumulada hasta la clase anterior ms la frecuencia absoluta
simple de la clase o categora de que se trate.
As, la frecuencia absoluta acumulada de la primera clase o categora es igual a
frecuencia absoluta simple, para nuestro ejemplo, la frecuencia absoluta
acumulada de la primera clase es igual a 12. La frecuencia absoluta
acumulada en la segunda clase o categora es la suma de la frecuencia
acumulada en la primera clase ms la frecuencia absoluta simple de la
segunda clase, es decir (11 + 10)= 21.
El procedimiento se sigue de manera similar hasta determinar la frecuencia
acumulada para cada clase o categora. De esta forma la frecuencia acumulada
de la tercera clase es igual a la frecuencia acumulada de la segunda clase ms
la frecuencia absoluta simple de la tercera clase, en este caso (21 + 10)= 31, la
frecuencia acumulada de la cuarta clase es igual a la frecuencia acumulada
hasta la tercera clase ms la frecuencia absoluta simple de la cuarta, esto es
(31 + 12)= 43 y la frecuencia acumulada de la quinta clase o es igual a la
frecuencia acumulada hasta la cuarta clase ms la frecuencia simple de la
quinta clase, es decir (43 + 7)= 50. El resultado de las sumas se muestra en la
tabla siguiente:
Calificacin

fi

12.0

11

22.0

11

12.0 13.9

10

20.0

21

14.0 15.9

10

20.0

31

16.0 17.9

12

24.0

43

18.0 20.0

14.0

50

50

100.0

TOTAL

FA

Una vez que se ha determinado la frecuencia absoluta acumulada el siguiente


paso es calcular la frecuencia relativa acumulada o porcentaje acumulado.
Este porcentaje puede obtenerse de dos formas, o se acumula la el porcentaje
simple o se divide cada frecuencia absoluta acumulada entre el total. El
procedimiento de acumular el porcentaje simple, simplifica los clculos.
El porcentaje acumulado de la primera clase es igual porcentaje simple de la
misma. Para nuestro ejemplo, el porcentaje acumulado de la primera clase o

Elaborado por H. Medina Disla. Junio 2010.

24

Apuntes sobre Estadstica


categora es igual a 22.0%. El porcentaje acumulado en la segunda clase o
categora es la suma del porcentaje acumulado en la primera clase ms el
porcentaje simple de la segunda clase, es decir (22.0 + 20.0)= 42.0%.
Al igual que en la frecuencia absoluta acumula, procedimiento se sigue de
manera similar hasta determinar la porcentaje acumulado para cada clase o
categora. De esta forma la porcentaje acumulado de la tercera clase es igual al
porcentaje acumulado de la segunda clase ms el porcentaje simple de la
tercera clase, en este caso es (42.0 + 20.0)= 62.0%, el porcentaje acumulado
de la cuarta clase es igual al porcentaje acumulado hasta la tercera clase ms
el porcentaje simple de la cuarta, esto es (62.0 + 24.0)= 86.0% y el porcentaje
acumulado de la quinta clase o es igual al porcentaje acumulado hasta la
cuarta clase ms el porcentaje simple de la quinta clase, es decir (86.0 + 14.0)=
100.0%. El resultado de las sumas se muestra en la tabla siguiente:
Calificacin

fi

FA

FRA

12.0

11

22.0

11

22.0

12.0 13.9

10

20.0

21

42.0

14.0 15.9

10

20.0

31

62.0

16.0 17.9

12

24.0

43

86.0

18.0 20.0

14.0

50

100.0

50

100.0

TOTAL

Una vez que han calculado las frecuencias se procede a completar el cuadro
de manera adecuada, es decir, poner el ttulo, se elimina la columna del
conteo, (si se ha incluido), y se coloca la fuente de los datos.
Cuadro No : Calificacin de 50 estudiantes de
un curso de estadstica en una prueba parcial
Calificacin
fi
%
FA
FRA

12.0

11

22.0

11

22.0

12.0 13.9

10

20.0

21

42.0

14.0 15.9

10

20.0

31

62.0

16.0 17.9

12

24.0

43

86.0

18.0 20.0

14.0

50

100.0

50

100.0

TOTAL
Fuente: Tabla 2

Elaborado por H. Medina Disla. Junio 2010.

25

Apuntes sobre Estadstica

2.5 TIPOS DE DISTRIBUCIN DE FRECUENCIA


Para agrupar los datos existen tres tipos de distribucin de frecuencia, la
cuales se utilizarn de acuerdo al tipo de datos que estemos tratando.
2.5.1 Distribucin de frecuencia para datos cualitativos: cuando se tienen
datos cualitativos, el procedimiento se simplifica, pues solo se requiere
colocar las diferentes categoras de la variable y la frecuencia asociada con
dada una de ellas, como se muestra en el ejemplo siguiente:
Cuadro No.: Personas con quienes viven los/as
estudiantes de las escuelas pblicas y de la privadas

Con quien vive

fi

Ambos padres
Con la madre
Con el padre
Otro familiar
Total

%
106

79.7

15
5

11.3
3.8

5.3

133

100.0

Fuente: Estudio de mayo del 2006

2.5.2 Distribucin Frecuencia Simple o Tipo I: es un tipo de distribucin


de frecuencia que se utiliza para presentar una variable cuantitativa discreta,
cuyo rango de valor sea menor o igual de diez. Es decir se utiliza para
variables cuantitativas discretas que toman pocos valores diferentes.
Ejemplos de estas variables son nmero de hijos/as por familia, nmero de
asignaturas cursadas por los estudiantes de la UASD, nmero de cursos
realizados por los empleados y empleadas de una empresa, entre otros.
Ejemplo: Se les pregunt a cincuenta profesores sobre el nmero de
estudiantes reprobados que tena en su curso, los datos son:
Tabla 3: Nmero de estudiantes reprobados/as por curso

5
3

4
5

2
3

4
1

5
2

3
2

2
4

3
2

3
1

1
0

El dato menor que aparece en los datos es el valor cero y el mayor es el cinco
de forma tal que esta variable en esta muestra toma seis valores diferentes:
cero, uno, dos, tres, cuatro y cinco. Para organizar los datos en una
distribucin de frecuencia simple o tipo I colocamos los diferentes valores de

Elaborado por H. Medina Disla. Junio 2010.

26

Apuntes sobre Estadstica


la variable en la primera columna y luego se cuenta el nmero de veces que se
repite cada dato, como se muestra en la distribucin de frecuencia siguiente:
Cuadro No.: Cantidad de estudiantes reprobados/as por curso
# de estudiantes
fi .
%
FA
% Acum.
0
1
2.5
1
2.5
1
6
15.0
7
17.5
2
11
27.5
18
45.0
3
9
22.5
27
67.5
4
8
20.0
35
87.5
5
5
12.5
40
100.0
Total
40
100.0
Fuente: Encuesta a 40 profesores noviembre 2006

2.5.3 Distribucin Frecuencia con Clase o Tipo II: Este tipo de distribucin
se utiliza para variables cuantitativas continuas y para aquellas variables
cuantitativas discretas, cuyo rango de valor sea mayor de diez.
Siempre que se trate de datos cuantitativos continuos se hace necesario el
uso de este tipo de distribucin. La razn para ello es que los datos
cuantitativos continuos pueden diferir uno del otro por milsima de datos, lo
que, de tener los diferentes valores con sus respectivas frecuencias se podra
tener tantas clases como valores individuales se tenga, perdindose de esta
manera la esencia de la agrupacin de los datos, proporcionar informacin
sobre las caractersticas de las variables estudiadas
Un ejemplo de este tipo de distribucin de frecuencia se muestra a
continuacin
Cuadro No : Calificacin de 50 estudiantes de
un curso de estadstica en una prueba parcial
Calificacin
fi
%
FA
FRA

12.0

11

22.0

11

22.0

12.0 13.9

10

20.0

21

42.0

14.0 15.9

10

20.0

31

62.0

16.0 17.9

12

24.0

43

86.0

18.0 20.0

14.0

50

100.0

50

100.0

TOTAL
Fuente: Tabla 2

2.6 Pasos para construir una distribucin de frecuencia con clase.

Elaborado por H. Medina Disla. Junio 2010.

27

Apuntes sobre Estadstica

Los pasos que se presentan a continuacin son solo una gua de cmo
organizar los datos en una distribucin de frecuencia con clase, puesto que la
forma de presentar los datos muchas veces depende de lo que se quiera
mostrar en la distribucin. Pero cuando no se tiene una idea de cmo agrupar
los datos, los siguientes pasos son una buena gua y estos pasos son:
1. Calcular el rango de la variable: El rango de una variable se define como la
diferencia entre dato mayor y el dato menor y el mismo indica los diferentes
valores posibles que puede tomar la variable
RV = Xmayor - Xmenor
2. Calcular el intervalo o ancho de la clase: El intervalo o ancho de la clase
es la diferencia que existe entre el lmite inferior y el lmite superior de cada
clase y el mismo se puede obtener por tanteo o se puede establecer de acuerdo
a los objetivos de quien est presentado la informacin. Una forma de obtener
el intervalo de cada clase es a partir de la regla sugerida por Sturges4 la cual
establece que el ancho o intervalos de clases en una distribucin de frecuencia
puede aproximarse a partir de la siguiente frmula:

RV
, n representa el total de datos o tamao de la muestra
1 (3.322x log n)

A partir de esta frmula se obtiene un intervalo de igual dimensin para todas


las clases lo que facilita el anlisis.
3. Establecer los lmites de cada clase: para establecer los lmites de cada
clase o intervalo, se inicia con el dato menor y se le suma el intervalo y as se
contina hasta llegar al dato mayor observado. Es importante tener en
consideracin que los lmites se deben establecer de forma excluyentes, esto es,
que los valores en los lmites no deben ser iguales, por ejemplo, si una clase va
de 30 a 40, como el 40 no va incluido en esa clase lo aconsejable es establecer
como limite superior el resultado de la suma disminuido en una unidad, lo que
nos dara una clase con los siguientes lmites; 30 a 39, as, la siguiente clase
iniciara con 40 y de esta forma los valores del lmite superior de una clase y el
inferior de la siguiente no van a ser iguales.
Este procedimiento ayuda a que quien lea u organice la informacin no tenga
dudas sobre donde colocar por ejemplo el 40, adems de que este
procedimiento facilita un mayor entendimiento del comportamiento de los
datos.
4

Herbert A. Sturges: The Choice of a Class Interval, Journal of the American Statistical
Association. Marzo 1926

Elaborado por H. Medina Disla. Junio 2010.

28

Apuntes sobre Estadstica

4. Realizar el conteo y establecer las frecuencias: El conteo consiste es


determinar cuantos valores de la variable pertenecen a cada clase o intervalo
Ejemplo:
1. Los datos que se muestran a continuacin representan las edades de un
grupo de 40 personas que asistieron al estreno de una pelcula
21

24

33

29

35

26

26

25

44

32

40

21

31

28

20

26

21

33

32

41

22

20

22

23

43

50

47

45

26

38

26

22

24

39

38

35

20

46

20

25

A partir de los datos desarrolle las siguientes preguntas:


a)
b)
c)
d)

Construir una distribucin de frecuencia


Determinar el porcentaje de personas que tiene menos de 30 aos
Interprete el resultado de la frecuencia relativa simple de la tercera clase
Interprete el resultado de la frecuencia relativa acumulada de la quinta
clase.
e) Qu porcentaje de las personas que asistieron al curso de estadstica
tiene menos de 38 aos?
Iniciamos con los cinco pasos para construir una distribucin de frecuencia
con clase:
1. Rango de la variable:
RV = Xmayor - Xmenor
RV = 50 20
RV = 30

2.

RV
1 ( 3 . 322 log n )

30
30
30
30

4.75 5
1 (3 .322 log 40 ) 1 (3.322 1.6021) 1 5.3221 6.3221

3. Establecer los lmites de cada clase: recordemos que para la primera


clase se suma el intervalo al dato menor y as sucesivamente, como se
muestra a continuacin:

Elaborado por H. Medina Disla. Junio 2010.

29

Apuntes sobre Estadstica


EDAD
20-24
25-29
30-34
35-39
40-44
45-50
Obsrvese que la primera clase inicia con el 20 que es el dato menor y termina
en 24 ya que el intervalo de la distribucin es de cinco. El lector podr
preguntarse porque la primera la clase no termina en 25 que es resultado de
sumar el intervalo al dato menor y la respuesta es que el 20 como dato menor
va incluido en el intervalo de la clase y si contamos teneos 20, 21, 22, 23 y 24
que son los cinco valores del intervalo.
4. Por ltimo establecemos la frecuencia de cada de una de las clases. Un
procedimiento recomendado es hacer un conteo, tomando en consideracin los
lmites de cada clase. As por ejemplo, si tomamos los valores de la primera
columna observamos que estos son: 21, 40, 22 y 26 por lo que el primer valor
corresponde a la primera clase porque es un valor que esta entre 20 y 24, el
segundo valor corresponde es el 40 y corresponde la quinta clase que va de 40
a 44, el tercer valor es 22 y corresponde a la primera clase porque este valor
est entre 20 y 24 y el cuarto valor es el 26 y pertenece a la segunda claro
porque este valor esta entre 25 y 29 que son los lmites de esta clase. Este
procedimiento se sigue hasta incluir todos los valores de la variable en la clase
o intervalo correspondiente. El resultado de dicho proceso se muestra a
continuacin:
Cuadro No.: Edad de las personas que asistieron al estreno de la pelcula.
EDAD

fi

FA

% Acum.

20-24

13

32.5

13

32.5

25-29

22.5

22

55.0

30-34

12.5

27

67.5

35-39

12.5

32

80.0

40-44

10.0

36

90.0

45-50

10.0

40

100.0

Total

40

100.0

Fuente: Encuesta hecha a los/as asistentes al cine

Elaborado por H. Medina Disla. Junio 2010.

30

Apuntes sobre Estadstica


b) Determinar el porcentaje de personas que tiene menos de 30 aos:
Como se muestra en la tabla anterior menor a 30 aos hay un 55.0% que son
las personas que tienen entre 20 y 24 aos y las que tienen entre 25 y 29 aos.
c) Interprete el resultado de la frecuencia relativa simple de la tercera
clase: La tercera clase es la que va de 30 a 34 y el resultado indica que el
12.5% de las personas que asistieron al estreno de la pelcula tienen entre 30 y
34 aos.
d) Interprete el resultado de la frecuencia relativa acumulada de la quinta
clase. El resultado de la frecuencia relativa acumulada de la quinta clase es
90.0% y el mismo indica que el 90.0% de las personas que asistieron al estreno
de la pelcula tienen 44 aos o menos.
Tambin se puede decir, que el 90.0% de las personas que asistieron al estreno
de la pelcula tienen menos de 45 aos.
e) Qu porcentaje de las personas que asistieron al estreno de la pelcula
tiene menos de 38 aos? Como el 38 no aparece en ninguno de los lmites, se
hace necesario determinar en los datos sueltos cuantas personas tienen menos
de 38 aos y esta cantidad la dividimos entre el total y se multiplica por 100
para determinar el porcentaje.
Para este caso tenemos un total de 29 personas con menos de 38 aos, luego el
porcentaje de persona con menos de 38 aos es de (29/40)*100, es decir
72.5%

Ejercicios para el aula


1. El tamao de un grupo de viviendas, expresado en ciento de m 2, se muestra
en la tabla siguiente.
26
20
20

36
25
17

33
29
6

19
40
28

28
17

26
32

20
20

22
6

8
18

30
31

30
19

20
4

5
19

34
32

a) Construir una distribucin de frecuencia.


b) Qu por ciento de las viviendas tienes un tamao inferior a los 25 m 2?
c) Qu por ciento de las viviendas tiene un espacio mayor a 30 m2?
d) Interpretar el resultado de la cuarta clase de la frecuencia relativa
acumulada.
e) Interpretar el resultado de la frecuencia relativa simple de la tercera clase.

Elaborado por H. Medina Disla. Junio 2010.

31

Apuntes sobre Estadstica


2. Los datos que se presentan a continuacin representan el ndice de
calificacin de un grupo de estudiantes de preparatoria.
2.75
3.50

3.53
3.06

2.42
3.09

3.00
2.22

3.85
2.47

3.71 2.25
3.20 3.02

2.96
2.00

3.00 3.00
2.05 3.60

a) Construir una distribucin de frecuencia con cinco clases.


b) Interpretar el resultado de la frecuencia relativa simple de la tercera clase.
c) Interpretar el resultado de la frecuencia absoluta acumulada de la cuarta
clase.
d) Qu porcentaje de estudiantes tiene un ndice de calificacin menor a 3.00
puntos?
3. La escolaridad de 35 padres de
presenta como sigue.
14
16
13 14
16
12
16
16
13 12
15
12
13
14
16
12
15
16

familia (expresado en aos de educacin) se


12
16
18

13
14

12
12

15
12

16
15

14
14

16
13

17
17

a) Organice los datos en una distribucin de frecuencia.


b) Qu porcentaje de padres de familia, tiene menos de 15 aos de
educacin?
c) Qu porcentaje de padres de familia tiene 12 aos de educacin?
4. El ingreso quincenal, en cientos de RD$ de un grupo de empleados de la
empresa K.G. se muestra en los datos siguientes.
24
39

44
38

38
16

22
32

29
28

27
60

48
10

31
23

30
12

27
17

21
24

37
18

42

a) Organice los datos en una distribucin de frecuencia con un intervalo de


RD$10.
b) Qu porcentaje de los empleados ganan menos de $20?
c) Qu porcentaje gana entre 30 y 40?
d) Interpretar el resultado de la frecuencia relativa simple de la segunda clase.
5) El rea de estudio de un grupo de 30 estudiantes se presenta a
continuacin.
1.
2.
3.
4.
5.
6.
7.

Administracin
Economa
Contabilidad
Contabilidad
Mercadeo
Economa
Mercadeo

11. Indeciso
12. Indeciso
13. Economa
14. Mercadeo
15. Indeciso
16. Administracin
17. Economa

Elaborado por H. Medina Disla. Junio 2010.

21. Administracin
22. Computacin
23. Mercadeo
24. Economa
25. Indeciso
26. Administracin
27. Computacin

32

Apuntes sobre Estadstica


8. Administracin
9. Mercadeo
10. Economa

18. Mercadeo
19. Indeciso
20. Computacin

28. Mercadeo
29. Economa
30. Mercadeo

a. Construir una distribucin de frecuencia.


b. Calcular el porcentaje de estudiante por rea de estudio.

Elaborado por H. Medina Disla. Junio 2010.

33

Apuntes sobre Estadstica


2.7

TABULACIN CRUZADA

Tambin se le llama tabla de doble entrada y se utiliza para presentar dos o


ms variables en un solo cuadro. La Tabulacin Cruzada proporciona una
descripcin bsica de la interrelacin que hay entre las variables que se
tabulan en el cuadro, de igual forma ayuda a buscar patrones de interaccin
siempre que la frecuencia de cada celda represente un nmero significativo con
respecto al total.
Para realizar un cuadro de doble entrada se sigue el mismo procedimiento que
para construir una distribucin de frecuencia con una variable. Es decir que se
debe tomar en consideracin las variables a incluir en el cuadro de doble
entrada, (cualitativa o cuantitativa y en el caso de las variables cuantitativas,
se debe tomar en cuenta si estas son continuas o discontinuas).
2.7.1 TABULACIN CRUZADA PARA DOS VARIABLES
Para la construccin de un cuadro de doble entrada con dos variable, se coloca
una de las variables en la primera columna o columna principal y la otra
variable en la primera fila, de forma tal que se forme una celda comn para
cada una de las categoras de las variables incluidas. La variable que se coloca
en la primera fila generalmente es aquella que tienen un mayor nmero de
categoras.
Para ilustrar lo que se ha dicho, suponga que estamos interesados en conocer
la relacin que existe entre dos variables, digamos X e Y. Suponga adems que
la variable X tiene cinco categoras, X1, X2, X3, X4 y X5 y que la variable Y tiene
tres categoras, Y1, Y2, Y3, si queremos presentar estas dos variables en un solo
cuadro, el cuadro tendra la forma siguiente:
Yi
Xi

Y1

Y2

Y3

TOTAL

X1

C12
C22
.
.
C52

C13
C23
.
.
C53

Total X1

X5

C11
C21
.
.
C51

TOTAL

Total Y1

Total Y2

Total Y3

X2
X3
X4

Total X2

.
.
Total X5
Total
general

El cuadro indica dos renglones para el total, esto es debido a que estamos
presentando solo dos variables, as, en el total de la ltima fila representa el

Elaborado por H. Medina Disla. Junio 2010.

34

Apuntes sobre Estadstica


total de cada columna, mientras que el total de la ltima columna representa el
total de cada fila del cuadro.
En las celdas que se forman, se colocarn los datos que tienen las dos
caractersticas del cuadro. Por ejemplo, en la celda C 11, se colocan los
elementos que son comunes a X1 y a Y1, en la columna C12 se colocan los
elementos que son comunes a X1 y a Y2 y as sucesivamente.
Ejemplo: Se evalu el sexo y la calificacin final de treinta estudiantes de una
escuela primaria para conocer la relacin entre la calificacin en matemticas y
el sexo de los/as estudiantes. Los datos se muestran en la tabla siguiente.
No.

Sexo

1 Masc.
2
3
4
5
6
7
8
9
10

Fem
Masc.
Masc.
Masc.
Fem
Fem
Fem
Masc.
Masc.

Calif.

No.

Sexo

Calif.

68

11 Masc.

70

21 Fem

87

86
74
72
72
85
66
79
70
72

12
13
14
15
16
17
18
19
20

91
72
70
65
82
68
86
71
82

22
23
24
25
26
27
28
29
30

76
81
77
77
73
60
60
71
73

Fem
Masc.
Fem
Masc.
Fem
Fem
Masc.
Masc.
Fem

No.

Sexo
Masc.
Masc.
Masc.
Fem
Masc.
Fem
Masc.
Masc.
Masc.

Calif.

Para este caso tenemos dos variables, una variable cuantitativa, (calificacin
matemtica) y una cualitativa, (sexo de los/as estudiantes). La variable sexo
tiene dos categoras, masculino y femenino, y la calificacin en matemtica es
continua y su rango es mayor de 10 por lo tanto hay que hacer una
distribucin con clases. Para ello vamos a dividir esta variable en cuatro
categoras, los estudiantes con menos de 70 puntos, los que tienen entre 70 y
80 puntos, los que tienen entre 80 y 90 y los que tienen 90 o ms puntos.
Luego de esta clasificacin el cuadro queda como se ilustra a continuacin:
Como se muestra en el cuadro siguiente, el primer alumno es de sexo
masculino y tiene una calificacin de 68 puntos, por lo tanto se coloca en la
columna de masculino y en la primera fila, ya que aqu de colocan los que
tienen calificacin entre 60 y 69 puntos. El segundo estudiante es una
estudiante y tiene una calificacin de 86 puntos, por lo tanto se coloca en la
columna de sexo femenino y en la tercera fila, ya que aqu se deben colocar los
estudiantes que tienen entre 80 y 89 puntos.
El tercer estudiante es sexo masculino y tiene una calificacin de 72 puntos,
por lo que se coloca en la columna de masculino y en la segunda fila, ya que en

Elaborado por H. Medina Disla. Junio 2010.

35

Apuntes sobre Estadstica


esta se colocan los estudiantes con calificacin entre 70 y 79 puntos. El
procedimiento se contina hasta tabular los datos de la tabla como se ilustra a
continuacin
Sexo
Calificacin

Masculino

Femenino

60 - 69

///

///

70 - 79

///////////// ///

80 - 89

//

Total

/////

90 - 100

Total
Luego del conteo de las frecuencias, los datos son

Cuadro No. Calificacin en matemticas y sexo de


los estudiantes

Calificacin
60 - 69
70 - 79
80 - 89
90 - 100
Total

Sexo
Masculino Femenino
3
3
13
3
2
5
0
1
18
12

Total
6
16
7
1
30

Fuente: Registro de la escuela

Preguntas
1.
2.
3.
4.
5.

Determinar el porcentaje de estudiante por sexo


Calcular el porcentaje de estudiantes con menos de 80 puntos
De los que tienen menos de 90 puntos, qu porcentaje es femenino?
Del grupo femenino qu porcentaje tiene menos de 90 puntos?
Que porcentaje de estudiantes tiene entre 80 y 89 puntos

Ejercicio:
Con los datos que se presentan en la tabla siguiente crear un pequeo reporte
indicando la relacin entre el rendimiento acadmico y el sexo de los
estudiantes, entre el nmero de asignatura por sexo, as como el gasto en
transporte por sexo y nmero de asignaturas cursadas. Finalmente incluya un
pequeo anlisis de la relacin entre la edad de los estudiantes y el nmero de
asignaturas cursadas.

Elaborado por H. Medina Disla. Junio 2010.

36

Apuntes sobre Estadstica


Para el ndice acadmico divida esta variable en tres categoras, los que tienen
menos de 75 puntos, los que tienen entre 75 y 80 puntos y los que tienen ms
de 80 puntos. En el caso del nmero de asignaturas, divdala en tres
categoras, los que cursan menos de cuatro asignaturas, los que estn
cursando cuatro asignaturas y los que cursan ms de cuatro.
Para la edad divida esta variable en tres categoras, los que tienen entre 20 y
23 aos, los que estn entre 24 y 27 aos y los que tienen de 28 y ms aos.
En el caso del gasto en transporte haga una divisin en categoras, si lo
considera necesario y ser as, divida la variable a su conveniencia.
Datos personales de 30 estudiantes de Informtica
No.

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30

EDAD

SEXO

# DE
ASIG.

INDICE
ACAD.

GASTO EN
TRANSP.

22
24
23
25
21
25
22
21
28
28
29
25
20
30
28
24
28
24
21
24
35
21
24
22
21
26
25
24
29
25

M
F
M
M
M
F
M
F
F
F
M
F
M
F
F
F
F
F
F
M
M
F
M
F
F
F
F
M
M
F

3
3
4
5
3
3
3
6
3
4
5
3
4
2
3
4
3
6
4
3
2
4
3
3
4
3
4
5
3
5

80.0
77.8
75.6
74.6
82.1
74.3
77.7
80.1
70.3
70.3
73.5
74.3
79.8
73.3
81.5
74.4
78.6
76.7
77.7
79.4
75.7
83.0
81.2
76.8
80.7
70.8
71.3
74.9
82.6
80.6

20
50
60
30
30
50
40
40
40
40
40
20
40
20
40
40
40
40
20
20
40
40
50
60
30
50
20
80
30
20

FUENTE: ENCUESTA EN EL AULA EST-211 SEC-01. 24/02/2007.

Elaborado por H. Medina Disla. Junio 2010.

37

Apuntes sobre Estadstica

Elaborado por H. Medina Disla. Junio 2010.

38

También podría gustarte