Estadistica Descriptiva
Estadistica Descriptiva
Estadistica Descriptiva
Discretas: sólo pueden tomar valores enteros (1, 2, 8, -4, etc.). Por
ejemplo: número de hermanos (puede ser 1, 2, 3...., etc., pero, por
ejemplo, nunca podrá ser 3.45).
Continuas: pueden tomar cualquier valor real dentro de un intervalo. Por
ejemplo, la velocidad de un vehículo puede ser 90.4 km/h, 94.57 km/h.…
etc.
Las variables aleatorias son variables que son seleccionadas al azar o por
procesos aleatorios.
CLASIFICACION DE DATOS
Los datos son medidas y/o números recopilados a partir de la observación. Los
datos pueden concebirse como información numérica necesaria para ayudar a
tomar una decisión con más bases en una situación particular.
Los datos se pueden clasificar en:
Datos discretos. Son respuestas numéricas que surgen de un proceso
de conteo.
Datos continuos. Son respuestas numéricas que surgen de un proceso
de medición.
ESCALAS DE MEDICIÓN
La medición de las variables puede realizarse por medio de cuatro escalas de
medición: la nominal, ordinal, de intervalo y de razón. Se utilizan para ayudar
en la clasificación de las variables, el diseño de las preguntas para medir
variables, e incluso indican el tipo de análisis estadístico apropiado para el
tratamiento de los datos.
TIPOS DE GRÁFICAS
Una gráfica es la representación de datos, generalmente numéricos, mediante
líneas, superficies o símbolos, para ver la relación que esos datos guardan
entre sí. Sirven para analizar el comportamiento de un proceso, o un conjunto
de elementos o signos que permiten la interpretación de un fenómeno. Las
gráficas se pueden agrupar en cinco tipos:
GRÁFICAS DE LÍNEAS
Gráfica simple de líneas
Muestran la relación entre dos variables cuantitativas. En el eje horizontal (x) se
gráfica la variable independiente en el eje vertical (y). Las marcas de los
cuadrantes en los ejes marcan las unidades de medida; las escalas en los ejes
pueden ser lineales, logarítmicas o ambas.
Ejemplo.
Aquí se muestra el comportamiento de los promedios escolares finales de dos
alumnos (Daniel y Blanca) a lo largo de cinco observaciones anuales:
Polígono de frecuencias
La diferencia fundamental entre ambas es que en el polígono de frecuencias se
añaden dos clases con frecuencias cero: una antes de la primera clase con
datos y otra después de la última. El resultado es que se "sujeta" la línea por
ambos extremos al eje horizontal y lo que podría ser una línea separada del eje
se convierte, junto con éste, en un polígono.
Ejemplo.
El siguiente polígono de frecuencias muestra los goles anotados por un
delantero en un equipo de fútbol en las temporadas de 2000 a 2007:
Barras verticales
En el eje horizontal (o de las abscisas) se representan los intervalos de los
datos, marcándose de manera continua las fronteras entre cada uno de éstos.
De esta manera, el histograma está compuesto por rectángulos, cuyo número
coincide con la cantidad de intervalos considerados, el ancho de la base de
cada uno de esos rectángulos es la misma siempre y coincide con las fronteras
de los intervalos, y la altura corresponde a la frecuencia de cada intervalo.
Ejemplo.
La gráfica siguiente representa el número de campeonatos de fútbol que han
ganado los países en las 18 ediciones desde 1930 hasta 2006:
Barras horizontales
Se parecen mucho a las gráficas de columnas, con la salvedad importante de
que la función de los ejes se intercambia y el eje horizontal queda destinado a
las frecuencias y el eje vertical a las clases.
Es muy común que este tipo de gráficos se utilicen para ilustrar el tamaño de
una población dividida en estratos como, por ejemplo, son sus edades.
Ejemplo.
La siguiente gráfica presenta la distribución de las edades de los 236 niños que
estudian en una escuela primaria:
A este tipo de gráficos en particular se le llama pirámide de edades por su
forma.
GRÁFICAS CIRCULARES
Denominadas también gráfica de pastel, se utilizan para mostrar porcentajes y
proporciones. El número de elementos comparados dentro de un gráfico
circular, no deben ser más de 7, ordenando los segmentos de mayor a menor,
iniciando con el más amplio a partir de las 12 como en un reloj. Una manera
sencilla de diferenciar los segmentos es sombreándolos con colores
contrastantes.
Ejemplo.
La siguiente gráfica ilustra los gustos musicales de un grupo de jóvenes de la
Facultad de Contaduría:
GRÁFICAS DE DISPERSIÓN
Una gráfica de dispersión tiene dos ejes de valores, mostrando un conjunto de
datos numéricos en el eje x y otro en el eje y. Combina estos valores en puntos
de datos únicos y los muestra en intervalos uniformes o agrupaciones. Los
gráficos de dispersión se utilizan normalmente para mostrar y comparar valores
numéricos, como datos científicos, estadísticos y de ingeniería.
Ejemplo.
La siguiente gráfica de dispersión compara temperaturas en un día en la
Ciudad de México. En el eje de horizontal mide la hora de medición y el eje
vertical mide las temperaturas previstas y las temperaturas reales.
Es interesante observar que los puntos parecen seguir una cierta tendencia en
una curva imaginaria. Uno de los usos de este tipo de gráficas es precisamente
encontrar si las observaciones siguen algún patrón (lineal, exponencial,
polinomial, logarítmica, etc.) o si existen valores atípicos.
GRÁFICAS DE BURBUJAS
Un tipo de gráfico similar a las gráficas de dispersión son las gráficas de
burbujas, en las cuales se presenta la dispersión de las observaciones de la
misma forma pero se le añade la posibilidad de visualizar otra variable
representada en el tamaño del punto, pues éstos se convierten en círculos
(burbujas) con radios proporcionales a las magnitudes que representan.
Ejemplo.
La gráfica siguiente se puede apreciar el volumen de ventas y el número de
productos de siete artículos (A-1 a A-7) en una fábrica. Además, se puede ver
fácilmente la participación o cuota de mercado de cada artículo a través del
tamaño de cada burbuja, que corresponde a la cifra que está después de cada
coma:
PICTOGRAMAS
Son gráficos con dibujos alusivos al carácter que se está estudiando y cuyo
tamaño es proporcional a las frecuencias que representan. Se emplean para
representar diferencias cuantitativas simples entre grupos. Los símbolos
utilizados para representar valores idénticos deben ser de igual dimensión.
Ejemplo.
El pictograma siguiente representa la población de los Estados Unidos de 1930
a 1990 (cada figura representa a dos millones de habitantes).
MEDIA ARITMÉTICA
La media aritmética de n valores, es igual a la suma de todos ellos dividida
entre n. Se denota por x. Esto es:
MEDIANA
La mediana es el punto central de una serie de datos ordenados de forma
ascendente o descendente.
De acuerdo al número de casos o datos, hay dos formas para calcular la
mediana: para número impar y para número par:
Número impar de datos ordenados de menor a mayor o de mayor a
menor: la mediana es el valor que queda justo al centro.
MODA
La moda de un conjunto de datos numéricos es el valor que más se repite, es
decir, el que tiene el mayor número de frecuencias absolutas. La moda puede
ser no única e inclusive no existir.
La moda es una medida de tendencia central muy importante, porque permite
planificar, organizar y producir para satisfacer las necesidades de la mayoría.
MEDIA PONDERADA
La media ponderada de un conjunto de valores de una variable x a los que se
han asignado, respectivamente, una ponderación se calcula mediante la
fórmula:
Ejemplo.
Un profesor decide que la calificación final de un alumno constará del 60% del
promedio de los exámenes, el 30% de promedio de tareas y el 10% de
participación en clase a lo largo del año escolar. Si un alumno tiene 5.3 de
promedio de exámenes, 7.1 de tareas y 7.8 promedio de participaciones. ¿Cuál
será su calificación final?
Solución.
5.
xp ==6.09