Resumen Estadistica Descriptiva - Primer Parcial
Resumen Estadistica Descriptiva - Primer Parcial
Resumen Estadistica Descriptiva - Primer Parcial
descriptiva
Distinción entre estadística descriptiva e
inferencial.
La estadística descriptiva es un conjunto de procedimientos para describir, resumir y
analizar datos referentes a un determinado aspecto de la realidad, de modo que estos
datos se puedan emplear mejor o de una forma mas útil o significativa.
Es posible considerar sólo una parte de la población, esta parte se denomina muestra,
y puede ser mucho menor que la población. Si en la muestra se encuentra que el 40
por ciento de los alumnos son repetidores, se puede generalizar a la población
diciendo que la proporción de repetidores en ella muy probablemente esté entre 38 por
ciento y 42 por ciento. Para poder legítimamente efectuar esta generalización, la
muestra debe ser extraída de acuerdo a procedimientos que prescribe la estadística
inferencial.
1
Ejemplos de estadística descriptiva
Suponiendo (en un caso hipotético) que un psicólogo/a decide realizar un estudio
acerca de cuántos casos y tipos de ansiedad hubieron registrados en algún centro
de salud mental en específico, en el año 2020. Para efectuar este estudio, tendrá
que consultar datos y frecuencias de la cantidad de personas que presentaban
algún tipo de ansiedad a lo largo del 2020. Luego de recolectar la información (por
ejemplo por medio de una encuesta anónima) se podrán realizar tablas o gráficos
donde se plasme y organice la información.
Concepto de medición
Toda medición se refiere a un atributo, aspecto, dimensión o variable de una cosa o
entidad sujeta a observación. No se mide, por ejemplo, una mesa sino su superficie,
su peso o su altura; Se mide la estatura de un hombre, su peso, su edad, su
capacidad intelectual, sus prejuicios o su neuroticismo.
La noción de medición aparece del uso que se hace en la vida diaria y en ciencias
como la física. Presupone, casi siempre, un punto de origen o cero absoluto y una
unidad de medida especificada, constante y estandarizada, como en el caso de medir
una longitud, un peso, una superficie, un volumen, etc. El concepto de “medir” en
ciencias sociales y psicología, incluye por tanto el sentido clásico, inspirado en
ciencias físicas, pero es mas amplio, ya que abarca el resultado de cualquier
operación de ordenamiento o posicionamiento de una serie. Torgerson sostiene que el
término medir significa siempre el valor, la cantidad o grado de un cierto atributo,
considerado específico de un objeto, fenómeno o acontecimiento.
2
Variable. Tipos de variables
En la estadística descriptiva, el investigador describe lo que ve. Lo que se estudia son
hechos o fenómenos, acontecimientos que cambian con el tiempo y son denominados
variables. Las variables pueden ser de tipo cualitativa o cuantitativa.
Escalas
Se distinguen cuatro tipos de escalas de medición: escala nominal, ordinal, intervalar y
proporcional. Los tipos de escalas difieren entre sí en las “propiedades” que los
símbolos numéricos utilizados en ellas realmente poseen. En una escala proporcional,
los símbolos numéricos realmente poseen todas las “propiedades” mostradas. En los
restantes tres tipos, se recurre a algunas de esas “propiedades” y no a todas. Las
escalas proporcionales son las más completas; las restantes tres proporcionan
mediciones más débiles.
Escala nominal
Una escala nominal es un sistema de clasificación cuyas categorías difieren entre sí
cualitativamente y no en grados. Las categorías deben ser mutuamente excluyentes
(ningún sujeto puede ser incluido en dos de ellas). Las categorías deben ser también
exhaustivas. Esto quiere decir que, para todos los sujetos en observación, existe una
categoría en que pueden ser incluidos.
Los símbolos numéricos de una escala nominal sólo sirven para designar categorías.
Por lo cual, ellos no expresan orden. Los números que se utilizan pueden ser
cualesquiera, con tal de respetar la regla: no asignar el mismo número a dos
categorías diferentes. Cabe resaltar, que puede asignarse al número “0” a una
categoría. El mismo, en una escala nominal, no indica ausencia del atributo. Las
escalas nominales, a diferencia de las proporcionales por ejemplo, son las más
simples. Los procedimientos estadísticos que pueden utilizarse con ellas son también
los más simples.
3
“Escalas de este tipo (clasificaciones cualitativas) son, por lo demás, comunes y
numerosas en psicología y ciencias sociales”
Escala ordinal
Una escala ordinal es un ordenamiento, en función de mayor o menor grado con que
se presenta un atributo. Las categorías de tal escala no sólo difieren entre sí, sino que
es posible ordenarlas.
Los símbolos numéricos de una escala ordinal no permiten efectuar juicios sobre
distancias, ni sobre valores absolutos, y, eventualmente, el 0 no significa ausencia del
atributo.
Los números en las escalas ordinales designan, e indican orden pero no expresan la
magnitud absoluta de un atributo ni el valor de las diferencias.
Ejemplos:
Escala proporcional
Constituyen el nivel más completo de medición. Las proporcionalidades entre números
corresponden a proporcionalidades en el atributo medido. Hay que disponer de un
cero absoluto.
4
Escala intervalar
Cuando hablamos, dentro de variables cuantitativas y nos referimos a escalas
intervalares, estamos diciendo que la variable en estudio tiene categorías
predeterminadas; un ejemplo de esta escala es el nivel de inteligencia, en el caso del
test WISC el autor determina un puntaje continuo.
Matriz de datos
El mundo observable o experimentable se resume mediante unidades de análisis a las
que asignamos unos valores en determinadas variables. Todo esto queda registrado
en una matriz de datos. Por lo tanto, la matriz de datos es un modo de ordenar los
datos de manera que sea particularmente visible la estructura tripartita de los datos. Es
una forma de sistematizar la información recogida de la realidad para investigar un
problema y tratar de obtener conocimiento científico que intente explicar dicho
problema a través del método de investigación científica. En efecto, mediante el
análisis de la matriz de datos podemos obtener un conocimiento que describa,
explique y prediga el comportamiento de los hechos tal como se observa o
experimenta en la realidad.
5
Datos agrupados y sin agrupar
Los datos no agrupados son el conjunto de datos que no se ha clasificado y se es
presentada en su forma de aparición en una tabla de datos donde cada valor se
presenta de forma individual. Por lo general este conjunto comprende una cantidad de
elementos menor a 30 con poca o nula repetición.
Ejemplo:
Los datos agrupados son una cantidad dada de datos que puede clasificarse, ya sea
por sus cualidades cualitativas o cuantitativas, y por tal agruparse para su análisis.
Estos datos, por lo general, se aconseja agruparlos cuando su población cuenta con
alrededor de 20 o más elementos que comparten una característica y caben dentro de
una categorización (repeticiones de un valor), ya que permite un mejor manejo y
análisis mas profundo de los mismos.
(primer grupo + segundo grupo, primer grupo + segundo grupo + tercer grupo y así
sucesivamente hasta llegar a acumular del primer grupo al último)
6
Límite inferior – Límite superior (LI-LS)
Son los valores extremos de cada intervalo. Por lógica el valor menor es el límite
inferior y el valor mayor corresponde al límite superior.
Mda: punto medio con 50% de los datos por arriba y 50% de los datos por debajo.
Media: promedio.
-------------------------------------segunda parte-----------------------------------------------------------
Ejemplo:
Alumno A: 6, 6, 7, 8, 8 = promedio 7
Alumno B: 4, 6, 7, 8, 10 = Promedio 7
Las notas del alumno B presentan mayor variabilidad que las del alumno A. Las notas
de B son más variadas, más heterogéneas.
Ejemplo:
Alumno A: 6, 6, 7, 8, 8 = promedio 7
Alumno B: 4, 6, 7, 8, 10 = Promedio 7
7
Alumno C: 7, 7, 7, 7, 7 = Promedio 7
AMPLITUD O RECORRIDO
Se define como la diferencia entre puntaje máximo observado y el puntaje mínimo
observado, más 1.
Ejemplo:
Puntaje máximo= 20
Puntaje mínimo= 10
20 - 10 + 1= 11
8
Es una medida de variabilidad que se usa pocas veces en psicología y en ciencias
sociales. Su objetivo es promediar las desviaciones con respecto a la media. Cuanto
mayor es su valor, mayor la variabilidad al conjunto de datos.
Cuartiles
Los cuartiles son valores que dividen el recorrido de una variable en cuatro partes, de
modo que en cada una de ellas se encuentre un 25% (1/4) del total de casos
observados.
Valores: 10.5, 10, 6, 3, 11, 20, 30, 21. Por consiguiente se ordenan los valores:
Q1: 8 (6+10 : 2)
Deciles
Los deciles son valores que dividen el recorrido de una variable en 10 partes, de modo
que en cada una de ellas se encuentra un 10% (1/10) del total de casos observados.
El primer decil es un valor de un 10% de los casos. El segundo decil es un valor que
deja por debajo de el un 20% de los casos. Y así con los otros. El quinto decil es igual
a la mda y al segundo cuartil.
Percentiles
Los percentiles son valores que dividen el recorrido de una variable en 100 partes de
tal forma que en cada una de ellas se encuentra el 1% de los casos observados
(1/100). El percentil 50 es igual a la mda, al segundo cuartil y al quinto decil.
Gráficos
DIAGRAMA DE SECTORES
El Diagrama de Sectores también se conoce como Gráfico de Torta o Gráfico Circular.
Representa los datos en un círculo, de modo que la frecuencia de cada valor viene
dada por un trozo de área del círculo. Así, el círculo queda dividido en sectores cuya
amplitud es proporcional a las frecuencias de los valores. Con este tipo de gráfica
estadística se puede representar cualquier variable.
9
DIAGRAMA DE BARRAS
El gráfico adecuado para representar datos de escalas nominales es el diagrama de
barras. En el eje horizontal se expresan las categorías de la variable (sin importar el
orden). En el eje vertical se expresan las frecuencias (absolutas) dejando la extensión
necesaria para representar la máxima frecuencia registrada. Cada categoría de la
variable se representa por una barra cuya altura expresa la frecuencia que
corresponde. En un diagrama de barras los rectángulos no contactan entre sí, para
denotar que las categorías de las variables difieren entre sí cualitativamente. También
se puede representar la frecuencia relativa.
HISTOGRAMA
Este gráfico es similar al diagrama de barras ya que a cada valor de la variable le
corresponde un rectángulo, cuya altura representa la frecuencia. Una diferencia es que
en el histograma los rectángulos son adyacentes (están unidos) ya que indica que se
trata de categorías contiguas, que difieren en grado. Otra diferencia es que en el
histograma, si se trata de escalas intervalares o proporcionales, las categorías
conllevan un orden y por tanto los valores menores se ubican al principio y los
mayores se irán alejando del origen (en el eje horizontal). La última diferencia es que
en el histograma el ancho de las barras son todos iguales, mientras que en el
diagrama de barras, no importa el ancho.
POLÍGONO DE FRECUENCIA
En el polígono de frecuencias el eje vertical expresa frecuencias absolutas o relativas
y el eje horizontal, valores de las variables en forma de puntos centrales de las clases.
Sobre el punto central de las clases, se eleva virtualmente una perpendicular cuya
altura corresponde a la frecuencia a representar, la frecuencia de ese valor. Esto se
hace en cada valor de la variable observada (los puntos centrales). Los extremos
superiores de esas perpendiculares se unen entre sí con líneas rectas, quedando
dibujada “una curva”. Deben completarse los extremos para obtener una figura
cerrada, como corresponde a un polígono.
OJIVA
La ojiva es otra representación gráfica que puede efectuarse con datos de escalas
Intervalar o proporcional. Lleva en el eje de las ordenadas (Y), frecuencias
acumuladas relativas. En el eje de las abscisas (X) se representan valores de la
variable en la forma de límites superiores de las categorías. Para trazar la curva, se
eleva una perpendicular cuya altura corresponde a la frecuencia relativa acumulada (o
porcentual) a representar en cada categoría. Luego se unen los puntos y así queda
trazada la curva.
10