Resumen Estadistica Descriptiva - Primer Parcial

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 10

Resumen parcial-Estadística

descriptiva
Distinción entre estadística descriptiva e
inferencial.
La estadística descriptiva es un conjunto de procedimientos para describir, resumir y
analizar datos referentes a un determinado aspecto de la realidad, de modo que estos
datos se puedan emplear mejor o de una forma mas útil o significativa.

La estadística descriptiva se usa cada vez que se habla de número de promedios de


años de escolarización de una población, la tasa de recuperación en los hospitales
psiquiátricos, los porcentajes de alumnos que abandonan la escuela primaria antes de
completar el ciclo, etc.

Por ejemplo, en la investigación social, una persona se encontrará a menudo en la


situación de disponer de tantos datos, que le resulte difícil absorber la información
entera. Con el empleo de medidas de cálculo: porcentajes, promedios, desviaciones
estándar y coeficientes de correlación, resulta posible reducir los datos a proporciones
manuables.

En la estadística inferencial se estudia un conjunto de procedimientos para extender


las conclusiones que se obtienen en una muestra, a la población general que es objeto
de estudio. Por ejemplo, se desea conocer qué proporción de los alumnos que cursan
el primer grado de la escuela primaria de nuestra ciudad son repetidores (repiten el
grado). La totalidad de alumnos inscriptos en primer grado en nuestra ciudad es la
población de interés en el estudio. Se debe observar cada uno de estos niños para
determinar si repite o no de grado; los procedimientos de muestreo de la estadística
inferencial permiten que el proceso sea más corto.

Es posible considerar sólo una parte de la población, esta parte se denomina muestra,
y puede ser mucho menor que la población. Si en la muestra se encuentra que el 40
por ciento de los alumnos son repetidores, se puede generalizar a la población
diciendo que la proporción de repetidores en ella muy probablemente esté entre 38 por
ciento y 42 por ciento. Para poder legítimamente efectuar esta generalización, la
muestra debe ser extraída de acuerdo a procedimientos que prescribe la estadística
inferencial.

1
Ejemplos de estadística descriptiva
 Suponiendo (en un caso hipotético) que un psicólogo/a decide realizar un estudio
acerca de cuántos casos y tipos de ansiedad hubieron registrados en algún centro
de salud mental en específico, en el año 2020. Para efectuar este estudio, tendrá
que consultar datos y frecuencias de la cantidad de personas que presentaban
algún tipo de ansiedad a lo largo del 2020. Luego de recolectar la información (por
ejemplo por medio de una encuesta anónima) se podrán realizar tablas o gráficos
donde se plasme y organice la información.

 Se quiere saber cuántas personas tuvieron covid en diferentes provincias de todo


el país, lo ordenas y organizas.
Santa fe: 100
Buenos Aires: 2000000

Ejemplos de estadística inferencial

 Suponiendo que un investigador decide analizar cuantas personas poseen


estudios universitarios completos en una determinada ciudad. Para hacerlo deberá
utilizar la estadística inferencial al tomar una muestra del total de personas de la
población, cantidad de habitantes, para analizarla y luego establecer hipótesis y
conclusiones a partir de los resultados obtenidos.

Concepto de medición
Toda medición se refiere a un atributo, aspecto, dimensión o variable de una cosa o
entidad sujeta a observación. No se mide, por ejemplo, una mesa sino su superficie,
su peso o su altura; Se mide la estatura de un hombre, su peso, su edad, su
capacidad intelectual, sus prejuicios o su neuroticismo.

La noción de medición aparece del uso que se hace en la vida diaria y en ciencias
como la física. Presupone, casi siempre, un punto de origen o cero absoluto y una
unidad de medida especificada, constante y estandarizada, como en el caso de medir
una longitud, un peso, una superficie, un volumen, etc. El concepto de “medir” en
ciencias sociales y psicología, incluye por tanto el sentido clásico, inspirado en
ciencias físicas, pero es mas amplio, ya que abarca el resultado de cualquier
operación de ordenamiento o posicionamiento de una serie. Torgerson sostiene que el
término medir significa siempre el valor, la cantidad o grado de un cierto atributo,
considerado específico de un objeto, fenómeno o acontecimiento.

2
Variable. Tipos de variables
En la estadística descriptiva, el investigador describe lo que ve. Lo que se estudia son
hechos o fenómenos, acontecimientos que cambian con el tiempo y son denominados
variables. Las variables pueden ser de tipo cualitativa o cuantitativa.

Las variables cualitativas son las que describen cualidades, circunstancias o


características de un objeto o persona, sin hacer uso de números. Por ejemplo, el sexo
de una persona es una variable cualitativa, ya que es masculino o femenino. Por otro
lado, las variables que otorgan como resultado un valor numérico. Por ejemplo,
variables tales como el peso (62 kg, 80 kg), la altura (1.72 cm, 1.85 cm) o la cantidad
de miembros en una familia (2, 3 o 4), son variables cuantitativas.

Escalas
Se distinguen cuatro tipos de escalas de medición: escala nominal, ordinal, intervalar y
proporcional. Los tipos de escalas difieren entre sí en las “propiedades” que los
símbolos numéricos utilizados en ellas realmente poseen. En una escala proporcional,
los símbolos numéricos realmente poseen todas las “propiedades” mostradas. En los
restantes tres tipos, se recurre a algunas de esas “propiedades” y no a todas. Las
escalas proporcionales son las más completas; las restantes tres proporcionan
mediciones más débiles.

 Escala nominal
Una escala nominal es un sistema de clasificación cuyas categorías difieren entre sí
cualitativamente y no en grados. Las categorías deben ser mutuamente excluyentes
(ningún sujeto puede ser incluido en dos de ellas). Las categorías deben ser también
exhaustivas. Esto quiere decir que, para todos los sujetos en observación, existe una
categoría en que pueden ser incluidos.

Los símbolos numéricos de una escala nominal sólo sirven para designar categorías.
Por lo cual, ellos no expresan orden. Los números que se utilizan pueden ser
cualesquiera, con tal de respetar la regla: no asignar el mismo número a dos
categorías diferentes. Cabe resaltar, que puede asignarse al número “0” a una
categoría. El mismo, en una escala nominal, no indica ausencia del atributo. Las
escalas nominales, a diferencia de las proporcionales por ejemplo, son las más
simples. Los procedimientos estadísticos que pueden utilizarse con ellas son también
los más simples.

3
“Escalas de este tipo (clasificaciones cualitativas) son, por lo demás, comunes y
numerosas en psicología y ciencias sociales”

Datos que se recolectan:

frecuencia, frecuencia relativa y frecuencia porcentual. M.O.

 Escala ordinal
Una escala ordinal es un ordenamiento, en función de mayor o menor grado con que
se presenta un atributo. Las categorías de tal escala no sólo difieren entre sí, sino que
es posible ordenarlas.

Los símbolos numéricos de una escala ordinal no permiten efectuar juicios sobre
distancias, ni sobre valores absolutos, y, eventualmente, el 0 no significa ausencia del
atributo.

Los números en las escalas ordinales designan, e indican orden pero no expresan la
magnitud absoluta de un atributo ni el valor de las diferencias.

Los valores de una escala ordinal indican meramente la posición de un ordenamiento.

Ejemplos:

El nivel socioeconómico: clase alta media y baja

Sistema de calificación escolar: excelente, bueno, muy bueno, satisfactorio

Datos que se recolectan:

frecuencia, frecuencia relativa, frecuencia acumulada y frecuencia porcentual. M.O Y


MDA

 Escala proporcional
Constituyen el nivel más completo de medición. Las proporcionalidades entre números
corresponden a proporcionalidades en el atributo medido. Hay que disponer de un
cero absoluto.

Se diferencia de la escala intervalar en que el cero es absoluto y en la intervalar es


relativo, es decir, el número no necesariamente tiene que empezar de cero.

Datos que se recolectan:

frecuencia, frecuencia relativa, frecuencia porcentual, frecuencia acumulada, límite


inferior y superior, X', frecuencia por x'. M.O, MDA y media

4
 Escala intervalar
Cuando hablamos, dentro de variables cuantitativas y nos referimos a escalas
intervalares, estamos diciendo que la variable en estudio tiene categorías
predeterminadas; un ejemplo de esta escala es el nivel de inteligencia, en el caso del
test WISC el autor determina un puntaje continuo.

Un ejemplo clásico para introducir el concepto de escala Intervalar es el de la


temperatura medida por el termómetro común en escalas Celsius (centígrados) o
Fahrenheit: En la escala centígrada (como es cualquier escala Intervalar), el 0 no
indica ausencia del atributo sino que es un punto de origen de la medición
arbitrariamente fijado y convencionalmente aceptado. (Se dice que es un 0 arbitrario)

En una escala Intervalar los números permiten efectuar juicios de proporcionalidad


entre las distancias. Los valores numéricos que corresponden a este tipo de escala
permiten efectuar operaciones aritméticas y el empleo de todos los procedimientos
estadísticos a estudiar.

Datos que se recolectan:

frecuencia, frecuencia relativa, frecuencia porcentual, frecuencia acumulada, límite


inferior y superior, X', frecuencia por x'. M.O, MDA y media.

(Ver ejemplos en el libro de Grasso- a partir de la página 42 hasta llegar a la


proporcional).

Matriz de datos
El mundo observable o experimentable se resume mediante unidades de análisis a las
que asignamos unos valores en determinadas variables. Todo esto queda registrado
en una matriz de datos. Por lo tanto, la matriz de datos es un modo de ordenar los
datos de manera que sea particularmente visible la estructura tripartita de los datos. Es
una forma de sistematizar la información recogida de la realidad para investigar un
problema y tratar de obtener conocimiento científico que intente explicar dicho
problema a través del método de investigación científica. En efecto, mediante el
análisis de la matriz de datos podemos obtener un conocimiento que describa,
explique y prediga el comportamiento de los hechos tal como se observa o
experimenta en la realidad.

5
Datos agrupados y sin agrupar
Los datos no agrupados son el conjunto de datos que no se ha clasificado y se es
presentada en su forma de aparición en una tabla de datos donde cada valor se
presenta de forma individual. Por lo general este conjunto comprende una cantidad de
elementos menor a 30 con poca o nula repetición.

El manejo de los datos se hace recolectando los datos de la población de estudio y


dichos datos se distribuyen en una tabla de datos y se analizan sin necesidad de
formar clases con ellos. Estos datos al distribuirse en tabla de frecuencia donde cada
dato mantiene su propia identidad después que la distribución de frecuencia se ha
elaborado.

Ejemplo:

2,2,1,3,3,3,4,4,5,6,1,2,2,3,3,3,4,4,3,6 (Total 20 niños)

Estos son datos no agrupados porque no se han clasificado y contado.

Los datos agrupados son una cantidad dada de datos que puede clasificarse, ya sea
por sus cualidades cualitativas o cuantitativas, y por tal agruparse para su análisis.
Estos datos, por lo general, se aconseja agruparlos cuando su población cuenta con
alrededor de 20 o más elementos que comparten una característica y caben dentro de
una categorización (repeticiones de un valor), ya que permite un mejor manejo y
análisis mas profundo de los mismos.

Frecuencia acumulada (Fa)


La frecuencia acumulada se obtiene simplemente de ir sumando una clase o grupo de
la muestra con la anterior.

(primer grupo + segundo grupo, primer grupo + segundo grupo + tercer grupo y así
sucesivamente hasta llegar a acumular del primer grupo al último)

Frecuencia relativa (F´)


La proporción que las observaciones de una categoría representan en relación al
conjunto total de observaciones o sea, en relación al número total de casos (N). Para
calcular la F´ de una categoría o variable: se divide su frecuencia absoluta por el
número total de casos.

6
Límite inferior – Límite superior (LI-LS)
Son los valores extremos de cada intervalo. Por lógica el valor menor es el límite
inferior y el valor mayor corresponde al límite superior.

Frecuencia porcentual (F%)


La frecuencia relativa es muy usada en probabilidad, y hace referencia a la relación de
una frecuencia absoluta entre un total. Este valor de frecuencia relativa porcentual
representa la posibilidad sobre 100% de encontrar este número en una serie de datos,
es por esta razón que es una relación de frecuencias.

Medidas de posición central


Mo: mayor frecuencia de la variable que se estudia.

Mda: punto medio con 50% de los datos por arriba y 50% de los datos por debajo.

Media: promedio.

-------------------------------------segunda parte-----------------------------------------------------------

Medidas de variabilidad y dispersión


El concepto de variabilidad o dispersión se refiere a la heterogeneidad u
homogeneidad de un conjunto de datos, a la semejanza o desemejanza de los datos
entre sí. Un conjunto de datos presenta poca variabilidad o dispersión cuando los
datos coinciden o se concentran alrededor de aquel que es más representativo del
conjunto (medida de tendencia central). Al contrario, hay gran variabilidad cuando los
datos se alejan de aquel que constituye una medida de tendencia central.

Ejemplo:

Alumno A: 6, 6, 7, 8, 8 = promedio 7

Alumno B: 4, 6, 7, 8, 10 = Promedio 7

Las notas del alumno B presentan mayor variabilidad que las del alumno A. Las notas
de B son más variadas, más heterogéneas.

Las medidas de tendencia central (MO – MDA – MEDIA) representan mejor un


conjunto de datos cuanto menor es la dispersión o variabilidad. Al contrario, cuanto
mayor sea la variabilidad, menos representativo es el resultado de una medida de
tendencia central.

Ejemplo:

Alumno A: 6, 6, 7, 8, 8 = promedio 7

Alumno B: 4, 6, 7, 8, 10 = Promedio 7

7
Alumno C: 7, 7, 7, 7, 7 = Promedio 7

En el caso del alumno C, las medidas de tendencia central (7) representan


exactamente las notas que obtuvo porque no hay variabilidad. En el caso del alumno
A, el promedio (7) representa bastante bien (no exactamente) el conjunto de notas
porque se alejan poco de la tendencia central. No obstante, en el caso del alumno B,
las medidas de tendencia central representan poco al conjunto de notas porque tiene
mucha variabilidad.

Existen varias medidas de tendencia central: el recorrido o amplitud, la amplitud


semi- intercuartilar, la varianza y la desviación standard.

En las escalas nominales NO se pueden calcular medidas de variabilidad o


dispersión. Sin embargo, se puede comparar al concepto de “incertidumbre”. Es decir,
mayor variabilidad corresponde a mayor incertidumbre.

AMPLITUD O RECORRIDO
Se define como la diferencia entre puntaje máximo observado y el puntaje mínimo
observado, más 1.

Ejemplo:

Puntaje máximo= 20

Puntaje mínimo= 10

20 - 10 + 1= 11

La diferencia (resta) es la que refleja la dispersión o heterogeneidad de los datos:


cuanta mayor variabilidad mayor la diferencia. El 1 se agrega para obtener una
indicación de cuántas unidades están comprendidas en el intervalo total cubierto por
los datos. Aunque, algunos autores suprimen el 1.

El recorrido (R) se aprecia fácilmente en un histograma o en un polígono de


frecuencias. Cuanto mayor es el recorrido es mayor la variabilidad.

VARIANZA Y DESVIACIÓN STANDARD


Cuando se habló de los conceptos de variabilidad se dijo que la dispersión de un
conjunto de datos está dada por el grado en que las observaciones individuales se
alejan o se acercan al valor más característico del conjunto (medida de tendencia
central). La varianza y la desviación standard son índices que se basan en esta idea y
reflejan la medida en que las observaciones individuales se alejan o se acercan de la
media. Son los índices de variabilidad más importantes. La desviación standard es el
más utilizado en estadística descriptiva y la varianza se usa en aplicaciones
avanzadas.

La desviación standard es la desviación de los puntajes con respecto a la media.


Nunca puede ser negativa en estadística descriptiva y tampoco puede superar la
media.

8
Es una medida de variabilidad que se usa pocas veces en psicología y en ciencias
sociales. Su objetivo es promediar las desviaciones con respecto a la media. Cuanto
mayor es su valor, mayor la variabilidad al conjunto de datos.

Cuartiles
Los cuartiles son valores que dividen el recorrido de una variable en cuatro partes, de
modo que en cada una de ellas se encuentre un 25% (1/4) del total de casos
observados.

El primer cuartil (Q1) es un valor de la variable en el que por debajo de él se encuentra


una cuarta parte de los caso, es decir, un 25% de los casos. El segundo cuartil (Q2) es
un valor de la variable en el cual se percibe dos cuartas partes de los casos, es decir,
un 50%. El tercer cuartil (Q3) es un valor de la variable en el cual se percibe tres
cuartas partes de los casos, o sea, un 75%.

Valores: 10.5, 10, 6, 3, 11, 20, 30, 21. Por consiguiente se ordenan los valores:

3, 6, 10, 10.5, 11, 20, 21, 30

Q1: 8 (6+10 : 2)

Mda-Q2: 10,75 (10,5+11 : 2) para datos sueltos

Q3: 20.5 (20+21 : 2)

Deciles
Los deciles son valores que dividen el recorrido de una variable en 10 partes, de modo
que en cada una de ellas se encuentra un 10% (1/10) del total de casos observados.
El primer decil es un valor de un 10% de los casos. El segundo decil es un valor que
deja por debajo de el un 20% de los casos. Y así con los otros. El quinto decil es igual
a la mda y al segundo cuartil.

Percentiles
Los percentiles son valores que dividen el recorrido de una variable en 100 partes de
tal forma que en cada una de ellas se encuentra el 1% de los casos observados
(1/100). El percentil 50 es igual a la mda, al segundo cuartil y al quinto decil.

Gráficos
DIAGRAMA DE SECTORES
El Diagrama de Sectores también se conoce como Gráfico de Torta o Gráfico Circular.
Representa los datos en un círculo, de modo que la frecuencia de cada valor viene
dada por un trozo de área del círculo. Así, el círculo queda dividido en sectores cuya
amplitud es proporcional a las frecuencias de los valores. Con este tipo de gráfica
estadística se puede representar cualquier variable.

9
DIAGRAMA DE BARRAS
El gráfico adecuado para representar datos de escalas nominales es el diagrama de
barras. En el eje horizontal se expresan las categorías de la variable (sin importar el
orden). En el eje vertical se expresan las frecuencias (absolutas) dejando la extensión
necesaria para representar la máxima frecuencia registrada. Cada categoría de la
variable se representa por una barra cuya altura expresa la frecuencia que
corresponde. En un diagrama de barras los rectángulos no contactan entre sí, para
denotar que las categorías de las variables difieren entre sí cualitativamente. También
se puede representar la frecuencia relativa.

HISTOGRAMA
Este gráfico es similar al diagrama de barras ya que a cada valor de la variable le
corresponde un rectángulo, cuya altura representa la frecuencia. Una diferencia es que
en el histograma los rectángulos son adyacentes (están unidos) ya que indica que se
trata de categorías contiguas, que difieren en grado. Otra diferencia es que en el
histograma, si se trata de escalas intervalares o proporcionales, las categorías
conllevan un orden y por tanto los valores menores se ubican al principio y los
mayores se irán alejando del origen (en el eje horizontal). La última diferencia es que
en el histograma el ancho de las barras son todos iguales, mientras que en el
diagrama de barras, no importa el ancho.

POLÍGONO DE FRECUENCIA
En el polígono de frecuencias el eje vertical expresa frecuencias absolutas o relativas
y el eje horizontal, valores de las variables en forma de puntos centrales de las clases.
Sobre el punto central de las clases, se eleva virtualmente una perpendicular cuya
altura corresponde a la frecuencia a representar, la frecuencia de ese valor. Esto se
hace en cada valor de la variable observada (los puntos centrales). Los extremos
superiores de esas perpendiculares se unen entre sí con líneas rectas, quedando
dibujada “una curva”. Deben completarse los extremos para obtener una figura
cerrada, como corresponde a un polígono.

OJIVA
La ojiva es otra representación gráfica que puede efectuarse con datos de escalas
Intervalar o proporcional. Lleva en el eje de las ordenadas (Y), frecuencias
acumuladas relativas. En el eje de las abscisas (X) se representan valores de la
variable en la forma de límites superiores de las categorías. Para trazar la curva, se
eleva una perpendicular cuya altura corresponde a la frecuencia relativa acumulada (o
porcentual) a representar en cada categoría. Luego se unen los puntos y así queda
trazada la curva.

La utilidad de la ojiva reside en que permite efectuar estimaciones, en forma gráfica,


de varios índices estadísticos importantes en psicología. La precisión de esas
estimaciones dependerá de la prolijidad en la que se haya dibujado la ojiva.

10

También podría gustarte