PSICOPATOLOGÍA ADULTOS (Resumen Completo)

‭1‬
‭ esumen de Métodos y técnicas‬

R
‭cuantitativas. (2021). Módulos 1-8‬‭.‬
‭‬
● ‭ ibliografía:‬‭https://psicoresumenes.weebly.com/bibliocuantitativas.html‬
B
‭●‬ ‭Pruebas de practica:‬‭https://psicoresumenes.weebly.com/pruebascuanti.html‬
‭●‬ ‭Resúmenes de primer año:‬‭https://psicoresumenes.weebly.com/primerano.html‬
‭●‬ ‭Resúmenes de segundo año:‬
‭https://psicoresumenes.weebly.com/segundoano.html‬
‭ ‬ ‭Resúmenes de tercer año:‬‭https://psicoresumenes.weebly.com/tercerano.html‬
●
‭Unidad 1 - Presentación del curso y nociones básicas acerca de variable‬ ‭pág. 2‬
‭Unidad 2 - Variables categóricas I: frecuencias y tablas bivariadas‬ ‭pág. 10‬
‭Unidad 3 - Variables categóricas II: gráficos, tendencia central y dispersión‬ ‭pág. 16‬
‭Unidad 4 - Variables numéricas I - cuantiles‬ ‭pág. 19‬
‭Unidad 5 - Variables numéricas II - tendencia central y dispersión‬ ‭pág. 29‬
‭Unidad 6 - Puntuaciones Z y distribución normal‬ ‭pág. 38‬
‭Unidad 7 - Muestreo - Introducción a la inferencia‬ ‭pág. 43‬
‭Unidad 8 - Estimación: Intervalos de confianza‬ ‭pág. 47‬
‭Alejandro Busto‬
‭2‬
‭Unidad 1 - Presentación del curso y nociones básicas acerca de variables‬
‭¿Qué son los métodos cuantitativos?‬
‭ s un método de investigación que se fundamenta en la medición de variables mediante el‬

E
‭uso de un sistema numérico, el análisis de estas mediciones mediante el uso de modelos‬
‭estadísticos, y el reporte de las relaciones y asociaciones entre las variables estudiadas.‬
‭ l‬‭objetivo‬‭de reunir los datos cuantitativos es entender,‬‭describir, y predecir la naturaleza‬

E
‭de un fenómeno, particularmente mediante el desarrollo de modelos y teorías.‬
‭Estadística descriptiva e inferencial‬
‭ l acto de ir desde lo que se observa que ocurre en un conjunto reducido de observaciones‬

E
‭hasta la afirmación de que eso mismo es válido también para el total de observaciones de la‬
‭misma clase es lo que se conoce como‬‭inducción‬‭o‬‭generalización‬‭inductiva.‬
‭ a ciencia que recoge, ordena y analiza los datos de una muestra extraída de una‬
L
‭determinada población, para hacer inferencias acerca de esa población valiéndose del‬
‭cálculo de probabilidades es la‬‭estadística.‬
‭Es como encontrar la estadística subdividida en:‬

‭1)‬ ‭Estadística descriptiva:‬‭corresponde con una serie‬‭de procedimientos diseñados‬
‭para describir información contenida en un conjunto de datos, es decir, resume y‬
‭organiza datos.‬
‭2)‬ ‭Estadística inferencial o inductiva:‬‭engloba una serie‬‭de procedimientos que‬
‭permiten generalizar la información contenida en ese conjunto particular de datos, al‬
‭conjunto total de datos, es decir, extrae información y elabora conclusiones.‬
‭¿Para qué se puede usar la metodología cuantitativa dentro de la psicología?‬
‭Los psicólogos tenemos diferentes áreas de inserción laboral:‬

‭-‬ ‭Clínica: se pueden recibir informes con datos cuantitativos sobre niveles de ansiedad‬
‭de una persona‬
‭-‬ ‭Laboral: recolección de datos de los empleados‬
‭-‬ ‭Educación: contrastar métodos educativos con otros y que tan eficientes son‬
‭respecto a otros en las distintas áreas‬
‭-‬ ‭Investigación: la mayoría de las publicaciones en revistas científicas a nivel‬
‭internacional en psicología utilizan técnicas cuantitativas.‬
‭Análisis de datos‬
‭ l análisis de datos, o análisis estadístico, pertenece a una rama de las matemáticas‬

E
‭conocida como estadística. La estadística es el resultado de la confluencia de dos‬
‭disciplinas:‬
‭1.‬ ‭el cálculo de probabilidad‬
‭2.‬ ‭la estadística o ciencia del estado‬
‭3‬
‭ a unión de ambas en el siglo XIX dio lugar a una nueva ciencia interesada en estudiar‬
L
‭cómo obtener conclusiones de la investigación empírica mediante el uso de modelos‬
‭matemáticos.‬
‭ ara poder llegar a esas conclusiones, es decir, para poder efectuar un salto de lo particular‬
P
‭a lo general, es crucial que el conjunto de datos utilizados para obtener información sea‬
‭representativo del conjunto total de datos sobre el que se desea realizar la inferencia, o sea,‬
‭es necesario efectuar una correcta selección de los datos. Esto se consigue mediante‬
‭técnicas de muestreo.‬
‭Existen dos tipos de estadística:‬

‭●‬ ‭Estadística teórica:‬‭se ocupa de investigar y proponer‬‭métodos formalmente‬
‭válidos para organizar los datos y realizar inferencias‬
‭●‬ ‭Estadistica aplicada:‬‭se ocupa de aplicar esos métodos‬‭a datos reales. Está es la‬
‭que actualmente se conoce como‬‭análisis de datos.‬
‭ l análisis de datos es un proceso que se desarrolla en fases: empieza con la seleccion y‬

E
‭recopilacion de los datos, continúa con la aplicación de herramientas descriptivas para‬
‭organizar y resumir la información contenida en los datos y termina frecuentemente, aunque‬
‭no necesariamente, con la aplicación de herramientas inferenciales para efectuar‬
‭comparaciones y estudiar relaciones.‬
‭¿Para qué sirve el análisis de datos?‬
‭ ara encontrar relaciones de tipo general (leyes) capaces de explicar el comportamiento de‬
P
‭uno o varios eventos reales, a partir de la inducción o generalización inductiva.‬
‭ n la mayoría de las ciencias empíricas (medicina, biología, psicología, sociología, etc), la‬
E
‭variación existente entre las distintas observaciones de un mismo evento no puede ser‬
‭sometida, habitualmente, a un control riguroso. Las fuentes de variación existentes son muy‬
‭numerosas y resultan extremadamente difíciles de identificar, medir y controlar. En estas‬
‭circunstancias, las conclusiones a las que es posible llegar inductivamente requieren la‬
‭utilización de una metodología especial. Y es precisamente la estadística la encargada de‬
‭proporcionar a las ciencias empíricas esa metodología.‬
‭Niveles de indagación: descriptivo, relacional, explicativo‬
‭La investigación empírica puede desarrollarse en diferentes niveles de indagación:‬

‭-‬ ‭Descriptivo:‬‭se busca dar respuesta a la pregunta‬‭cómo son las cosas.‬‭En este‬
‭nivel de indagación se intenta obtener conocimiento sobre algo desconocido,‬
‭identificar problemas de investigación y generar ideas para ser estudiadas a otros‬
‭niveles.‬
‭-‬ ‭Relacional:‬‭se busca dar respuesta a la pregunta‬‭cómo‬‭unas cosas se relacionan‬
‭con otras.‬‭Los hechos deben ser conectados entre sí‬‭de una forma lógica y‬
‭sistemática para constituir conocimiento organizado. Permite avanzar hacía el‬
‭objetivo intentando descubrir qué hechos se encuentran relacionados y en qué‬
‭medida, y predecir unos a partir de otros.‬
‭-‬ ‭Explicativo:‬‭se busca dar respuesta (al menos respuesta‬‭parcial) a la pregunta‬
‭cómo las cosas han llegado a ser de la forma que son,‬‭o‬‭por qué las cosas son‬
‭como son.‬‭Permite establecer relaciones de tipo causal‬‭entre los eventos de‬
‭‬
4
‭manera que lo que ocurre con uno o varios de ellos puede ser explicado recurriendo‬
‭a otro o varios diferentes.‬
‭ as técnicas de análisis de datos pueden ser aplicadas a cualquier conjunto de datos‬

L
‭independientes del nivel de indagación en el que pueda situarse un estudio.‬
‭ na técnica de análisis de datos no determina el nivel de indagación en el que se es posible‬

U
‭situar las conclusiones de un estudio. Esto viene condicionado, no por las técnicas de‬
‭análisis, sino por la estrategia de recogida de datos adoptada.‬
‭ a recogida de datos se realiza en el contexto de un diseño de investigación, y puede‬

L
‭efectuarse siguiendo dos caminos alternativos:‬
‭1.‬ ‭Diseño observacional:‬‭esperando que aparezca el fenómeno‬‭que se desea‬
‭estudiar y observando cuando ocurre‬
‭2.‬ ‭Diseño experimental:‬‭provocando que ocurra bajo circunstancias‬‭controladas y‬
‭registrandolo al producirse‬
‭ stas dos formas difieren, básicamente, en el grado de control que se ejerce sobre los‬
E
‭diferentes elementos de la situación en la que se da el fenómeno que se desea estudiar,‬
‭siendo este control máximo en la metodología experimental.‬
‭Metodología correlacional‬
‭ medio camino entre la metodología observacional y la experimental se encuentra la‬

A
‭metodología correlacional, también llamada selectiva o cuasi-experimental. En ella se da un‬
‭mayor grado de control que en la observacional, pero un menor grado de control que en la‬
‭experimental.‬
‭ o existe en la metodología correlacional una asignación aleatoria de los sujetos a las‬

N
‭condiciones de estudio. Esto se debe algunas veces a que no es posible hacerlo, otras por‬
‭razones prácticas y otras por razones éticas.‬
‭ a principal consecuencia de la falta de asignación aleatoria a las condiciones de estudio es‬

L
‭que no se trabaja con grupos equivalentes. Y esto significa que, a diferencia de lo que‬
‭ocurre con los diseños experimentales, con los correlacionales no es posible conocer con‬
‭certeza si las diferencias y relaciones encontradas se deben a las condiciones de estudio o‬
‭a la presencia de variables que no se han podido controlar.‬
‭ o que interesa destacar es que la utilización de una u otra técnica de análisis no determina,‬
L
‭por ella misma, el tipo de conclusiones que es posible extraer de un análisis. No permiten‬
‭saber a que se deben las diferencias y relaciones detectadas. El principal determinante del‬
‭nivel de indagación en el que es posible situarse no es la técnica de análisis aplicada, sino‬
‭la estrategia de recogida de datos utilizada.‬
‭ n términos generales, la metodología observacional y selectiva generan investigación‬

E
‭descriptiva y relacional, mientras que la metodología experimental genera investigación‬
‭explicativa.‬
‭5‬
‭¿Que es una variable?‬
‭Es la representación numérica de una característica sometida a medición.‬
‭ uede ser tanto una característica física, como la altura, o el color de pelo, como un‬
P
‭constructo que no se puede ver a simple vista, estos últimos siendo los que se usan‬
‭habitualmente en psicología, por ejemplo, la depresión; estas son también denominadas‬
‭como‬‭variables latentes.‬
‭ e le denomina variable debido a que en determinada población, está va a‬‭variar‬‭de‬

S
‭persona a persona, por ejemplo, la edad es distinta en general en todas las personas,‬
‭dependiendo de qué tan en profundidad se la analice. Supongamos que solo se toma en‬
‭cuenta el año de nacimiento, en una población determinada se puede llegar a tener‬
‭personas de entre 0 a 122 años.‬
‭ n cuanto a las variables que no se pueden ver, como la depresión, está no es posible‬
E
‭distinguir a simple vista sino que está construida (por eso es un constructo) por diferentes‬
‭dimensiones, por ejemplo:‬
‭-‬ ‭alteraciones del sueño‬
‭-‬ ‭sensación de fatiga‬
‭-‬ ‭pensamientos recurrentes acerca de la muerte‬
‭-‬ ‭etc‬
‭ stos indicadores se pueden utilizar para intentar determinar el nivel de depresión de una‬
E
‭persona, así para poder conocer si una persona está deprimida, es necesario medir esas‬
‭diferentes dimensiones a través de preguntas relacionadas con esos indicadores, este‬
‭proceso anterior es denominado como‬‭operacionalización‬‭de una variable.‬
‭ a depresión es una variable debido a que hay personas que pueden tener valores bajos de‬
L
‭depresión, otras intermedio y otras muy altos.‬
‭ ntonces podemos decir que una variable es una propiedad de un sujeto u objeto que varía,‬
E
‭pudiendo adquirir así diferentes valores.‬
‭Variables en Psicología‬
‭ as variables son las dimensiones o facetas de la conducta que son analizadas y pueden‬
L
‭tomar dos o más valores.‬
‭ a mayoría de las variables son latentes, es decir, no tenemos “acceso” a su medida de‬
L
‭forma directa. Por ejemplo, la satisfacción, inteligencia, ansiedad, etc.‬
‭ ara poder medir estos atributos es necesario‬‭operacionalizar‬‭las variables y‬

P
‭constructos.‬
‭ s importante destacar que no todas las variables son iguales. Hay distintos “formatos” de‬
E
‭variables cuando trabajamos con métodos cuantitativos. Esto tiene que ver con la‬
‭formulación de la pregunta, no es lo mismo preguntar sobre el departamento donde vive una‬
‭persona, lo cual la respuesta va a ser cerrada pero va a estar dentro de un margen de‬
‭opciones limitado que serán la cantidad de departamentos; que preguntar sobre si una‬
‭persona tiene agua potable en la casa, lo cual va a dar una respuesta de “si” o “no”.‬
‭6‬
‭Entonces, podemos decir que los formatos de variables dependeran de:‬
‭-‬ ‭La pregunta formulada‬
‭-‬ ‭Las opciones de respuesta de esa pregunta‬
‭ sto es porque también es posible preguntar la misma cosa, pero formulando la pregunta‬
E
‭de una manera que de opciones de respuesta distinta. Por ejemplo, frente a una pregunta‬
‭sobre cómo una persona valora determinado servicio brindado, la pregunta puede‬
‭formularse de las siguientes maneras:‬
‭Pregunta‬ ‭Tipos de respuesta‬
‭¿Está satisfecho con el servicio?‬ ‭SI | NO‬
‭¿Su satisfacción con el servicio es….?‬ ‭Baja | Moderada | Alta‬
‭Valore del 1 al 10 su satisfacción con el servicio.‬ ‭1,2,3,4,5…,10‬
‭Tipos de variables y niveles de medida‬
‭ ipos de variables.‬
T
‭Podemos clasificarlas en:‬
‭-‬ ‭Variables categóricas:‬‭también denominados como variables‬‭cualitativas. Estas‬
‭toman valores o niveles discretos para cada categoría.‬
‭ or ejemplo, ante la pregunta ¿usted trabaja? las respuestas pueden ser “si” y “no”. Cuando‬
P
‭se ingresan esas respuestas a la base de datos, a “si” se le otorga el valor 1, a “no” se le‬
‭otorga el valor 2.‬
‭ a variable en el caso anterior es‬‭trabajar‬‭, y sus‬‭categorías de respuesta son “si” y “no”, a‬

L
‭su vez, el “valor” de cada categoría es, para “si” 1, y para “no” 2. En este sentido, se dice‬
‭que “trabajar” está representado con el valor 1, y “no trabajar” está representado con el‬
‭valor 2.‬
‭Entonces, las variables categorías sirven para clasificar las distintas opciones de respuesta.‬
‭-‬ ‭ ariables cuantitativas o numéricas:‬‭toman valores‬‭numéricos para sus‬

V
‭respuestas.‬
‭Estas variables pueden ser tanto:‬

‭-‬ ‭Discretas:‬‭existe distancia mínima entre valores posibles.‬‭Utiliza números enteros‬
‭(1,2,3,4…), es decir, no pueden ser 13.4, 21.3, etc. Por ejemplo, la edad en años‬
‭debe ser 12 años, y no 12 años y 4 meses.‬
‭-‬ ‭Continuas:‬‭no existe distancia mínima entre valores‬‭posibles. Utiliza números‬
‭reales, es decir todos por encima del 0 (1,2,3…, pero también 2.2, 14.5, 21.02, etc)‬
‭Por ejemplo, la temperatura es 37.7 grados.‬
‭Variable‬ ‭Tipo de número‬ ‭Ejemplo‬
‭Discreta‬ ‭Enteros: 1, 20, 506‬ ‭12 años; 5 hijos‬
‭Continua‬ ‭Reales: 1.05, 21,5‬ ‭Temperatura 37.7°‬
‭7‬
‭Niveles (o escalas) de medida‬
‭Medir consiste en hacer corresponder dos sistemas de relaciones:‬

‭1.‬ ‭Uno empírico:‬‭el de las propiedades que se desea medir‬
‭2.‬ ‭Uno formal:‬‭el de los números que se asignan a la‬‭medición‬
‭ s necesario que las relaciones presentes en el sistema formal reflejen las presentes en el‬
E
‭sistema empírico para que la correspondencia efectuada se considere una medición.‬
‭ ependiendo del tipo de relaciones que puedan establecerse entre los valores (números)‬
D
‭asignados a una característica, es posible definir diferentes niveles o escalas de medida.‬
‭Tradicionalmente se distinguen 4 niveles: nominal, ordinal, de intervalos y de razón.‬
‭A su vez, dentro de las‬‭variables categóricas‬‭, tenemos‬‭los niveles de medida:‬

‭1)‬ ‭Nivel de medida nominal:‬‭consiste en clasificar en‬‭categorías a los sujetos u‬
‭objetos que se desea medir haciendo que todos los sujetos u objetos clasificados‬
‭dentro de la misma categoría sean equivalentes en la característica que se está‬
‭midiendo; los sujetos u objetos a los que se les ha asignado el mismo número son‬
‭cualitativamente iguales en la variable medida, mientras que los sujetos u objetos a‬
‭los que se les ha asignado un número diferente se considera que son‬
‭cualitativamente distintos. Por ejemplo si la variable es “trabajar”, la respuesta es “si”‬
‭o “no” y sus categorías de respuesta adquieren valores, 1(si) y 2(no), no importa el‬
‭valor de la categoría como tal sino que lo que importa es que exista un valor por‬
‭cada opción de respuesta o categoría. Entre esos números sólo puede establecerse‬
‭una relación de igualdad o desigualdad. No se puede establecer una relación de‬
‭orden, es decir, de mayor o menor, ya que el valor 2 no indica mayor cantidad que‬
‭en el valor 1, solamente indican que alguien trabaja o que alguien no trabaja, es‬
‭decir, el que trabaja es desigual cualitativamente al que no trabaja, e igual‬
‭cualitativamente a otras personas que trabajan.‬
‭Las categorías utilizadas deben reunir 2 propiedades:‬

‭-‬ ‭Por un lado,‬‭homogeneidad intra elementos‬‭o‬‭exhaustividad:‬‭cada sujeto u‬
‭objeto puede ser clasificado en alguna de las categorías establecidas.‬‭Trabajar‬
‭siempre se representa con el valor 1 y en ese sentido, todas las personas que‬
‭trabajen tendrán una correspondiente categoría, y a su vez, todas las que no‬
‭trabajen tendrán su categoría, nadie queda sin categoría.‬
‭-‬ ‭Por otro lado,‬‭heterogeneidad inter elementos‬‭o‬‭exclusividad:‬‭cada sujeto u‬
‭objeto puede ser clasificado en solo una de las categorías establecidas, o sea,‬‭todos‬
‭los 1 son diferentes de los 2. Es decir que todas las personas que trabajan, en la‬
‭base de datos estarán siempre representadas por el valor 1 y nunca en el valor 2, o‬
‭en ambos valores a la vez.‬
‭ n un tipo de variable categórica, los “valores” de su medida son los de sus categorías de‬
E
‭respuesta. Es importante recordar que, el “valor” de determinada categoría no es en sí‬
‭mismo valorativo de la categoría en sí, es decir, trabajar no vale 1, sino que el 1 representa‬
‭a la categoría “trabaja” y el 2 representa a la categoría “no trabaja”. Dicho de otra forma, no‬
‭hay una relación jerárquica entre los valores “si trabajo” y “no trabajo”, trabajar no vale‬
‭menos, ni es peor ni mejor que no trabajar, la función de los números es meramente‬
‭representacional.‬
‭8‬
‭2)‬ N
‭ ivel ordinal (orden):‬‭en las ciencias sociales y‬‭de la salud es frecuente‬
‭encontrarse con características en las que resulta apropiado utilizar está escala. La‬
‭satisfacción con un producto o servicio, el bienestar psicológico, el dolor percibido,‬
‭etc., son ejemplos de características que suelen medirse con una escala ordinal. En‬
‭este nivel se desconoce si la diferencia existente entre los sujetos a los que se les‬
‭ha asignado un 1 y un 2 es igual (o distinta) a la diferencia existente entre los sujetos‬
‭a los que se les ha asignado un 3 y un 4. Pero si es posible ordenarlos de manera‬
‭jerárquica. Consiste en asignar a los sujetos u objetos medidos un número que‬
‭permita ordenarlos según la cantidad que poseen de la característica medida.‬
‭Entonces sus categorías‬‭tienen‬‭un orden jerárquico‬‭pero‬‭no representan valores‬
‭reales‬‭de una variable en sí misma sino un orden o‬‭jerarquía de las mismas.‬
‭ or ejemplo, ante la pregunta sobre el nivel socioeconómico de una persona, sus‬

P
‭respuestas pueden ser:‬
‭-‬ ‭Alto‬
‭-‬ ‭Medio‬
‭-‬ ‭Bajo‬
‭ ada una de estas respuestas va a tener un valor, y cada valor va a ser correspondiente‬
C
‭con la jerarquía de esas respuestas, en este sentido:‬
‭-‬ ‭Alto vale 30‬
‭-‬ ‭Medio vale 20‬
‭-‬ ‭Bajo vale 10‬
‭ s decir, que los valores respetan el orden jerárquico, no son al azar. Y si bien los valores‬
E
‭no importan, o sea, alto podría haber valido 18 en vez de 30, pero “medio” siempre tiene‬
‭que tener un valor menor al de “alto”, y a su vez, “bajo” siempre tiene que tener un valor‬
‭menor a “medio”, perfectamente podrían haber sido:‬
‭-‬ ‭Alto 18‬
‭-‬ ‭Medio 11‬
‭-‬ ‭Bajo 3‬
‭En cuanto a las‬‭variables numéricas o cuantitativas,‬‭encontramos dos tipos:‬

‭1)‬ ‭Nivel por intervalos:‬‭en este nivel de medida, además‬‭de poder afirmar que la‬
‭característica medida se da con mayor intensidad en un sujeto que en otro, también‬
‭es posible determinar la magnitud de la diferencia existente entre dos sujeto s‬
‭medidos, es decir, la cantidad en la que difieren. Sin embargo, no es posible afirmar‬
‭por ejemplo, que 12 es el doble de 6. La razón de esto es que no existe cero‬
‭absoluto, es decir, no existe un valor numérico que indique ausencia total de‬
‭cantidad. El valor numérico 0 es un punto más en la escala, un punto arbitrario. La‬
‭temperatura, por ejemplo, es una característica que se mide utilizando una escala de‬
‭intervalos. Cuando se dice, en escala Celsius, que ayer hubo 20 grados de‬
‭temperatura máxima y hoy 25, se está diciendo no solo que hoy hubo más‬
‭temperatura que ayer, sino que hoy hubo 5 grados más de temperatura que ayer.‬
‭Del mismo modo, 20 grados son 5 más que 15. La diferencia entre 15 y 20 grados‬
‭es la misma que entre 20 y 25, y esto va más allá de lo que puede afirmarse con una‬
‭escala ordinal.‬‭Sin embargo,‬‭no es posible afirmar‬‭que 20 grados representen el‬
‭doble de temperatura que 10, pues en la escala Celsius, el valor cero es un punto‬
‭arbitrario de la escala, y por tanto, no indica ausencia de la característica medida.‬
‭9‬
‭Características de está escala:‬
‭-‬ ‭Presenta intervalos constantes.‬
‭-‬ ‭El cero de la escala es arbitrario, se puede comenzar a medir por debajo del cero.‬
‭-‬ ‭Las “razones” de las medidas‬‭dependen de la escala.‬
‭-‬ ‭El doble en una escala no equivale al doble en otra escala.‬
‭ s importante destacar que la frontera entre la escala ordinal y la de intervalos es lo‬

E
‭bastante difusa como para poder asegurar que muchas características aparentemente‬
‭medidas con una escala ordinal pueden ser tratadas como si estuvieran medidas con una‬
‭de intervalos. Esto es algo que un analista de datos no puede pasar por alto.‬
‭2)‬ N
‭ ivel de razón:‬‭está medida añade a la de intervalos‬‭la‬
‭presencial del cero absoluto, lo cual permite afirmar que la‬
‭característica medida se da el doble, el triple, etc, que en otro.‬
‭Características de está escala:‬

‭-‬ ‭Los cocientes o razones de los valores no dependen de la‬
‭escala.‬
‭-‬ ‭El cero de la escala es absoluto‬
‭-‬ ‭Siempre equivale al doble en otra escala.‬
‭ l tiempo, por ejemplo, es una característica medida en escala de‬

E
‭razón. No solo es posible afirmar que la diferencia existente entre 30 y‬
‭60 segundos es la misma que entre 60 y 90 (lo cual también se da en‬
‭la de intervalos), sino que‬‭además,‬‭que 60 segundos‬‭es el doble que‬
‭30 segundos. Esto se da porque el cero absoluto se refiere a la ausencia de tiempo.‬
‭Programas informáticos para el análisis de datos‬
‭ a lista de programas informáticos disponibles para el análisis de datos es interminable.‬

L
‭Existen dos tipos de programas:‬
‭-‬ ‭Generales:‬‭incluyen la mayoría de las técnicas estadísticas‬‭que un analista puede‬
‭necesitar‬
‭10‬
‭-‬ ‭ specíficos:‬‭se centran en una técnica concreta o en un conjunto reducido de‬
E
‭técnicas‬
‭ ntre los de carácter general, destacan entre otros: SPSS, SAS, R/S-Plus, Minitab y Stata.‬
E
‭Y entre ellos, quizá el SPSS sea el de mayor implantación tanto en el ámbito académico‬
‭como en el profesional: a su innegable potencial para el análisis hay que añadir sus‬
‭prestaciones como base de datos y su facilidad de manejo.‬
‭Unidad 2 - Variables categóricas I: frecuencias y tablas bivariadas‬
‭Base de datos (BD):‬‭conjunto de información ordenada‬‭de forma lógica.‬
‭ n las BD cada una de las preguntas del cuestionario es representada como una columna.‬
E
‭Cada pregunta es una variable.‬
‭ uando las variables son categóricas (sexo: hombre, mujer, otro), cada opcion de respuesta‬
C
‭de la variable se llama “categoria” o “valor” de la variable.‬
‭ uando las variables son numéricas (edad), cada opción de respuesta de la variable se‬
C
‭llama “valor” o “nivel” de la variable.‬
‭En una base de datos, las respuestas de cada persona es considerada un “caso”.‬
‭ uando la BD es muy extensa, es decir, muchas personas han contestado a las preguntas y‬
C
‭por consiguiente se pasa a tener entonces muchos casos, es necesario resumir la‬
‭información para contestar las preguntas planteadas en la investigación. Para ello existen‬
‭herramientas.‬
‭Herramientas: Distribuciones de frecuencias‬
‭¿Que es una tabla o distribución de frecuencias?‬
‭ s una forma de ordenar resumidamente los datos de una variable. Es decir, permiten‬
E
‭resumir y analizar la información de variables categóricas.‬
‭ as tablas de frecuencia ofrecen información precisa de 2 de las 3 características que‬

L
‭conviene prestar atención para describir apropiadamente una variable:‬‭centro‬‭y‬‭forma‬‭de la‬
‭distribución. Siendo la‬‭dispersión‬‭la que queda sin‬‭información.‬
‭-‬ ‭ entro de la distribución:‬‭es el valor con la frecuencia‬‭más alta (el valor que más‬
C
‭se repite). Este recibe el nombre de‬‭moda.‬
‭-‬ ‭Forma de la distribución:‬‭es visible a partir del‬‭tamaño de las frecuencias, que son‬
‭las que indican donde tienden a agruparse los valores y qué categorías tienen‬
‭frecuencias pequeñas.‬
‭-‬ ‭Dispersión:‬‭grado de concentración o alejamiento de‬‭los valores en torno al centro‬
‭de la distribución. La información de una tabla de frecuencias es poco precisa‬
‭respecto de está característica. Sabemos que la dispersión es mínima o nula cuando‬
‭todas las frecuencias estan concentradas en un mismo valor y máxima cuando estan‬
‭repartidas homogéneamente por todos ellos. Cuando las frecuencias estan‬
‭concentradas en una sola categoría, es decir, tiene dispersión mínima o nula, la‬
‭dispersión toma el valor cero, cuando las frecuencias estan uniformemente‬
‭ 1‬
1
‭repartidas entre todas las categorías, es decir, tiene dispersión máxima, la dispersión‬
‭toma el valor uno.‬
‭Existen varios tipos de distribuciones de frecuencias:‬

‭-‬ ‭Frecuencias absolutas‬
‭-‬ ‭Frecuencias relativas‬
‭-‬ ‭Frecuencias porcentuales‬
‭ partir de las distribuciones anteriores es posible también calcular las‬‭frecuencias‬

A
‭acumuladas.‬
‭ recuencias absolutas:‬‭es una representación de los‬‭datos que muestra el número‬

F
‭concreto de casos que tiene una variable en cada una de sus categorías. En otras palabras,‬
‭es la frecuencia con la que aparece cada categoría de la variable en la BD.‬
‭ a variable sexo tiene 3 categorias: varon, mujer, otro. La frecuencia absoluta muestra los‬
L
‭valores de cada una de esas categorías.‬
‭ ste tipo de frecuencias constituyen el punto de referencia de una tabla de frecuencias, es‬
E
‭decir, todas las demás frecuencias se calculan a partir de las absolutas. Por tanto, es‬
‭recomendable incluirlas siempre.‬
‭ recuencias relativas:‬‭es la proporción de veces que‬‭se repite cada categoría de la‬

F
‭variable en la base de datos.‬
‭Se calcula, para cada categoría como:‬‭frecuencia absoluta‬‭/ número total de casos.‬
‭ ntonces, para calcular la frecuencia relativa de la categoría‬

E
‭“varón” se debería hacer 250/1409, lo que daría como‬
‭resultado, 0,177.‬
‭ recuencias porcentuales:‬‭es un tipo de frecuencia‬‭relativa.‬

F
‭Es el porcentaje de veces que se repite cada categoría de la‬
‭variable en la base de datos. Se calcula multiplicando la‬
‭frecuencia relativa por 100.‬
‭12‬
‭ ara calcular la frecuencia porcentual de la categoría “mujer” se debe calcular primero la‬
P
‭frecuencia relativa, es decir, realizar la división‬
‭1154/1049, lo cual da como resultado 0,819, y‬
‭este resultado multiplicarlo por 100, lo cual‬
‭daría como resultado 81,9%‬
‭ sto nos permite decir que del total de‬

E
‭estudiantes, el 17,7% son varones, el 81,9%‬
‭son mujeres y el 0,4% son otr@s.‬
‭ e puede decir entonces que tanto la‬

S
‭frecuencia relativa y la frecuencia porcentual ofrecen prácticamente la misma información‬
‭para describir los datos, por lo tanto, cuando se presenta una tabla de frecuencias se suele‬
‭utilizar solo una de ellas. Y como ambas frecuencias se calculan a partir de las frecuencias‬
‭absolutas, es recomendable que las absolutas siempre se presenten en la tabla.‬
‭Las frecuencias relativas, así como las porcentuales, son útiles para hacer comparaciones.‬
‭ recuencia acumulada:‬‭Este tipo de frecuencia solamente‬‭se puede calcular para‬

F
‭variables categóricas con nivel de medición ordinal.‬‭Es decir, que las categorías tengan‬
‭un orden determinado. Por ejemplo, el salario, específicamente cuando se pregunta por‬
‭franjas de salarios ya que eso convierte la variable salario en categórica. Si fuera una‬
‭variable en que cada persona indicará su salario específicamente (es decir, de respuesta‬
‭abierta), sería numérica.‬
‭ a frecuencia acumulada se define como‬‭la suma de‬‭todas las frecuencias hasta una‬
L
‭categoría dada.‬
‭ s posible calcular la frecuencia absoluta acumulada, la frecuencia porcentual acumulada o‬

E
‭la relativa acumulada.‬
‭ stá frecuencia nos permite conocer cuántas personas ganan hasta X cantidad de dinero.‬
E
‭Por ejemplo, hasta 9.999 pesos. Es decir, supongamos que tenemos dos franjas, una entre‬
‭1 peso hasta 4.999 pesos, y otra franja entre 5.000 pesos hasta 9.999 pesos. A través de la‬
‭encuesta sabemos cuántas personas ganan entre 1 y 4999, y también sabemos cuántas‬
‭ganan entre 5000 y 9999, pero la frecuencia acumulada nos permite sumar ambas franjas‬
‭para conocer el total que ganan entre 1 y 9999.‬
‭13‬
‭ or ejemplo, si queremos saber cuántas personas ganan hasta 9999 pesos, a partir de la‬
P
‭tabla anterior se hace la cuenta 480 + 58 + 143, lo que da como resultado 681. Este último‬
‭número es la frecuencia absoluta acumulada. Lo mismo para la frecuencia porcentual,‬
‭considerando las mismas franjas, hacemos la cuenta 34.1 + 4.1 + 10.1, que da como‬
‭resultado 48.3, está última es la frecuencia porcentual acumulada.‬
‭ s decir, las 681 personas que ganan hasta 9999 pesos representan el 48.3% del total de‬
E
‭personas que contestaron la encuesta. Entonces, las frecuencias acumuladas sólo cobran‬
‭sentido cuando existe un orden lógico en las categorías de la variable. Por eso se calculan‬
‭solamente para variables categóricas con nivel de medición ordinal.‬
‭ n definitiva, las distribuciones de frecuencias nos sirven para organizar, resumir y analizar‬
E
‭la información, y además nos permiten conocer cuales son las categorías de la variable con‬
‭las que estamos trabajando, cómo se distribuye la variable, cuáles son las categorías más‬
‭frecuentes y menos frecuentes, y que tan frecuentes son esas categorías, y además a‬
‭través de las frecuencias acumuladas, nos permiten conocer la cantidad de casos hasta una‬
‭determinada categoría de la variable.‬
‭ ota:‬‭las distribuciones de frecuencias también pueden‬‭ser usadas para variables‬

N
‭numéricas, el inconveniente es que no siempre sirven para resumir esa información, ya que‬
‭una variable numérica puede tener muchos niveles. Pero para situaciones en que los‬
‭niveles de respuesta varían en poca cantidad, por ejemplo, días de la semana (siete‬
‭niveles), es posible utilizarlas.‬
‭Tablas de contingencias o tablas bivariadas‬
‭ diferencia de las tablas de frecuencias, las cuales permiten describir de forma resumida la‬
A
‭información de‬‭una‬‭sola variable, las tablas de contingencia‬‭o bivariadas permiten describir‬
‭dos‬‭variables al mismo tiempo.‬
‭ ambién son llamadas‬‭tablas cruzadas‬‭o‬‭tablas de doble‬‭entrada.‬‭Permiten analizar la‬

T
‭distribución de una variable con relación a otra o a otras. Sirven para mostrar la frecuencia‬
‭conjunta de las variables analizadas.‬
‭ or ejemplo, al combinar los resultados de la variable‬‭salario‬‭y‬‭sexo,‬‭obtenemos como‬

P
‭resultado la siguiente tabla de contingencia, llamemosle tabla N°1:‬
‭14‬
‭ los valores que corresponden a la frecuencia absoluta de las variables sexo y salarios, se‬
A
‭les llama‬‭frecuencias marginales.‬
‭ los valores que corresponden al cruce de ambas frecuencias, es decir, al interior de la‬
A
‭tabla de contingencia, se le llama‬‭frecuencias condicionales.‬
‭ i quisiéramos responder a la pregunta ¿es mayor la proporción de mujeres sin salarios que‬
S
‭la de los varones en la misma situación?, sería necesario calcular tablas de contingencia‬
‭porcentuales.‬
‭ as tablas de contingencia porcentuales resultan más útiles para comparar datos que las‬
L
‭tablas de valores absolutos.‬
‭ os tipos de tablas de contingencia con números porcentuales serían las de‬‭distribución‬

D
‭porcentual:‬
‭Tabla N° 2: “‬‭Distribución porcentual de estudiantes‬‭de MyTC segun salario, por sexo”‬
‭15‬
‭Tabla N° 3: “‬‭Distribucion porcentual de estudiantes‬‭de MyTC segun sexo, por salario”‬
‭ mbas tablas fueron construidas calculando porcentajes a partir de la tabla de números‬

A
‭absolutos, es decir, la tabla N° 1.‬
‭ a‬‭tabla N° 2‬‭nos informa como se distribuye la variable‬‭salario‬‭para cada una de las‬

L
‭categorias de la variable‬‭sexo.‬‭Es posible darse cuenta‬‭de ello porque cada una de las‬
‭categorías de la variable‬‭salario‬‭tiene como total‬‭100%.‬ ‭A partir de está tabla es posible‬
‭decir que del total de las personas que‬‭no reciben‬‭salario‬‭, el 16% son varones, el 83.5%‬
‭son mujeres y el 0.4% son otr@s. O también, que dentro del grupo que gana mayores‬
‭salarios (es decir, más de 30000 pesos), el 69,7% son mujeres y el 30,3% son varones.‬
‭Es importante destacar que está tabla se interpreta segun la frecuencia porcentual de la‬
‭variable sexo, es decir, nos informa la distribucion porcentual del sexo del total de personas.‬
‭ a‬‭tabla N° 3‬‭nos informa como se distribuye la variable‬‭sexo‬‭para cada una de las‬

L
‭categorias de la variable‬‭salario.‬‭Nos damos cuenta‬‭de ello porque cada una de las‬
‭categorias de la variable‬‭sexo‬‭tiene como total‬‭100%.‬‭A partir de está tabla es posible decir‬
‭que del total de las mujeres, el 34.7% no recibe salario, mientras que el 36.6% recibe un‬
‭salario de entre 10000 y 29999 pesos.‬
‭ s importante destacar‬‭que para construir una tabla‬‭de contingencias a partir de‬

E
‭porcentajes, los valores de los marginales (resultados totales) de la tabla de contingencia‬
‭original (tabla N°1) sean mayores a 30 casos siempre que se las quiera utilizar como 100%.‬
‭Es por eso que en está situación es recomendable quitar la categoría “Otros” ya que‬
‭solamente alude a 5 casos.‬
‭ veces las tablas se muestran sin‬‭los resultados‬‭marginales‬‭de 100%, eso ocurre porque‬
A
‭ese 100 está implícito en la tabla, ya que la suma de las frecuencias condicionales suma‬
‭100.‬
‭Porcentajes‬
‭Para calcularlos es necesario realizar la siguiente operación:‬
‭( Cociente de la población de interés / población total ) x 100‬
‭ s decir, si tenemos un grupo de personas que en total son 50, y nos interesa calcular el‬
E
‭porcentaje de mujeres en este grupo, primero es necesario saber cuántas mujeres hay,‬
‭supongamos que hay 17, entonces la cuenta sería:‬‭(‬‭17 / 50 ) x 100.‬‭Lo que daría como‬
‭resultado 34, es decir, 34% de las personas de este grupo son mujeres.‬
‭16‬
‭Gráficos para variables categóricas‬
‭ os gráficos más utilizados, y también los más apropiados, con variables categóricas son‬
L
‭los de barras y los de sectores. Ambos son equivalentes, es decir, ofrecen la misma‬
‭información, pero cambian en su aspecto.‬
‭Gráfico de barras‬
‭ n gráfico de barras se construye sobre un plano definido por dos ejes cartesianos: en el‬
U
‭eje horizontal se colocan los valores de la variable y en el eje vertical las frecuencias, y‬
‭sobre cada valor se levanta una barra de altura proporcional a su frecuencia.‬
‭ ara construir gráficos de barras hay que tomar algunas precauciones para no distorsionar‬
P
‭la información que se está ofreciendo:‬
‭-‬ ‭Debe evitarse cortar el eje vertical‬
‭-‬ ‭Es muy desaconsejable sustituir las barras por figuras o dibujos de aquello que se‬
‭quiere representar‬
‭ os gráficos de barra no solo son útiles para representar variables categóricas, sino también‬
L
‭para representar variables cuantitativas discretas cuando estas toman solo unos pocos‬
‭valores.‬
‭Gráfico de sectores‬
‭ e construyen dividiendo un círculo en tantos sectores como valores distintos (categorías)‬

S
‭toma la variable representada y asignando a cada valor un sector de tamaño proporcional a‬
‭su frecuencia.‬
‭ n general, un gráfico de sectores no permite comparar el tamaño de los sectores con la‬
E
‭misma facilidad que lo hace un gráfico de barras. Y pierde eficacia cuando la variable tiene‬
‭muchas categorías. Sin embargo, tiene una ventaja: es posible, en caso de que se‬
‭considere conveniente, destacar un sector separándolo del resto.‬
‭Unidad 3 - Variables categóricas II: gráficos, tendencia central y dispersión‬
‭Representaciones gráficas‬
‭-‬ ‭Nos ofrecen información muy útil y de forma “economica”‬
‭-‬ ‭Son imágenes que “representan” los casos que tenemos en una matriz datos en‬
‭función de una/s variable/s que componen a dicha matriz (o base de datos)‬
‭-‬ ‭Se construyen a partir de las frecuencias‬
‭-‬ ‭Hay que interpretarlas en función de las variables que analizamos para que la‬
‭interpretación de esos datos tenga sentido‬
‭Tipos más comunes o útiles para‬‭variables categóricas‬

‭-‬ ‭Gráficos de columnas o barras y columnas acumuladas:‬‭El de columnas son‬
‭columnas separadas, una por cada categoría, y el de columnas acumuladas es una‬
‭única columna donde cada categoría ocupa un espacio de esa columna. Son ideales‬
‭para nivel‬‭ordinal.‬
‭ 7‬
1
‭Los gráficos de barras se construyen sobre un plano definido por dos ejes cartesianos: en el‬
‭eje horizontal se colocan los valores de la variable, y en el vertical las frecuencias, y sobre‬
‭cada valor se levanta una barra de altura proporcional a su frecuencia.‬
‭ as barras se representan separadas para resaltar la idea de que corresponden a distintos‬

L
‭valores de la variable. Elegir uno u otro tipo de frecuencias (absoluta, relativas o‬
‭porcentuales) afecta a los números que aparecen en el eje vertical, pero no a la forma del‬
‭gráfico.‬
‭ os gráficos de barra no solo son útiles para representar variables categóricas, también lo‬
L
‭son para representar variables cuantitativas discretas cuando estas toman solo unos pocos‬
‭valores.‬
‭ s muy importante‬‭prestar atención en las gráficas‬‭de barras si el 0 está presente, ya que‬

E
‭si no lo está pueden ser engañosas y representar “diferencias” que en realidad no son tan‬
‭grandes.‬
‭-‬ ‭ ráficos de sectores:‬‭también llamados “tortas”, “quesos”,‬‭“pasteles”, etc. Son‬

G
‭ideales para‬‭nivel nominal.‬
‭ os gráficos de sectores se construyen dividiendo un círculo en tantos sectores como‬

L
‭valores distintos (categorías) toma la variable representada y asignando a cada valor un‬
‭sector de tamaño proporcional a su frecuencia. El tamaño de cada sector se obtiene‬
‭asignandole el ángulo resultante de multiplicar por 360 la correspondiente frecuencia‬
‭relativa, pero la forma del gráfico no se ve afectada por elegir uno u otro tipo de frecuencias‬
‭(absolutas, relativas o porcentuales).‬
‭ n general, el gráfico de sectores pierde eficacia cuando la variable tiene muchas‬

E
‭categorías. No obstante, tiene una interesante ventaja: es posible, en caso de que se‬
‭considere conveniente, destacar un sector separándolo del resto.‬
‭Gráficas de más de una variable‬
‭Se construyen también a partir de las frecuencias (absolutas, relativas, porcentajes, etc)‬
‭ on gráficos de barra donde cada variable está representada en cada una de las‬
S
‭categorías, por ejemplo en un gráfico donde hay 3 variables (varón, mujer, otros) y varias‬
‭categorías de salarios (sin salario, entre 1 y 4999 pesos, etc) las 3 variables estarán‬
‭representadas en cada una de las categorías, teniendo cada variable una barra en esa‬
‭categoría, por lo tanto, cada categoría tendrá un número de barras igual al número de‬
‭variables representadas:‬
‭18‬
‭¿Qué se recomienda tener en cuenta al leer una gráfica?‬

‭-‬ ‭Atender el título‬
‭-‬ ‭Cuales son las variables que se representan‬
‭-‬ ‭Cuales son las categorías‬
‭-‬ ‭Si es posible leerlas de forma acumulada‬
‭-‬ ‭Que cada sector o barra representa la frecuencia de cada categoría‬
‭Tendencia central y dispersión‬
‭ a tendencia central o centro, y la dispersión son estadísticos descriptivos. Todas las‬

L
‭variables‬‭categóricas‬‭de una base de datos se pueden‬‭analizar a través de estos‬
‭estadísticos univariables.‬
‭ endencia central o “centro” de los datos:‬‭refiere‬‭a donde se concentran la mayoría de‬

T
‭las puntuaciones de la distribución. Existen 3 medidas de tendencia central más utilizadas:‬
‭-‬ ‭Media o promedio:‬‭usada para variables cuantitativas‬
‭-‬ ‭Mediana:‬‭usada para variables cuantitativas‬
‭-‬ ‭Moda:‬‭usada para variables categóricas‬
‭Para variables categóricas sólo tiene sentido conocer la‬‭moda.‬
‭ oda:‬‭es el nivel (o categoría) de la variable con‬‭mayor frecuencia. Es decir, es la categoría‬

M
‭que se repite más veces.‬
‭ iene una capacidad descriptiva muy limitada, por lo que debe interpretarse con cautela.‬
T
‭Puede ocurrir que el valor que más se repite tenga una frecuencia baja, o también puede‬
‭ocurrir que haya más de una moda, o que haya muy poca diferencia entre las dos‬
‭categorías que más se repiten.‬
‭ uando hay dos puntuaciones con la mayor frecuencia, o sea, dos modas, en ese caso se‬
C
‭dice que la distribución es bimodal.‬
‭ l cálculo de la moda proviene de la suma de las veces de cada valor o categoría. Por‬
E
‭ejemplo, en la siguiente tabla donde tenemos 3 categorías en la variable “sexo” (mujer,‬
‭varón, otros), la categoría que más se repite es “mujer” por lo que la moda es esa categoría.‬
‭19‬
‭Dispersión‬
‭ os estadísticos de dispersión de una distribución de datos informan sobre qué tan‬

L
‭concentradas o alejadas estan las puntuaciones del centro de dicha distribución.‬
‭ n el caso de los datos categóricos, la dispersión informa que tan heterogéneas son las‬
E
‭puntuaciones.‬
‭Se calculan examinando los porcentajes y concentración de los datos.‬
‭ na forma de cuantificar la dispersión es a través del‬‭índice de variación cualitativa (IVC),‬

U
‭el cual expresa el grado en que los casos estan dispersos en las diferentes categorías de la‬
‭variable. El IVC tiene un valor máximo de 1 y un valor mínimo de 0, y por lo tanto su‬
‭interpretación es muy intuitiva, ya que:‬
‭-‬ ‭Cuanto más cercano al 1, hay una mayor igualdad de las frecuencias relativas , es‬
‭decir,‬‭hay una distribución más uniforme,‬‭cuando las‬‭frecuencias relativas son‬
‭iguales para todas las categorías el IVC es 1.‬
‭-‬ ‭Cuanto más cercano al 0, hay una menor igualdad de frecuencias relativas y por lo‬
‭tanto hay una distribución con una dispersión tendiendo a ser nula. Es decir, hay una‬
‭concentración de casos en una de las categorías. Cuando el IVC es 0 los casos se‬
‭concentran en una sola categoría.‬
‭Unidad 4 - Variables numéricas I - cuantiles‬
‭ os cuantiles son medidas de “posición”, sirven para organizar y resumir la información de‬
L
‭una variable numérica pero además nos permiten comparar las características de un‬
‭individuo dentro de un grupo determinado.‬
‭ u principal característica es que dividen a la población en partes iguales. Algunos ejemplos‬

S
‭de cuantiles son:‬
‭-‬ ‭Mediana:‬‭es una medida de tendencia central, y es‬‭el valor que divide en 2 partes‬
‭iguales al conjunto de medida de una variable.‬
‭-‬ ‭Cuartiles:‬‭dividen en 4 partes iguales la variable‬
‭-‬ ‭Quintiles:‬‭dividen en 5 partes iguales a la variable‬
‭-‬ ‭Deciles:‬‭dividen en 10 partes iguales a la variable‬
‭-‬ ‭Centiles:‬‭dividen en 100 partes iguales‬
‭-‬ ‭Percentiles:‬‭es una forma de otorgar valor porcentual‬‭a los cuantiles‬
‭ l concepto de cuantil está estrechamente asociado al de frecuencia porcentual acumulada,‬

E
‭de ahí que, al trabajar con cuantiles, lo habitual sea utilizar percentiles.‬
‭20‬
‭ ediana‬
M
‭Es el valor de la variable que divide al total de las medidas (ordenadas) en 2 partes iguales.‬
‭Es el centro de la variable en sentido literal: es el valor que ocupa la posición central cuando‬
‭los casos estan ordenados.‬
‭ or encima de la mediana se encuentra el 50% de los casos, por debajo de ella se‬
P
‭encuentra el otro 50%.‬
‭ ara hacerlo, primero se debe seleccionar una variable numérica, por ejemplo la edad. Para‬
P
‭calcular la mediana se usa la información tal cual como aparece en la base de datos, luego‬
‭se siguen los siguientes pasos:‬
‭Si el grupo tiene 9 personas:‬ ‭ n el caso de que el grupo estuviese‬

E
‭compuesto por 10 personas:‬
‭ - Ordenar los valores de la‬
1
‭variable de menor a mayor.‬ ‭ - Ordenar los valores de la variable de menor a‬
1
‭2- Encontrar el valor de la‬ ‭mayor.‬
‭variable que divide el total de‬ ‭2- Encontrar el valor de la variable que divide el‬
‭las medidas (ordenadas) en 2‬ ‭total de las medidas (ordenadas) en 2 partes‬
‭partes iguales, en este caso‬ ‭iguales. Lo que ocurre acá es que la mediana‬
‭como tenemos 9 medidas, el‬ ‭divide el total de las medidas en dos partes‬
‭valor que divide va a ser 4.5‬ ‭iguales, pero su valor no se sitúa en uno de los‬
‭porque esa es la mitad de 9‬ ‭casos específicos, sino‬‭entre medio‬‭de dos de‬
‭(4.5 medidas para abajo de la‬ ‭los casos (27 y 28).‬
‭mediana y 4.5 para arriba de‬
‭la mediana)‬ ‭ or lo tanto, la mediana va a ser el punto medio‬
P
‭entre esos dos valores, que es‬‭27.5.‬
‭ ntonces la edad mediana de‬
E ‭Es importante destacar, que si en vez de haber‬
‭este grupo de 9 personas es‬ ‭sido 27 y 28, hubiese sido 27 y 29, la mediana‬
‭de 27 años.‬ ‭habría tomado el valor de 28, aun si no‬
‭apareciera entre los valores de la tabla.‬
‭ onviene advertir que los cuantiles no son porcentajes, sino valores de la variable. Así,‬
C
‭como el percentil 50 del grupo de 9 vale 27, eso quiere decir que el 50% de las personas‬
‭tienen al menos 27 años. Si bien los cuantiles tienen distintos nombres como ya hemos‬
‭visto (mediana, cuartiles, etc), lo cierto es que todos ellos pueden ser concebidos como‬
‭percentiles: la mediana es el percentil 50; los cuartiles los percentiles 25, y así‬
‭sucesivamente.‬
‭ or lo tanto, para conocer el valor de un cuantil cualquiera, basta con calcular el‬
P
‭correspondiente percentil. No existe una única manera de calcularlos, pero la más usada se‬
‭ajusta a una regla sencilla. Se comienza ordenando los casos de forma ascendente por su‬
‭valor en el eje Y, y calculando:‬
‭i=k(n+1)/100‬
‭ i i es un número entero, entonces P‬‭k‬ ‭= Y‬‭i‬

S
‭Si i es número decimal, entonces P‬‭k‬ ‭= (1-d) Y‬‭i‬ ‭+ ((d)Y‬‭i+1‬
‭ 1‬
2
‭Donde k es el porcentaje de casos acumulados que se busca; Y‬‭i‬‭es el valor de la variable‬
‭que ocupa la posición correspondiente a la parte entera de i; y d es la parte decimal de i.‬
‭ or ejemplo, para calcular la edad correspondiente de P‬‭25‬‭en el grupo de hombres,‬

P
‭comenzamos calculando la posición que corresponde a ese percentil en ese grupo.‬
‭ partir de lo anterior podemos decir que el percentil 25 de la variable edad de la‬

A
‭categoría hombres es 20, por lo que hasta ese percentil todos los hombres tienen al‬
‭menos 20 años.‬
‭Cuartiles‬
‭ on los 3 valores de la variable que dividen al total de las medidas (ordenadas) en 4 partes‬
S
‭iguales.‬
‭ e está forma, separando los cuartiles‬

D
‭en estas medidas (21, 27.5 y 37.5)‬
‭obtenemos 4 partes iguales que cada‬
‭una equivale a 2.5 casillas.‬
‭-‬ ‭20 a 21.5‬
‭-‬ ‭21.5 a 27‬
‭-‬ ‭28 a 36.5‬
‭-‬ ‭36.5 a 52‬
‭22‬
‭Quintiles‬
‭Son los 4 valores de la variable que dividen al total de las medidas en 5 partes iguales.‬
‭ unciona de la misma forma‬

F
‭que los cuartiles.‬
‭23‬
‭Mediana y equivalencia en los distintos tipos de cuantiles‬
‭ a mediana es equivalente al‬‭cuartil 2‬‭y a su vez,‬‭cuando se calculan percentiles, la‬

L
‭mediana es equivalente al‬‭percentil 50.‬‭También se‬‭puede ver que el‬‭cuartil 1‬‭equivale al‬
‭percentil 25‬‭, y que el‬‭cuartil 3‬‭equivale al‬‭percentil‬‭75.‬
‭ ambién se puede observar que el‬‭quintil 1‬‭es equivalente‬‭al‬‭percentil 20,‬‭y que el‬‭quintil‬
T
‭4‬‭es equivalente al‬‭percentil 80.‬
‭Porcentajes en que se separan según cuantiles:‬

‭-‬ ‭La mediana divide los cuantiles en 50%‬
‭-‬ ‭Los cuartiles dividen los cuantiles en 25%‬
‭-‬ ‭Los quintiles dividen los cuantiles en 20%‬
‭-‬ ‭Los percentiles dividen los cuantiles en 10%‬
‭¿Para que se utilizan los cuantiles?‬
‭-‬ ‭ on medidas de posición, tienen la utilidad de permitir comparar las características‬

S
‭de un individuo dentro de un grupo‬
-‭ ‬ ‭Se utilizan para la elaboración de tablas de clasificación o baremos‬
‭-‬ ‭También son utilizados en análisis socioeconómicos para conocer cómo se‬
‭distribuyen los ingresos monetarios en la población. Para describir ingresos, la‬
‭mediana es un mejor indicador que el promedio (o media), ya que la mediana es una‬
‭medida robusta frente a casos extremos, mientras que el promedio es una medida‬
‭muy sensible. Es decir, la mediana es una medida adecuada para describir la‬
‭información referente al ingreso cuando estamos refiriendonos a distribuciones‬
‭desiguales‬
‭24‬
‭Cuantiles como grupo de puntuaciones‬
‭ os cuantiles muchas veces también se consideran, no como puntos de corte, como hemos‬
L
‭visto anteriormente, sino como grupos de puntuaciones.‬
‭ n este caso, la línea de corte, es decir, el cuartil Q1, no representa sólo el número 21, sino‬
E
‭que representa a todas las personas que tienen entre 20 y 21. De la misma forma, el cuartil‬
‭Q2 no representa el 27.5 sino que a todas las personas que tienen entre 21 y 27.5, y así‬
‭sucesivamente.‬
‭ n está forma de considerar cuantiles, no son medidas si no que se trata de una variable‬
E
‭categórica construida a partir de esas medidas.‬
‭Representaciones gráficas sobre cuantiles‬
‭ iagrama de cajas, diagrama de cajas y bigotes o Boxplot:‬‭Es un gráfico utilizado para‬

D
‭representar‬‭una‬‭variable numérica.‬
‭ s útil porque permite visualizar 3‬

E ‭Nos permite conocer:‬
‭propiedades de la variable:‬ ‭-‬ ‭La posición de la mediana‬
‭-‬ ‭Centro‬ ‭-‬ ‭La posición del primer y tercer cuartil‬
‭-‬ ‭Dispersión‬ ‭-‬ ‭El grado de asimetría de la distribución de la variable‬
‭-‬ ‭Forma‬ ‭-‬ ‭El rango total de la variable y el rango intercuartil‬
‭-‬ ‭Si existen valores extremos‬
‭25‬
‭ a línea más oscura representa la‬‭mediana.‬‭La línea‬‭inferior a la caja proporciona‬

L
‭información sobre el primer cuartil (Q1), y la línea superior a la caja proporciona inferior‬
‭sobre el tercer cuartil (Q3)‬
‭ e está forma, la caja representa entonces la amplitud intercuartil, lo cual sería la distancia‬
D
‭entre el primer y tercer cuartil. La amplitud intercuartil sirve para definir cuales son los‬
‭valores típicos de la variable y cuales son los valores atípicos.‬
‭ os bigotes del diagrama muestran los valores inferior y superior de la variable, siempre que‬
L
‭no haya casos atípicos, es decir nos proporciona información sobre el rango de esa‬
‭variable. El bigote inferior es el valor más pequeño que no llega a ser atípico, así como el‬
‭bigote superior representa los valores más grandes que no llegan a ser atípicos.‬
‭ n este caso, los valores atípicos estan por encima del rango superior de los valores‬
E
‭superiores de la variable.‬
‭26‬
‭¿Cómo saber cuando un caso es atípico?‬
‭ os casos atípicos son siempre los valores situados a más de 1.5 amplitudes intercuartiles‬
L
‭del cuartil 1 o del cuartil 3. Es decir, si los casos atípicos estan por encima del bigote‬
‭superior, estarán entonces a 1.5 amplitudes del tercer cuartil, pero si los casos atípicos‬
‭estan por debajo del bigote inferior, estarán a 1.5 amplitudes del primer cuartil.‬
‭ ambién existen‬‭casos extremos‬‭que estos estan a 3‬‭amplitudes, siguiendo la misma‬

T
‭lógica de los casos atípicos, 3 amplitudes del tercer cuartil o 3 amplitudes del primer cuartil‬
‭Ejemplo (Eje vertical = salario)‬
‭ n el ejemplo anterior, podemos ver que la mediana está en 15000, eso quiere decir que el‬
E
‭50% de los empleados gana‬‭hasta‬‭15000 pesos, entonces‬‭el centro de la distribución es‬
‭15000.‬
‭ obre la dispersión, en este ejemplo, se puede ver que la distribución de “sueldo 1” es más‬
S
‭dispersa que la de “sueldo 2”, esto puede observarse tanto en la amplitud de la caja como‬
‭en la amplitud de los bigotes.‬
‭ n el sueldo 1, hay más dispersión porque hay gente que gana hasta 12 mil pesos, y‬
E
‭algunos casos atípicos que ganan incluso mucho menos que eso, y otros que ganan hasta‬
‭casi 18000 pesos, y algunos casos atípicos que ganan incluso más que eso. Por otro lado,‬
‭en el sueldo 2, hay quienes ganan hasta 13 mil pesos y algunos casos atípicos que ganan‬
‭un poquito menos pero no demasiado, lo mismo con el salario máximo, algunos llegan a‬
‭ganar hasta 17 mil pesos y algunos casos atípicos un poquito más, pero no tanto.‬
‭ n estos casos es importante destacar que la dispersión, para ambos gráficos, es‬
E
‭asimétrica.‬
‭27‬
‭Gráfico con dos variables categóricas, una referente a quintiles de ingreso‬
‭ ste gráfico muestra el porcentaje de repetición en niños de primaria por quintil de ingresos‬
E
‭per cápita del hogar.‬
‭Se interpreta de está manera:‬
‭ e los niños que viven en un hogar perteneciente al quintil 1 de ingresos, el 43.2% repiten.‬
D
‭De los niños que viven en un hogar dentro del quintil 5 (de los que tienen mayores ingresos)‬
‭el porcentaje de repetición es bajo (4.6%).‬
‭ or lo tanto este gráfico nos sirve para conocer la desigualdad en el desempeño educativo‬
P
‭en función del ingreso.‬
‭Tendencia central‬
‭ na buena manera de identificar el centro de una variable consiste en elegir el valor que‬
U
‭mejor representa el resto de los valores. El centro de una variable cuantitativa puede‬
‭encontrarse de diferentes maneras, todo depende del aspecto de la variable que se‬
‭considera relevante: puede prestarse atención a todos los valores de la variable o solo a‬
‭parte de ellos; si se decide no prestar atención a todos los valores, la decisión puede‬
‭atender a distintos criterios; pueden ponderarse todos los valores por igual o pueden‬
‭asignarse ponderaciones distintas a valores distintos, etc. No existe un estadístico perfecto‬
‭para describir el centro de todas las variables en el sentido de que no existe ningún‬
‭estadístico capaz de captar toda la complejidad de una variable cuantitativa; cada‬
‭estadístico se centra en un aspecto de la variable y ese detalle le confiere sus fortalezas y‬
‭sus debilidades.‬
‭ edia aritmética:‬‭o simplemente media, es el estadístico‬‭de tendencia central más‬

M
‭utilizado. Se define como la suma de todas las puntuaciones dividida por el número de‬
‭puntuaciones y se representa con el nombre de la variable coronado por un guión.‬
‭ a media por si sola tiene una capacidad descriptiva bastante limitada, ya que por un lado,‬
L
‭no dice nada acerca de lo bien o mal que está representando al resto de valores, y por otro‬
‭lado, el hecho de que en el cálculo de la media intervengan todos los valores hace de ella‬
‭un estadístico muy sensible a la presencia de asimetría en la distribución, es decir, a la‬
‭presencia de valores muy alejados del centro por uno de los dos extremos de la distribución.‬
‭28‬
‭Estadísticos resistentes:‬
‭ e dice que un estadístico es resistente cuando es poco sensible a la presencia de‬

S
‭anomalías en los datos. Está propiedad es particularmente útil cuando se trabaja con‬
‭distribuciones asimétricas, es decir, con distribuciones que contienen casos muy alejados‬
‭del centro por uno de los dos extremos de la distribución.‬
‭ a media aprovecha las propiedades cuantitativas (de intervalo o razón) de los datos. La‬
L
‭mediana sin embargo solo aprovecha sus propiedades ordinales. Las implicancias de está‬
‭diferencia son importantes. La mediana no se alteraría si uno de los valores más alejados‬
‭de ella se cambiara, en cambio, la media cambiaria en cierta cantidad, sea cual sea el‬
‭cambio, de manera significativa o menos significativa.. Es decir que mientras que el cambio‬
‭de un solo dato altera la media, la mediana permanece inalterada.‬
‭ a mediana por tanto, es un estadístico más resistente a la media. Pero la mediana no es el‬
L
‭único estadístico resistentes, también se encuentran:‬
‭-‬ ‭La media recortada o media truncada‬
‭-‬ ‭La media winsorizada‬
‭-‬ ‭La trimedia‬
‭-‬ ‭Los estimadores M‬
‭Dispersión‬
‭ escribir un conjunto de datos a partir de un solo número conlleva, obviamente, una‬

D
‭importante pérdida de información: un estadístico de tendencia central informa sobre el‬
‭centro de la distribución pero no dice nada sobre el resto de los valores. La consecuencia‬
‭de esa limitación es que un mismo valor puede ser centro de conjuntos de datos muy‬
‭diferentes.‬
‭ or lo tanto, conocer únicamente la edad promedio de un grupo no permite identificar el‬

P
‭grupo del que se está hablando, es necesario conocer, además, el grado de dispersión, es‬
‭decir, el grado de parecido entre los datos en el sentido de concentración o alejamiento‬
‭entre ellos.‬
‭ demás conocer el grado de dispersión de un conjunto de datos permite precisar si el‬

A
‭centro de una distribución es o no un buen representante del resto de valores. Cuando la‬
‭mayoría de los valores se encuentran próximos al centro, la dispersión es baja, cuando la‬
‭mayoría de los valores se encuentran alejados del centro, la dispersión es alta.‬
‭Consecuentemente, el grado de representatividad del centro de una distribución será tanto‬
‭mayor cuanto menor sea la dispersión de la distribución.‬
‭29‬
‭Unidad 5 - Variables numéricas II - tendencia central y dispersión‬
‭ ara describir de forma organizada los valores de una variable cuantitativa se requiere‬
P
‭utilizar 3 propiedades centrales: centro, dispersión y forma de la distribución.‬
‭ os estadísticos diseñados para identificar el centro de una variable se les llama‬‭medidas‬

L
‭de tendencia central.‬‭Los estadísticos que permiten‬‭cuantificar el grado de dispersión de‬
‭las puntuaciones respecto de su centro suelen llamarse‬‭medidas de dispersión o de‬
‭variabilidad.‬‭Los estadísticos que sirven para describir‬‭la forma de la distribución suelen‬
‭atender a la‬‭asimetría y curtosis.‬
‭Tendencia central (moda, media y mediana)‬
‭ na buena manera de identificar el centro de una variable consiste en elegir el valor que‬
U
‭mejor representa el resto de los valores. El centro de una variable cuantitativa puede‬
‭encontrarse de diferentes maneras, todo depende del aspecto de la variable que se‬
‭considera relevante: puede prestarse atención a todos los valores de la variable o solo a‬
‭parte de ellos; si se decide no prestar atención a todos los valores, la decisión puede‬
‭atender a distintos criterios; pueden ponderarse todos los valores por igual o pueden‬
‭asignarse ponderaciones distintas a valores distintos, etc. No existe un estadístico perfecto‬
‭para describir el centro de todas las variables en el sentido de que no existe ningún‬
‭estadístico capaz de captar toda la complejidad de una variable cuantitativa; cada‬
‭estadístico se centra en un aspecto de la variable y ese detalle le confiere sus fortalezas y‬
‭sus debilidades.‬
‭ n estadístico es una herramienta que nos permite caracterizar un conjunto de datos que‬
U
‭tenemos acerca de diferentes variables, es decir, es un resumen de una determinada‬
‭cantidad de información que tenemos acerca de un u otro fenómeno psicológico.‬
‭ l igual que un resumen de un PDF sintetiza los puntos centrales de ese PDF, el estadístico‬
A
‭hace lo mismo, y en ese sentido, tanto los resúmenes como los estadísticos no son capaces‬
‭de brindar toda la información contenida en eso que resumen. En el caso de los‬
‭estadísticos, no son capaces de brindar toda la información contenida en esos datos. y por‬
‭tanto, siempre hay algo de información que queda fuera.‬
‭ n este sentido, es importante recordar que el estadístico a utilizar se elige en‬

E
‭consideración de lo que se quiere saber.‬
‭Tipos de estadísticos o medias‬
‭La media, media aritmética o promedio es el estadístico más utilizado.‬
‭ edia aritmética:‬‭o simplemente media, es el estadístico‬‭de tendencia central más‬

M
‭utilizado. Se define como la suma de todas las puntuaciones dividida por el número de‬
‭puntuaciones y se representa con el nombre de la variable coronado por un guión.‬
‭ a media por si sola tiene una capacidad descriptiva bastante limitada, ya que por un lado,‬
L
‭no dice nada acerca de lo bien o mal que está representando al resto de valores, y por otro‬
‭lado, el hecho de que en el cálculo de la media intervengan todos los valores hace de ella‬
‭un estadístico muy sensible a la presencia de asimetría en la distribución, es decir, a la‬
‭presencia de valores muy alejados del centro por uno de los dos extremos de la distribución.‬
‭30‬
‭ a media consiste en la suma de todas las puntuaciones dividida por el número de‬
L
‭puntuaciones. Es decir, si tenemos las puntuaciones 1, 2 y 4 (3 puntuaciones), la cuenta a‬
‭hacer será 1+2+4=7, y luego 7/3= 2.33, la media entonces es 2.33.‬
‭ l problema de la media es que es muy sensible a valores extremos, por lo tanto, si se‬
E
‭agrega un valor que sea muy por encima (o por debajo) de los valores más comunes, la‬
‭media se verá afectada altamente. Por ejemplo, si tenemos las puntuaciones 1, 2, 4 y 30 (4‬
‭puntuaciones), la cuenta a hacer será 1+2+4+30= 37, y luego 37/4= 9.25.‬
‭ e puede ver que hay una gran diferencia entre 2.33 y 9.25. Por lo tanto tener únicamente‬
S
‭la media como información no es muy útil, por eso es necesario tener otros tipos‬
‭complementarios de información.‬
‭A pesar de sus limitaciones descriptivas, la media posee algunas importantes propiedades:‬

‭1.‬ ‭La primera tiene relación con operaciones que se realizan con mucha frecuencia al‬
‭analizar datos, y se refiere a las diferencias entre cada puntuación y la media. A‬
‭estas diferencias se les llama‬‭puntuaciones diferenciales‬‭o‬‭puntuaciones de‬
‭desviación.‬‭Las puntuaciones diferenciales tienen‬‭una importante propiedad:‬‭su‬
‭suma vale cero.‬‭Esto significa que las desviaciones‬‭negativas (asociadas a los‬
‭valores menores que la media) se anulan con las positivas (las asociadas a los‬
‭valores mayores que la media), es decir, la suma de las puntuaciones diferencias‬
‭negativas es idéntica a la suma de las puntuaciones diferenciales positivas. Está‬
‭propiedad de la media permite concebirla como “centro de gravedad” de la variable,‬
‭ya que las desviaciones de la media “pesan” exactamente lo mismo a cada lado de‬
‭ella.‬
‭2.‬ ‭Otra propiedad tiene que ver con los cambios que experimenta cuando se‬
‭transforman las puntuaciones originales. Si a las puntuaciones de una variable se les‬
‭multiplica y/o suma una constante, la media de la variable también queda‬
‭multiplicada y/o sumada por esa misma constante. Es decir, si tenemos por ejemplo‬
‭11 personas, es decir, 11 edades, y a esas edades se le suman 10 años, la media de‬
‭esas 11 puntuaciones originales pasa a valer 10 años más, supongamos que la‬
‭media de esas 11 edades era 30, al sumarles 10 años a esas edades la media‬
‭pasaría a valer 30 + 10=‬‭40.‬‭Lo mismo pasa si se multiplican‬‭las edades, si por‬
‭ejemplo, las 11 edades se multiplican cada una por 5, la media pasa a valer 30 x 5=‬
‭150.‬
‭ ediana:‬‭el método de cálculo más extendido se ajusta‬‭a una regla bastante simple. Hay‬
M
‭que recordar que para calcular la mediana hay que ordenar los casos de mayor a menor.:‬
‭-‬ ‭Si el número de casos es impar, la mediana es el valor que ocupa i=(n+1)/2. Es‬
‭decir, si tenemos 5 casos (impar), la mediana de ese valor será entonces la posición‬
‭i, que se calcula así: (5+1)/2, siendo n=5 (n es el número de casos totales).‬
‭Básicamente sumándole 1 al número de casos impar para convertirlo en par, 5+1= 6,‬
‭y luego dividiéndolo entre 2. Entonces la mediana estaría en la posición número 3.‬
‭-‬ ‭Si el número de casos es par, la mediana es el punto medio entre los dos valores‬
‭que ocupan las posiciones n/2 y (n/2)+1, es decir, entre la posición resultante de‬
‭dividir el número de casos entre 2 y dividir el número de casos entre 2 y sumarle 1.‬
‭Si tenemos 6 casos, estas dos cuentas nos dan las posiciones 3 y 4, entonces la‬
‭mediana será el número que este entre esas posiciones. Si por ejemplo, la posición‬
‭3 vale 31 y la posición 4 vale 32, la mediana entonces será 31.5, si la posición 3 vale‬
‭10 y la posición 4 vale 12, la mediana será 11, etc.‬
‭31‬
‭ omparación entre estadísticos de tendencia central:‬‭uno de los principales objetivos‬
C
‭del análisis descriptivo consiste en identificar el centro de una variable. El grado de parecido‬
‭entre estos estadísticos depende, básicamente, de la forma de la distribución de la variable:‬
‭si la distribución es simétrica, todos los estadísticos toman el mismo valor; la diferencia‬
‭entre ellos va aumentando conforme aumenta el grado de asimetría.‬
‭ a media aritmética utiliza las propiedades cuantitativas de los datos y se basa en una‬
L
‭ponderación uniforme de todos ellos. Esto la convierte en un estadístico muy sensible a la‬
‭presencia de asimetría en la distribución de los datos. Las medias recortada y winsorizada‬
‭intentan corregir la falta de resistencia de la media aritmética modificando el tratamiento que‬
‭dan a un determinado porcentaje de casos de los extremos de la distribución, está‬
‭modificación, lógicamente, implica una pérdida de información que debe tenerse en cuenta.‬
‭La mediana lleva al límite esa modificación del tratamiento que se da a los valores más‬
‭extremos: elimina del análisis todos los casos menos los que ocupan la posición central; de‬
‭este modo, su resistencia a la presencia de anomalías en los datos es máxima. Por lo tanto,‬
‭la media aritmética es el estadístico más sensible a la presencia de asimetría en la‬
‭distribución.‬
‭ ero entonces ¿qué estadístico de tendencia central conviene elegir para informar de‬
P
‭nuestros resultados?‬
‭ a fase descriptiva sólo representa el comienzo del análisis, terminada esa fase se pasa a‬
L
‭la fase inferencial para efectuar comparaciones. Las herramientas disponibles para efectuar‬
‭comparaciones se basan sobre todo en la media aritmética, y por lo tanto, debe incluirse en‬
‭el informe descriptivo ya que si bien posee limitaciones descriptivas, tiene excelentes‬
‭propiedades inferenciales. En este sentido, el resto de los estadísticos de tendencia central‬
‭se pueden utilizar para recomendar si conviene prestar atención a la media o a la mediana.‬
‭Dispersión‬
‭ s un concepto muy útil para complementar con la media dado que brinda información‬
E
‭adicional relevante para comprender el resumen de los datos.‬
‭ a dispersión es esencialmente positiva, puede ser baja dispersión, media o elevada, pero‬
L
‭nunca existirá una dispersión negativa.‬
‭Usemos este ejemplo en el que cada grupo tiene una media de 50:‬
‭ omo conocer únicamente la edad promedio de cada grupo no permite identificar el grupo‬
C
‭del que se está hablando (pues todos tienen la misma edad promedio): es necesario‬
‭conocer, además, el grado de dispersión, es decir, el grado de parecido entre los datos en el‬
‭sentido de concentración o alejamiento entre ellos.‬
‭ onocer el grado de dispersión de un conjunto de datos permite precisar si el centro de una‬

C
‭distribución es o no un buen representante del resto de valores. Cuando la mayoría de los‬
‭32‬
‭ alores se encuentran próximos al centro, la dispersión es baja (grupo 1); cuando la‬
v
‭mayoría de los valores se encuentran alejados del centro, la dispersión es alta (grupo 3).‬
‭ mplitudes‬
A
‭El estadístico de dispersión más simple de todos consiste en calcular la diferencia entre el‬
‭valor más grande y el más pequeño. A está diferencia se le llama‬‭amplitud total,‬‭aunque‬
‭también puede encontrarse como rango, recorrido o, simplemente, amplitud.‬
‭ ango o amplitud:‬‭consiste en la diferencia entre‬‭el valor más bajo de los datos y el más‬
R
‭alto. En el caso del ejemplo en el que las puntuaciones eran (1, 2 y 4) esos valores serían 1‬
‭y 4, en el ejemplo (1, 2, 4 y 30) esos valores serían el 1 y el 30.‬
‭ ara calcularla lo que se debe hacer es simplemente tomar el valor más elevado y restarle‬
P
‭el valor más bajo, o sea:‬
‭ rimer ejemplo: 4 - 1= 3‬
P
‭Segundo ejemplo: 30 - 1= 29‬
‭ s importante recordar que en este estadístico únicamente intervienen los dos valores‬
E
‭extremos, lo cual significa que no se está prestando atención a la disposición de los valores‬
‭intermedios. Y esto tiene dos consecuencias indeseables:‬
‭1.‬ ‭puede ocurrir que conjuntos de datos muy diferentes tengan la misma amplitud total;‬
‭basta con que los dos valores extremos sean los mismos‬
‭2.‬ ‭la presencia de un solo caso muy distante del resto es capaz de alterar‬
‭sensiblemente el valor de la amplitud total‬
‭Se trata por tanto de un estadístico muy sensible.‬
‭ n estadístico más resistente es la‬‭amplitud intercuartil:‬‭se basa en la distancia existente‬

U
‭entre los cuartiles primero y tercero. La amplitud intercuartil mide el grado de dispersión del‬
‭50% de los casos centrales, y de está manera, resuelve los problemas derivados de prestar‬
‭atención únicamente a los dos casos más extremos; pero no puede pasarse por alto que al‬
‭prestar atención únicamente al 50% de los casos centrales, se puede estar desechando‬
‭información relevante. El diagrama de cajas se basa justamente en este estadístico.‬
‭ arianza‬
V
‭Es uno de los estadísticos de dispersión más utilizados. Se basa en las desviaciones de la‬
‭media, pero para evitar que su suma valga cero, en lugar de tomar esas desviaciones en‬
‭valor absoluto (como la media de las desviaciones) se elevan al cuadrado.‬
‭ s definida como el promedio de las desviaciones cuadráticas de la media, es decir, el‬

E
‭promedio de las desviaciones de la media elevadas al cuadrado. Se trata, por lo tanto, de‬
‭una media de cuadrados.‬
‭ ntonces, si tenemos las puntuaciones 5 y 1 (2‬

E
‭puntuaciones), para hallar la media hacemos 5 + 1= 6, y‬
‭luego 6/2= 3. La media es entonces 3.‬
‭ or lo tanto de la primera puntuación a la media, hay una‬

P
‭distancia de -2, porque todas las puntuaciones por debajo‬
‭de la media tienen valores negativos de distancia con‬
‭33‬
r‭ especto de la media, y desde la segunda puntuación a la media hay una distancia de 2,‬
‭porque todas las puntuaciones por encima de la media tienen valores positivos con respecto‬
‭de la media.‬
‭ anto -2 al cuadrado (-2 x -2) como 2 al cuadrado (2 x 2) dan 4, es decir, tenemos dos‬
T
‭puntuaciones que dan 4, y si hallamos el promedio de dos valores que son 4, vamos a‬
‭obtener un 4 de promedio:‬
‭4 + 4= 8, y luego 8/2= 4. Por lo tanto, el valor de la varianza es 4.‬
‭ i tomáramos el ejemplo (1, 2, 4 y 30) sería algo así, teniendo en cuenta que su media era‬
S
‭9.25.‬
‭ rimer paso‬
P ‭ egundo paso‬
S ‭ ercer paso‬
T
‭Tenemos que la‬ ‭Calculamos el cuadrado de‬ ‭Calculamos el promedio o media de‬
‭diferencia entre:‬ ‭cada uno:‬ ‭los cuadrados:‬
‭1 y 9:25 es -8.25‬ ‭-8.25 al cuadrado es: 68.06‬
‭ 8.06+52.56+27.56+430.56=578.74‬
6
‭2 y 9.25 es -7.25‬ ‭-7.25 al cuadrado es: 52.56‬
‭, y luego 578.74/4= 144.68‬
‭4 y 9.25 es -5.25‬ ‭-5.25 al cuadrado es: 27.56‬
‭30 y 9.25 es 20.75‬ ‭20.75 al cuadrado es: 430.56‬ ‭La varianza en este caso es 144.68‬
‭ omo podemos observar en el ejemplo anterior, la varianza no permite formarse una idea‬
C
‭acertada del grado de dispersión de una variable. La razón de esto es que las distancias a‬
‭la media estan elevadas al cuadrado. La varianza puede servir, sin embargo, para comparar‬
‭entre sí distintos grupos (lógicamente, en la misma variable) y saber en cuál de ellos hay‬
‭mayor dispersión, pero no sirve para formarse una idea sobre el grado de dispersión. Por‬
‭está razón, lo que suele hacerse es utilizar la raíz cuadrada de la varianza, o‬‭desviación‬
‭típica.‬
‭Desviación típica o desviación estándar‬
‭ onsiste en la raíz cuadrada de la varianza. En relación a su cálculo, no tiene grandes‬

C
‭diferencias en comparación a la varianza, pero su gran ventaja es que es expresada en la‬
‭misma métrica o unidad que la variable que está siendo estudiada.‬
‭ o que se hace básicamente es hallar la raíz cuadrada del valor de la varianza. Por ejemplo,‬
L
‭en los ejemplos anteriores teníamos dos resultados:‬
‭-‬ ‭En el primer ejemplo la varianza era 4‬
‭-‬ ‭En el segundo ejemplo la varianza era 144.68‬
‭ ara hallar la desviación típica simplemente hallamos raíz cuadrada de 4 o raíz cuadrada de‬
P
‭144.68:‬
‭ a raíz cuadrada de 4 es 2. Por lo tanto la‬
L ‭ a raíz cuadrada de 144.68 es‬
L
‭desviación típica es 2‬ ‭aproximadamente 12.03. Por lo tanto la‬
‭desviación típica es 12.03‬
‭34‬
‭Forma de la distribución‬
‭ demás de ayudar a elegir entre estadísticos, es útil por sí misma: permite obtener una‬
A
‭visión rápida de las características de la variable, detectar valores anómalos, advertir‬
‭inconsistencias de los datos (valores que se repiten demasiado o valores que no aparecen),‬
‭etc. Por tanto, conocer la forma de una distribución tiene un interés comparable al de‬
‭identificar su centro o cuantificar su dispersión.‬
‭ studiar la forma de una distribución implica, básicamente, valorar dos características:‬

E
‭asimetría y curtosis‬
‭1)‬ L
‭ a asimetría:‬‭refiere a la forma en que los datos‬‭se distribuyen por encima y por‬
‭debajo del centro. Es una medida que nos indica acerca de la distribución de los‬
‭valores en relación a la media, específicamente nos indica si existen más elementos‬
‭antes o después de la media. Si hay más elementos antes de la media esto se‬
‭conoce como‬‭asimetría positiva‬‭o‬‭asimetría con cola‬‭hacía la derecha.‬‭Si hay‬
‭más elementos antes de la media esto se conoce como‬‭asimetría negativa‬‭o‬
‭asimetría con cola hacía la izquierda.‬‭También existen‬‭distribuciones simétricas,‬
‭que es donde existe el mismo número de elementos a la izquierda como a la‬
‭derecha.‬
‭Distribución simétrica‬
‭ na característica particular de este tipo de distribución es que la media, mediana y moda‬

U
‭tienen el mismo valor.‬
‭35‬
‭Asimetría positiva o con cola hacía la derecha‬
‭Se le llama “con cola hacía la derecha” porque:‬
‭ n este tipo de asimetría se encuentra en general que la media está a la derecha de la‬
E
‭mediana, debido a que muchos valores atípicos “arrastran” a la media en esa dirección:‬
‭Asimetría negativa o con cola hacía la izquierda‬
‭En este caso la media es inferior a la mediana, es decir, va a estar más a la izquierda.‬
‭ 6‬
3
‭2)‬ ‭La curtosis:‬‭refiere al grado de apuntamiento de una‬‭distribución, es decir, al nivel‬
‭de concentración de casos en un punto particular de la distribución:‬
‭ stá característica se valora por comparación con una distribución teórica llamada curva‬
E
‭normal (mesocúrtica)‬
‭ a curtosis expresa el grado en que una distribución acumula casos en sus colas en‬
L
‭comparación con los casos que acumulan las colas de una curva normal con la misma‬
‭medida y con la misma desviación típica.‬
‭Existen 3 tipos de curtosis:‬

‭1.‬ ‭Leptocurtica:‬‭refiere a una distribución muy puntiaguda,‬‭lo cual implica que existen‬
‭muchos participantes concentrados en pocos valores‬
‭2.‬ ‭Mesocúrtica también llamada curva normal:‬‭donde la‬‭distribución tiene una forma‬
‭de campana. La distribución normal tiene la misma media, mediana y moda.‬
‭3.‬ ‭Platicúrtica:‬‭donde la distribución es más bien plana,‬‭lo cual puede interpretarse‬
‭como que existe poca variabilidad entre los diferentes valores de la variable‬
‭ ara valorar la asimetría y la curtosis se utilizan dos tipos de herramientas: gráficos y‬

P
‭estadísticos‬
‭Histograma‬
‭ s una representación gráfica de la distribución de frecuencias de una variable numérica‬

E
‭continua, en la forma de un gráfico con barras.‬
‭Es diferente del gráfico con barras utilizado con variables categóricas.‬
‭37‬
‭Características del histograma:‬
‭-‬ ‭Sirve únicamente para trabajar‬‭con una variable.‬‭Si‬‭se requiere analizar varias‬
‭variables se necesita un histograma para cada variable.‬
‭-‬ ‭Las variables deben ser numéricas continuas‬
‭-‬ ‭A cada intervalo de valores le corresponde solo una barra‬
‭-‬ ‭El alto de las barras es determinado en función del valor de la frecuencia de cada‬
‭uno de esos valores‬
‭-‬ ‭El gráfico puede ser presentado en forma vertical u horizontal‬
‭-‬ ‭Las barras se disponen juntas generando una impresión de continuidad que‬
‭permiten ver si hay patrones en los datos‬
‭ os permite analizar la tendencia central, la dispersión y las frecuencias de una‬

N
‭determinada variable de forma rápida.‬
‭Sus limitaciones son:‬

‭-‬ ‭Permite analizar una sola variable‬
‭-‬ ‭No permite establecer comparaciones entre diferentes conjuntos de datos‬
‭ ntre los gráficos disponibles para describir la forma de la distribución de una variable‬
E
‭cuantitativa los más utilizados son: el histograma, el polígono de frecuencias, el diagrama‬
‭de tallo y hojas y el diagrama de caja.‬
‭ l histograma se construye sobre 2 ejes cartesianos: en el eje horizontal se colocan los‬

E
‭valores de la variable ordenados de menor a mayor, en el vertical se colocan las frecuencias‬
‭y sobre cada valor se levanta una barra.‬
‭Comparación de histograma con diagrama de caja‬
‭ i se voltea el histograma para que aparezca verticalmente puede compararse con el‬
S
‭diagrama de cajas.‬
‭38‬
‭Unidad 6 - Puntuaciones Z y distribución normal‬
‭Puntuaciones Z‬
‭ ambién llamadas puntuaciones típicas o puntuaciones estandarizadas. Se utilizan‬

T
‭únicamente para variables cuantitativas.‬
‭ e definen como “transformaciones que se realizan a los valores o‬‭puntuaciones directas‬

S
‭de una distribución normal para analizar su distancia respecto a la media. Se expresan en‬
‭unidades de desviación estándar.”‬
‭La‬‭tipificación‬‭se refiere a la transformación anteriormente‬‭mencionada.‬
‭ sí, la puntuación Z representa el número de desviaciones típicas o estándar por encima o‬

A
‭por debajo de la media.‬
‭ orman una distribución que siempre tiene el mismo centro, la misma dispersión y la misma‬
F
‭métrica.‬
‭-‬ ‭ untuaciones directas:‬‭valor de la variable asignado‬‭a un sujeto a partir de la‬

P
‭medición de una propiedad. Es decir, la puntuación original.‬
-‭ ‬ ‭Media:‬‭promedio de‬‭las puntuaciones directas de una‬‭distribución‬
‭-‬ ‭Desviación estándar o típica:‬‭es el “promedio” o variación‬‭esperada con respecto a‬
‭la media de la distribución‬
‭ as puntuaciones Z se utilizan‬‭para comparar puntuaciones‬‭de diferentes distribuciones:‬

L
‭diferentes métricas, diferente centro (media) y diferente dispersión.‬
‭ or ejemplo, cuando quiero comparar las puntuaciones de una persona en pruebas‬

P
‭diferentes o que midan el mismo concepto a través de 2 pruebas diferentes.‬
‭ as puntuaciones Z son útiles porque las puntuaciones de distribuciones distintas no‬

L
‭admiten una comparación directa a no ser que esas distribuciones tengan el mismo centro,‬
‭la misma dispersión y la misma métrica, y en ese sentido, la puntuación Z otorga las‬
‭condiciones necesarias para lograr la comparación.‬
‭ os centiles‬‭también permiten comparar las puntuaciones‬‭de diferentes distribuciones, ya‬

L
‭que calculando los percentiles, las puntuaciones directas (cualquiera que sea su métrica) se‬
‭transforman en posiciones relativas que pasan a tener el mismo centro (la mediana o‬
‭percentil 50), la misma dispersión (de 0 a 100) y la misma métrica (unidades porcentuales).‬
‭Permiten conocer la posición relativa que ocupa ocupa cada puntuación dentro de su‬
‭distribución.‬
‭ jemplo:‬‭si quisiéramos comparar 3 puntuaciones de‬‭3 pruebas distintas, no podríamos‬

E
‭compararlas si cada una tiene su propia media y desvío estándar. Pero al transformar cada‬
‭una de estas puntuaciones a centiles es posible ubicarlos dentro de un determinado rango‬
‭porcentual, entonces si dividimos las puntuaciones en cuartiles podemos decir que la‬
‭primera puntuación se encuentra dentro de por ejemplo el 25% de los casos, la segunda‬
‭puntuación dentro del 75% de los caos y la tercera dentro del 25%, lo cual hace que sea‬
‭posible compararlas.‬
‭39‬
‭ or lo tanto, comparando por centiles puedo saber que significa haber obtenido cierta‬
P
‭puntuación en una determinada prueba (podes saber si fue una puntuación que no es muy‬
‭común, por ejemplo, si está dentro del 25%, pero si está dentro del 75% no es tan rara, ya‬
‭que el 75% se saca al menos esa nota), y en ese sentido, se puede definir en cada‬
‭distribución a que estudiantes les fue “mejor” en la prueba.‬
‭ in embargo, está forma de comparar con centiles convierte la métrica original en ordinal‬
S
‭(posiciones relativas) alterando la forma de la distribución. Para que esto no ocurra, se‬
‭utilizan las puntuaciones típicas o Z.‬
‭Para calcular las puntuaciones Z se debe hacer:‬
‭Puntuación directa - media del grupo / desvío del grupo‬
‭ as puntuaciones Z obtenidas forman una distribución que siempre tiene el mismo centro,‬
L
‭misma dispersión y misma métrica, y por lo tanto pueden compararse. Y representan el‬
‭número de desviaciones típicas o estándar por encima o por debajo de la media.‬
‭ or ejemplo, si tenemos una puntuación directa de 7.4 en una distribución que tiene una‬
P
‭media de 6 y una desviación típica de 1.1, hacemos la siguiente cuenta:‬
‭7.4 - 6 / 1.1 = 1.3. La puntuación Z de está distribución es 1.3.‬
‭Está puntuacion Z nos dice dos cosas:‬

‭-‬ ‭que la puntuación directa está por encima de la media (porque es positiva)‬
‭-‬ ‭y que está por encima de la media a 1.3 desviaciones típicas‬
‭ l dividir cada distancia a la media entre la desviación típica, el resultado queda expresado‬
A
‭en unidades de dispersión.‬
‭ esumiendo, entonces, las puntuaciones Z obtenidas forman una distribución que siempre‬
R
‭tienen:‬
‭-‬ ‭El mismo centro:‬‭0‬
‭-‬ ‭La misma dispersión:‬‭desvío típico 1‬
‭-‬ ‭La misma métrica:‬‭unidades de dispersión‬
‭ lgo importante para recordar es que, aunque en teoría las puntuaciones Z no tienen límite‬
A
‭máximo, siempre suelen tomar valores entre -3 y +3 desvíos estándar(lo cual es‬
‭denominado curva normal). Los valores que salgan de está curva normal son, en general,‬
‭vistos como atípicos.‬
‭ uando se da que las puntuaciones directas de distribuciones distintas tienen la misma‬

C
‭puntuación Z, se dice que esas puntuaciones directas son equivalentes.‬
‭Escalas derivadas‬
‭ as puntuaciones Z poseen una interesante utilidad que refiere a que toda variable‬
L
‭cuantitativa, cualquiera que sea su métrica, puede ser tipificada en una nueva variable, es‬
‭decir, puede ser convertida a puntuación Z, y estas, a su vez, pueden ser transformadas a‬
‭un nuevo conjunto de puntuaciones con media y desviación típica conocidas. Esto significa‬
‭40‬
‭ ue toda variable cuantitativa, cualquiera que sea su métrica, puede ser transformada en‬
q
‭otra variable equivalente con media y desviación típica conocida.‬
‭ ste tipo de transformaciones sirven para que un conjunto de puntuaciones puedan‬

E
‭expresarse en la métrica deseada.‬
‭Ejemplo de equivalencia de puntuaciones directas a puntuaciones Z‬
‭ s posible observar acá que, aunque las curvas originales eran distintas, ambas curvas son‬
E
‭idénticas cuando se las transforma a puntuaciones Z, y en ese sentido, será posible‬
‭comparar las originales.‬
‭Distribución normal‬
‭ as distribuciones teóricas como la normal o binomial, son distribuciones que, aunque no‬
L
‭estan generadas a partir de los datos sino a partir de una función matemática, son‬
‭representaciones de los datos que tienen la enorme utilidad de ayudar a interpretarlos‬
‭mejor.‬
‭ uchas veces las variables cuantitativas que medimos tienen una forma particular: la‬
M
‭mayoría de los valores se encuentran próximos al centro de la distribución y van siendo‬
‭menos frecuentes a medida que va aumentando la distancia al centro. Es el caso de la‬
‭distribución normal. La curva normal puede concebirse como una especie de histograma‬
‭suavizado cuyas barras se han levantado sobre intervalos infinitamente pequeños.‬
‭ a‬‭curva normal‬‭es entonces, una distribución teórica‬‭de probabilidad que sirve como‬
L
‭referente del comportamiento de muchas de las variables cuantitativas.‬
‭ a justificante de está regularidad de la curva normal se encuentra en el teorema del límite‬

L
‭central que plantea que:‬
‭41‬
‭Si los datos que se recogen son debidos a la suma de cierto número de causas‬
i‭ndependientes entre sí, cada una con un efecto parcial, la distribución de los datos‬
‭recogidos se asemejara tanto más a la curva normal cuantos más datos se recojan.‬
‭ s decir, mientras más datos recogemos de algo la distribución de esos datos se va a ir‬
E
‭pareciendo cada vez más a la curva normal a medida que la cantidad de datos recogidos‬
‭aumente.‬
‭ o interesante es que no existe una única curva normal, sino muchas, pero todas ellas‬
L
‭comparten las mismas características:‬
-‭ ‬ ‭ ienen un único máximo en‬‭µ‬‭Y,‬‭por lo tanto son unimodales.‬
T
‭-‬ ‭Tienen forma de campana, lo cual implica que los valores centrales son más‬
‭probables que los que se van alejando del centro‬
‭-‬ ‭ on simétricas respecto al eje central situado en‬‭µ‬‭Y,‬‭por lo que las diferentes‬
S
‭medidas de tendencia central (mediana, media, moda) coinciden.‬
‭-‬ ‭Son asintóticas respecto al eje horizontal (por mucho que se extiendan nunca llegan‬
‭a tocarlo), por lo que los valores mínimo y máximo del eje de abscisas son‬‭−∞‬‭y‬
‭+∞‬‭.‬
-‭ ‬ ‭ xisten dos puntos de inflexión por encima y por debajo de‬‭µ‬‭Y,‬
E
‭-‬ ‭El área total bajo la curva vale 1. Todas las puntuaciones posibles se encuentran‬
‭entre‬‭−∞‬‭y‬‭+∞‬‭, por lo tanto la probabilidad de encontrar‬‭valores menores que‬‭−∞‬
‭y mayores que‬‭+∞‬‭vale cero.‬
‭ uando tipificamos las puntuaciones directas obtenemos una media de 0 y un desvío de 1,‬
C
‭y de esa manera los valores obtenidos se deben leer en términos de valores estándar.‬
‭ i tenemos una distribución cualesquiera y la transformamos a puntuaciones Z, al graficar‬

S
‭esas puntuaciones Z lo que ocurre es que van a ser iguales, es decir, la gráfica de las‬
‭puntuaciones directas como la de las puntuaciones Z serán idénticas, esa es la ventaja‬
‭frente a los centiles de este tipo de comparaciones, la forma de la distribución se mantiene a‬
‭pesar de que la media y el desvío cambian.‬
‭42‬
‭ a distribución de las puntuaciones Z tiene forma de “Campana de Gauss”, la cual es la‬
L
‭distribución teórica más importante en estadística, debido a que:‬
‭-‬ ‭Es la más frecuente‬
‭-‬ ‭Es muy usada en test de hipótesis‬
‭-‬ ‭Muchos test estadísticos asumen que la distribución de los datos es normal‬
‭Distribución de probabilidad‬
‭Cuando tenemos una distribución normal es posible aplicar algunas reglas.‬

‭-‬ ‭En una variable continua, el área bajo la curva me da la probabilidad de un intervalo‬
‭de valores.‬
‭-‬ ‭En términos de probabilidad, toda el área debajo de la curva vale 1.‬
‭-‬ ‭Los valores comprendidos entre -1 y la media, y entre la media y 1, tienen una‬
‭probabilidad u ocurrencia de un 34.1% cada uno, es decir, entre ambos 68.2%.‬
‭-‬ ‭Los valores comprendidos entre -2 y -1 y entre 1 y 2 tienen una ocurrencia, cada‬
‭uno, de 13.6%.‬
‭-‬ ‭Y los valores comprendidos entre -3 y -2 y entre 2 y 3, tienen una ocurrencia o‬
‭probabilidad cada uno de 2.1%.‬
‭-‬ ‭Los valores que van más allá de -3 y 3 tienen una probabilidad de 0.1%.‬
‭ ero es importante recordar que se deben calcular en términos de porcentajes acumulados,‬

P
‭por lo que si quisiéramos saber cual es la probabilidad de ocurrencia de una puntuación‬
‭entre -2 y 0, deberíamos sumar la probabilidad entre -2 y -1 y entre -1 y 0, es decir:‬
‭13.6+34.1=47.7%. En este sentido:‬
‭-‬ ‭La probabilidad de ocurrencia de una puntuación que se encuentre‬‭entre -1 y 1 es‬
‭de 68.2%‬‭(34.1 + 34.1)‬
‭de 95.4%‬‭(13.6 + 34.1 + 34.1 + 13.6)‬
‭de 99.6%‬‭(2.1 + 13.6 + 34.1 + 34.1 + 13.6 + 2.1)‬
‭ omo se puede ver, el 99.6% de las puntuaciones van a aparecer entre -3 y 3, y es por ello‬
C
‭que se dice que las puntuaciones que sean menores a -3 o mayores a 3 son atípicas.‬
‭43‬
‭Unidad 7 - Muestreo - Introducción a la inferencia‬
‭ stadística inferencial:‬‭su objetivo es buscar reducir‬‭la incertidumbre sobre aquello que no‬
E
‭observamos.‬
‭ no de los objetivos del análisis de datos es extraer conclusiones generales a partir de unos‬
U
‭pocos datos particulares, a este salto de lo particular a lo general es lo que se llama‬
‭inferencia estadística.‬
‭ ara esto es preciso utilizar procedimientos que permitan realizar de forma correcta está‬
P
‭generalización, los análisis de datos a implementar deben ser tan apropiados como la‬
‭propia selección de los mismos.‬
‭ as técnicas de muestreo son las responsables de garantizar que la inferencia se sustenta‬

L
‭en una buena base, y los análisis de datos engloban las herramientas que permiten‬
‭desarrollar correctamente las inferencias.‬
‭Población:‬‭refiere al conjunto total de elementos‬‭que interesa estudiar.‬
‭ o primero que hay que hacer es definir una pregunta de investigación, ¿que queremos‬
L
‭saber?, esto tendrá implícito una cierta población de investigación, por ejemplo, si queremos‬
‭saber la edad de los psicólogos del Uruguay, la población implícitamente de la investigación‬
‭serán Psicólogos que trabajen en Uruguay, o más aún, si se quiere ser más específico, y se‬
‭quiere saber la edad de los psicólogos recibidos en la UdelaR, la población de la‬
‭investigación serán los psicólogos recibidos en la UdelaR.‬
‭ ómo investigar sobre una población entera muchas veces es muy caro y lleva mucho‬
C
‭tiempo, no es viable, por lo que luego de definir la población lo que se hace es definir una‬
‭muestra de esa población.‬
‭Muestra‬
‭ a‬‭muestra‬‭es un porcentaje de la población que representa‬‭a la población total lo más‬

L
‭fielmente posible, es decir, es un subconjunto de elementos de una población. Para que ese‬
‭subconjunto sea una muestra de la población necesita tener ciertas características:‬
‭-‬ ‭No debe estar sesgada:‬‭no puede tener sobrerrepresentación‬‭de un tipo de‬
‭individuos, es decir, todos los individuos de la población deben tener la misma‬
‭probabilidad de estar en la muestra.‬
‭-‬ ‭Tiene que ser eficiente:‬‭es decir tiene que tener‬‭el menor error posible‬
‭ or lo tanto para que las conclusiones obtenidas sean válidas, la muestra utilizada debe ser‬
P
‭representativa de la población que se supone representa, esto se logra a través de las‬
‭técnicas de muestreo.‬
‭ uanto mayor sea el tamaño de la muestra utilizada, mayor precisión tendrán las medidas‬
C
‭obtenidas en relación a la población.‬
‭ uestreo:‬‭se refiere al proceso seguido para extraer‬‭una muestra de una población. Puede‬
M
‭ser de 2 tipos:‬
‭44‬
‭-‬ ‭ robabilístico:‬‭un subtipo de este muestreo es el‬‭muestreo aleatorio,‬‭en el cual‬
P
‭todos los elementos de la población tienen la misma probabilidad de ser elegidos, y‬
‭el resultado de cada extracción no afecta ni depende del resultado de cualquier otra,‬
‭es decir son independientes entre sí.‬
‭-‬ ‭No probabilístico‬
‭ a forma más sencilla de lograr una muestra que no este sesgada es calcularla‬
L
‭aleatoriamente, es decir, de la población total se seleccionan al azar individuos‬
‭pertenecientes a ella.‬
‭ s importante destacar que dado que las poblaciones con las que trabajamos son‬
E
‭desconocidas, no hay manera de saber si la muestra elegida es representativa o no de la‬
‭población muestreada. Lo que podemos saber es si se ha utilizado un método de selección‬
‭que garantiza que la muestra elegida sea representativa de la población.‬
‭ l problema al tomar muestras de una población, es que cada muestra tendrá una media‬
E
‭distinta, porque a pesar de que la media de la población es una constante, la media de las‬
‭muestras es una variable.‬
‭Población y muestra‬
‭ arámetros:‬‭son valores numéricos que describen una‬‭característica de la‬‭población‬‭. Por‬

P
‭ejemplo la media.‬
‭ os parámetros son generalmente valores poblacionales desconocidos ya que no se suele‬

L
‭tener acceso a todos los elementos que lo conforman.‬
‭Los parámetros de la población, es decir, media, desvío, etc se representan a menudo con:‬
‭-‬ ‭Media:‬‭mú (μ)‬
‭-‬ ‭Desvío:‬‭sigma (σ)‬
‭Es importante destacar que una de las características de los parámetros es que son‬
‭constantes, no varían.‬
‭ or otro lado, cuando se habla de‬‭muestras‬‭no nos‬‭referimos a parámetros, sino que nos‬
P
‭referimos a‬‭estadisticos‬
‭Un estadístico es un valor numérico que describe una característica muestral. Por lo tanto‬
‭un estadístico es a la muestra, lo que un parámetro es a la población.‬
‭ o es posible calcular los parámetros, pero cada parámetro poblacional posee su réplica‬
N
‭muestral en un estadístico concreto que sí puede ser calculado. De este modo, los‬
‭estadísticos muestrales se van a utilizar para intentar formarnos una idea sobre los‬
‭verdaderos valores de sus correspondientes parámetros poblacionales desconocidos. A‬
‭este proceso se lo conoce con el nombre de‬‭estimación.‬
‭Resumiendo, las características de los estadísticos son:‬

‭-‬ ‭Son variables que dependen de la muestra‬
‭-‬ ‭Pueden calcularse si se hace una muestra‬
‭-‬ ‭Media:‬‭se representa con‬ ‭o‬
‭-‬ ‭Desvío:‬‭se representa con S o‬

‭45‬
‭Distribución muestral‬
‭ a diferencia entre la media de la muestra y la media de la población se le denomina como‬

L
‭error.‬‭Al no tener los datos de la población, no se‬‭puede saber si esa diferencia es muy‬
‭grande o es muy chica, porque el único dato que tenemos es el de la muestra y no se la‬
‭puede comparar. Esto tiene como consecuencia que las conclusiones de tomar ese dato de‬
‭la muestra como verdadero pueden ser incorrectas, ya que al tomar otra muestra esos‬
‭datos pueden variar y darnos conclusiones totalmente distintas.‬
‭ ero si no tenemos cómo comparar los datos de la muestra con el de la población ¿es‬
P
‭posible conocer el tamaño del error?‬
‭ ara conocer el tamaño del error es necesario conocer cómo varían los datos de la‬
P
‭muestra, por ejemplo, en distintas muestras.‬
‭Uno de los estadísticos más útiles y utilizados en el contexto de la inferencia estadística es‬
l‭a media aritmética:‬ ‭. Si tenemos varias muestras‬‭y en cada una de ellas calculamos la‬
‭media aritmética, esos posibles valores de este estadístico son los que constituyen su‬
‭distribución muestral.‬
‭ a media aritmética puede tomar el mismo valor en más de una muestra, y aunque todas‬
L
‭las muestras que tenemos son equiprobables, los posibles valores de la media aritmética no‬
‭lo son: hay algunos valores de la media aritmética que son más probables que otros porque‬
‭unos pueden obtenerse en un mayor número de muestras que otros.‬
‭ or todo esto decimos que la‬‭distribución muestral‬‭es un constructo teórico que nos‬
P
‭permite conocer qué tanto y de qué forma varían las medias muestrales (medias‬
‭aritméticas). Otra característica que presenta la distribución muestral es que cuando se‬
‭grafica en un histograma está es simétrica, independientemente de la forma de la‬
‭distribución poblacional.‬
‭ a distribución muestral de la media puede obtenerse por procedimientos puramente‬

L
‭matemáticos, sin necesidad de tener que extraer todas las posibles muestras posibles. Sin‬
‭embargo, hacerlo en todas las posibles muestras ayuda a reparar en errores posibles.‬
‭Resumiendo:‬
‭-‬ ‭la media de la distribución muestral coincide con la media poblacional‬
‭-‬ ‭La distribución muestral permite relacionar los estadísticos obtenidos en una‬
‭muestra con los parámetros de la población‬
‭Teorema central del límite‬
‭ ste teorema afirma que si los datos que se recogen son debidos a la suma de cierto‬
E
‭número de causas independientes entre sí, cada una con un efecto parcial, la distribución‬
‭de los datos recogidos se asemejará tanto más a la curva normal cuantos más datos se‬
‭recojan.‬
‭Además este teorema nos dice‬‭:‬

‭-‬ ‭Que la distribución muestral de la media tiene una distribución normal‬
‭ 6‬
4
‭-‬ ‭Que la media de la distribución muestral es igual a la media poblacional, es decir, si‬
‭promediamos todas las distribuciones muestrales de las muestras que tenemos, ese‬
‭promedio (o media) sería igual a la media poblacional (o sea, sería igual a μ). Si esto‬
‭se da de esa forma, eso significa que las muestras y el estadístico elegido (la media‬
‭en este caso) no estan sesgados.‬
‭-‬ ‭Que el desvío de la distribución muestral se lo conoce como‬‭error estándar‬
‭Error estándar‬
‭La variabilidad de la muestra se calcula en un parámetro llamado‬‭error estándar.‬
‭ l error estándar‬‭lo que muestra es que tanto se aleja‬‭la media muestral de la media‬
E
‭poblacional.‬
‭ i se comparan muchísimas muestras la media muestral coincidirá con la media‬

S
‭poblacional. Y el desvío de la distribución sería entonces el error estándar.‬
‭Pero entonces ¿cómo conozco el error?‬
‭ n error estándar grande significa que las medias muestrales pueden errar por mucho con‬
U
‭respecto de la media poblacional. Por el contrario, un error estándar bajo significa que las‬
‭medias muestrales son cercanas a la media poblacional.‬
‭El error estándar se calcula haciendo la siguiente cuenta:‬
‭Desvío de la población / raíz cuadrada del tamaño de la muestra = error estándar‬
‭ or ejemplo, si el desvío de la población es 1.58 y el tamaño de la muestra es 40, la cuenta‬

P
‭sería así: 1.58 / √ 40‬
‭ ara reducir el error a la mitad, es necesario multiplicar por 4 la muestra (por eso la raíz‬
P
‭cuadrada), por lo que una muestra de 10 tendrá el doble de error que una muestra de 40, y‬
‭una muestra de 40 tendrá el doble de error que una muestra de 160.‬
‭¿Pero si no conocemos el desvío de la población, como se calcula el error estándar?‬
‭En ese caso la cuenta es:‬
‭Desvío de la muestra / raíz cuadrada del tamaño de la muestra = error estándar‬
‭ ste resultado, es decir, el error estandar que en está cuenta se da como resultado, es un‬
E
‭estimativo y se representa con el +/-, por ejemplo, se puede decir que la media de una‬
‭distribución es 30 +/- 3, eso quiere decir que se estima un error estándar de +/-3 por lo que‬
‭la media podría en realidad estar entre 27 y 33.‬
‭Resumiendo‬
‭‬ D
● ‭ istribución muestral‬
‭-‬ ‭Indica cómo varían los estadísticos muestrales‬
‭-‬ ‭Muchas son distribuciones normales‬
‭47‬
‭‬ D
● ‭ istribución muestral de la media‬
‭-‬ ‭Media: es la media poblacional‬
‭-‬ ‭Desvío: se le llama error estándar‬
‭‬ E
● ‭ rror estándar‬
‭-‬ ‭Aumenta a mayor variabilidad en la población‬
‭-‬ ‭Disminuye al aumentar el tamaño muestral‬
‭Unidad 8 - Estimación: Intervalos de confianza‬
‭ a inferencia estadística es un tipo de razonamiento que intenta extraer conclusiones de‬

L
‭tipo general a partir de unos pocos datos particulares.‬
‭ stas inferencias (comparaciones, relaciones) pueden realizarse utilizando 2 estrategias‬

E
‭distintas:‬
‭1.‬ ‭Contraste de hipótesis:‬‭ha constituido tradicionalmente‬‭la esencia de lo que hoy‬
‭llamamos análisis estadístico; sin embargo, raramente se ha visto libre de críticas, al‬
‭punto de que algunos autores han propuesto el abandono de dicha estrategia por no‬
‭considerarla un método válido para generar conocimiento científico.‬
‭2.‬ ‭Estimación de parámetros:‬‭se refiere al proceso mediante‬‭el cual la información‬
‭muestral es utilizada para inferir valores poblacionales. La estimación sólo tiene‬
‭sentido con parámetros desconocidos (ya que si se los conoce no es necesario‬
‭estimarlo).‬
‭ o cierto es que la estimación y el contraste se complementan. A pesar de que ambas‬

L
‭formas de inferencia son equivalentes, la información que ofrecen no es exactamente la‬
‭misma: mientras que el contraste de hipótesis pone el énfasis en intentar detectar la‬
‭presencia de un efecto significativo (una diferencia entre grupos, una relación entre‬
‭variables), la estimación de parámetros pone el énfasis en intentar cuantificar el tamaño de‬
‭es efeco (como de grande es la diferencia entre los grupos, como de intensa es la relación‬
‭entre las variables).‬
‭ mbas estrategias son posibles gracias a las distribuciones muestrales. Tanto el contraste‬
A
‭de hipótesis como la estimación de parámetros se basan en la variabilidad inherente a todo‬
‭estadístico. Y son las distribuciones muestrales las que informan sobre esa variabilidad.‬
‭Estimacion de parametros‬
‭ ota:‬‭En el PDF los parámetros cualesquiera que sean‬‭son representados por la letra‬
N
‭griega theta θ. A los estadísticos utilizados para efectuar estimaciones se les llama‬
‭estimadores y se representan con la letra griega theta θ con un gorrito.‬
‭Podemos llevar a cabo 2 tipos de estimaciones de parámetros:‬

‭-‬ ‭Estimación puntual:‬‭constituye la más simple de las‬‭inferencias estadísticas que‬
‭pueden realizarse, consiste en asignar un valor muestral concreto al valor‬
‭poblacional que se desea estimar. Por ejemplo, cuando para conocer la edad media‬
‭de una población se toma una muestra aleatoria y se adopta como edad media de la‬
‭población la edad media obtenida de esa única muestra.‬
‭-‬ ‭Estimación por intervalos‬‭consiste en asignar al parámetro‬‭que se desea estimar‬
‭un rango de valores entre los que se espera que pueda encontrarse el verdadero‬
‭valor del parámetro con probabilidad conocida.‬
‭48‬
‭ l valor muestral concreto asignado en la estimación depende del‬‭método de estimación‬

E
‭adoptado. Uno de los métodos más simples, ideado por Pearson y llamado‬‭método de los‬
‭momentos,‬‭consiste precisamente en atribuir al parámetro‬‭que se desea estimar el valor‬
‭que toma su correspondiente estadístico, sin embargo, el problema de esa estrategia es‬
‭que, dado un parámetro, siempre es posible definir más de un estadístico diferente para‬
‭efectuar una estimación del mismo. Por ejemplo, la media poblacional podría ser estimada‬
‭con la media aritmética, o la media recortada, o la mediana, o cualquier otro estadístico de‬
‭tendencia central. Se hace necesario, por tanto, determinar cuales son las propiedades que‬
‭debe reunir un estadístico para poder ser considerado un‬‭buen estimador.‬
‭Propiedades de un buen estimador‬

‭a.‬ ‭Carencia de sesgo:‬‭lo primero que debe exigirse de‬‭un estimador es que ofrezca‬
‭estimaciones correctas, al menos en promedio, Un estimador es insesgado si su‬
‭valor esperado coincide con el parámetro que estima.‬
‭-‬ ‭Coeficiente de correlacion de Pearson:‬‭es un estimador‬‭sesgado‬
‭b.‬ ‭Eficiencia:‬‭un estimador es tanto más eficiente cuanto‬‭menor es su varianza. Una‬
‭mayor eficiencia indica que el estadístico en cuestión varía menos de una muestra a‬
‭otra, por lo que las estimaciones que pueden hacerse con él son más precisas que‬
‭las que se hacen con un estimador menos eficiente.‬
‭ o cierto es que, aunque un estimador‬‭insesgado‬‭ofrece,‬‭en promedio, estimaciones‬

L
‭correctas, si ese estimador no es eficiente muchas de sus estimaciones estarán muy por‬
‭encima del verdadero valor del parámetro y otras muchas muy por debajo. Aunque unas y‬
‭otras se contrarrestarán para ofrecer una estimación promedio correcta, al elegir el azar una‬
‭de esas estimaciones se estará corriendo el riesgo de cometer un error muy grande.‬‭De ahí‬
‭la conveniencia de que un estimador, además de ser insesgado, sea eficiente.‬
‭Estimación por intervalos‬
‭ iempre que se efectúa una estimación es importante conocer la‬‭precisión‬‭(y, por tanto, el‬
S
‭error) con la que se está trabajando. Esto puede conseguirse recurriendo a la estimación‬
‭por intervalos.‬
‭ omo vimos anteriormente, este tipo de estimación se‬‭consiste en asignar al parámetro que‬
C
‭se desea estimar un‬‭rango de valores‬‭entre los que‬‭se espera que pueda encontrarse el‬
‭verdadero valor del parámetro con‬‭probabilidad conocida.‬
‭Estos dos conceptos son muy importantes y es necesario tenerlos en cuenta‬

‭1.‬ ‭Rango de valores:‬‭se refiere al rango de valores que‬‭se asigna al parámetro, a este‬
‭rango se le llama‬‭intervalo de confianza‬‭. Este intervalo‬‭de confianza tiene, por‬
‭supuesto, dos límites, uno inferior llamado Li [ (L)imite (i)nferior ] y otro superior‬
‭llamado Ls [ (L)imite (s)uperior ].‬
‭Para construir un intervalo de confianza de un parámetro cualesquiera, a su‬

‭ orrespondiente estimador puntual se le suma y se le resta una cantidad llamada Error‬
c
‭máximo (E‬‭max‬‭).‬
‭●‬ ‭Error máximo:‬‭representa la diferencia máxima que,‬‭con una determinada‬
‭probabilidad, cabe esperar encontrar el verdadero valor del parámetro estimado, y el‬
‭valor concreto del estadístico utilizado para estimarlo.‬
‭ 9‬
4
‭La utilidad de está estrategia radica justamente en que permite conocer la probabilidad con‬
‭la que cabe esperar que el intervalo construido incluya el verdadero valor del parámetro‬
‭estimado. A esa probabilidad se le llama‬‭nivel de‬‭confianza.‬
‭ ntonces el‬‭nivel de confianza‬‭se refiere‬‭a la probabilidad‬‭con la que cabe esperar que el‬
E
‭intervalo construido incluya el verdadero valor del parámetro estimado. Para esto se deben‬
‭tener en cuenta 2 cosas respecto al nivel de confianza:‬
‭-‬ ‭A mayor confianza, menor precisión:‬‭cuanto mayor sea‬‭E‬‭max‬‭, mayor será la‬
‭amplitud del intervalo y mayor también la probabilidad de que el intervalo construido‬
‭incluya el verdadero valor del parámetro.‬
‭-‬ ‭A menor error, mayor precisión:‬‭respecto a lo anteriormente‬‭dicho, es importante‬
‭tener en cuenta que, cuanto mayor sea E‬‭max‬‭, menor‬‭será la precisión de la‬
‭estimación, pues se estará atribuyendo al parámetro un rango más amplio de‬
‭valores.‬
‭ or eso, si el intervalo es más estrecho (más preciso), ese aumento de precisión implicará‬
P
‭una disminución del nivel de confianza.‬
‭Esto sugiere que es necesario buscar un equilibrio entre dos objetivos contrapuestos:‬
‭ ue el intervalo construido sea lo bastante amplio como para garantizar que la‬
Q
‭probabilidad de incluir el parámetro sea alta y, al mismo tiempo, lo bastante‬
‭estrecho como para ofrecer una precisión razonable. Este equilibrio se ha buscado‬
‭tradicionalmente en la literatura estadística estableciendo un nivel de confianza de‬
‭0.95 y, por tanto, un nivel de riesgo de 0.05.‬
‭ ivel de riesgo‬‭o‬‭nivel de significación:‬‭representa‬‭la probabilidad de construir un‬

N
‭intervalo entre cuyos límites no se encuentre el verdadero valor del parámetro.‬
‭2.‬ ‭Probabilidad conocida:‬
‭ ara construir intervalos de confianza es necesario utilizar estimadores con distribución‬

P
‭muestral conocida. De está manera, para construir intervalos de confianza, todo lo que se‬
‭necesita es conocer la distribución muestral del estadístico utilizado como estimador: la‬
‭distribucion muestral de un estimador informa de la probabilidad asociada a cada uno de‬
‭sus valores y eso es todo lo que hace falta para seguir está estrategia. Y ya sabemos que‬
‭para conocer la distribución muestral de un estadístico no es necesario seleccionar una‬
‭muestra; existen procedimientos matemáticos que permiten conocer con exactitud el valor‬
‭esperado, el error típico y la forma de muchas distribuciones muestrales.‬
‭¿Qué sabemos para construir un rango de valores?‬

‭1.‬ ‭Que la distribución muestral de la media se aproxima a una distribución normal‬
‭2.‬ ‭Que en una distribución normal hay un 95% de chance de que los valores caigan‬
‭entre +- 1.96 desvíos estándar de la media‬
‭3.‬ ‭Entonces hay un 95% de chance de que la‬‭media muestral‬‭caiga a +- 1.96 errores‬
‭estándar de la media poblacional‬
‭Nota:‬‭en la población se llama‬‭desvío estándar,‬‭en‬‭la muestra se llama‬‭error estándar‬
‭ l‬‭intervalo de confianza‬‭entonces se refiere al intervalo‬‭que hay entre -1.96 errores‬

E
‭estándar y +1.96 errores estándar en la media muestral‬
‭50‬
‭Interpretación del intervalo de confianza‬
‭ o se debe hablar de probabilidades, sino de estimaciones. En caso de ser 95% debería‬

N
‭interpretarse de la siguiente forma: “estimamos, con una confianza del 95% que el‬
‭verdadero valor del parámetro estimado se encuentra entre los límites del intervalo‬
‭construido. Esto significa que de cada 100 intervalos que se construyan en las mismas‬
‭condiciones, 95 de ellos incluirán el verdadero valor del parámetro (5 de ellos no lo harán).‬

PSICOPATOLOGÍA ADULTOS (Resumen Completo)

Cargado por

Copyright:

Formatos disponibles

PSICOPATOLOGÍA ADULTOS (Resumen Completo)

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

PSICOPATOLOGÍA ADULTOS (Resumen Completo)

Cargado por

Copyright:

Formatos disponibles

‭1‬

‭ esumen de Métodos y técnicas‬

‭Unidad 1 - Presentación del curso y nociones básicas acerca de variable‬ ‭pág. 2‬

‭Unidad 2 - Variables categóricas I: frecuencias y tablas bivariadas‬ ‭pág. 10‬

‭Unidad 4 - Variables numéricas I - cuantiles‬ ‭pág. 19‬

‭Unidad 5 - Variables numéricas II - tendencia central y dispersión‬ ‭pág. 29‬

‭Unidad 6 - Puntuaciones Z y distribución normal‬ ‭pág. 38‬

‭Unidad 7 - Muestreo - Introducción a la inferencia‬ ‭pág. 43‬

‭Unidad 8 - Estimación: Intervalos de confianza‬ ‭pág. 47‬

‭¿Qué son los métodos cuantitativos?‬

‭ s un método de investigación que se fundamenta en la medición de variables mediante el‬

‭ l‬‭objetivo‬‭de reunir los datos cuantitativos es entender,‬‭describir, y predecir la naturaleza‬

‭Estadística descriptiva e inferencial‬

‭ l acto de ir desde lo que se observa que ocurre en un conjunto reducido de observaciones‬

‭Es como encontrar la estadística subdividida en:‬

‭¿Para qué se puede usar la metodología cuantitativa dentro de la psicología?‬

‭Los psicólogos tenemos diferentes áreas de inserción laboral:‬

‭ l análisis de datos, o análisis estadístico, pertenece a una rama de las matemáticas‬

‭Existen dos tipos de estadística:‬

‭ l análisis de datos es un proceso que se desarrolla en fases: empieza con la seleccion y‬

‭¿Para qué sirve el análisis de datos?‬

‭Niveles de indagación: descriptivo, relacional, explicativo‬

‭La investigación empírica puede desarrollarse en diferentes niveles de indagación:‬

‭ as técnicas de análisis de datos pueden ser aplicadas a cualquier conjunto de datos‬

‭ na técnica de análisis de datos no determina el nivel de indagación en el que se es posible‬

‭ a recogida de datos se realiza en el contexto de un diseño de investigación, y puede‬

‭ medio camino entre la metodología observacional y la experimental se encuentra la‬

‭ o existe en la metodología correlacional una asignación aleatoria de los sujetos a las‬

‭ a principal consecuencia de la falta de asignación aleatoria a las condiciones de estudio es‬

‭ n términos generales, la metodología observacional y selectiva generan investigación‬

‭Es la representación numérica de una característica sometida a medición.‬

‭ e le denomina variable debido a que en determinada población, está va a‬‭variar‬‭de‬

‭ ara poder medir estos atributos es necesario‬‭operacionalizar‬‭las variables y‬

‭Pregunta‬ ‭Tipos de respuesta‬

‭¿Está satisfecho con el servicio?‬ ‭SI | NO‬

‭¿Su satisfacción con el servicio es….?‬ ‭Baja | Moderada | Alta‬

‭Valore del 1 al 10 su satisfacción con el servicio.‬ ‭1,2,3,4,5…,10‬

‭Tipos de variables y niveles de medida‬

‭ a variable en el caso anterior es‬‭trabajar‬‭, y sus‬‭categorías de respuesta son “si” y “no”, a‬

‭-‬ ‭ ariables cuantitativas o numéricas:‬‭toman valores‬‭numéricos para sus‬

‭Estas variables pueden ser tanto:‬

‭Variable‬ ‭Tipo de número‬ ‭Ejemplo‬

‭Discreta‬ ‭Enteros: 1, 20, 506‬ ‭12 años; 5 hijos‬

‭Continua‬ ‭Reales: 1.05, 21,5‬ ‭Temperatura 37.7°‬

‭Medir consiste en hacer corresponder dos sistemas de relaciones:‬

‭A su vez, dentro de las‬‭variables categóricas‬‭, tenemos‬‭los niveles de medida:‬

‭Las categorías utilizadas deben reunir 2 propiedades:‬

‭ or ejemplo, ante la pregunta sobre el nivel socioeconómico de una persona, sus‬

‭En cuanto a las‬‭variables numéricas o cuantitativas,‬‭encontramos dos tipos:‬

‭ s importante destacar que la frontera entre la escala ordinal y la de intervalos es lo‬

‭Características de está escala:‬

‭ l tiempo, por ejemplo, es una característica medida en escala de‬

‭Programas informáticos para el análisis de datos‬

‭ a lista de programas informáticos disponibles para el análisis de datos es interminable.‬

‭Unidad 2 - Variables categóricas I: frecuencias y tablas bivariadas‬

‭Base de datos (BD):‬‭conjunto de información ordenada‬‭de forma lógica.‬

‭Herramientas: Distribuciones de frecuencias‬

‭¿Que es una tabla o distribución de frecuencias?‬

‭ as tablas de frecuencia ofrecen información precisa de 2 de las 3 características que‬