Diccionario Estadistico

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 28

Poblacion

El concepto de población en estadística va más allá de lo que comúnmente se conoce como tal. Una
población se precisa como un conjunto finito o infinito de personas u objetos que presentan características
comunes.
"Una población es un conjunto de todos los elementos que estamos estudiando, acerca de los cuales
intentamos sacar conclusiones". Levin & Rubin (1996).
"Una población es un conjunto de elementos que presentan una característica común". Cadenas (1974).

Marco Poblacional

Muestra
"Se llama muestra a una parte de la población a estudiar que sirve para representarla". Murria R. Spiegel
(1991).
"Una muestra es una colección de algunos elementos de la población, pero no de todos". Levin & Rubin
(1996).
"Una muestra debe ser definida en base de la población determinada, y las conclusiones que se obtengan
de dicha muestra solo podrán referirse a la población en referencia", Cadenas (1974)

Marco Muestral

Dato
Datos Estadísticos:
Los datos estadísticos no son otra cosa que el producto de las observaciones efectuadas en las personas
y objetos en los cuales se produce el fenómeno que queremos estudiar. Dicho en otras palabras, son los
antecedentes (en cifras) necesarios para llegar al conocimiento de un hecho o para reducir las
consecuencias de este.
Los datos estadísticos se pueden encontrar de forma no ordenada, por lo que es muy difícil en general,
obtener conclusiones de los datos presentados de esta manera. Para poder obtener una precisa y rápida
información con propósitos de descripción o análisis, estos deben organizarse de una manera sistemática;
es decir, se requiere que los datos sean clasificados. Esta clasificación u organización puede muy bien
hacerse antes de la recopilación de los datos.
Ejemplo:
Si se quiere conocer las características de los estudiantes del Núcleo San Carlos de la UNESR, que
solicitan préstamo a la biblioteca de dicha Universidad, la recolección de la información debe clasificar a
cada estudiante sobre la base de: Carrera que estudia, edad, semestre de estudios, etc. Vemos pues que
la clasificación marca la pauta de la clase de datos que debe ser obtenido.
Clasificación de los datos
Los datos estadísticos pueden ser clasificados en cualitativos, cuantitativos, cronológicos y geográficos.
Datos Cualitativos: cuando los datos son cuantitativos, la diferencia entre ellos es de clase y no de
cantidad.
Ejemplo:
Si deseamos clasificar los estudiantes que cursan la materia de estadística I por su estado civil,
observamos que pueden existir solteros, casados, divorciados, viudos.
Datos cuantitativos: cuando los valores de los datos representan diferentes magnitudes, decimos que
son datos cuantitativos.
Ejemplo:
Se clasifican los estudiantes del Núcleo San Carlos de la UNESR de acuerdo a sus notas, observamos
que los valores (nota) representan diferentes magnitudes.
Datos cronológicos: cuando los valores de los datos varían en diferentes instantes o períodos de
tiempo, los datos son reconocidos como cronológicos.
Ejemplo:
Al registrar los promedios de notas de los Alumnos del Núcleo San Carlos de la UNESR en los diferentes
semestres.
Datos geográficos: cuando los datos están referidos a una localidad geográfica se dicen que son datos
geográficos.
Ejemplo
El número de estudiantes de educación superior en las distintas regiones del país.

Unidad Elemental

Variables o Caracteres Cuantitativos


Las variables, también suelen ser llamados caracteres cuantitativos, son aquellos que pueden ser
expresados mediante números. Son caracteres susceptibles de medición. Como por ejemplo, la estatura,
el peso, el salario, la edad, etc.
Según, Murray R. Spiegel, (1992) "una variable es un símbolo, tal como X, Y, Hx, que puede tomar un
valor cualquiera de un conjunto determinado de ellos, llamado dominio de la variable. Si la variable puede
tomar solamente un valor, se llama constante."
Todos los elementos de la población poseen los mismos tipos de caracteres, pero como estos en general
no suelen representarse con la misma intensidad, es obvio que las variables toman distintos valores. Por
lo tanto estos distintos números o medidas que toman los caracteres son los "valores de la variable".
Todos ellos juntos constituyen una variable.

Característica

Característica de Interés

Registro de una Característica

Atributo o Caracteres cualitativos


Los atributos también llamados caracteres cualitativos, son aquellos que no son susceptibles de medición,
es decir que no se pueden expresar mediante un número.
IUTIN (1997). "Reciben el nombre de variables cualitativas o atributos, aquellas características que
pueden presentarse en individuos que constituyen un conjunto.
La forma de expresar los atributos es mediante palabras, por ejemplo; profesión, estado civil, sexo,
nacionalidad, etc. Puede notar que los atributos no se presentan en la misma forma en todos los
elementos. Estas distintas formas en que se presentan los atributos reciben el nombre de "modalidades".

Muestreo
Esto no es más que el procedimiento empleado para obtener una o más muestras de una población; el
muestreo es una técnica que sirve para obtener una o más muestras de población.
Este se realiza una vez que se ha establecido un marco muestral representativo de la población, se
procede a la selección de los elementos de la muestra aunque hay muchos diseños de la muestra.
Al tomar varias muestras de una población, las estadísticas que calculamos para cada muestra no
necesariamente serían iguales, y lo más probable es que variaran de una muestra a otra.

Métodos o Técnicas de Muestreo


Existen dos métodos para seleccionar muestras de poblaciones;

 el muestreo no aleatorio o de juicio y el muestreo aleatorio o de probabilidad. En este último


todos los elementos de la población tienen la oportunidad de ser escogidos en la muestra.
 Una muestra seleccionada por muestreo de juicio se basa en la experiencia de alguien con la
población.

Algunas veces una muestra de juicio se usa como guía o muestra tentativa para decidir como tomar una
muestra aleatoria más adelante. Las muestras de juicio evitan el análisis estadístico necesarios para
hacer muestras de probabilidad.

Estadístico

Parámetro
Estimador

Estadística Descriptiva

Estadística Inferencial

 
DICCIONARIO ESTADÍSTICO

En esta sección encontrarás la definición de términos usuales en Estadística. Periódicamente


incluiremos nuevas entradas que irán completando el glosario. Si no localizas el término que buscas
comunícalo a través del buzón de sugerencias y lo incorporaremos inmediatamente. Gracias por utilizar
el diccionario Divestadística y contribuir a su actualización y exhaustividad.

 Contraste de hipótesis: Test de hipótesis


 Correlación: Medida de la relación existente entre dos variables. Su valor está comprendido
entre –1 y 1. Si es negativo la relación entre las variables es inversa, es decir, a medida que
aumentan los valores de una decrecen los de la otra. Si es positivo la asociación es directa, es decir,
los valores de una variable aumentan con la otra. Un valor de cero indica ausencia de relación.
Cuando las variables son continuas y tienen una relación lineal, el coeficiente de correlación lineal de
Pearson es una medida de asociación adecuada. Cuando las variables no son continuas se utilizan
otros coeficientes de correlación.

 Desviación típica: Valor mayor o igual a cero que mide la dispersión de una característica de
los individuos alrededor de la media del grupo. Los sujetos serán más parecidos u homogéneos entre
sí cuanto más próxima a cero esté la desviación típica. Su unidad de medida coincide con la unidad
de medida de la variable original. Es la raíz cuadrada de la varianza.
 Diseño de experimentos: Método estadístico cuyo objetivo es estudiar cómo cambian los
valores de una variable respuesta cuando se modifican los valores de una o varias variables
independientes, denominadas factores experimentales. Un experimento bien diseñado puede ser el
punto de partida para establecer relaciones causales entre las variables estudiadas.

E
 Estadística: Ciencia que estudia los fenómenos aleatorios. Es un área de conocimiento
específico de las Matemáticas que comenzó a desarrollarse a mediados del siglo XVII. Sus técnicas
permiten resumir grandes cantidades de información, estudiar la relación entre variables, investigar la
causa de algunos sucesos o predecir la evolución de un fenómeno en el tiempo y en el espacio, entre
otras cosas.
 Estimador: Valor numérico extraído de las observaciones de una muestra que se aproxima en
mayor o menor medida al parámetro de la población sobre el que se quiere investigar. Así, la edad
media de un grupo de individuos elegidos aleatoriamente de una población es un estimador de la
verdadera edad media de la población.
 Error alfa (α): Valor comprendido entre 0 y 1 que mide cuánto se equivoca el investigador al
aceptar como verdadera la hipótesis alternativa de un test de hipótesis. Cuanto más próximo a cero
esté, menor será el riesgo de establecer hipótesis falsas en la población de estudio. Su valor se fija a
priori, antes de comenzar la investigación, para conocer el número de individuos necesario para
llevar a cabo el estudio. Cuanto más pequeño sea el error alfa mayor será el tamaño de la muestra y,
por tanto, más precisos serán los resultados. Habitualmente este error se fija en 0.05, aunque puede
variar dependiendo del tipo de investigación.
 Error beta (β): Valor comprendido entre 0 y 1 que mide cuánto se equivoca el investigador al
aceptar como verdadera la hipótesis nula de un test de hipótesis. Cuanto más próximo a cero esté,
menor será el riesgo de establecer hipótesis falsas en la población de estudio. Su valor se fija a priori,
antes de comenzar la investigación, para conocer el número de individuos necesario para llevar a
cabo el estudio. Cuanto más pequeño sea el error beta mayor será el tamaño de la muestra y, por
tanto, más precisos serán los resultados. Habitualmente este error se fija en 0.20, aunque puede
variar dependiendo del tipo de investigación.
 Error estándar: Variabilidad del estimador cuando se obtiene a partir de muestras diferentes,
resultando un valor distinto en cada muestra. El error estándar siempre es mayor que cero. Cuanto
más pequeño sea mayor es la precisión de la estimación realizada.
 Especificidad: Probabilidad de que una prueba diagnóstica proporcione un resultado negativo
cuando el sujeto no está afectado por la enfermedad investigada. Lo ideal es que esta probabilidad
sea 1 siempre que la prueba diagnóstica se aplique en el grupo de población libre de enfermedad.
Sin embargo, no siempre es así. Cualquier prueba puede fallar mostrando un resultado positivo en un
individuo sano. La especificidad es, por tanto, la capacidad de la prueba diagnóstica para detectar la
ausencia de la enfermedad estudiada.

 Falso negativo: Probabilidad de que una prueba diagnóstica proporcione un resultado negativo
cuando el sujeto realmente tiene la enfermedad investigada. Es el valor complementario a la
sensibilidad.
 Falso positivo: Probabilidad de que una prueba diagnóstica proporcione un resultado positivo
cuando el sujeto no está afectado por la enfermedad investigada. Es el valor complementario a la
especificidad.

 Hipótesis nula: Afirmación establecida por el investigador sobre la población de estudio cuando
realiza un test o contraste de hipótesis. Esta hipótesis siempre se asume verdadera a menos que los
datos de la muestra proporcionen evidencia de lo contrario. Se suele formular mediante una negación
o una igualdad. Así, la hipótesis nula de un estudio sobre cirrosis hepática puede establecer que no
existe relación entre el consumo habitual de alcohol y la cirrosis o, de forma equivalente, que el
porcentaje de personas con cirrosis es igual en bebedores y no bebedores.
 Hipótesis alternativa: Aseveración opuesta a la hipótesis nula en un test o contraste de
hipótesis. Así, la hipótesis alternativa de un estudio sobre cirrosis hepática puede establecer que
existe relación entre el consumo habitual de alcohol y la cirrosis o, de forma equivalente, que el
porcentaje de personas con cirrosis es diferente en bebedores y no bebedores.

 Inferencia estadística: Procedimiento que permiten extrapolar o generalizar a la población los


resultados obtenidos en el análisis de una muestra. Las técnicas utilizadas para ello incluyen los
intervalos de confianza y los tests de hipótesis.
 Intervalo de confianza: Rango de valores que, con una cierta confianza, contiene al parámetro
poblacional que se pretende conocer. El intervalo de confianza se construye a partir de la información
de la muestra y es una de las herramientas utilizadas para extrapolar los resultados a la población.

 Media: Valor numérico en torno al cual se sitúan los valores de una característica de los
individuos. Es un representante del grupo de sujetos analizado.
 Muestra: Grupo de individuos extraídos aleatoriamente de la población de estudio. La
información proporcionada por estos sujetos se almacena en una base de datos para analizarla
posteriormente. Los resultados obtenidos en este análisis son una aproximación a lo que realmente
ocurre en toda la población. La inferencia estadística permite extrapolar los resultados de la muestra
a la población y conocer el error cometido en estas estimaciones.

 Nivel de confianza (1-α): Probabilidad de que el intervalo de confianza obtenido a partir de los
datos de la muestra contenga al parámetro de la población que se pretende estimar. Aunque puede
tomar cualquier valor entre 0 y 1, el más usual es 0.95 (95%).
 Nivel de significación (α): Error alfa.

 Población: Todos los individuos sobre los que se desea realizar una investigación o estudio.
Cuando la información necesaria para el estudio ha sido extraída de todos y cada uno de los
individuos de la población se habla de censo de población. Si por el contrario no es posible acceder a
todos los sujetos por falta de recursos se procede a tomar una muestra aleatoria de la población de
estudio.
 Potencia (1-β): Valor comprendido entre 0 y 1 complementario al error beta. Mide el grado de
acierto del investigador cuando acepta como verdadera la hipótesis nula de un test de hipótesis. Su
valor se fija a priori, antes de comenzar la investigación, para conocer el número de individuos
necesario para llevar a cabo el estudio. Cuanto mayor sea la potencia, mayor será el tamaño de la
muestra y, por tanto, más precisos serán los resultados obtenidos. Habitualmente este error se fija en
0.80, aunque puede variar dependiendo del tipo de investigación.
 Probabilidad: Medida adimensional que cuantifica la ocurrencia de los fenómenos producidos
por azar. Sus valores son números comprendidos entre 0 y 1. Cuando la probabilidad es cero, el
suceso no ocurrirá nunca. Si la probabilidad es uno, ocurrirá con total certeza. Los valores
intermedios miden el gradiente de certidumbre.
 Prueba diagnóstica: Procedimiento destinado a detectar la presencia o ausencia de una
enfermedad en el individuo. Su capacidad de discriminación está determinada por la sensibilidad y la
especificidad, características propias de cada prueba o test diagnóstico.

 Regresión: Técnicas estadísticas que permiten determinar la ecuación matemática que


relaciona un efecto (variable dependiente o respuesta) con una o varias causas (variables
independientes o predictoras).

 Sensibilidad: Probabilidad de que una prueba diagnóstica proporcione un resultado positivo


cuando el sujeto tiene realmente la enfermedad. Lo ideal es que esta probabilidad sea 1 siempre que
la prueba diagnóstica se aplique en el grupo de población afectado por la enfermedad. Sin embargo,
no siempre es así. Cualquier prueba puede fallar mostrando un resultado negativo en un individuo
enfermo. La sensibilidad es, por tanto, la capacidad de la prueba diagnóstica para detectar la
presencia de la enfermedad estudiada.

 Tamaño de muestra: Número de sujetos necesario para llevar a cabo una investigación, de
manera que los resultados obtenidos a partir de ellos se aproximen a los resultados que se hubieran
obtenido al estudiar a toda la población. El error cometido en esa extrapolación de resultados es
conocido y prefijado antes de comenzar la investigación. El tamaño de muestra será mayor cuanto
más pequeño sea el error que se desee cometer.
 Test de hipótesis: Técnica estadística utilizada para decidir si una afirmación establecida por el
investigador sobre la población de estudio es compatible con los resultados observados en una
muestra. Cualquier test de hipótesis se compone de una hipótesis nula, formulada en términos de
igualdad o negación, y una hipótesis alternativa.
 Test diagnóstico: Prueba diagnóstica
V

 Valor P: Valor comprendido entre 0 y 1 que mide el grado de acuerdo entre la información que
proporciona la muestra y la hipótesis nula del test de hipótesis. Cuanto más próximo a cero esté,
menor será el acuerdo entre ambas. Así, la hipótesis nula será rechazada en favor de la alternativa
siempre que el Valor P sea muy pequeño, inferior al nivel de significación preestablecido.
 Valor predictivo negativo: Probabilidad de que un individuo no padezca la enfermedad cuando
la prueba diagnóstica aplicada proporcione un resultado negativo. Este valor depende tanto de la
especificidad y de la proporción de falsos negativos de la prueba como del número de personas
enfermas registrado en la población a la que pertenece el individuo. Por este motivo, el valor
predictivo negativo puede ser diferente dependiendo del país o región en que se calcule, aún
utilizando la misma prueba diagnóstica.
 Valor predictivo positivo: Probabilidad de que un individuo padezca la enfermedad cuando la
prueba diagnóstica aplicada proporcione un resultado positivo. Este valor depende tanto de la
sensibilidad y de la proporción de falsos positivos de la prueba como del número de personas
enfermas registrado en la población a la que pertenece el individuo. Por este motivo, el valor
predictivo positivo puede ser diferente dependiendo del país o región en que se calcule, aún
utilizando la misma prueba diagnóstica.
 Variable: Cualquier característica de los individuos que componen la muestra que toma un valor
diferente para cada uno de ellos. La edad y el sexo son variables habituales en muchas
investigaciones.
 Variable cualitativa: Característica que recoge una cualidad de los individuos de la muestra.
Una variable cualitativa no puede medirse con un instrumento ni lleva asociada una unidad de
medida. La gravedad de un accidente es una variable cualitativa ordinal, ya que registra una cualidad
que pueden ordenarse de forma natural de menor a mayor severidad. El sexo, en cambio, es una
variable cualitativa nominal porque sus categorías, masculino y femenino, no tienen un orden natural
preestablecido.
 Variable cuantitativa: Característica de los individuos de la muestra que puede medirse con un
instrumento y lleva asociada una unidad de medida. El peso es una variable cuantitativa, ya que
puede medirse con una báscula y su unidad de medida es el gramo. Además, esta variable es
continua, ya que el valor del peso asignado a cada individuo puede tener tantos decimales como
admita la precisión de la báscula. Otras variables cuantitativas, como el número de hijos, se
denominan discretas porque sus valores solo pueden ser números enteros, sin decimales.
 Varianza: Valor mayor o igual a cero que mide la dispersión de una característica de los
individuos alrededor de la media del grupo. Los sujetos serán más parecidos u homogéneos entre sí
cuanto más próxima a cero esté la varianza. Su unidad de medida es la unidad de medida de la
variable original elevada al cuadrado. Su valor coincide con el cuadrado de la desviación típica.

Glosario de términos
 

A
 
Amplitud de variación. Se considera como el dato mayor menos el dato menor

de todo el conjunto de datos considerados en toda la muestra, si consideramos a l0 el

dato menor de la muestra y al dato mayor ln  entonces la amplitud de variación estará


determinada como:

A  l0  ln

Amplitud de clase. Se considera la amplitud que deben tener las clases


consideradas para realizar un estudio estadístico. Para n datos con k clases se determina
que la amplitud de clase es igual a:

k
Amplitud de clase 
A

B
 

C
 

Censo. En el caso particular en que la muestra sea del mismo tamaño que la
población el estudio estadístico se conoce como censo.

 
Carácter estadístico. Es la propiedad que permite clasificar a los individuos de
una población estadística, puede haber de dos tipos:

-  Cuantitativos: aquellos  datos que se pueden medir o expresarse mediante un número


sin tener que recurrir a la frecuencia con que ocurren.

-  Cualitativos: aquellos datos que no se pueden medir.

Cartogramas. Son gráficos en los que se puede agrupar para una misma clase
diferentes frecuencias, por lo que se hace apropiado su uso cuando se desea analizar 
diferentes resultados obtenidos, con diferentes frecuencias pero con una misma clase.

D
 

Datos aleatorios: Es la obtención de datos realizada a partir de una población a


los cuales no se les ha dado ninguna prioridad.

Dato estadístico. Los datos que se considera participan en el estudio estadístico


se conoce como datos estadísticos, mas concretamente, se consideran como los valores
que se pueden obtenerse de la observación para formar la muestra.

Diagramas de barras.  Se utiliza para representar datos  cualitativos y


cuantitativos, con datos  de tipo discreto. En el eje x se representan los datos ordenados
en clases mientras que en el eje y se pueden representar frecuencias absolutas o
relativas.  

 
Domesday es el vocablo resultante de la deformación de la palabra doomsday (el
día del Juicio Final o Universal) la obra fue llamada de este modo por sus dictámenes
relativos a las imposiciones y a las tasaciones, que eran irrevocables.

Distribuciones de frecuencias. Se le conoce con este nombre al conjunto de


clases que aparecen con su frecuencia correspondiente, generalmente mediante una
tabla estadística.

Diagrama de sectores. Este tipo de diagramas puede ser de dos tipo, se puede
considerar una figura geométrica en la que la información se distribuye dentro de la
figura como puede ser una dona o un anillo en el que cada porción dentro de la figura
representa la información porcentual del total de datos. La segunda opción es la
utilización de pasteles en los que una porción del pastel determinada por sectores
individuales la información  para ese sector especifico.

E
La estadística es una ciencia de las matemáticas encargada del estudio del
comportamiento de una población mediante un estudio cuyo propósito es hacer
inferencias a partir  de un subconjunto de datos, llamado muestra, tomados de ella.

La estadística inferencial o inductiva. Sirve extrapolar los resultados obtenidos


en el análisis  de los datos y a partir de ello predecir acerca de la  población, con un
margen de confianza conocido. Se apoya fuertemente mediante el cálculo de
probabilidades.
 

La estadística descriptiva o deductiva. Se construye a partir de los datos y la


inferencia  sobre la población no se puede realizar, al menos con una confianza
determinada, la representación de la información obtenida de los datos se representa
mediante el uso de unos cuantos parámetros, tablas  y algunas graficas planteadas de tal
forma que den importancia los mismos datos a través de parámetros que caractericen la
distribución.

Experimento aleatorio. Experimento en el que existen diferencias de una muestra


a otra, cuyas muestras pese  ha ser de una misma población son diferentes.

Estadístico  es el término que se utiliza para designar al profesional que se


dedica al análisis de la información estadística, al que en ocasiones también se le conoce
como estadígrafo.

Estadígrafo  es el término utilizado para designar a la persona dedicada a las


tareas propias de la estadística, aunque en ocasiones también es frecuente que se utilice
para designar a la variable que define una distribución estadística, de esta forma es
común escuchar el término estadígrafo de prueba.

F
 
La frecuencia absoluta f(xi) se determina como el número de veces que se repite
un dato xi.

La frecuencia absoluta acumulada Fi  Para un determinado valor se considera


como la frecuencia de cada dato xi mas la suma de los valores anteriores a dicha suma.

La frecuencia relativa hi es el cociente fi /N , donde N es el número total de datos.

La frecuencia relativa acumulada Hi  es el cociente Fi /N

G
 
H
Histogramas. Los histogramas de frecuencias son gráficas que representan un
conjunto de datos que se emplean para representar datos de una variable cuantitativa. En
el eje horizontal o de las abscisas se representan los valores tomados por la variable, en
el caso de que los valores considerados sean continuos la forma de representar los
valores es mediante intervalos  de un mismo tamaño llamados clases. En el eje vertical
se representan los valores de las frecuencias de los datos. Las barras que se levantan
sobre la horizontal y hasta una altura que representa la frecuencia. Un punto importante
en el manejo de la información bajo el uso de histogramas es el hecho de poder
comparar, bajo un proceso en control,  que a medida que se crecen las clase tiene
aproximadamente la forma de una campana centrada, es la de una de las distribuciones
mas importantes conocidas como frecuencia normal o gaussiana.

I
 

Inferencia: Término utilizado para indicar la predicción hecha acerca de una


población.

J
 
K
 
 
L
 

Los Libros de las Crónicas  dos libros del Antiguo Testamento que interpretan la
historia de Israel y Judea desde la creación de Adán hasta mediados del siglo VI a.C.

 
M
 

Una muestra es un subconjuntos de datos tomados de la población, cuya


finalidad es la de realizar inferencias acerca de la población a partir del comportamiento
de sus elementos. Es claro que si la muestra es un subconjunto de la población entonces
la muestra tendrá un número menor de elementos. La naturaleza de la muestra radica en
la optimización de los recursos, por ejemplo, si deseamos hacer un estudio acerca de las
lecturas que a los estudiantes de Michoacán les gusta leer, el estudio implicaría
considerar a los estudiantes de lugares remotos, resultando difícil desde el punto de vista
económico, sin embargo la estadística plantea métodos mediante los cuales con una
elección adecuada del tamaño de muestra  podemos predecir a partir de una muestra  las
preferencias que tienen los estudiantes acerca del tipo de lectura.

N
 

 Números es el nombre del cuarto libro que forma parte de la colección del
Pentateuco, uno los libros del antiguo testamento de la cultura judía, porque en su
primer capítulo refiere el censo llevado a cabo después de concluida la legislación
sinaítica y antes de la salida del monte de Dios.

O
 
P
 
Una población es conjunto de elementos que tiene características comunes, al
menos una. Por ejemplo, una población es el grupo de estudiantes de un país.

En el caso particular de la estadística la población constituye el objeto de estudio, es


decir, la población es el conjunto de individuos o entes que constituyen el objeto de
estudio sobre el que se desea predecir un comportamiento a partir del estudio.

Promedio de datos: Es la cantidad que se obtiene al sumar el conjunto de datos


que intervienen en la muestra entre el total de datos, este también es conocido como
media aritmética o simplemente media y se calcula como:

x
x i

Polígono de frecuencias. Representaciones gráficas alternativas al histograma de


frecuencias. Estos se construyen a partir de los puntos medios de cada clase. La
utilización de los puntos medios o marcas de clase son llevados al escenario gráfico
mediante la utilización de los polígonos de frecuencias. Se construye uniendo los
puntos medios de cada clase localizados en las tapas superiores de los rectángulos
utilizados en los histogramas de las gráficas. Su utilidad se hace necesaria cuando
desean destacarse las variables de tendencia central, como son media, modas y
medianas.

Pictogramas. El pictograma consiste en la utilización de símbolos utilizados para


representar un conjunto de datos, en el caso de la representación de datos individuales a
través de barras hemos utilizado los pictogramas, sin embargo en áreas especificas
convendría analizar el conjunto de datos.

 
Pirámides de población. Este gráfico se construye utilizando pirámides para
construir la representación de los datos bajo cierta clase, la diferencia de información
considerada entre cada clase será dada por el tamaño de la pirámide. En ocasiones la
frecuencia de cada clase se coloca en el extremo superior de cada clase, sin embargo
también, al igual que en las anteriores puede resultar útil colocar información, como el
porcentaje de información en la punta de cada pirámide.

 
Q
 
 
R
 

Recorrido de una distribución. Es la diferencia que existe entre el valor máximo 


del conjunto de datos y su valor mínimo.

S
 

Staat. Palabra alemana que se refiere a estado como expresión de unidad política
superior. Asociada con el origen etimológico de la palabra  estadística.

Status. Palabra latina  que significa situación, posición, estado. Asociada con el origen
etimológico de la palabra  estadística.

Statera. Palabra griega que quiere decir balanza, ya que la estadística mide o pesa
hechos. Asociada con el origen etimológico de la palabra  estadística.

 
T
 

Tamaño de muestra:  El número de elementos que intervienen dentro de la


elección de la muestra extraída de una población.

 
U
 
V
 
Variables nominales. Son aquellas variables que son descritas por algunas
características de sus integrantes.

Variables cuasicuantitativa. Son variables nominales que a pesar de ello se


pueden ordenar entre ellas, ejemplo de ellas los pueden representar los valores que
pueden tomar los corredores  en una competencia, en la forma en que llegan a la meta,
primer lugar, segundo lugar, etc...

Variables cualitativas. Son aquellas variables que como su nombre lo indica


estan relacionadas con sus características exteriores.

Variables cuantitativas. Estas variables  son caracterizadas por alguna


información numérica que se le puede asociar a los individuos de la una población. Esta
caracterización puede ser clasificada en discreta y continua.    

Variables cuantitativas discretas. Son aquellas cuyo valor esta determinado por
valores enteros.

Variables cuantitativas continuas. Son aquellas cuyo valor esta determinado por
valores reales, generalmente esas variables pueden tomar toda una gama de valores
dentro de la recta real.

Variables aleatorias continuas. Permiten una infinidad de valores al azar dentro


de un intervalo, considerándose variables continuas precisamente por la posibilidad de
poder tomar cualquier valor dentro de una infinidad de valores.

Variables aleatorias discretas. Las variables cuya naturaleza toma un número


finito de  valores enteros, tales como: los estudiantes de la escuela de medicina de una
universidad, los alumnos reprobados en la materia de matemáticas, el número de peces
en un estanque, el número de cursos que un estudiante debe cursar para graduarse,
etcétera. El conjunto de valores que podría de tomar una variable aleatoria discreta 
puede ser finita o infinita numerable.
GLOSARIO DE CONCEPTOS DE ESTADÍSTICA

ELEMENTOS O UNIDADES: Son las entidades acerca de las que se reúnen


datos. Por ejemplo, 1) si se evalúa la memoria de los aspirantes a un puesto de
mozo en el restaurante X, las unidades son cada uno de los aspirantes. 2) Si se
estudia el fenómeno de deserción escolar de las escuelas primarias públicas de
Lomas de Zamora, las unidades son cada una de las escuelas de dicha región.
3) Si a un comerciante le interesa el volumen de ventas semanal de su
comercio durante el último año, las unidades son cada una de las semanas de
ese año.
POBLACIÓN_DE INDIVIDUOS: Es el conjunto de todos los elementos sobre
los
cuales se observa una o más características de Interés. Frecuentemente se
alude a ella como población objetivo, en razón de que sobre ella recae el
objetivo o el interés del estudio. Ejemplos: 1) el conjunto de aspirantes al
empleo del restaurante X, 2) el conjunto de escuelas primarias públicas de
Lomas de Zamora y 3) el conjunto de semanas a lo largo del último año.
__
MUESTRA_DE INDIVIDUOS: Es un subconjunto o parte de una población de
individuos. Ejemplos: 1) los cinco primeros aspirantes entrevistados; 2) las
escuelas nro. 12, 16, 17, 23, 34, 55, 62, 70, 84 y 97 de Lomas de Zamora; 3)
las semanas 1, 6, 12, 19, 27, 36 y 46 del último año.
Notas:
Es importante destacar que, tanto cuando hablamos de las unidades
como de la población objetivo o de individuos o de la muestra de individuos,
éstas entidades deben ser situadas en el espacio (situación geográfica) y en el
tiempo (año o fecha). Por ejemplo no es lo mismo observar el fenómeno de la
deserción escolar en 2010, que observar lo que ocurría en 1983. Tampoco es
lo mismo observarla en Lomas de Zamora que observarla en San Isidro.
Como generalmente las muestras se extraen con fines inferenciales;
esto es, para tener conocimiento de lo que acontece a nivel poblacional, es de
desear que sean representativas de las respectivas poblaciones. Para
favorecer la representatividad de las muestras, la llamada Teoría de Muestreo
ha desarrollado diversidad de métodos. Uno de ellos es la elección al azar de
las unidades muestrales. Así, por ejemplo, las escuelas del ejemplo 2) pueden
haber sido seleccionadas por sorteo.
VARIABLE O CARACTERÍSTICA: Es una característica de un fenómeno
observable en los individuos de una población. Es una variable propiamente
dicha cuando presenta diferentes modalidades (dos o más) entre los individuos.
Si se presenta bajo una única modalidad se dice que es una característica
constante. Ejemplos: 1) Memoria de los aspirantes al empleo, 2) Nivel de
deserción escolar y 3) Volumen de ventas respectivamente.
VARIABLE ESTADÍSTICA: Es una representación, a través de números u
otros símbolos, de una variable. Esta representación se obtiene mediante algún
procedimiento de medición. Ejemplos: 1) Cantidad de palabras recordadas de
una lista de 12. 2) Porcentaje de deserción escolar (Cantidad de estudiantes
que abandonaron los estudios en determinado período dividida el total de
alumnos que ingresaron, multiplicado por 100). 3) Total en $ de los productos
vendidos en una semana.
Las variables estadísticas se clasifican de acuerdo con el tipo de valores
que pueden tomar en:
Variable cualitativa. Es aquella cuyos valores expresan atributos. Ejemplo: Tipo
de trastorno que presentan los pacientes de un servicio de salud mental (de
ansiedad, de atención, de sueño, etc.)
Variable cuasi-cuantitativa. Es aquella cuyos valores indican un orden o
jerarquía. Ejemplo: Nivel de deserción escolar (bajo, medio, alto).
Variable cuantitativa. Es aquella cuyos valores expresan cantidades numéricas.
Dentro de las variables cuantitativas se diferencian las llamadas discretas de
las continuas. Se consideran discretas aquellas cuyos valores son puntos
aislados; esto es, cuando todo valor tiene un consecutivo. Se dice que dos
valores son consecutivos cuando no puede existir un valor de la variable entre
ellos. Ejemplo: Cantidad de palabras recordadas. Se consideran continuas a
las variables que, al menos teóricamente, pueden tomar cualquier valor dentro
de un intervalo numérico. Ejemplo: Tiempo de reacción ante un estímulo. Hay
variables que no son discretas ni continuas pero no se tratarán en este curso.
CONSTRUCTO Y OPERACIONALIZACIÓN. La mayoría de las características
psicológicas son de naturaleza compleja, resultado de varias variables que
interactúan. Cuando se alude a estas variables es necesario explicitar qué se
entiende por ellas, o qué aspectos se están considerando y qué relaciones se
verifican entre ellas. De allí surge una construcción teórica, hipotética, que
toma el nombre de constructo. Algunos ejemplos de constructos son la
inteligencia, la memoria, la ansiedad, la actitud solidaria, etc. Estos constructos
o variables complejas no son directamente observables como son; por ejemplo,
la estatura o el estado civil de una persona, y esto es lo que dificulta el proceso
de medición. ¿Por qué? Para poder obtener valores de estas variables a través
de la medición es necesario hacer un “recorte adecuado” del constructo; es
decir, considerar un solo aspecto del mismo y explicitar cuáles son las
manifestaciones observables que dan cuenta de él. Por ejemplo, una
manifestación observable de la memoria es la cantidad de palabras
recordadas, aunque la sola recordación de palabras no agota la riqueza del
constructo memoria. En estos casos se recurre a una definición operacional
(operacionalización) del constructo permite asignar sin ambigüedad un valor a
la variable a través del proceso de medición. En el presente ejemplo, la
definición operacional del constructo memoria es la cantidad de palabras
recordadas. A las variables que no son directamente observables también se
las denomina rasgos latentes. Así, por ejemplo, la obsesividad de un estudiante
es un rasgo latente que puede manifestarse a través de la cantidad de veces
que pregunta lo mismo hasta sentirse satisfecho.
¿CONTINUO O DISCRETO? El hecho de que una variable estadística sea
discreta o continua determina el tipo de tratamiento estadístico que se le dará.
Sin embargo muchas veces es decisión del investigador si la tratará de un
modo u otro dependiendo de la naturaleza de la variable estadística y de su
correspondiente variable latente. Por ejemplo; la cantidad de palabras
recordadas de una lista es claramente una variable discreta y es perfectamente
adecuado que el investigador la trate como tal. Pero esta variable representa a
la variable latente memoria, la cual tiene sentido que sea concebida en un
continuo; esto es, entre dos niveles de memoria es razonable pensar que
podrían existir infinitos valores posibles. De modo que el investigador puede
considerar que en realidad está ante una discretización de un continuo debida
al instrumento de medición; del mismo modo que la hora registrada con un reloj
digital es una discretización del tiempo que se desea medir. Bajo esta
perspectiva el investigador puede dar a la cantidad de palabras recordadas un
tratamiento de variable continua y considerar, por ejemplo, que el valor 10 (diez
palabras recordadas) bien puede representar todo un continuo de niveles de
memoria entre 9,5 y 10,5 que podría observar si dispusiera de un instrumento
de medición más sensible que la sola cantidad de palabras recordadas. Es
importante considerar que, para que una variable discreta pueda ser tratada
adecuadamente como continua, es conveniente que tome una gran cantidad de
valores diferentes.
POBLACIÓN DE OBSERVACIONES: Es el conjunto de todos los valores que
puede tomar una variable estadística sobre la población de individuos. Nótese
que sobre una misma población de individuos se pueden definir muchas
poblaciones de observaciones, tantas como variables de Interés.
MUESTRA DE OBSERVACIONES: Es el conjunto de valores que toma una
variable estadística sobre una muestra de individuos; es decir, es un
subconjunto de la población de observaciones.
ESTADÍSTICA DESCRIPTIVA: Es la parte de la Estadística que proporciona
métodos para organizar, representar, resumir y analizar la información
contenida en un conjunto de datos muestrales o poblacionales.
ESTADÍSTICA INFERENCIAL: Es la parte de la Estadística que proporciona
métodos para extraer conclusiones sobre las poblaciones a partir de sus
muestras controlando el margen de error que se puede cometer en esa
extrapolación de lo muestral a lo poblacional. Los métodos de inferencia
estadística se agrupan fundamentalmente en dos clases: Estimación de
parámetros y Contraste de hipótesis.
POBLACIONES REALES O HIPOTÉTICAS, FINITAS O INFINITAS. Una
muestra de observaciones siempre es real porque consiste de datos
efectivamente recolectados; pero la correspondiente población de
observaciones puede ser real o hipotética. Por ejemplo; si la muestra
corresponde a la actitud de los consumidores respecto de un nuevo producto
introducido en el mercado, los valores de esta variable Actitud son reales,
concretos; ya que todos los consumidores tienen alguna actitud hacia dicho
producto, desde negativa a positiva, pasando por neutra o indiferente o
inclusive de desconocimiento del producto. Pero si la muestra de
observaciones se refiere al nivel de ansiedad que presentan ciertos fumadores
después de completar determinado tratamiento para dejar la adicción, la
población de observaciones se refiere al nivel de ansiedad que tendrían todos
los fumadores que voluntariamente siguieran dicho tratamiento, lo cual no tiene
existencia real, en el acto, sino hipotética, potencial. Por otra parte, una
población de observaciones puede ser finita; esto es con una cantidad grande
o pequeña pero limitada de elementos. Por ejemplo, la intención de voto para
una elección presidencial de los habitantes de cierto distrito. La cantidad de
elementos de esa población está dada por la cantidad de personas
empadronadas. Pero una población puede ser (o considerarse) infinita, como
es el rendimiento académico (representado por el promedio general de la
carrera) alcanzado por los egresados de Psicología de la UBA. Se considera
infinita porque comprende a los egresados del pasado, del presente y del futuro
mientras exista la Institución. La importancia de reconocer con qué tipo de
población se está trabajando radica en la pertinencia de los métodos
estadísticos que se utilizan para recoger los datos, analizarlos y sacar
conclusiones. Por ejemplo, generalmente si una población es real y finita, con
límites bien definidos en espacio y tiempo, los criterios para la elección de
muestras representativas son provistos por la TEORÍA DE MUESTREO
mientras que si la investigación se refiere a una población infinita e hipotética
donde la pertenencia a determinado ámbito geográfico o temporal no está bien
definida o no es relevante al objetivo de dicha investigación, generalmente es
abordada desde el DISEÑO DE EXPERIMENTOS.
PARÁMETRO: Es una característica fija, generalmente numérica, de la
población de valores de una variable. Por ejemplo, si la variable es el tiempo de
reacción de sujetos entrenados ante un estímulo, un parámetro es el tiempo
promedio de reacción de todos los individuos de la población de interés si
éstos fueran entrenados (éste es un ejemplo de población hipotética). Nótese
que al promediar todos los valores de la población se obtiene un único valor,
fijo para la población. Otro parámetro podría ser el tiempo mínimo de reacción
que surgiría de comparar los tiempos de todos los sujetos de la población y
que, por tanto, también es único; lo mismo puede decirse del tiempo máximo.
Si la variable es actitud de los consumidores hacia un nuevo producto, un
parámetro puede ser el porcentaje de consumidores de toda la población
objetivo que tiene una actitud positiva.
ESTADÍSTICO: Es una característica muestral y, como tal, es una variable
porque sus valores dependen de la muestra que salga seleccionada (piense
que dada una población pueden extraerse muchas muestras diferentes). Cada
valor del estadístico se obtiene como función de las observaciones de una
muestra. Por ejemplo, tiempo promedio de reacción de 10 individuos que
fueron entrenados. Porcentaje de consumidores entre 100 encuestados que
manifestaron tener una actitud positiva frente al producto.
ESTIMADOR: Es un estadístico cuyos valores se consideran próximos a un
parámetro que, por ser generalmente desconocido, se desea estimar.
FRECUENCIA ABSOLUTA: Es la cantidad de veces que cada valor de la
variable aparece en un conjunto de datos. La suma de todas las frecuencias

absolutas coincide con la totalidad de los datos.

1.ALEATORIO: aleatorio es cuando no sigue un patrón particular que se pueda describir


directamente por ecuaciones. Se basa mas en la probabilidad. Al azar, estocástico. Este
término representa una idea que debe ser expresada en términos del concepto de
probabilidad.

2. ATRIBUTO: Característica cualitativa de un objeto o individuo tal como sexo, país de


origen, estado marital...

3. COEFICIENTE DE RELACION:Medida de asociación que indica el grado en que dos


variables continuas poseen una relación lineal (r). Tanbién indica la dirección de esa
asociación

4. COEFICIENTE DE DETRMINACION: Es el cuadrado del coeficiente de correlación.


Expresado en tanto por ciento, mide el grado de información compartida entre dos o más
variables continuas.
5. CONFIABILIDAD. Probabilidad de que la estimación efectuada se ajuste a la realidad.
Cualquier información que queremos recoger está distribuida según una ley de
probabilidad (Gauss o Student), así llamamos nivel de confianza a la probabilidad de que
el intervalo construido en torno a un estadístico capte el verdadero valor del parámetro.

6. CUADRADO MINIMO: es decir, hacer una estimación en el sentido de los mínimos


cuadrados, es seleccionar en una familia de modelos teóricos aquel para el cual la media
de los cuadrados de la diferencias entre los datos y el modelo, es mínima.

Coefficient

7. DISTRIBUCION DE FECUENCIAS: Resumen tabular que muestra el número


(frecuencia) de artículos en cada una de varias clases que no se traslapan, Distribución de
frecuencias relatives, Distribución de frecuencias porcentuales.

8. ERROR MUESTRAL: Es la diferencia entre un estadístico y su parámetro


correspondiente. Es una medida de la variabilidad de las estimaciones de muestras
repetidas en torno al valor de la población, nos da una noción clara de hasta dónde y con
qué probabilidad una estimación basada en una muestra se aleja del valor que se hubiera
obtenido por medio de un censo completo

9. EXPERIMENTO: es una acción mediante la cual se obtiene un resultado y queimplica la


observación de éste.

10. LINEA DE REGRESION: Cuando observamos una nube de puntos podemos apreciar
si los puntos se agrupan cerca de alguna curva. Aquí nos limitaremos a ver si los puntos
se distribuyen alrededor de una recta. Si así ocurre diremos que hay correlación lineal. La
recta se denomina recta de regresión.

11. MEDIA ARITMETICA: es el número que se obtiene al dividir la suma de todas las
observaciones por la cantidad de observaciones sumadas

12. MEDIANA: si todos los valores observados de la variable se ordenan en sentido


creciente (o decreciente), la mediana es el valor de la variable que ocupa el lugar central,
es decir, el que deja a un lado y a otro el mismo número de observaciones. La mediana se
representa con el símbolo Mna.

13. MODA: es el valor de la variable que más veces se repite, o sea, el valor que presenta
mayor frecuencia.

14 .MUESTRA: Un conjunto de medidas u observaciones tomadas a partir de una


población dada. Es un subconjunto de la población.

15. MUESTRA ALEATORIA: Trata de obviar las dificultades que presentan los anteriores
ya que simplifican los procesos y suelen reducir el error muestral para un tamaño dado de
la muestra.

16. MUESTRA ESTRATIFICADA: es un subconjunto limitado extraído de una población


con el objeto de reducir el campo de experiencias. Las propiedades que obtengamos se
harán extensivas a toda la población.

17. .POBLACIÓN: Es el conjunto de todos los posibles elementos que intervienen en un


experimento o en un estudio.

18. PRUEBA DE HIPOTESIS Proceso que permite tomar una decisión entre dos hipótesis
opuestas. Estas hipótesis se plantean de modo que una es la negación de la otra, Luego,
una hipótesis se prueba con la esperanza de poder demostrar que su ocurrencia es muy
improbable, implicándose así que la otra hipótesis es probablemente verdadera.
19. SUMA CUADRADA DEBIDO A LA REGRECION: En un modelo de regresión lineal
simple, y = mx + b, SSR está dada por la suma de los cuadrados de las diferencias de la
media de y al valor correspondiente en la línea recta.

20. TEORIA DEL LIMITE CENTRO: consiste en un conjunto de resultados acerca del
comportamiento de la distribucion de la suma (o promedio) de variables aleatorias.

21 .VARIABLE: es la cualidad o cantidad medible que se estudia de las unidades de


análisis y que varían de una unidad a otra. Por ejemplo: edad, ingreso de un individuo,
sexo, cantidad de lluvia caída, etc.

22.. VARIABLE ALEATORIA a: Cuando no es posible hacer medidas numéricas, son


susceptibles de clasificación.

23 VARIABLE CONTINUA: Aquellas que no se pueden expresar mediante un número


entero, es decir, aquellas que por su naturaleza admiten que entre dos valores
cualesquiera la variable pueda tomar cualquier valor intermedio, por ejemplo peso, tiempo.
etc.

24 .VARIABLES DISCRETAS:. Aquellas a las que se les puede asociar un número entero,
es decir, aquellas que por su naturaleza no admiten un fraccionamiento de la unidad, por
ejemplo número de hermanos, páginas de un libro, etc. Variable que tiene un número
limitado de valores. El sexo, por ejemplo, es una variable discreta. Compárese con variable
continua.

25. VARIABLE DEPENDIENTE : Es aquella que teóricamente puede tomar cualquier valor
en una escala de medidas, ya sea entero o fraccionario.

Cuartil.
Percentil cuyo valor que indica su proporción es un múltiplo de 25. Primer cuartil es el percentil
25, segundo cuartil es la mediana, tercer cuartil es el percentil 75.

Decil.
Percentil cuyo valor que indica su proporción es un múltiplo de diez. Percentil 10 es el primer
decil, percentil el segundo decil, etc.

 
E

Estadística.
Función de los datos muestrales que no contiene parámetros desconocidos.

Escala de Intervalo.
Escala de medición que permite calcular diferencias (además de asignar nombres y orden)
entre los datos.

Escala Nominal.
Escala de medición que sólo permite asignar nombres a los datos.

Escala Ordinal.
Escala de medición que permite asignar orden (además de nombres) a los datos.

Escala de Razón.
Escala de medición que permite calcular proporciones (además de diferencias y de asignar
nombres y orden) entre los datos.

Exactitud.
Cercanía de una medición al ‘verdadero’ valor que se pretende medir.

Experimento.
Proceso, sin una definición específica en el contexto de estadística, mediante el cual se
obtienen datos.
 

Gráfico Circular.
Gráfico formado por un círculo dividido en sectores, de modo que cada uno de ellos representa
una categoría distinta de la variable observada, manteniendo su proporción relativa respecto
del total de la muestra.

Gráfico de Caja.
Gráfico dibujado de acuerdo a cinco estadísticas: Mínimo de la muestra, 1er. Cuartil, Mediana,
3er. Cuartil, Máximo de la muestra.

 
 

Histogramas.
Representación gráfica formada por rectángulos, de una tabla de frecuencias cuya variable es
numérica, de modo que cada dato de la muestra ocupa igual área que los demás.

Mediana.
Percentil 50.

Medidas de Dispersión.
Estadísticas que expresan criterios para describir la ubicación relativa de los datos.

Medidas de Localización.
Estadísticas que describen características generales de la ubicación de los datos dentro de un
conjunto de valores posibles.

Medidas de Tendencia Central.


Subconjunto de medidas de localización que intenta describir la ubicación que mejor representa
algún sentido de ‘centro de los datos’

Muestra.
Subconjunto de la Población Muestral.

 
P

Percentil.
Valor del recorrido de una variable, bajo el cual se encuentra una proporción determinada de la
población.

Población Muestral.
Subconjunto de la Población Objetivo cuyos elementos son susceptibles de ser escogidos para
su estudio. Usualmente denominada ‘población’.

Población Objetivo.
Conjunto de elementos sobre los que interesa obtener información o tomar decisiones.

Precisión.
Número de cifras decimales con las que se representa una medición.

Promedio.
Medida de tendencia central que se obtiene sumando los datos y dividiéndolos por el número
de ellos.

Promedio Ponderado.
Promedio de datos a los que se asigna distinta importancia relativa.

Promedio Recortado.
Promedio de un conjunto de datos al que se ha descartado una proporción de sus valores
extremos.

Quintil.
Percentil cuyo valor que indica su proporción es un múltiplo de veinte. Primer quintil es el
percentil 20, segundo el percentil 40, etc.
 
 
 
 

Redondeo.
Procedimiento para expresar un número de acuerdo a un precisión establecida.

Tablas de Frecuencias.
Tabla que muestra el número de veces que en un conjunto de datos aparece cada una de las
clases de interés especificadas en el recorrido de los datos.

Tabligrama.
Representación de los datos en la que la última cifra decimal de un número se escribe
separada de las restantes, de acuerdo a un orden que facilita la descripción de las frecuencias
sin perder información.

También podría gustarte