Apuntesestadística

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 7

INTRODUCCIÓN A LA ESTADÍSTICA.

( apuntes complementarios a las fotocopias del manual).


1.CONCEPTO DE ESTADÍSTICA.

A.- Como colección de datos numéricos: es el significado mas usual de la palabra estadística. Se
sobre entiende que tales datos han de estar presentados de forma ordenada y sistemática.

B.-Como ciencia: es la ciencia que estudia el comportamiento de los fenómenos de masas,


centrándose en las características generales de un colectivo y prescindiendo de las particulares
de cada elemento de dicho colectivo.

En la mayoría de las ocasiones, entendemos la estadística en su primera acepción.

2.POBLACIÓN Y MUESTRA.

• Se denomina población al conjunto de personas o cosas que se quiere investigar o


estudiar y cada uno de los componentes de esta población se llama elemento de la
población.

Según tamaño:

P. Finita: cuando su número de elementos es finito ( menos de 100.000 elementos.)

P. Infinita: cuando consta de infinitos elementos. ( más de 100.000 elementos

• Muestra es el conjunto representatitvo de la población de referencia. El número de


individuos o elementos de una muestra es menor que el de la población.

Cuando se quiere estudiar ciertas características de una población, para que el estudio
no salga demasiado caro y se tarde mucho tiempo en realizarlo, se recurre a escoger
una muestra de esa población. La muestra es, por tanto, una parte de la población que
representa a dicha población , de tal forma que los resultados de estudiar la muestra
se consideran quecorresponde a la población en su conjunto.

3. DEFINICIÓN DE VARIABLE. Tipos.

Una variable estadística es cada una de las cualidades o propiedades referidas a la población y
que son objeto de estudio.

Las variables estadísticas pueden ser de dos tipos:

1-Variables cualitativas o atributos: son aquellas que no se pueden cuantificar o medir


numéricamente. Ej. Nacionalidad, color de la piel , sexo, estado civil, etc…EN ocasiones, los
atributos pueden ordenarse ( por ejemplo…decir del 1 al cinco qué característica es más
importante a la hora de establecerse en un país extranjero si la cercanía, el idioma del país o el
carácter de su gente… son cualidades en los que las personas podrían hacer una ordenación),
sin embargo, cuando no se pueden ordenar, se habla de variables nominales o categóricas…

2-Variables cuantitativas: son aquellas a las que se puede asignar un valor numérico, es decir,
se pueden medir y, por tanto, se puede operar con ellos.

Ej de variables cuantitativas: edad, altura, precio de un producto, ingresos anuales, nivel de


renta, calificación de exámenes, etc…
A su vez, las variables cuantitativas pueden clasificarse como discretas y continuas.

Discretas: solo pueden tomar un número finito y tratable de valores numéricos


pertenecientes a los números naturales. Ej. Número de hijos de una familia (0,1,2,3…), número
de habitaciones de un hotel, número de personas que forman parte de un determinado grupo,
número de veces que se ha casado una persona…Este tipo de variables no admite un valor
decimal ya que no se tienen 2,5 hijos o uno no se casa 1,5 veces, etc…

Las variables cuantitativas continuas: pueden tomar cualquier valor perteneciente a los
números reales dentro de un intervalo. Ej: La velocidad de un vehículo, la altura de una persona,
el peso de una persona, el salario, la distancia entre centros comerciales…Estas variables
admiten valores decimales.

4-DISTRIBUCIÓN O TABLA DE FRECUENCIAS.

Tabulación: cuando se realiza un estudio estadístico, los datos que se obtienen, para que
realmente sean válidos, hay que presentarlos de forma resumida y ordenada para que resalten
de una forma clara las características objeto de estudio.

Por tanto, podemos decir que la tabulación es la operación de reducir las observaciones y el
resultado de la tabulación es una tabla estadística o simplemente una estadística.

Estadística de una sola variable: estudia una sola característica de un conjunto de elementos
Estas estadísticas dependen del:

-Número de observaciones realizadas.

-Del número de valores distintos que tome la variable.

De la unión de estos dos factores resultan tres tipos de estadísticas: Tipo I, Tipo II y Tipo III

ESTADÍSTICAS DE TIPO I

Son aquellas que constan de un número reducido de observaciones al tiempo que la variable
toma también pocos valores distintos.(Poco importantes). Ej: estudiar la edad de los 4 hijos de
una familia.

ESTADÍSTICASD DE TIPO II

Son aquellas en las que el número de observaciones es grande, pero el número de valores
distintos que toma la variable es pequeño.

Ej: estudiar edad alumnos secundaria

Xi ni

X1 n1 Xi: valores variable.

X2 n2 ni: frecuencia absoluta

…………… ni/N: frecuencia relativa de xi

Xk nK

N
ESTADADÍSTICAS DE TIPO III

Son aquellas en las que el número de observaciones es grande y la variable toma también
muchos valores distintos.

Ej: salario mensual de 1.000 trabajadores.

Li-1 ----Li ni

Lo -----L1 n1

L1 -----L2 n2

………… …

Lk-1 –Lk nk

Concepto de distribución de frecuencias.

Llamaremos distribución de frecuencias al conjunto ordenado de valores de la variable con sus


correspondientes frecuencias.

¿Qué es una frecuencia?

La frecuencia es el número de veces que se presenta cada valor de la variable.

La frecuencia puede ser absoluta o relativa.

Definimos la frecuencia absoluta como el número de apariciones en una muestra de un


determinado valor de la variable.

Si la variable puede tomar valores en el conjunto x1,x2,…xn, la frecuencia absoluta del valor o
categoría i se denota por ni.

La suma de las frecuencias de todos los valores de la variable equivale a un recuento de los
elementos de la muestra, por lo que esa suma debe ser igual al tamaño muestral
𝑛

∑ 𝑛𝑖 = 𝑁
𝑖=1

La frecuencia absoluta puede ser de dos tipos: ordinaria y acumulada.

La frecuencia absoluta ordinaria es la que hemos visto hasta ahora, número de veces
que se presenta cada valor de la variable. La llamaremos ni

La frecuencia absoluta acumulada sería número de veces que se presenta cada valor
de la variable y la de los valores anteriores a él. La llamaremos Ni
La frecuencia relativa es el porcentaje de veces que se presenta cada valor de la
variable.
La frecuencia relativa al igual que la absoluta tiene dos tipos de frecuencia: la ordinaria
y la acumulada.
La frecuencia relativa ordinaria es el porcentaje de veces que se presenta cada valor de
la variable. Y la representaremos por la letra "f".
Se calcula fi = ni / N
La frecuencia relativa acumulada es el porcentaje de veces que aparece cada valor de
la variable y el de los valores anteriores a él. Y la representaremos por la letra "F".

Se calcula Fi = Ni / n
REPRESENTACIONES GRÁFICAS:

La representación gráfica sirve para mostrar de una forma intuitiva y clara los objetivos de la
investigación.

Las tipologías de gráficos más utilizados habitualmente son:

El diagrama de barras.

El polígono de frecuencias.

Diagrama de sectores.

Histograma.

Diagrama de barras:

Se basa en la representación de una distribución de frecuencias o de los porcentajes de casos


presentes en una de las categorías de la variable a través de ejes cartesianos.

En el eje de abcisas (x) se reflejan los valores de la variable y en el eje de ordenadas (Y) se
representa las frecuencias o porcentajes en que se presentan los valores de la variable.

Cuando lo que se representan son frecuencias absolutas, el eje de la( y) refleja valores
absolutos, si lo que se representan son datos relativas, la escala del eje( y )estará en tanto por
uno o en tanto por ciento.

El diagrama de barras consiste en levantar, para cada valor de la variable, una barra cuya
altura sea su frecuencia absoluta

Indicamos los distintos valores en el eje horizontal, y las frecuencias absolutas en el eje
vertical.

Diagrama de sectores:

Esta modalidad consiste en dividir un círculo en tantos sectores circulares como valores
podamos observar. Cada sector deber ser proporcional a la frecuencia absoluta de su valor.

Este gráfico es de la misma naturaleza que el diagrama de barras; A cada frecuencia absoluta u
relativa ordinaria le correspondería una porción del sector, es decir, una superficie del circulo;
la suma de todas esas frecuencias corresponderá con el área o superficie total del circulo, es
decir, 360º.
Histograma:

Se utiliza para representar gráficamente los datos de una variable continua o de una variable
cuantitativa discreta en laque, debido a la gran cantidad de modalidades o categorías poisbles,
los datos han sido agrupados en intervalos.

A partir de esta consideración, en el eje de abcisas (X) se recogerán los distintos intervalos
contemplados, debiendo de tener siempre en cuenta la amplitud de los mismos y en el eje de
ordenadas (Y) levantamos un rectángulo del área igual a la frecuencia reflejada en cada
categoría.

Muchas veces, el investigador comercial necesita resumir todas las respuestas dadas por los
encuestados a una determinada pregunta (variable), mediante un único dato o valor de la
variable, esa es la función de los estadísticos de posición: "proporcionar medidas de
resumen" para cada variable.

En función del tipo de variable, cabe utilizar tres medidas de posición principales: Moda,
Mediana y Media.

La moda es el caso de respuesta de una variable nominal que presenta un mayor valor de
frecuencia absoluta, esto es, la respuesta que más veces aparece. Puede ocurrir que una misma
variable tenga dos o más modas, en tal caso se denominan bimodal, trimodal, etc. Ahora bien,
cuando esto ocurra hay que entender que la moda es menos representativa y significativa como
valor para representar a la variable en cuestión.

La mediana es el caso de respuesta de una variable ordinal que divide a la distribución de


frecuencias en dos partes iguales, de tal manera que la mitad de los valores están por debajo y
la otra mitad por encima. Para su estimación se recurre a la frecuencia acumulada,
determinando qué respuesta consigue un valor acumulado por encima del 50 %.

La media aritmética es, sin duda, la medida central más conocida y de mayor interés, sin
embargo en los estudios de mercado solo puede utilizarse en las variables numéricas, que suelen
ser pocas, y en las variables de intervalo, sobre todo las de tipo Likert, que sí son frecuentes en
los cuestionarios. Habitualmente se la conoce como media aritmética o simplemente media, de
acuerdo a la siguiente fórmula:

Los estadísticos de dispersión complementan a los estadísticos de posición, indicando si los


valores que toma la variable (las distintas respuestas) están más o menos próximos, esto es, si
hay una mayor o menor variabilidad en los mismos. Resultan, también, complementarios, y
por eso se suelen presentar junto a las medidas centrales, en la medida que supone un factor
de medición de la bondad de las mismas, es decir, que cuanto más bajo sea el estadístico de
dispersión más buena es la medida central.

Los más frecuentes son la varianza, la desviación típica, el coeficiente de variación y el


recorrido.
La varianza y la desviación típica son medidas de dispersión de las variables numéricas y de
intervalos. La varianza (S2) es igual a la media de las distancias de los valores de la variable
respecto a su media elevadas al cuadrado:

La desviación típica (S) es igual a la raíz cuadrada de la varianza.


FORMULARIO ESTADÍSTICA BÁSICA.

E. TIPO I E. TIPO II E. TIPO III


MEDIA ARITMÉTICA ∑𝑥𝑖 ∑𝑥𝑖 𝑛𝑖 ∑𝑥𝑖 𝑛𝑖
𝑥̅ = 𝑥̅ = 𝑥̅ =
𝑁 𝑁 𝑁
Xi es marca de clase
MEDIA ARITMÉTICA ∑𝑥𝑖 𝑤𝑖
𝑥𝑝 =
̅̅̅
PONDERADA ∑𝑤𝑖
MEDIANA Se ordenan los Se calcula la frecuencia 𝑁⁄ − 𝑁
𝑀𝑒 = 𝐿𝑖−1 + 2
𝑖−1
Valor de la variable que valores xi: acumulada y se calcula ⋅𝑎
𝑛𝑖
ocupa el valor central, a) Impar: valor N/2. El valor de la variable
que deja a un lado y a central. que corresponde a la
otro el mismo número b) Par: media frecuencia acumulada
de observaciones de los dos siguiente a N/2 es la
valores mediana
centrales
MODA No tiene relevancia Es el valor de la variable a)Intervalos iguales
Valor de la variable que con mayor frecuencia 𝑛𝑖+1
𝑀0 = 𝐿𝑖−1 + 𝑎
se repite más veces. absoluta 𝑛𝑖−1 + 𝑛𝑖+1
b)Intervalos desiguales
ℎ𝑖+1
𝑀0 = 𝐿𝑖−1 +
ℎ𝑖−1 + ℎ𝑖+1
⋅𝑎
DESVIACIÓN ESTÁNDAR
Permite comparar ∑𝑥𝑖2 ∑𝑥𝑖 2 ∑𝑥𝑖2 𝑛𝑖 ∑𝑥𝑖 𝑛𝑖 2 ∑𝑥𝑖2 𝑛𝑖 ∑𝑥𝑖 𝑛𝑖 2
𝑠= √ −( ) 𝑠= √ −( ) 𝑠= √ −( )
distribuciones en una 𝑁 𝑁 𝑁 𝑁 𝑁 𝑁
misma unidad de medida Donde xi es la marca de clase

VARIANZA ∑𝑥𝑖2 ∑𝑥𝑖 2 ∑𝑥𝑖2 𝑛𝑖 ∑𝑥𝑖 𝑛𝑖 2 ∑𝑥𝑖2 𝑛𝑖 ∑𝑥𝑖 𝑛𝑖 2


𝑠2 = −( ) 𝑠2 = −( ) 𝑠2 = −( )
𝑁 𝑁 𝑁 𝑁 𝑁 𝑁
Donde xi es la marca de clase
RECORRIDO R= XM -Xm
COEFICIENTE DE V=S/X*100
VARIACIÓN

También podría gustarte