Apuntesestadística
Apuntesestadística
Apuntesestadística
A.- Como colección de datos numéricos: es el significado mas usual de la palabra estadística. Se
sobre entiende que tales datos han de estar presentados de forma ordenada y sistemática.
2.POBLACIÓN Y MUESTRA.
Según tamaño:
Cuando se quiere estudiar ciertas características de una población, para que el estudio
no salga demasiado caro y se tarde mucho tiempo en realizarlo, se recurre a escoger
una muestra de esa población. La muestra es, por tanto, una parte de la población que
representa a dicha población , de tal forma que los resultados de estudiar la muestra
se consideran quecorresponde a la población en su conjunto.
Una variable estadística es cada una de las cualidades o propiedades referidas a la población y
que son objeto de estudio.
2-Variables cuantitativas: son aquellas a las que se puede asignar un valor numérico, es decir,
se pueden medir y, por tanto, se puede operar con ellos.
Las variables cuantitativas continuas: pueden tomar cualquier valor perteneciente a los
números reales dentro de un intervalo. Ej: La velocidad de un vehículo, la altura de una persona,
el peso de una persona, el salario, la distancia entre centros comerciales…Estas variables
admiten valores decimales.
Tabulación: cuando se realiza un estudio estadístico, los datos que se obtienen, para que
realmente sean válidos, hay que presentarlos de forma resumida y ordenada para que resalten
de una forma clara las características objeto de estudio.
Por tanto, podemos decir que la tabulación es la operación de reducir las observaciones y el
resultado de la tabulación es una tabla estadística o simplemente una estadística.
Estadística de una sola variable: estudia una sola característica de un conjunto de elementos
Estas estadísticas dependen del:
De la unión de estos dos factores resultan tres tipos de estadísticas: Tipo I, Tipo II y Tipo III
ESTADÍSTICAS DE TIPO I
Son aquellas que constan de un número reducido de observaciones al tiempo que la variable
toma también pocos valores distintos.(Poco importantes). Ej: estudiar la edad de los 4 hijos de
una familia.
ESTADÍSTICASD DE TIPO II
Son aquellas en las que el número de observaciones es grande, pero el número de valores
distintos que toma la variable es pequeño.
Xi ni
Xk nK
N
ESTADADÍSTICAS DE TIPO III
Son aquellas en las que el número de observaciones es grande y la variable toma también
muchos valores distintos.
Li-1 ----Li ni
Lo -----L1 n1
L1 -----L2 n2
………… …
Lk-1 –Lk nk
Si la variable puede tomar valores en el conjunto x1,x2,…xn, la frecuencia absoluta del valor o
categoría i se denota por ni.
La suma de las frecuencias de todos los valores de la variable equivale a un recuento de los
elementos de la muestra, por lo que esa suma debe ser igual al tamaño muestral
𝑛
∑ 𝑛𝑖 = 𝑁
𝑖=1
La frecuencia absoluta ordinaria es la que hemos visto hasta ahora, número de veces
que se presenta cada valor de la variable. La llamaremos ni
La frecuencia absoluta acumulada sería número de veces que se presenta cada valor
de la variable y la de los valores anteriores a él. La llamaremos Ni
La frecuencia relativa es el porcentaje de veces que se presenta cada valor de la
variable.
La frecuencia relativa al igual que la absoluta tiene dos tipos de frecuencia: la ordinaria
y la acumulada.
La frecuencia relativa ordinaria es el porcentaje de veces que se presenta cada valor de
la variable. Y la representaremos por la letra "f".
Se calcula fi = ni / N
La frecuencia relativa acumulada es el porcentaje de veces que aparece cada valor de
la variable y el de los valores anteriores a él. Y la representaremos por la letra "F".
Se calcula Fi = Ni / n
REPRESENTACIONES GRÁFICAS:
La representación gráfica sirve para mostrar de una forma intuitiva y clara los objetivos de la
investigación.
El diagrama de barras.
El polígono de frecuencias.
Diagrama de sectores.
Histograma.
Diagrama de barras:
En el eje de abcisas (x) se reflejan los valores de la variable y en el eje de ordenadas (Y) se
representa las frecuencias o porcentajes en que se presentan los valores de la variable.
Cuando lo que se representan son frecuencias absolutas, el eje de la( y) refleja valores
absolutos, si lo que se representan son datos relativas, la escala del eje( y )estará en tanto por
uno o en tanto por ciento.
El diagrama de barras consiste en levantar, para cada valor de la variable, una barra cuya
altura sea su frecuencia absoluta
Indicamos los distintos valores en el eje horizontal, y las frecuencias absolutas en el eje
vertical.
Diagrama de sectores:
Esta modalidad consiste en dividir un círculo en tantos sectores circulares como valores
podamos observar. Cada sector deber ser proporcional a la frecuencia absoluta de su valor.
Este gráfico es de la misma naturaleza que el diagrama de barras; A cada frecuencia absoluta u
relativa ordinaria le correspondería una porción del sector, es decir, una superficie del circulo;
la suma de todas esas frecuencias corresponderá con el área o superficie total del circulo, es
decir, 360º.
Histograma:
Se utiliza para representar gráficamente los datos de una variable continua o de una variable
cuantitativa discreta en laque, debido a la gran cantidad de modalidades o categorías poisbles,
los datos han sido agrupados en intervalos.
A partir de esta consideración, en el eje de abcisas (X) se recogerán los distintos intervalos
contemplados, debiendo de tener siempre en cuenta la amplitud de los mismos y en el eje de
ordenadas (Y) levantamos un rectángulo del área igual a la frecuencia reflejada en cada
categoría.
Muchas veces, el investigador comercial necesita resumir todas las respuestas dadas por los
encuestados a una determinada pregunta (variable), mediante un único dato o valor de la
variable, esa es la función de los estadísticos de posición: "proporcionar medidas de
resumen" para cada variable.
En función del tipo de variable, cabe utilizar tres medidas de posición principales: Moda,
Mediana y Media.
La moda es el caso de respuesta de una variable nominal que presenta un mayor valor de
frecuencia absoluta, esto es, la respuesta que más veces aparece. Puede ocurrir que una misma
variable tenga dos o más modas, en tal caso se denominan bimodal, trimodal, etc. Ahora bien,
cuando esto ocurra hay que entender que la moda es menos representativa y significativa como
valor para representar a la variable en cuestión.
La media aritmética es, sin duda, la medida central más conocida y de mayor interés, sin
embargo en los estudios de mercado solo puede utilizarse en las variables numéricas, que suelen
ser pocas, y en las variables de intervalo, sobre todo las de tipo Likert, que sí son frecuentes en
los cuestionarios. Habitualmente se la conoce como media aritmética o simplemente media, de
acuerdo a la siguiente fórmula: