Estadística Empresarial PDF
Estadística Empresarial PDF
Estadística Empresarial PDF
1
Prefacio:
La estadística desarrolla aspectos básicos en la
Estadística Descriptiva, Análisis de Regresión y
Correlación y Números Índice, utilizando para ello los
cálculos e interpretaciones de las Medidas de
Resumen, aplicando el procedimiento pertinente,
según se trate de datos agrupados y no agrupados.
Analizando en forma dependiente y asociación de
variables estadísticas mediante el uso de modelos
lineales y de medidas de asociación en el estudio de
los fenómenos económico-financieros
2
Índice del Contenido
I. PREFACIO 02
30
III. TRABAJO PRÀCTICO
30
IV. FUENTES DE INFORMACIÓN
3
CAPITULO I: FUNDAMENTOS DE LA ESTADÍSTICA
ESTADISTICA
Se define como la rama de las matemáticas que se
ocupa de facilitar la toma de decisiones acertadas
frente a una incertidumbre y por lo tanto, desarrolla
y utiliza técnicas para la recolección cuidadosa,
presentación efectiva y el análisis correcto de la
información numérica. La estadística la podemos
agrupar en dos grandes ramas, la descriptiva o
deductiva y la analítica o inferencia estadística.
En cambio, la Estadística entendida como ciencia
tiene un origen más reciente y el gran desarrollo de la misma ha tenido lugar,
fundamentalmente, a lo largo del siglo XX.
Como ciencia, la Estadística está formada por el conjunto de métodos y técnicas que
permiten la obtención, organización, síntesis, descripción e interpretación de los datos
para la toma de decisiones en ambiente de incertidumbre. Ese objetivo que persigue la
Estadística con la organización y síntesis de los datos tiene su razón de ser en el hecho
de que la misma se preocupa del estudio de los que podemos denominar como
fenómenos de masas. Es decir, la Estadística no está interesada en el estudio de datos
aislados, pues si la información es escasa no tiene sentido plantearse problemas de
organización ni de síntesis. Así, si se estudian los gastos en publicidad de las empresas
de una determinada rama de actividad y se tiene información para solo dos empresas,
entonces, con esos dos datos no ha lugar plantearse si los mismos han de presentarse
mediante una tabla o un gráfico o si deben resumirse mediante un promedio.
4
El primero de ellos da lugar a lo que se conoce como
Estadística Descriptiva. Esta rama es la más antigua de
la Estadística y su objeto es el análisis de los datos para
descubrir o describir las posibles regularidades que
presenten. Paralelamente, aunque con posterioridad, se
desarrolló la Teoría de la Probabilidad. La unión ambas
ha dado lugar a lo que se conoce como Estadística
Matemática o Inferencia Estadística. El instrumental
propio de esta rama es el que nos permite tomar decisiones en ambiente de
incertidumbre.
Se trata de decisiones basadas en la información que suministran los datos y que
permiten generalizar los resultados obtenidos.
LA OBSERVACIÓN ESTADÍSTICA.
En lo anterior se ha intentado dejar claro que la Estadística se dedica al estudio de los
fenómenos de masas. Es decir, la Estadística centra su interés en la observación de
colectivos amplios de entes o elementos, los cuales pueden ser personas o cosas. A esos
colectivos se les denomina en Estadística como Población.
Ahora bien, una vez que se tiene claro que el objeto de la Estadística es la observación y
estudio de las poblaciones, la siguiente cuestión que puede plantearse es cómo ha de
realizarse esa observación. La misma puede ser exhaustiva o parcial.
Las dos formas tienen ventajas e inconvenientes. En el caso de la observación exhaustiva
o total, y si se asume que no hay errores de medida entonces, lo que se consigue es
eliminar la incertidumbre.
Frente a esa ventaja fundamental, la observación exhaustiva tiene un grave
inconveniente: el coste. Se trata tanto de un coste monetario como en tiempo.
Imaginemos la siguiente situación. Un partido político, antes de unas elecciones, quiere
saber cuál es la intención de voto del electorado. Para ello tiene dos opciones.
5
La alternativa al enfoque anterior es la observación parcial.
Esta implica que no se observa a toda la población. Dentro
de esta forma de proceder se pueden distinguir dos
categorías distintas. Por un lado está la subpoblación y por
otro la muestra. Con la primera lo que se hace es observar
a un conjunto de entes o elementos de la población que
guardan entre si una cierta característica y que los
diferencia de los demás. Así, siguiendo con el ejemplo
anterior, los electores que no han votado antes porque en
las elecciones anteriores no tenían la edad mínima exigida
constituyen una subpoblación. Al proceder de esta forma se consigue realizar una
operación estadística en menos tiempo y a menor coste pero, en cambio, la incertidumbre
acerca de la intención de voto del electorado es enorme, pues esa subpoblación no
representa en absoluto a toda la población. Su intención de voto no tiene por qué coincidir
con la de los demás electores.
6
Pero no todo son ventajas en la observación parcial. El principal inconveniente se deriva
precisamente de que la observación no es exhaustiva. En estos casos las características
de la población serán desconocidas, pues aunque la muestra pretenda representar lo más
fielmente posible a la población, nunca dejará de ser eso, una muestra. Con los datos de
la muestra solo podremos conocer las características de esos valores muéstrales.
Concluir que son iguales a las de la población sería poco menos que una osadía.
VARIABLES Y ATRIBUTOS.
En líneas anteriores, se ha señalado que el objeto de estudio de la Estadística son las
poblaciones y que estas están formadas por entes o elementos. El número total del mismo
determina el tamaño de la población. Para estudiar una población, lo primero que debe
hacerse es observarla de alguna de las formas que ya se ha señalado en las líneas
anteriores. Pero observar una población es equivalente a observar sus elementos. Ahora
bien, esos elementos poseen una serie de características que son las que realmente se
observan. Por ejemplo, el conjunto de todas las empresas industriales radicadas en el
Perú, constituyen una población.
7
Los elementos de esa población son las
empresas. Pero una empresa no se observa
en abstracto. Lo que realmente tiene interés
son las distintas características de esas
empresas, como, por ejemplo, el número de
empleados, el volumen de ventas, los costes
salariales, los gastos en publicidad, los
beneficios de las mismas, la naturaleza de los
productos que fabrican, etc.
A todas estas características de los elementos de una población se les conoce de forma
genérica como caracteres. Estos últimos, según su naturaleza, pueden ser de tipo
cuantitativo o cualitativo. Para el ejemplo anterior, serían caracteres cuantitativos “el
número de empleados”, “el volumen de ventas”, “los costes salariales”, “los gastos en
publicidad”, “los beneficios de las mismas”, etc., mientras que sería cualitativo “la
naturaleza de los productos que fabrican”. Hay que señalar que, en general, cualquier
carácter de tipo cuantitativo se puede ofrecer en términos cualitativos. Así, si el número
de empleados lo agrupamos en intervalos se podría hablar de empresas pequeñas,
medianas y grandes, siendo ahora el carácter “tamaño de la empresa” de naturaleza
cualitativa. De manera similar se podría proceder con los demás.
8
En los casos en los que las variables toman infinitos valores, la práctica habitual
es agruparlos en intervalos, como se muestra en las Tabla 1, para variable continua.
9
CAPITULO II: ANÁLISIS DE LA VARIABLE
FUENTES ESTADÍSTICAS.
El objetivo de la Estadística es el estudio de
los fenómenos de masas. Pero ello requiere
el manejo de una información numérica
amplia. La cuestión inmediata que surge es
saber adónde se puede recurrir para
encontrar esa información necesaria y sin la
cual el análisis estadístico no se puede
realizar. En definitiva, se trata es de conocer
las fuentes que suministran información de carácter estadístico. Estas fuentes son
susceptibles de clasificarse según distintos criterios.
10
10
Entre las primeras, los principales productores de información estadística son la
Oficina de Estadística de la ONU (UNSTAT) y la Oficina de Estadística de la Unión
Europea (EUROSTAT).
La segunda y tercera de las categorías contempladas conforman el sistema
estadístico nacional, cuya organización responde al esquema de la Figura.
11
11
Entre las mismas cabe destacar las siguientes:
1) forma de la distribución;
2) medidas de posición (valor central o promedios);
3) dispersión;
4) asimetría;
5) curtosis.
12
12
La forma estándar de dar una distribución de frecuencias
con valores no agrupados es la que aparece en la Tabla.
Las frecuencias de esta tabla puede ser unitarias o
mayores que uno. El primer caso tienen poco interés para
la Estadística, pues como ya se indicó el objeto de la
misma era el estudio de colectivos grandes y nunca las
poblaciones con un número de elementos muy
reducido.Junto a las frecuencias absolutas de los valores
de una variable resulta habitual dar, también, lo que se conoce como frecuencias
relativas. Para un valor concreto, la frecuencia relativa, que representaremos por fi, es el
cociente entre la frecuencia absoluta y el número total de observaciones N. Es decir, fi =
ni/N. Estas frecuencias se puede expresar en porcentajes o en tantos por uno. A su vez,
las frecuencias, tanto las absolutas como las relativas, se pueden dar de forma
acumulada. Las frecuencias absolutas acumuladas se representan por Ni y las relativas
acumuladas por Fi.
13
13
Otro problema surge cuando un valor de la
variable coincide exactamente con un extremo
del intervalo, con lo que hay dudas sobre su
inclusión en ese intervalo o el siguiente. Como
solución a este problema es habitual proceder
a definir intervalos abiertos por la izquierda y
cerrados por la derecha, lo que implica que
intervalo definido entre a y b incluye a todos los
valores menores o iguales que b pero mayores que a. En general, una distribución de
frecuencias para una variable continua será como la que se da en la Tabla. A partir del
contenido de esta tabla hay que definir los siguientes conceptos:
a) Amplitud del intervalo. Es la diferencia entre el extremo superior y el inferior. Así para
el intervalo i-ésimo, la amplitud vendría dada por:
ai = Li - Li-1 (2.1)
14
14
CAPÍTULO III: ANÁLISIS GRÁFICO
El tipo de representación gráfica depende en gran
medida de la naturaleza del carácter de los
elementos de la población con el que se esté
trabajando. Así, si se trata de una variable se
recurrirá al diagrama de barras en el caso de que
sea discreta y sus valores no estén agrupados.
Este diagrama se realiza haciendo uso de un
sistema cartesiano en el que sobre el eje de
abscisas se ponen los valores de la variable y sobre el de ordenadas las
frecuencias, tanto absolutas (ni) como relativas (fi).
15
15
Frente a este tipo de gráfico, cuando la
naturaleza de la variable sea continua,
entonces la representación gráfica
más adecuada es el histograma o
también conocido como histograma de
frecuencias. Este tipo de gráficos
podría utilizarse también en los casos
de variables discretas con valores
agrupados, aunque no resulta
aconsejable hacer uso de los
histogramas para variables discretas por los problemas que conlleva asimilar una
variable discreta a otra de tipo continuo.
16
16
Una vez que se han señalado los instrumentos gráficos más habituales en el
análisis de variables, quedan por introducir los correspondientes cuando de lo que
se trata es de atributos. Ahora, las modalidades no tienen la dimensión numérica
de los valores de las variables. Esto hace que haya que pensar en otro tipo de gráficos.
Entre los más utilizados están los diagramas de tarta. En estos casos lo que se
hace es asignarle a cada modalidad del atributo un sector circular proporcional a
su frecuencia. Para aclarar esta idea en la Figura.
PIRÁMIDE DE POBLACIÓN
Otra forma corriente de presentación visual de datos estadísticos es la llamada pirámide
de población. Las pirámides de población se utilizan en la expresión de informaciones
demográficas, económicas o sociales, y en ellas se clasifican comúnmente los datos de
la población del grupo de muestra considerado en diferentes escalas de edad y
diferenciada por sexo.
17
17
PICTOGRAMAS Y CARTOGRAMAS
Para aligerar la presentación de datos estadísticos, con frecuencia se recurre a
imágenes pictóricas representativas del valor de las variables. Dos formas
comunes de expresión gráfica de los datos son:
Los pictogramas, que muestran diagramas figurativos con figuras o
motivos que aluden a la distribución estadística analizada (por ejemplo, una
imagen antropomórfica para indicar tamaños, alturas u otros).
18
18
CAPITULO IV: ETAPA DE ELABORACION DE
DATOS
DISTRIBUCIÓN DE FRECUENCIAS
Las distribuciones de frecuencias son
tablas en que se dispone las modalidades
de la variable por filas. En las columnas se
dispone el número de ocurrencias por
cada valor, porcentajes, etc. La finalidad
de las agrupaciones en frecuencias es
facilitar la obtención de la información que
contienen los datos.
19
19
X: Símbolo genérico de la variable.
f: Frecuencia (también se simboliza como ni).
La distribución de frecuencias de los datos del ejemplo muestra que la actitud
mayoritaria de los individuos del grupo estudiado es indiferente.
La interpretación de los datos ha sido facilitada porque se ha reducido el número
de números a examinar (en vez de los 20 datos originales, la tabla contiene 5
valores de la variable y 5 frecuencias).
20
20
La distribución de frecuencias es:
21
21
Ahora es más sencillo interpretar los datos. Por
ejemplo, podemos apreciar inmediatamente que el
intervalo con mayor número de datos es el 34-39,
o que el 75% de los datos tiene valor inferior a 46.
Este tipo de tabla es denominado "tabla de datos
agrupados en intervalos".
Elementos básicos de las tablas de intervalos:
Intervalo: Cada uno de los grupos de
valores de la variable que ocupan una fila en una distribución de frecuencias
Límites aparentes: Valores mayor y menor del intervalo que son observados en la
tabla. Dependen de la precisión del instrumento de medida. En el ejemplo, los
límites aparentes del intervalo con mayor número de frecuencias son 34 y 39.
Límites exactos: Valores máximo y mínimo del intervalo que podrían medirse si se
contara con un instrumento de precisión perfecta. En el intervalo 34-39, estos
límites son 33.5 y 39.5
Punto medio del intervalo (Marca de clase): Suma de los límites divididos por dos.
Mc del intervalo del ejemplo= 36.5
Amplitud del intervalo: Diferencia entre el límite exacto superior y el límite exacto
inferior. En el ejemplo es igual a 6.
xi fi Fi ni Ni
0 1 1 0.02 0.02
1 1 2 0.02 0.04
2 2 4 0.04 0.08
3 3 7 0.06 0.14
4 6 13 0.12 0.26
5 11 24 0.22 0.48
6 12 36 0.24 0.72
7 7 43 0.14 0.86
8 4 47 0.08 0.94
9 2 49 0.04 0.98
10 1 50 0.02 1.00
50 1.00
DIAGRAMA DE BARRAS
22
22
A continuación se presenta una tabla de distribución de frecuencias para
datos agrupados.
ci fi Fi
[50, 60) 55 8 8
[60, 70) 65 10 18
[70, 80) 75 16 34
[80, 90) 85 14 48
[90, 100) 95 10 58
65
23
23
REPRESENTACIONESGRÁFICAS
Diagrama de barras
Un diagrama de barras se utiliza para de presentar datos
cualitativos o datos cuantitativos de tipo discreto.
Se representan sobre unos ejes de coordenadas, en el eje de
abscisas se colocan los valores de la variable, y sobre el eje de
ordenadas las frecuencias absolutas o relativas o acumuladas.
Los datos se representan mediante barras de una altura
proporcional a la frecuencia.
Ejemplo
A 6
B 4
AB 1
0 9
20
24
24
POLÍGONOS DE FRECUENCIA
Un polígono de frecuencias se forma uniendo los extremos de las barras mediante
segmentos.
También se puede realizar trazando los puntos que representan las frecuencias y
uniéndolos mediante segmentos.
Ejemplo
Las temperaturas en una ciudad han sufrido las siguientes variaciones:
Hora Temperatura
6 7º
9 12°
12 14°
15 11°
18 12°
21 10°
24 8°
Un diagrama de sectores se puede utilizar para todo tipo de variables, pero se usa
frecuentemente para las variables cualitativas.
25
25
Los datos se representan en un círculo, de modo que el ángulo de
cada sector es proporcional a la frecuencia absoluta correspondiente.
El diagrama circular se construye con la ayuda de un transportador de
ángulos.
Ejemplo
Baloncesto 12 144°
Natación 3 36°
Fútbol 9 108°
Total 30 360°
26
26
POLÍGONO DE FRECUENCIA
Para construir el polígono de frecuencia se toma la marca de clase que coincide
con el punto medio de cada rectángulo.
Ejemplo
[50, 60) 55 8 8
[60, 70) 65 10 18
[70, 80) 75 16 34
[80, 90) 85 14 48
[90, 100) 95 10 58
65
27
27
HISTOGRAMA Y POLÍGONO DE FRECUENCIAS ACUMULADAS
Si se representan las frecuencias acumuladas de una tabla de datos agrupados se
obtiene el histograma de frecuencias acumuladas o su correspondiente polígono.
Ejemplo
En la siguiente tabla se muestra las calificaciones (suspenso, aprobado,
fi hi
[0, 5) 15 3
[5, 7) 20 10
[7, 9) 12 6
[9, 10) 3 3
50
28
28
29
29
ACTIVIDADES PRÁCTICAS
FUENTES DE INFORMACIÓN
Bibliográficas
Electrónicas:
www.todaslascatedras.com.
www.loelbedon.com
30
30