ESTADISTICAS
ESTADISTICAS
ESTADISTICAS
Unidad 3
ESTADÍSTICA APLICADA – UNIDAD 3
Introducción
En las últimas décadas la estadística ha alcanzado un alto grado de desarrollo, hasta el
punto de incursionar en la totalidad de las ciencias; inclusive, en la lingüística se aplican
técnicas estadísticas para esclarecer la paternidad de un escrito o los caracteres más
relevantes de un idioma.
La estadística es una ciencia auxiliar para todas las ramas del saber; su utilidad se
entiende mejor si se tienen en cuenta que los quehaceres y decisiones diarias embargan
cierto grado, trabaja con ella y orienta para tomar las decisiones con un determinado
grado de confianza.
La asignatura pretende formar a los alumnos en la aplicación de técnicas estadísticas
en el entorno industrial y productivo, que les ayuden en la toma de decisiones y en el
control de los procesos de los trabajos de las ingenierías.
Objetivo
General
● Conocer cómo tomar decisiones basadas en la aceptación o el rechazo de
ciertas relaciones que se toman como hipótesis.
Específicos
● Comprender las diferentes herramientas estadísticas que permiten el
análisis de datos.
● Utilizar los test de hipótesis para tomar decisiones de los resultados
obtenidos.
● Lograr hacer predecible un proceso en el tiempo a través del uso de las
gráficas de control.
1
ESTADÍSTICA APLICADA – UNIDAD 3
Desarrollo
UNIDAD III ESTADÍSTICA INDUCTIVA
La Estadística descriptiva y la teoría de la Probabilidad van a ser los pilares de un nuevo
procedimiento (Estadística Inferencial) con los que se va a estudiar el comportamiento
global de un fenómeno. La probabilidad y los modelos de distribución junto con las
técnicas descriptivas, constituyen la base de una nueva forma de interpretar la
información suministrada por una parcela de la realidad que interesa investigar.
En el siguiente esquema representa el tema a tratar y que será desarrollado a
continuación.
Ilustración 1
2
ESTADÍSTICA APLICADA – UNIDAD 3
3
ESTADÍSTICA APLICADA – UNIDAD 3
3.2 Estimación
En la mayoría de las investigaciones resulta imposible estudiar a todos y cada uno de
los individuos de la población ya sea por el coste que supondría, o por la imposibilidad
de acceder a ello. Mediante la técnica inferencial obtendremos conclusiones para una
población no observada en su totalidad, a partir de estimaciones o resúmenes
numéricos efectuados sobre la base informativa extraída de una muestra de dicha
población. Por tanto, el esquema que se sigue es:
4
ESTADÍSTICA APLICADA – UNIDAD 3
Ilustración 3
A partir de una población se extrae una muestra por algunos de los métodos existentes,
con la que se generan datos numéricos que se van a utilizar para generar estadística
con los que realizar estimaciones o contrastes poblacionales.
Existen dos formas de estimar parámetros:
- la estimación puntual y
- la estimación por intervalo de confianza.
En la primera se busca, con base en los datos muestrales, un único valor estimado para
el parámetro. Para la segunda, se determina un intervalo dentro del cual se encuentra
el valor del parámetro, con una probabilidad determinada.
ESTIMACIÓN PUNTUAL
Un estimador de un parámetro poblacional es una función de los datos muestrales. En
pocas palabras, es una fórmula que depende de los valores obtenidos de una muestra,
para realizar estimaciones. Lo que se pretende obtener es el valor exacto de un
parámetro. Por ejemplo, si se pretende estimar la talla media de un determinado grupo
de individuos, puede extraerse una muestra y ofrecer como estimación puntual la talla
media de los individuos de la muestra.
La media de la muestra puede ser un estimador de la media de la población, la
cuasivarianza muestral es un buen estimador de la varianza poblacional y el total
muestral es un buen estimador del total poblacional.
Una definición más matemática de un estimador y las propiedades que debe de cumplir
un estimador para ser bueno.
Sea X1......Xn, una m.a.s. de tamaño n, decimos que es un estimador θ* de un parámetro
θ si el estadístico que se emplea para conocer dicho parámetro desconocido es este.
5
ESTADÍSTICA APLICADA – UNIDAD 3
6
ESTADÍSTICA APLICADA – UNIDAD 3
7
ESTADÍSTICA APLICADA – UNIDAD 3
Dado que las hipótesis nula y alternativa son contradictorias, debe examinar las pruebas
para decidir si tiene suficiente evidencia para rechazar la hipótesis nula o no. Las
pruebas se presentan en forma de datos de muestra.
Una vez que haya determinado qué hipótesis apoya la muestra, tome una decisión. Hay
dos opciones para tomar una decisión. Son “no puede aceptar H0” si la información de
la muestra favorece la hipótesis alternativa o “no se rechaza H0” o “se declina rechazar
H0” si la información de la muestra es insuficiente para rechazar la hipótesis nula. Todas
estas conclusiones se basan en un nivel de probabilidad, un nivel de significación, que
establece el analista.
Cuando se realiza una prueba de hipótesis hay cuatro resultados posibles en según la
verdad (o falsedad) de la hipótesis nula H0 y de la decisión de rechazarla o no. Los
resultados se resumen en el siguiente cuadro:
Cuadro 1 resultados posibles de prueba de hipótesis
8
ESTADÍSTICA APLICADA – UNIDAD 3
Dónde:
● X: variable sobre la que se pretenden calcular la varianza
● xi: observación número i de la variable X. i puede tomará valores entre 1 y n.
● n: número de observaciones.
● x̄: Es la media de la variable X.
9
ESTADÍSTICA APLICADA – UNIDAD 3
La varianza es una medida de dispersión. Eso significa que pretende capturar en qué
medida los datos están en torno a la media. Si tenemos datos muy por encima y muy
por debajo de la media, esta será menos representativa y lo veremos reflejado en una
elevada varianza.
Ejemplo
Queremos calcular el salario medio de dos empresas de solo dos trabajadores. En la
empresa A, los salarios son de 24.500 y 23.500 euros. En la B, son de 16.000 y 32.000
euros. Vemos que, en ambos casos, la media es la misma: 24.000 euros. Sin embargo,
esa media es más representativa en la empresa A, ya que los 2 valores se encuentran
mucho más próximos a la media que en la empresa B.
Ejemplo
Vamos a acuñar una serie de datos sobre salarios. Tenemos cinco personas, cada uno
con un salario diferente:
Juan: 1.500 euros
Pepe: 1.200 euros
José: 1.700 euros
Miguel: 1.300 euros
Mateo: 1.800 euros
La media del salario, la cual necesitamos para nuestro cálculo, es de ((1.500 + 1.200 +
1.700 + 1.300 + 1.800) /5) 1.500 euros.
Obtendremos que se debe calcular tal que:
10
ESTADÍSTICA APLICADA – UNIDAD 3
3.5 Regresión
El análisis de regresión es una técnica estadística que permite comprobar la hipótesis
de que una variable depende de otra u otras variables. Además, el análisis de regresión
brinda una estimación de la magnitud del impacto de un cambio en una variable sobre
otra. Por supuesto, esta última característica es de vital importancia para predecir los
valores futuros.
El análisis de regresión se basa en una relación funcional entre variables y supone,
además, que la relación es lineal. Esta suposición de linealidad es necesaria porque, en
su mayor parte, las propiedades estadísticas teóricas de la estimación no lineal no están
aún bien elaboradas por los matemáticos y econometristas.
El modelo de regresión lineal general se puede enunciar mediante la ecuación:
yi=β0+β1X1i+β2X2i+⋯+βkXki+εiyi=β0+β1X1i+β2X2i+⋯+βkXki+εi
Dónde:
β0 es la intersección,
βi's es la pendiente entre Y y el Xi apropiado, y
ε, es el término de error que captura los errores en la medición de Y y el efecto sobre Y
de cualquier variable que falte en la ecuación y que contribuiría a explicar las variaciones
en Y.
Esta ecuación es la ecuación teórica de la población y, por lo tanto, utiliza letras griegas.
La ecuación que estimaremos tendrá los símbolos romanos equivalentes. Esto es
paralelo a la forma en que antes hemos mantenido el seguimiento de los parámetros de
la población y los parámetros de la muestra. El símbolo de la media poblacional era µ y
el de la media muestral 𝑋, para la desviación típica de la población fue σ y para la
desviación típica de la muestra fue s. Luego, la ecuación que se estimará con una
muestra de datos para dos variables independientes será:
yi=b0+b1x1i+b2x2i+eiyi=b0+b1x1i+b2x2i+ei
Este modelo solo funciona si se cumplen ciertos supuestos. Estos son: qué Y se
distribuya normalmente, que los errores también se distribuyan normalmente con una
media de cero y una desviación típica constante, y que los términos de error sean
independientes del tamaño de X e independientes entre sí. (Holmes, et al. 2022).
11
ESTADÍSTICA APLICADA – UNIDAD 3
12
ESTADÍSTICA APLICADA – UNIDAD 3
Si el proceso se encuentra bajo control estadístico es posible realizar una predicción del
intervalo en el que se encontrarán las características de la pieza fabricada. (Ruiz-Falcó,
2006).
Para que tenga sentido la aplicación de los gráficos de control, el proceso ha de tener
una estabilidad suficiente que, aun siendo aleatorio, permite un cierto grado de
predicción. En general, un proceso caótico no es previsible y no puede ser controlado.
A estos procesos no se les puede aplicar el gráfico de control ni tiene sentido hablar de
capacidad. Un proceso de este tipo debe ser estudiado mediante herramientas
estadísticas avanzadas hasta que el grado de conocimiento empírico obtenido sobre el
mismo permita conocer las causas de la estabilidad y se eliminen.
En lo sucesivo, se supondrá que los procesos tienen un cierto grado de estabilidad.
Podemos distinguir dos casos:
∙ El proceso está regido por una función de probabilidad cuyos parámetros permanecen
constantes a lo largo del tiempo. Este sería el caso de un proceso normal de media
constante y desviación típica constante. Este es el caso ideal y al que se pueden aplicar
los gráficos de control para detectar la presencia de causas asignables.
∙ El proceso está regido por una función de probabilidad, alguno de cuyos parámetros
varía ligeramente a lo largo del tiempo. Este sería el caso de un proceso normal cuya
media varía a lo largo del tiempo (por ejemplo, una herramienta de corte que va
desgastando la cuchilla de corte). Estrictamente hablando, este desgaste de la
herramienta sería una causa especial; sin embargo sí puede conocerse la velocidad de
desgaste, podría compensarse resultando un proceso análogo al caso anterior. (Ruiz,
2006).
13
ESTADÍSTICA APLICADA – UNIDAD 3
ÍNDICES CP Y CPK
Con objeto de comparar la capacidad del proceso y la amplitud de las tolerancias a
satisfacer, se define el índice de capacidad de proceso:
14
ESTADÍSTICA APLICADA – UNIDAD 3
De este modo se define un proceso capaz como aquel que Cpk > 1.
Aplicando estos mismos conceptos a la variabilidad atribuible de una máquina de las
que integran el proceso de fabricación, podemos definir la capacidad de máquina, el
índice de capacidad de máquina CM y CMk. (Ruiz-Falcó, 2006).
Ilustración 6
15
ESTADÍSTICA APLICADA – UNIDAD 3
Suponiendo que se desplazase el proceso 1.5 σ, ver Figura 10, los coeficientes pasarían
a ser:
Aún estas circunstancias, la cantidad de producto fuera de tolerancia sería tan solo de
3.4 ppm. (Ruiz-Falcó, 2006).
Ilustración 7
16
ESTADÍSTICA APLICADA – UNIDAD 3
Cuadro 3
control 𝑋 − R, 𝑋 − S y 𝑋 − S*
17
ESTADÍSTICA APLICADA – UNIDAD 3
SOLUCIÓN:
Dispongamos los cálculos en la tabla siguiente:
18
ESTADÍSTICA APLICADA – UNIDAD 3
19
ESTADÍSTICA APLICADA – UNIDAD 3
Referencias bibliográficas
1- Bibliografía Básica
● Carro, R. y González, D. Control Estadístico de Procesos. (s.f.).
http://nulan.mdp.edu.ar/1617/1/12_control_estadistico.pdf
● Holmes, A. Illowsky,, B. y Dean, S. (2022). Introducción a la estadística
empresarial. Editorial/sitio web: OpenStax.
https://openstax.org/books/introducci%C3%B3n-estad%C3%ADstica-
empresarial/pages/9-1-hipotesis-nula-y-alternativa
● López, J. F. (2017). Varianza. Economipedia.com.
https://economipedia.com/definiciones/varianza.html
● Montero, M.A. (s.f.). Inferencia, estimación y contraste de hipótesis.
https://www.ugr.es/~eues/webgrupo/Docencia/MonteroAlonso/estadistica
II/tema4.pdf
● Moreno, O. (s.f.). Distribución muestral de estadísticos. Ministerio de
Educación y Formación Profesional - INTEF. Licencia Creative Commons
Reconocimiento Compartir igual 4.0.
https://formacion.intef.es/pluginfile.php/246706/mod_resource/content/1/
distribucin_muestral_de_estadsticos.html
● Ruiz A. (2006). Control Estadístico de Procesos.
https://web.cortland.edu/matresearch/controlprocesos.pdf
20
ESTADÍSTICA APLICADA
Unidad 3
ESTADÍSTICA APLICADA – UNIDAD 3
Introducción
En las últimas décadas la estadística ha alcanzado un alto grado de desarrollo, hasta el
punto de incursionar en la totalidad de las ciencias; inclusive, en la lingüística se aplican
técnicas estadísticas para esclarecer la paternidad de un escrito o los caracteres más
relevantes de un idioma.
La estadística es una ciencia auxiliar para todas las ramas del saber; su utilidad se
entiende mejor si se tienen en cuenta que los quehaceres y decisiones diarias embargan
cierto grado, trabaja con ella y orienta para tomar las decisiones con un determinado
grado de confianza.
La asignatura pretende formar a los alumnos en la aplicación de técnicas estadísticas
en el entorno industrial y productivo, que les ayuden en la toma de decisiones y en el
control de los procesos de los trabajos de las ingenierías.
Objetivo
General
● Conocer cómo tomar decisiones basadas en la aceptación o el rechazo de
ciertas relaciones que se toman como hipótesis.
Específicos
● Comprender las diferentes herramientas estadísticas que permiten el
análisis de datos.
● Utilizar los test de hipótesis para tomar decisiones de los resultados
obtenidos.
● Lograr hacer predecible un proceso en el tiempo a través del uso de las
gráficas de control.
1
ESTADÍSTICA APLICADA – UNIDAD 3
Desarrollo
UNIDAD III ESTADÍSTICA INDUCTIVA
La Estadística descriptiva y la teoría de la Probabilidad van a ser los pilares de un nuevo
procedimiento (Estadística Inferencial) con los que se va a estudiar el comportamiento
global de un fenómeno. La probabilidad y los modelos de distribución junto con las
técnicas descriptivas, constituyen la base de una nueva forma de interpretar la
información suministrada por una parcela de la realidad que interesa investigar.
En el siguiente esquema representa el tema a tratar y que será desarrollado a
continuación.
Ilustración 1
2
ESTADÍSTICA APLICADA – UNIDAD 3
3
ESTADÍSTICA APLICADA – UNIDAD 3
EJEMPLO
Se tiene una variable aleatoria x con distribución normal de media 2 y varianza 9, N(2,9).
Se quiere calcular la probabilidad de que la variable tome valores entre 1 y 2.
La probabilidad pedida corresponde al área bajo la curva normal especificada y limitada
por los valores dados de la variable. Para poder consultar una tabla de áreas bajo la
curva normal estándar, se tipifican los valores límite de la variable:
zA = (xA−μ)/σ = (1−2)/√9 = -0,333
zB = (xB−μ)/σ = (2−2)/√9 = 0
El área bajo la curva normal N(2,9) delimitada por los valores de la variable 1 y 2 es la
misma que el área bajo la curva normal N(0,1) delimitada por los valores de la variable
−0,333 y 0. Si se busca en una tabla de áreas bajo la curva normal (como se describe
en los ejemplos posteriores), se obtiene 0,13. Así, la probabilidad de que una variable
aleatoria distribuida según N(2,9) tome valores entre 1 y 2 es de 0,13, es decir, un 13%.
(Moreno, s.f.).
3.2 Estimación
En la mayoría de las investigaciones resulta imposible estudiar a todos y cada uno de
los individuos de la población ya sea por el coste que supondría, o por la imposibilidad
de acceder a ello. Mediante la técnica inferencial obtendremos conclusiones para una
población no observada en su totalidad, a partir de estimaciones o resúmenes
numéricos efectuados sobre la base informativa extraída de una muestra de dicha
población. Por tanto, el esquema que se sigue es:
4
ESTADÍSTICA APLICADA – UNIDAD 3
Ilustración 3
A partir de una población se extrae una muestra por algunos de los métodos existentes,
con la que se generan datos numéricos que se van a utilizar para generar estadística
con los que realizar estimaciones o contrastes poblacionales.
Existen dos formas de estimar parámetros:
- la estimación puntual y
- la estimación por intervalo de confianza.
En la primera se busca, con base en los datos muestrales, un único valor estimado para
el parámetro. Para la segunda, se determina un intervalo dentro del cual se encuentra
el valor del parámetro, con una probabilidad determinada.
ESTIMACIÓN PUNTUAL
Un estimador de un parámetro poblacional es una función de los datos muestrales. En
pocas palabras, es una fórmula que depende de los valores obtenidos de una muestra,
para realizar estimaciones. Lo que se pretende obtener es el valor exacto de un
parámetro. Por ejemplo, si se pretende estimar la talla media de un determinado grupo
de individuos, puede extraerse una muestra y ofrecer como estimación puntual la talla
media de los individuos de la muestra.
La media de la muestra puede ser un estimador de la media de la población, la
cuasivarianza muestral es un buen estimador de la varianza poblacional y el total
muestral es un buen estimador del total poblacional.
Una definición más matemática de un estimador y las propiedades que debe de cumplir
un estimador para ser bueno.
Sea X1......Xn, una m.a.s. de tamaño n, decimos que es un estimador θ* de un parámetro
θ si el estadístico que se emplea para conocer dicho parámetro desconocido es este.
5
ESTADÍSTICA APLICADA – UNIDAD 3
6
ESTADÍSTICA APLICADA – UNIDAD 3
7
ESTADÍSTICA APLICADA – UNIDAD 3
Dado que las hipótesis nula y alternativa son contradictorias, debe examinar las pruebas
para decidir si tiene suficiente evidencia para rechazar la hipótesis nula o no. Las
pruebas se presentan en forma de datos de muestra.
Una vez que haya determinado qué hipótesis apoya la muestra, tome una decisión. Hay
dos opciones para tomar una decisión. Son “no puede aceptar H0” si la información de
la muestra favorece la hipótesis alternativa o “no se rechaza H0” o “se declina rechazar
H0” si la información de la muestra es insuficiente para rechazar la hipótesis nula. Todas
estas conclusiones se basan en un nivel de probabilidad, un nivel de significación, que
establece el analista.
Cuando se realiza una prueba de hipótesis hay cuatro resultados posibles en según la
verdad (o falsedad) de la hipótesis nula H0 y de la decisión de rechazarla o no. Los
resultados se resumen en el siguiente cuadro:
Cuadro 1 resultados posibles de prueba de hipótesis
8
ESTADÍSTICA APLICADA – UNIDAD 3
Dónde:
● X: variable sobre la que se pretenden calcular la varianza
● xi: observación número i de la variable X. i puede tomará valores entre 1 y n.
● n: número de observaciones.
● x̄: Es la media de la variable X.
9
ESTADÍSTICA APLICADA – UNIDAD 3
La varianza es una medida de dispersión. Eso significa que pretende capturar en qué
medida los datos están en torno a la media. Si tenemos datos muy por encima y muy
por debajo de la media, esta será menos representativa y lo veremos reflejado en una
elevada varianza.
Ejemplo
Queremos calcular el salario medio de dos empresas de solo dos trabajadores. En la
empresa A, los salarios son de 24.500 y 23.500 euros. En la B, son de 16.000 y 32.000
euros. Vemos que, en ambos casos, la media es la misma: 24.000 euros. Sin embargo,
esa media es más representativa en la empresa A, ya que los 2 valores se encuentran
mucho más próximos a la media que en la empresa B.
Ejemplo
Vamos a acuñar una serie de datos sobre salarios. Tenemos cinco personas, cada uno
con un salario diferente:
Juan: 1.500 euros
Pepe: 1.200 euros
José: 1.700 euros
Miguel: 1.300 euros
Mateo: 1.800 euros
La media del salario, la cual necesitamos para nuestro cálculo, es de ((1.500 + 1.200 +
1.700 + 1.300 + 1.800) /5) 1.500 euros.
Obtendremos que se debe calcular tal que:
10
ESTADÍSTICA APLICADA – UNIDAD 3
3.5 Regresión
El análisis de regresión es una técnica estadística que permite comprobar la hipótesis
de que una variable depende de otra u otras variables. Además, el análisis de regresión
brinda una estimación de la magnitud del impacto de un cambio en una variable sobre
otra. Por supuesto, esta última característica es de vital importancia para predecir los
valores futuros.
El análisis de regresión se basa en una relación funcional entre variables y supone,
además, que la relación es lineal. Esta suposición de linealidad es necesaria porque, en
su mayor parte, las propiedades estadísticas teóricas de la estimación no lineal no están
aún bien elaboradas por los matemáticos y econometristas.
El modelo de regresión lineal general se puede enunciar mediante la ecuación:
yi=β0+β1X1i+β2X2i+⋯+βkXki+εiyi=β0+β1X1i+β2X2i+⋯+βkXki+εi
Dónde:
β0 es la intersección,
βi's es la pendiente entre Y y el Xi apropiado, y
ε, es el término de error que captura los errores en la medición de Y y el efecto sobre Y
de cualquier variable que falte en la ecuación y que contribuiría a explicar las variaciones
en Y.
Esta ecuación es la ecuación teórica de la población y, por lo tanto, utiliza letras griegas.
La ecuación que estimaremos tendrá los símbolos romanos equivalentes. Esto es
paralelo a la forma en que antes hemos mantenido el seguimiento de los parámetros de
la población y los parámetros de la muestra. El símbolo de la media poblacional era µ y
el de la media muestral 𝑋, para la desviación típica de la población fue σ y para la
desviación típica de la muestra fue s. Luego, la ecuación que se estimará con una
muestra de datos para dos variables independientes será:
yi=b0+b1x1i+b2x2i+eiyi=b0+b1x1i+b2x2i+ei
Este modelo solo funciona si se cumplen ciertos supuestos. Estos son: qué Y se
distribuya normalmente, que los errores también se distribuyan normalmente con una
media de cero y una desviación típica constante, y que los términos de error sean
independientes del tamaño de X e independientes entre sí. (Holmes, et al. 2022).
11
ESTADÍSTICA APLICADA – UNIDAD 3
12
ESTADÍSTICA APLICADA – UNIDAD 3
Si el proceso se encuentra bajo control estadístico es posible realizar una predicción del
intervalo en el que se encontrarán las características de la pieza fabricada. (Ruiz-Falcó,
2006).
Para que tenga sentido la aplicación de los gráficos de control, el proceso ha de tener
una estabilidad suficiente que, aun siendo aleatorio, permite un cierto grado de
predicción. En general, un proceso caótico no es previsible y no puede ser controlado.
A estos procesos no se les puede aplicar el gráfico de control ni tiene sentido hablar de
capacidad. Un proceso de este tipo debe ser estudiado mediante herramientas
estadísticas avanzadas hasta que el grado de conocimiento empírico obtenido sobre el
mismo permita conocer las causas de la estabilidad y se eliminen.
En lo sucesivo, se supondrá que los procesos tienen un cierto grado de estabilidad.
Podemos distinguir dos casos:
∙ El proceso está regido por una función de probabilidad cuyos parámetros permanecen
constantes a lo largo del tiempo. Este sería el caso de un proceso normal de media
constante y desviación típica constante. Este es el caso ideal y al que se pueden aplicar
los gráficos de control para detectar la presencia de causas asignables.
∙ El proceso está regido por una función de probabilidad, alguno de cuyos parámetros
varía ligeramente a lo largo del tiempo. Este sería el caso de un proceso normal cuya
media varía a lo largo del tiempo (por ejemplo, una herramienta de corte que va
desgastando la cuchilla de corte). Estrictamente hablando, este desgaste de la
herramienta sería una causa especial; sin embargo sí puede conocerse la velocidad de
desgaste, podría compensarse resultando un proceso análogo al caso anterior. (Ruiz,
2006).
13
ESTADÍSTICA APLICADA – UNIDAD 3
ÍNDICES CP Y CPK
Con objeto de comparar la capacidad del proceso y la amplitud de las tolerancias a
satisfacer, se define el índice de capacidad de proceso:
14
ESTADÍSTICA APLICADA – UNIDAD 3
De este modo se define un proceso capaz como aquel que Cpk > 1.
Aplicando estos mismos conceptos a la variabilidad atribuible de una máquina de las
que integran el proceso de fabricación, podemos definir la capacidad de máquina, el
índice de capacidad de máquina CM y CMk. (Ruiz-Falcó, 2006).
Ilustración 6
15
ESTADÍSTICA APLICADA – UNIDAD 3
Suponiendo que se desplazase el proceso 1.5 σ, ver Figura 10, los coeficientes pasarían
a ser:
Aún estas circunstancias, la cantidad de producto fuera de tolerancia sería tan solo de
3.4 ppm. (Ruiz-Falcó, 2006).
Ilustración 7
16
ESTADÍSTICA APLICADA – UNIDAD 3
Cuadro 3
control 𝑋 − R, 𝑋 − S y 𝑋 − S*
17
ESTADÍSTICA APLICADA – UNIDAD 3
SOLUCIÓN:
Dispongamos los cálculos en la tabla siguiente:
18
ESTADÍSTICA APLICADA – UNIDAD 3
19
ESTADÍSTICA APLICADA – UNIDAD 3
Referencias bibliográficas
1- Bibliografía Básica
● Carro, R. y González, D. Control Estadístico de Procesos. (s.f.).
http://nulan.mdp.edu.ar/1617/1/12_control_estadistico.pdf
● Holmes, A. Illowsky,, B. y Dean, S. (2022). Introducción a la estadística
empresarial. Editorial/sitio web: OpenStax.
https://openstax.org/books/introducci%C3%B3n-estad%C3%ADstica-
empresarial/pages/9-1-hipotesis-nula-y-alternativa
● López, J. F. (2017). Varianza. Economipedia.com.
https://economipedia.com/definiciones/varianza.html
● Montero, M.A. (s.f.). Inferencia, estimación y contraste de hipótesis.
https://www.ugr.es/~eues/webgrupo/Docencia/MonteroAlonso/estadistica
II/tema4.pdf
● Moreno, O. (s.f.). Distribución muestral de estadísticos. Ministerio de
Educación y Formación Profesional - INTEF. Licencia Creative Commons
Reconocimiento Compartir igual 4.0.
https://formacion.intef.es/pluginfile.php/246706/mod_resource/content/1/
distribucin_muestral_de_estadsticos.html
● Ruiz A. (2006). Control Estadístico de Procesos.
https://web.cortland.edu/matresearch/controlprocesos.pdf
20
ESTADÍSTICA APLICADA
Unidad 1
ESTADÍSTICA APLICADA – UNIDAD 1
Introducción
En las últimas décadas la estadística ha alcanzado un alto grado de desarrollo, hasta el
punto de incursionar en la totalidad de las ciencias; inclusive, en la lingüística se aplican
técnicas estadísticas para esclarecer la paternidad de un escrito o los caracteres más
relevantes de un idioma.
La estadística es una ciencia auxiliar para todas las ramas del saber; su utilidad se
entiende mejor si se tienen en cuenta que los quehaceres y decisiones diarias embargan
cierto grado de incertidumbre y, la Estadística, ayuda en la incertidumbre, trabaja con
ella y orienta para tomar las decisiones con un determinado grado de confianza.
La asignatura pretende formar a los alumnos en la aplicación de técnicas estadísticas
en el entorno industrial y productivo, que les ayuden en la toma de decisiones y en el
control de los procesos de los trabajos de las ingenierías.
Objetivos
General
● Resumir la información de conjuntos más o menos numerosos de datos, a través
de los métodos de la estadística descriptiva.
Específicos
● Elaborar tablas de distribución de frecuencias absolutas, relativas,
porcentuales y acumuladas.
● Estudiar las medidas numéricas descriptivas y las variables estadísticas
bidimensionales.
● Introducir los conceptos de espacio de probabilidad, variables aleatorias
discretas variables aleatorias continuas.
1
ESTADÍSTICA APLICADA – UNIDAD 1
Desarrollo
UNIDAD I ESTADÍSTICA DESCRIPTIVA Y
PROBABILIDADES
1.1 Introducción
Breve análisis histórico
La palabra estadística se origina, en las técnicas de recolección, organización,
conservación, y tratamiento de los datos propios de un estado, con los antiguos.
Gobernantes controlaban sus súbditos y dominios económicos. Estas técnicas
evolucionaron a la par con el desarrollo de las matemáticas, utilizando sus herramientas
en el proceso del análisis e interpretación de la información.
Para mediados del siglo XVII en Europa, los juegos de azar eran frecuentes, aunque sin
mayores restricciones legales. El febril jugador De Méré consultó al famoso matemático
y filósofo Blaise Pascal (1623-1662) para que le revelara las leyes que controlan el juego
de los dados, el cual, interesado en el tema, sostuvo una correspondencia con Pierre de
Fermat (1601-1665, funcionario público apasionado por las matemáticas; célebre
porque no publicaba sus hallazgos) dando origen a la teoría de la probabilidad, la cual
se ha venido desarrollando y constituyéndose en la base primordial de la estadística.
En nuestros días, son de uso cotidiano las diferentes técnicas estadísticas que,
partiendo de observaciones muestrales o históricas, crean modelos lógico-matemáticos
que se "aventuran" describir o pronosticar un determinado fenómeno con cierto grado
de certidumbre medible.
El avance tecnológico en la informática ha contribuido enormemente al desarrollo de la
estadística, sobre todo en la manipulación de la información, pues en el mercado existen
paquetes estadísticos de excelente calidad, como el SAS, SPSS, SCA,
STATGRAPHICS, y otros, que se instalan en un ordenador sin mayores exigencias
técnicas, permitiendo el manejo de grandes volúmenes de información y de variables.
La estadística, entonces, ha dejado de ser una técnica exclusiva de los estados, para
convertirse en una herramienta imprescindible de todas las ciencias, de donde proviene
la desconcertante falta de uniformidad en las definiciones de los diferentes autores, ya
que cada estudioso la define de acuerdo con lo que utiliza de ella y tenemos definiciones
como que:
La estadística es la tecnología del método científico, o que es el conocimiento
relacionado con la toma de decisiones en condiciones de incertidumbre, o que la
estadística son métodos para obtener conclusiones a partir de los resultados de los
experimentos o procesos, o que es un método para describir o medir las propiedades
de una población. No se tratará aquí de discutir si la estadística es una ciencia, una
técnica o una herramienta, sino de la utilización de sus métodos en provecho de la
evolución del conocimiento.
2
ESTADÍSTICA APLICADA – UNIDAD 1
DEFINICIÓN
Definir la estadística es una tarea difícil porque tendríamos que definir cada una de las
técnicas que se emplean en los diferentes campos en los que interviene. Sin embargo,
diremos, en forma general, que la estadística es un conjunto de técnicas que, partiendo
de la observación de fenómenos, permiten al investigador obtener conclusiones útiles
sobre ellos (Guarín, 2002).
DIVISIÓN
La estadística se divide en dos grandes ramas de estudio que son:
1. La estadística descriptiva, la cual se encarga de la recolección, clasificación y
descripción de datos muestrales y poblacionales, para su interpretación y
análisis.
2. La estadística matemática o inferencial, que desarrolla modelos teóricos que
se ajusten a una determinada realidad con cierto grado de confianza.
Estas dos ramas no son independientes; por el contrario, son complementarias y entre
ambas dan la suficiente ilustración sobre una posible realidad futura, con el fin de que
quien tenga poder de decisión, tome las medidas necesarias para transformar ese futuro
o para mantener las condiciones existentes (Guarín, 2002).
3
ESTADÍSTICA APLICADA – UNIDAD 1
4
ESTADÍSTICA APLICADA – UNIDAD 1
Tabla 2 Ejemplo
Tabla 3 Ejemplo
5
ESTADÍSTICA APLICADA – UNIDAD 1
Tabla 4 Ejemplo
Como se puede observar, hay una gran diferencia entre los datos brutos de la Tabla
No.1 y el ordenamiento y agrupamiento de la Tabla 4.
6
ESTADÍSTICA APLICADA – UNIDAD 1
Tabla 6 Ejemplo
7
ESTADÍSTICA APLICADA – UNIDAD 1
Tabla 7 Ejemplo
Analizando las columnas porcentuales fr y fra se obtienen, entre otras las siguientes
conclusiones:
● Sólo el 4% de las obreras gana el máximo salario/día de la fábrica, el cual
corresponde a $58.000.00 → fila 9.
● El salario diario mínimo ($50.000.00) lo gana únicamente una obrera, lo que
constituye el 2% del personal asalariado → fila 1.
● El 62% de las operarias tiene un salario diario entre $53.000.00 y $55.000.00 →
filas 4, 5 y 6.
● El 60% de las obreras tiene un salario/día de $54.000.00 o menos → fila 5.
● El 64% tiene un ingreso/día de $54.000.00 o más → filas 5+6+7+8+9. (Guarín,
2002).
8
ESTADÍSTICA APLICADA – UNIDAD 1
Ilustraremos el caso a través de un ejemplo, para ello, supongamos que una fábrica de
baldosas, con el objeto de ofrecer una garantía de su producto, desea hacer un estudio
técnico de su producción, para lo cual extrae una muestra de 100 baldosas, cada una
de las cuales se somete a una prueba de resistencia destructiva cuyos datos expresados
en kg/cm2, se relacionan a continuación:
Tabla 8 Ejemplo
9
ESTADÍSTICA APLICADA – UNIDAD 1
● La amplitud debe ser igual para todos los intervalos y, en lo posible, no se debe
trabajar con clases abiertas. (Guarín, 2002).
7. Construir los intervalos, calcular los puntos medios o marcas de clase y hacer el
agrupamiento de frecuencias.
n: Número de observaciones.
LIPI: Límite inferior del primer intervalo.
LSUI: Límite superior del último intervalo.
Xi: Punto medio del intervalo, o marca de clase (Guarín, 2002).
10
ESTADÍSTICA APLICADA – UNIDAD 1
Tabla 9 Ejemplo
Con el fin de prever dobles conteos, quien clasifica deberá especificar si los intervalos
son abiertos a la derecha o abiertos a la izquierda, acá trabajaremos con intervalos
abiertos a la derecha; es decir, del tipo a ≤ X < b donde el límite superior no está incluido
dentro de la clase.
2. R = Xmax - Xmin
R = 780 – 122 = 658
3. Número de intervalos:
m ≈1 + 3.3 log(n)
m ≈1 + 3.3 log(100)
11
ESTADÍSTICA APLICADA – UNIDAD 1
m ≈1 + 3.3 (2)
m = 7.6
No es lógico tener 7.6 intervalos, por lo tanto se procede a aproximar el número de
intervalos a un número natural cercano. Aproximemos m = 7 y determinemos la amplitud
A > R/m;
A > 658/7
A > 94
Ya determinado el número de clases en m=7 encontramos que la amplitud debe ser
mayor que 94. Fijémosla, entonces, en A = 100, que hace más manejable y presentable
la tabla con la información.
4. Rango ampliado
Ra = m∙A
Ra = 7 ∙ 100
Ra = 700
Como se dijo antes, no estamos hablando de restar o sumar estrictamente a/2 sino una
cantidad aproximada que brinde una buena presentación.
12
ESTADÍSTICA APLICADA – UNIDAD 1
Conclusiones:
● El 72% de las baldosas tiene una resistencia entre 300 y 600 kg/cm2.
● El 86% de las baldosas resiste menos de 600 kg/cm2.
● Sólo el 5% resiste 700 o más kg/cm2. (Guarín, 2002).
13
ESTADÍSTICA APLICADA – UNIDAD 1
Una medida descriptiva calculada a partir de los datos de una muestra recibe el nombre
de Estadística/o.
Una medida descriptiva calculada a partir de los datos de una población recibe el
nombre de Parámetro.
14
ESTADÍSTICA APLICADA – UNIDAD 1
MEDIA ARITMÉTICA
Cotidiana e inconscientemente estamos utilizando la media aritmética. Cuando por
ejemplo, decimos que un determinado fumador consume una cajetilla de cigarrillos
diaria, no aseguramos que diariamente deba consumir exactamente los 20 cigarrillos
que contiene un paquete sino que es el resultado de la observación, es decir, dicho
sujeto puede consumir 18, un día; 19 otro; 20, 21, 22; pero según nuestro criterio, el
número de unidades estará alrededor de 20. (Guarín, 2002).
15
ESTADÍSTICA APLICADA – UNIDAD 1
Cuando la variable está agrupada en una distribución de frecuencias (se ordenan las
cifras), la media aritmética se calcula por la fórmula:
Ejemplo:
16
ESTADÍSTICA APLICADA – UNIDAD 1
Ejemplo:
Cálculo de la Media aritmética. El Salario/día de 50 operarias
17
ESTADÍSTICA APLICADA – UNIDAD 1
Ejemplo:
Cálculo de la Media aritmética de la resistencia de 100 baldosas
LA MEDIANA
Otra medida de tendencia central, utilizada principalmente en estadística no
paramétrica, es la mediana, la cual no se basa en la magnitud de los datos, como la
media aritmética, sino en la posición central que ocupa en el orden de su
magnitud, dividiendo la información en dos partes iguales, dejando igual número
de datos por encima y por debajo de ella.
18
ESTADÍSTICA APLICADA – UNIDAD 1
En el ejercicio de los cigarrillos, consumidos por un fumador tenemos lunes 18, martes
21, miércoles 22, jueves 21, viernes 20, sábado 19, y domingo 19.
Ordenando ascendentemente:
x1 → 18
x2 → 19
x3 → 19
x4 → 20
x5 → 21
x6 → 21
x7 → 22
n = 7, es impar;
19
ESTADÍSTICA APLICADA – UNIDAD 1
Cuando n es par:
20
ESTADÍSTICA APLICADA – UNIDAD 1
Ejemplo:
En la columna de frecuencia acumulada advertimos que la observación número 50 se
halla en el cuarto intervalo 4.
Se concluye que el 50% de las baldosas resiste menos de 445.45 kg/cm2 y el 50%
resiste más de 445.45 kg/cm2. (Guarín, 2002).
LA MODA
La moda, como su nombre lo indica, es el valor más común (de mayor frecuencia dentro
de una distribución. Una información puede tener una moda y se llama unimodal, dos
modas y se llama bimodal, o varias modas y llamarse multimodal. Sin embargo puede
ocurrir que la información no posea moda.
Ilustración 1 La Moda
21
ESTADÍSTICA APLICADA – UNIDAD 1
El valor que más veces se repite es 54 con una frecuencia de 12, entonces decimos que
la moda es Mo = 54.000.00 pesos diarios.
22
ESTADÍSTICA APLICADA – UNIDAD 1
Ejemplo:
Tabla 13 Resistencia de 100 Baldosas
23
ESTADÍSTICA APLICADA – UNIDAD 1
CUARTILES
Las cuartillas o cuartiles son valores posicionales que dividen la información en cuatro
partes iguales, el primer cuartil deja el 25% de la información por debajo de él, y el 75%
por encima, el segundo cuartil, al igual que la mediana, divide la información en dos
partes iguales, y por último el tercer cuartil deja el 75% por debajo de sí, y el 25% por
encima.
Gráficamente:
Ilustración 2 Cuartiles
24
ESTADÍSTICA APLICADA – UNIDAD 1
Ejemplo:
Posición que debe ser ubicada en la frecuencia acumulada, para determinar que clase
contiene este cuartil.
El 25% de las baldosas resiste menos de 352.38 kg/cm2 y el 75% tiene una resistencia
superior.
Como el segundo cuartil es lo mismo que la mediana: Me=Q2=445.45 kg/cm2.
El 75% de las baldosas tiene una resistencia inferior a 538.88 kg/cm2 y el 25% una
resistencia superior. (Guarín, 2002).
25
ESTADÍSTICA APLICADA – UNIDAD 1
QUINTILES
Los quintiles o quintillas dividen la información en cinco partes iguales, agrupándolas en
porcentajes de 20, 40, 60, y 80 por ciento, en consecuencia debemos calcular cuatro
parámetros:
Gráficamente:
Ilustración 3 Quintiles
El 40% de las baldosas resiste menos de 415.15kg/cm2 y el 60% resiste más. (Guarín,
2002).
DECILES
Similarmente, los deciles o decillas dividen la información en diez partes iguales, en
cantidades porcentuales de 10 en 10. (Guarín, 2002).
Ilustración 4 Deciles
26
ESTADÍSTICA APLICADA – UNIDAD 1
CENTILES
Obviamente los centiles dividen la información en 100 partes, lo cual facilita la
interpretación porcentual de una distribución de frecuencias.
RESUMEN
En general para calcular cualquier percentil:
27
ESTADÍSTICA APLICADA – UNIDAD 1
Se debe dar una garantía de 210 kg/cm2 de resistencia mínima. (Guarín, 2002).
MEDIDAS DE DISPERSIÓN
En el análisis estadístico no basta el cálculo e interpretación de las medidas de
tendencia central o de posición, ya que, por ejemplo, cuando pretendemos representar
toda una información con la media aritmética, no estamos siendo absolutamente fieles
a la realidad, pues pueden existir datos extremos inferiores y superiores a la media
aritmética, que no están siendo bien representados por este parámetro.
En dos informaciones con igual media aritmética, no significa este hecho, que las
distribuciones sean exactamente iguales, por lo tanto, debemos analizar el grado de
homogeneidad entre sus datos. Por ejemplo, los valores 5, 50 y 95 tiene igual media
aritmética, y mediana que los valores 49, 50 y 51; sin embargo, para la primera
información la media aritmética, se encuentra muy alejada de los valores extremos 5 y
95, cosa que no ocurre con la segunda información que posee igual media aritmética y
mediana, vemos entonces que la primera información es más heterogénea o dispersa
que la segunda.
28
ESTADÍSTICA APLICADA – UNIDAD 1
RANGO O RECORRIDO
Es la medida de dispersión más sencilla ya que solo considera los dos valores extremos
de una colección de datos, sin embargo, su mayor utilización está en el campo de la
estadística no paramétrica.
R = Xmax – Xmin
Xmax, Xmin son el máximo y el mínimo valor de la variable X, respectivamente.
DESVIACIÓN MEDIA
La desviación media, mide la distancia absoluta promedio entre cada uno de los datos,
y el parámetro que caracteriza la información. Usualmente se considera la desviación
media con respecto a la media aritmética:
29
ESTADÍSTICA APLICADA – UNIDAD 1
Ejemplo
1.400.00 es el error promedio que se comete al remplazar los ingresos diarios de cada
una de las 50 obreras por 54.100 pesos. (Guarín, 2002).
30
ESTADÍSTICA APLICADA – UNIDAD 1
VARIANZA
El problema de los signos en la desviación media, es eludido tomando los valores
absolutos de las diferencias de los datos con respecto a la media aritmética. Ahora bien,
la varianza obvia los signos elevando las diferencias al cuadrado, lo cual resulta ser más
elegante, aparte de que es supremamente útil en el ajuste de modelos estadísticos que
generalmente conllevan formas cuadráticas.
La varianza es uno de los parámetros más importantes en estadística paramétrica, se
puede decir que, teniendo conocimiento de la varianza de una población, se ha
avanzado mucho en el conocimiento de la población misma. (Guarín, 2002).
Numéricamente definimos la varianza, como desviación cuadrática media de los datos
con respecto a la media aritmética:
31
ESTADÍSTICA APLICADA – UNIDAD 1
Como los datos están expresados en miles de pesos y la varianza se encuentra en forma
cuadrática obtenemos una varianza de 3 210 000 pesos. Sin embargo para una mejor
comprensión debemos recurrir a la desviación típica o estándar definida como la raíz
cuadrada de la varianza:
(Guarín, 2002).
32
ESTADÍSTICA APLICADA – UNIDAD 1
COEFICIENTE DE VARIABILIDAD
Generalmente, interesa establecer comparaciones de la dispersión, entre diferentes
muestras que posean distintas magnitudes o unidades de medida.
El coeficiente de variabilidad tiene en cuenta el valor de la media aritmética, para
establecer un número relativo, que hace comparable el grado de dispersión entre dos o
más variables, y se define como:
Para el salario:
Para la resistencia
33
ESTADÍSTICA APLICADA – UNIDAD 1
Referencias bibliográficas
1- Bibliografía Básica
● Guarín, N. (2002). Estadística aplicada.
http://tifon.unalmed.edu.co/~pagudel/estadistica.html.
2- Bibliografía Complementaria
● Del Castillo, S. y Salazar, C. (2018). FUNDAMENTOS BÁSICOS DE
ESTADÍSTICA. Primera edición.
http://www.dspace.uce.edu.ec/bitstream/25000/13720/3/Fundamentos%
20B%C3%A1sicos%20de%20Estad%C3%ADstica-Libro.pdf.
● Vergara, J. C. y Quesada, V. M. Estadística básica con aplicaciones en
MS Excel. Universidad de Cartagena. ISBN: 978-84-690-5503-8
34