Estadistica Inferencial

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 22

lOMoARcPSD|13947250

Estadistica Inferencial

Costos y Presupuestos (Politécnico Grancolombiano)

Studocu is not sponsored or endorsed by any college or university


Downloaded by Joseph García ([email protected])
ESTADISTICA INFERENCIAL
TRABAJO COLABORATIVO GRUPO
12

MARIA DEL PILR RIOS SALAMANCA


JHON ALEJANDRO ALVAREZ
RAMIREZ

SERGIO CASTAÑEDA RAMIREZ


Profesor

POLITECNICO GRANCOLOMBIANO
INGENIERIA INDUSTRIAL
ESTADISTICA INFERENCIAL
2020
Trabajo colaborativo Estadística Inferencial – Politécnico
Grancolombiano SEMANA 3 1
lOMoARcPSD|13947250

Actividad 1.

1. Determine si se puede considerar que las variables Millaje y Price se


distribuyen normalmente. Para hacer esto pueden calcular e interpretar cada
una de las siguientes medidas o procedimientos, y finalmente concluir.
a. El sesgo:

Es el grado de asimetría que tiene la distribución de los datos, lo que nos


indica que tan dispersos se encuentran de respecto a la media aritmética, un
estimador cuyo sesgo es nulo se llama insesgado o centrado, si el valor se
distribuye positivamente nos indica que el grupo de datos del sesgo va a la
derecha, y por el contrario si el sesgo es negativo el grupo de datos ira a la
izquierda.
Calcular para Price:

• La media:
n

∑ x1
X = i=1 X =21343.13
n

• La mediana:
( n+ 1)
¿ =18025
2

• La moda:
∆1
MO=li+ ∗C=10922
∆1+ ∆ 2

• Desviación estándar:

Xi−¿
¿
X
¿
¿
n
1
∑¿
n i=0
S= √ ¿

• Varianza:
¿
¿2
¿
¿
n

S=∑ ¿
i=0

• Sesgo:
Media−Moda
AS= =1,57579638
desviación

Calcular para Millaje:

• La media:
n

∑x 1
X = i=1 X =19831,9341
n
• La mediana:
( n+ 1)
¿ =20913,5
2

• La moda:
∆1
MO=li+ ∗C =18910
∆1+ ∆ 2

• Desviación estándar:

Xi−¿
¿
X
¿
¿
n
1
∑¿
n i=0
S= √ ¿

• Varianza:
¿
¿2
¿
¿
n

S=∑ ¿
i=0

• Sesgo:
Media−Moda
AS= =−0,1312466
desviación

b. La curtosis:

Es una medida estadística que determina el grado de concentración que


presentan los valores de una variable alrededor de la zona central de la
distribución de frecuencias. También es conocida como medida de
apuntamiento[1].

1. Leptocúrtica: Existe una gran concentración de los valores en torno a


su media (g2>3)

2. Mesocúrtica: Existe una concentración normal de los valores en torno a su


media (g2=3).

3. Platicúrtica: Existe una baja concentración de los valores en torno a su


media (g2<3)
Dependiendo de la agrupación o no de los datos, se utiliza una fórmula u
otra.
➢ Datos sin agrupar:

X − X ¿4
1
¿
¿
∑¿
1
g2= ¿
n
➢ Datos agrupados en tablas de frecuencias:

X − X ¿4
1
¿
f i¿
∑¿
1
g2= ¿
n
➢ Datos agrupados en intervalos:

mX −X ¿4
1
¿
f i¿
∑¿
1
g2= ¿
n
= Coeficiente de curtosis

=Número de datos

=valor i-ésimo de las


observaciones =Media aritmética de
la distribución 6=desviación típica de
la distribución
lOMoARcPSD|13947250

=frecuencia absoluta del dato i-ésimo


= marca de la clase.

La interpretación del resultado en este caso sería la siguiente:


g2-3 > 0 -> distribución leptocúrtica.
g2-3 = 0 -> distribución mesocúrtica (o
normal). g2-3 < 0 -> distribución platicúrtica.

Price: n=804
Formula Curtosis Price: 3,291120122 de acuerdo con el grado de concentración de
las variables es Leptocúrtica: Existe una gran concentración de los valores en torno
a su media (g2>3).
140
120
100
80
60
40
20
Frecuenc

Clase
Frecuencia

Millaje: n=804
Formula Curtosis Millaje: 0,183909299 de acuerdo con el grado de
concentración de las variables es Platicúrtica: Existe una baja concentración
de los valores en torno a su media (g2<3).
100
90
80
70
60
50
Frecuen

40
30
20
10
0

Clase

Frecuencia

C. Una gráfica de la curva normal (q-q plot)


Se construye gráfica para Price.

Grafica 1 – Curva Price (Ver anexo hoja Curva Price)


En la gráfica Price se puede evidenciar gran parte de los datos se
encuentran alejados de la línea recta y se concluye que nos es una
distribución normal y descartamos la nulidad de esta.

Se construye gráfica para Millaje:

Trabajo colaborativo Estadística Inferencial – Politécnico Grancolombiano


7
lOMoARcPSD|13947250

Grafica 2 – Curva Millaje (Ver anexo hoja Curva Millaje)


D. Regla Empírica:
Price:

Coeficiente de asimetría: 1,576


Media (x con _ encima): 21343,1
Desviación estándar 9884,8
(s): CS:

CI:

De acuerdo con los valores arrojados en la regla empírica para price:

Trabajo colaborativo Estadística Inferencial – Politécnico Grancolombiano


8
➢ 68 % de los datos se encuentran entre 11458,30 y 31227,98
➢ 95 % de los datos se encuentran entre 1573,45 y 41112,82
➢ 99.7 % de los datos se encuentran entre -8311,39 y 50997,66
Millaje:

Coeficiente de asimetría: -0,1312


Media (x con _ encima): 19831,9
Desviación estándar (s): 8196,3
CS:

CI:

De acuerdo con los valores arrojados en la regla empírica Millaje:

➢ 68 % de los datos se encuentran entre 11635.6 y 28028.2


➢ 95 % de los datos se encuentran entre 3439.3 y 36224.5
➢ 99.7 % de los datos se encuentran entre -4757.0 y 44420.9
Conclusión punto 1:

Podemos evidenciar que en la gráfica de Millaje, que la mayoría de los datos


se encuentran muy cerca o sobre la línea recta con lo cual concluimos que
estos datos siguen los parámetros de una distribución normal, se realizó la
comprobación de los datos por medio de las fórmulas y el resultado de estos
evidencian que la distribución normal se encuentra mejor distribuida en el los
datos de Millaje.
Actividad 2.

2. Asuman que los datos corresponden a una población. Van a seleccionar


una muestra usando el muestreo aleatorio simple. Supongan conocido el
Trabajo colaborativo Estadística Inferencial – Politécnico Grancolombiano
9
lOMoARcPSD|13947250

tamaño de la población ¿Qué tamaño de muestra escogen? Justifiquen su


respuesta. Seleccionen la muestra y muestren o expliquen cómo la
obtuvieron.
Para hallar el número de muestra Utilizamos la siguiente ecuación:

Z 2 Npq
α
n = e 2 (N −1)+Z 2 pq
α

n= tamaño de la muestra (número de encuestas que vamos a hacer).

Error aceptado de estimación: estimamos un +-2% de error, con un % de


nivel de confianza del 95% = 1,96 (z)

Parámetro Valor
N 804 Tamaño de población o Universo
Z 1,96Coeficiente (Nível de confianza)
p 0,5 parâmetro estadístico depende de
N
q 0,5 (1-p) =probabilidad de que no
ocurra
e 2% error de estimación máximo
aceptado.
Reemplazamos los valores en la fórmula:

n=603

✓ El tamaño de muestra en esas condiciones sería de 603 datos.

Para los pasos de un muestreo aleatorio:

1. Se enumeran primero los datos.


2. Se inserta una columna con 603 datos en el que se agrega
=ALEATORIO.ENTRE(1,603)
3. Luego se copian estos datos correspondientes a cada uno

Para determinar el tamaño de la muestra definimos que deseamos un


margen de error que no supere el ±2% con un nivel de confianza de 95%.
Estos parámetros los definimos deseando que nuestra muestre represente
los valores de la población.

SEMANA 4

Trabajo colaborativo Estadística Inferencial – Politécnico Grancolombiano


10
Actividad 3. Utilizando la muestra obtenida en la Actividad 1, construyan un
intervalo de confianza para el millaje promedio. Deben seleccionar un nivel
de confianza; tomen en cuenta que se debe privilegiar la exactitud sobre la
confianza, aunque no se olviden completamente de la confianza ¿Qué nivel
de confianza escogen y por qué? Una vez obtenido el resultado, determinen
si es correcto o no, y justifiquen su elección. Supongan que la varianza
poblacional es desconocida.

Solución:

Llamamos intervalo de confianza para µ con una confianza de (1-α) al


intervalo aleatorio (T1,T2) obtenido para una realización muestra dada tal
que: P(T1≤ µ≤T2)=1- α 2

El valor 1-α se denomina nivel de confianza, y como corresponde a una


probabilidad su valor oscilará entre 0 y 1 [2].

El intervalo de confianza se expresa mediante la siguiente fórmula:


a ❑
σ

a σ
2
¿ ( √n

2
¿ (IC√ n=X) ≤ μ≤−ZX + Z ¿
¿

Para una población N=804, determinamos un tamaño de la muestra


n=603. Para determinar el tamaño de la muestra definimos un margen de
error que no supere el ±2%

Promedio 19042,4295

Desviación estándar
7703,75838
Confianza
Tamaño muestra
95%

603

Trabajo colaborativo Estadística Inferencial – Politécnico Grancolombiano


11
lOMoARcPSD|13947250

Z 1,96
Alfa 2%

Reemplazamos en la formula

a ❑
7703,75
2
a 7703,75¿

(√603 )
2
¿
( √ 603 ) ≤ μ≤ 19042,4295 +1,96 ¿

IC =19042,4295−1,96 ¿

IC=18427,54 ≤μ≤ 19657,32

intervalo de confianza
Millaje:
Límite inferior 18427,54
Límite superior 19657,32

Conclusión:

Estos datos se escogieron debido a lo enunciado anteriormente, sabiendo


que:

-Para determinar el tamaño de la muestra definimos que deseamos un


margen de error que no supere el ±2% con un nivel de confianza de 95%.
teniendo en cuenta que, si extraemos un número determinado de muestras
del mismo tamaño de una población con un parámetro de valor constante, el
95% de los intervalos de confianza construidos a partir de esas muestras
contendrán el valor del parámetro que buscamos y el 5% restante no lo
contendrán.

Sin embargo, el promedio de la población está fuera a del nivel de confianza


observado para la muestra.

Trabajo colaborativo Estadística Inferencial – Politécnico Grancolombiano


12
Actividad 4. Construyan un intervalo de confianza para determinar si el
millaje recorrido por los autos fabricados por Cadillac y Chevrolet es el mismo
o es diferente. Ahora, asuman que deben privilegiar la confianza sobre la
exactitud. Justifiquen su elección del nivel de confianza. Asuma que
las medias y las varianzas poblacionales son desconocidas.

cadillac:
La media:
n

X = ∑ =18908,5625
1
X
i=1

n
Desviación estándar:
X −X ¿2
i
¿
¿n
1
∑¿
N i=0
S= √ ¿
Varianza:
X −μ ¿2
i
¿
¿ n−1
¿
¿
n

S =∑¿
2

i=0

Trabajo colaborativo Estadística Inferencial – Politécnico Grancolombiano


13
lOMoARcPSD|13947250

alfa= = 5%
Z= 1,96

cadillac Datos
La media 18908,5625
Desviación estándar 8964,29192
Varianza 80358529,7
confianza 95%
tamaño de
80
la muestra
Z 1,96
alfa 5%

El intervalo queda entonces queda de la siguiente manera:

intervalo de confianza cadillac


Límite inferior 16944,21
Límite superior 20872,91

chevrolet:
La media:
n

X = ∑ =19655,5875
1
X
i=1

n
Desviación estándar:
X −X ¿2
i
¿
¿n
1
∑¿
N i=0
S= √ ¿
Varianza:

Trabajo colaborativo Estadística Inferencial – Politécnico Grancolombiano


14
X −μ ¿2
i
¿
¿ n−1
¿
¿
n

S =∑¿
2

i=0

alfa= = 5%
Z= 1,96

chevrolet Datos
La media 19655,5875
Desviación
8203,57073
estándar
Varianza 67298572,7
confianza 95%
tamaño de
320
la muestra
alfa 5%
Z 1,96

El intervalo queda entonces queda de la siguiente manera:

intervalo de confianza
chevrolet
Límite inferior 18756,76
Límite superior 20554,41

Se realiza la comparación de los datos obtenidos en los millajes de Cadillac y


Chevrolet y se evidencia que no son iguales.
Se escogió un nivel de confianza del 95% considerando el nivel de error que
se comete esto entendiendo que nos podemos equivocar en un 5% que para
un tamaño muestral y desviación obtenidas, el parámetro poblacional se
situará el 95% de las veces (o de las muestras) en el intervalo de valores
que determinamos esto sumándole y restándole el error muestral.
SEMANA 5

Actividad 5. Ahora, hagan una prueba de hipótesis sobre la proporción de


autos que tienen cuatro puertas (el valor poblacional es conocido, usen este

Trabajo colaborativo Estadística Inferencial – Politécnico Grancolombiano


15
lOMoARcPSD|13947250

valor para la hipótesis nula). ¿La conclusión obtenida es correcta o se


cometió un error tipo I o tipo II? Usen el valor p en el desarrollo

Hipótesis nula ( )
La hipótesis nula indica que un parámetro de población (tal como la media, la
desviación estándar, etc.) es igual a un valor hipotético. La hipótesis nula
suele ser una afirmación inicial que se basa en análisis previos o en
conocimiento especializado.

Hipótesis alternativa ( )
La hipótesis alternativa indica que un parámetro de población es más
pequeño, más grande o diferente del valor hipotético de la hipótesis nula. La
hipótesis alternativa es lo que usted podría pensar que es cierto o espera
probar que es cierto.

datos:

Nivel de significancia (Alpha): 0.05

Z=1.96 nivel de confianza del 95%


proporción población: 0,76
tamaño de la muestra es: 459
Valor P: 0,72
La hipótesis es de dos colas

calculamos el estadístico de prueba

Trabajo colaborativo Estadística Inferencial – Politécnico Grancolombiano


16
Remplazamos los valores y tenemos como resultado: -1,798

Calculamos el Z critico: 1,960

No podemos rechazar la hipótesis Ho ya que el valor encontrado, se


encuentra la zona de aceptación como lo muestra la gráfica.

De acuerdo a los datos se cometió el error de tipo I, La probabilidad de


cometer este tipo error es α en nuestro caso es de 0.05 con lo cual
aceptamos que podemos estar equivocados en 5% de la probabilidad.

Actividad 6. Ahora hagan una prueba de hipótesis, para determinar si el


millaje recorrido por los autos fabricados por Cadillac y Chevrolet es el mismo
Trabajo colaborativo Estadística Inferencial – Politécnico Grancolombiano
17
lOMoARcPSD|13947250

o es diferente. ¿cuál es la hipótesis nula?, ¿escoge una prueba de dos colas


o de una cola (de cola derecha o izquierda) ?, explique o justifique su
elección. Consideren que la probabilidad de cometer un error tipo I debe
ser pequeña. Expliquen qué valor escogen para el nivel de significancia.
Supongan que las medias y las varianzas poblacionales son desconocidas.

La hipótesis

datos:
Cadillac:

Cadillac Datos
La media Cadillac 18908,5625
Desviación estándar 8964,29192
Varianza 80358529,7
Nivel de confianza 95%
tamaño de la 80
muestra
Media Poblacional 19831,9348
Z 1,96

Los criterios de prueba son:

- El Nivel de significancia : 0.05

- Las regiones criticas (valores críticos) se determinan con el nivel de


significancia entre dos, ya que se trata de una prueba de hipótesis de 2 colas
por lo cual el nivel de significancia es de 0,025

Validamos en la tabla normal estándar para: a/2 = 0,025 y para (1-a/2) =


1,96

Reemplazando en -c y c, la región de decisión se determina = -1,96 y 1,96.

Trabajo colaborativo Estadística Inferencial – Politécnico Grancolombiano


18
• Si el estadístico Z* se encuentra entre -1,96 y 1,96 no se rechaza
- Hipótesis nula.

- Cuando la varianza poblacional es desconocida, se utiliza el estadístico T-


student, también se utiliza la desviación estándar de la muestra (S) en lugar
del sigma ( ), el estadístico t, sigue una distribución t-student con n-1
grados de libertad

Z= -0,921309
Decisión:
Para un nivel de confianza del 95%, el valor critico de t para (n-1) = 79
grados de libertad es de: 1.9905.
Se rechaza la hipótesis nula si el valor calculado es menor que - 1.9905 o
mayor que 1.9905.
Chevrolet
chevrolet Datos
La media (x) 19655,5875
Desviación estándar 8203,57073
Varianza 67298572,7
Nivel de confianza 95%
tamaño de la muestra 320
Media Poblacional 19831,9348
Z 1,96

Los criterios de prueba son:

Trabajo colaborativo Estadística Inferencial – Politécnico Grancolombiano


19
lOMoARcPSD|13947250

Cuando la varianza poblacional es desconocida, se utiliza el estadístico T-


student, también se utiliza la desviación estándar de la muestra (S) en lugar
del sigma ( ), el estadístico t, sigue una distribución t-student con n-1
grados de libertad

Z= -0,384539
Decisión:

Para un nivel de confianza del 95%, el valor critico de t para (n-1) = 319
grados de libertad es de: 1.96

Se rechaza la hipótesis nula si el valor calculado es menor que - 1.96 o mayor


que 1.96

Conclusión:

Chevrolet: Como el estadístico calculado es -0,384539, no se pude rechazar


la hipótesis nula.

Cadillac: Como el estadístico calculado es -0.921309, no se pude rechazar la


hipótesis nula.

Se puede inferir que el valor Z calculado queda en el área de aceptación de


la hipótesis nula, por lo tanto, se concluye que la media de Millaje recorrido
por los autos fabricados por Cadillac y Chevrolet es similar.

- Es una Hipótesis de dos colas puesto que estamos considerando la


relación igual "diferente" o” ", en este caso estamos comparando el millaje
de Cadillac y el de chevrolet.

Se decide analizar las dos colas debido puede existir una diferencia superior
o inferior de las medias. Se elige un nivel de significancia de 0.01; esto

Trabajo colaborativo Estadística Inferencial – Politécnico Grancolombiano


20
equivale a cometer un error de tipo I. Así, se usará una distribución normal
estandarizada en Z [3].

BIBLIOGRAFIA

[1] https://economipedia.com/definiciones/curtosis.html

[2] https://www.geogebra.org/m/Ps6ZVrVZ

[3] https://www.slideshare.net/ElisaMendoza7/prueba-de-hiptesis-76106690

Trabajo colaborativo Estadística Inferencial – Politécnico Grancolombiano


21

También podría gustarte