Estadística Fase 3
Estadística Fase 3
Estadística Fase 3
ESTADISTICA DESCRIPTIVA
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
CEAD SOCHA, TUNJA
2019
Introducción
El siguiente trabajo pretende dar un acercamiento general hacia los temas de la fase 3 del curso académico y del
identificación de población, muestra y variable, hallazgo de las medidas de tendencia central, análisis de datos y
resultados presentes en gráficos, histogramas y polígonos de frecuencia, que permiten hallar respuesta a numerosas
investigaciones con el fin de obtener datos y analizar la información presentada para su fácil acceso y
OBJETIVO
PREGUNTAS ORIENTADORAS
Punto muestral.
Se denomina punto muestral a cada uno de los posibles resultados de un estudio aleatorio, es
decir a cada elemento de Ω
Explique en sus propias palabras el experimento aleatorio del dado deben descargar el
CODIGODADO disponible en la siguiente columna. El estudiante debe entender que, aunque no
es un experimento agropecuario nos ayuda a entender los conceptos planteados
El experimento de los dados
Se ejecuta la tabla para las frecuencias absolutas, absolutas acumuladas y relativas.
Por ultimo en cuanto a las tablas se ejecuta la de frecuencias relativas acumuladas, con las
conclusiones que nos da el código.
El grafico de las frecuencias relativas.
Y por último el grafico de frecuencias relativas acumuladas
Las variables aleatorias, pueden ser interprtadas como funciones usadas para describir los
resultados de un estudio aleatorio. Para el propósito del análisis de datos las clasificamos en
cuantitativas y cualitativas y a las primeras en discretas y continuas dependiendo de los posibles
valores que la variable pueda asumir (contable o no).
Para la definición formal de variable aleatoria, el tipo de variable es importante. El tipo de
variable depende del conjunto de todos los valores que potencialmente pueden asumir en un
estudio aleatorio.
¿Qué significa que el espacio muestral de una variable aleatoria continua es no contable?
Si el espacio muestral de una variable es discreto pero representado por nombres o códigos que
representan categorías excluyentes y exhaustivas de la variable, entonces la variable aleatoria es
una variable cualitativa de tipo categorizada (nominal u ordinal).
¿Qué son variables aleatorias discretas proporcionales y que son variables aleatorias discretas
de conteo no acotado?
Una variable de tipo discreta es siempre contable, es decir puede ser teóricamente enumerado,
aún si éste es infinitamente grande o no está acotado. Por ejemplo, el número de nematodos por
hectárea registrado a partir de una muestra aleatoria de hectáreas en producción de papas, podría
no tener un valor límite. En las variables discretas, es posible contar el número de veces que un
determinado valor ocurre en el espacio muestral.
Entre las variables discretas es importante distinguir al menos dos subtipos muy comunes en
estudios biológicos: las proporciones que provienen de conteos que no pueden superar el número
de elementos evaluados y los conteos no acotados o sin denominador natural. Ejemplo de una
variable discreta expresada como proporción es el número de semillas germinadas en cajas de
Petri con 25 semillas cada caja; los resultados se expresan como proporciones porque existe un
denominador natural: la cantidad de semillas por caja. Ejemplo de variable discreta obtenida por
un conteo (no acotado) es el número de pústulas de roya por m2 de cultivo. Para el caso de
proporciones es importante dejar expresado que si bien el valor puede ser continuo en el rango
0-1, el espacio generatriz es discreto, porque la base de la variable es el conteo.
Existe dos conceptos de probabilidad el clásico y concepto frecuencial, defina cada uno, en el
caso del frecuencial explique el experimento de germinación de una semilla cuál es el
experimento aleatorio, cuál es el evento, cuantos puntos muestrales tiene.
El concepto de probabilidad puede definirse de distintas formas y con distintos niveles de
abstracción. Las definiciones clásica, frecuencial y de Kolmogorov son las más conocidas.
Cuando Ω es finito (el número de puntos muestrales es contable) se puede dar una definición de
probabilidad que se basa en la observación de los elementos del espacio muestral. Ésta se
desarrolló originariamente estudiando los juegos de azar. y se conoce como el concepto o
enfoque clásico de probabilidad:
Si A es un subconjunto de puntos muestrales de , entonces la probabilidad de ocurrencia del
evento A, denotada por P(A) es:
𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑝𝑢𝑛𝑡𝑜𝑠 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙𝑒𝑠 𝑓𝑎𝑣𝑜𝑟𝑎𝑏𝑙𝑒𝑠
𝑃(𝐴) =
𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑝𝑢𝑛𝑡𝑜𝑠 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙𝑒𝑠 𝑒𝑛 𝑒𝑙 𝑒𝑠𝑝𝑎𝑐𝑖𝑜 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙
Dado que el número de puntos favorables es un subconjunto del espacio muestral, se deduce que
la probabilidad de un evento siempre será un número positivo, entre 0 y 1.
Si bien la analogía es fundamental, las frecuencias se entienden como probabilidades sólo cuando
N tiende a infinito. Si el número de veces que se repite un experimento no es grande, entonces
hablaremos de frecuencia relativa y diremos que ésta “aproxima” una probabilidad.
Otra idea importante para comprender la medida de probabilidad es la de eventos mutuamente
excluyentes.
¿Que son eventos mutuamente excluyentes?, como es la intersección de dos eventos mutuamente
excluyentes, si son excluyentes, dado un evento A y uno B, a que es igual la P(AꓴB)?
Se dice que dos eventos son mutuamente excluyentes si cada uno está formado por puntos
muestrales distintos, es decir no existe ningún punto muestral en la intersección de los
subconjuntos que representan los eventos y , por la teoría de conjuntos, se tiene:
Si A y B son dos eventos de , la unión de eventos conforma un nuevo conjunto, que contiene a
los puntos muestrales de A y de B. La unión de A y B se denota por A∩B.
Si A y B son dos eventos de , la intersección de eventos conforma un nuevo conjunto, que
contiene a los puntos muestrales que simultáneamente pertenecen al subconjunto A y al
subconjunto B. Denotaremos la intersección de A y B con A ∩ B.
Cuando dos eventos son excluyentes, la intersección es cero y por tanto la probabilidad de la
unión de esos eventos, P(AUB), es la suma de las probabilidades de cada evento. Por el contrario,
si la intersección no es vacía, la probabilidad de la unión de eventos es la suma de las
probabilidades de cada evento, menos la probabilidad de la intersección.
La definición de probabilidad de Kolmogorov (1937) establece que una función P(.) será
considerada una medida de probabilidad si a cada evento de un espacio muestral se le asigna un
número real entre 0 y 1 y, además, se cumplen tres axiomas:
a) la probabilidad asociada al evento espacio muestral es igual a 1. Este resultado sugiere que si
el evento de interés es todo el espacio muestral, la probabilidad de ocurrencia dado el
experimento aleatorio, es 1. Existe certeza de la existencia de un resultado en el espacio muestral.
b) la probabilidad de cualquier evento que sea un subconjunto del espacio muestra es mayor o
igual a cero. Si entendemos a la probabilidad como el límite de una frecuencia relativa (cantidad
de casos respecto de un total) es claro que las probabilidades nunca pueden ser negativas.
c) Si existen dos o más eventos mutuamente excluyentes, la probabilidad de que ocurra uno u
otro evento, es decir la probabilidad de la unión es igual a la suma de la probabilidad de cada uno
de estos eventos.
En el caso de distribuciones de variables aleatorias cuando una variable es continua y
simétrica que modelo se usa.
Para una variable continua y de distribución simétrica unimodal, es común el uso del modelo
Normal; mientras que para proporciones se piensa en el modelo probabilístico Binomial y para
conteos no acotados en el modelo Poisson.
Se dice que dos eventos son mutuamente excluyentes si cada uno está formado por puntos
muéstrales distintos, es decir no existe ningún punto muestral en la intersección de los
subconjuntos que representan los eventos.
Cuando dos eventos son excluyentes, la intersección es cero y por tanto la probabilidad de la
unión de esos eventos, P(AB), es la suma de las probabilidades de cada evento.
Modelo de Poisson.
Cuáles son los parámetros más usados en estadística para estudiar y utilizar funciones de
distribución de variables aleatorias. El valor esperado y la varianza son los parámetros más
usados en estadística para estudiar y utilizar funciones de distribución de variables aleatorias.
¿Qué es la esperanza matemática de una variable aleatoria, como se denota? Denotada por E
() o la letra griega Mu (µ), desde el punto de vista intuitivo, un promedio de los valores asumidos
por la variable donde cada valor es ponderado por su probabilidad de ocurrencia. Proporciona
información parcial acerca de la función de probabilidad (o densidad) ya que explica dónde está
posicionada la distribución de valores sobre la recta real
Que es la varianza de una variable aleatoria, como se denota letra griega sigma al cuadrado
σ2 , es una medida de dispersión, denominada desvió estándar (σ) para expresar la dispersión en
términos diferencia de cada dato respectivo de la esperanza
Qué tipo de histograma se seleccionar un modelo probabilístico para una variable aleatoria
continua cuando se tienen datos de esa variable histograma de frecuencias relativas
DISTRIBUCIÓN BINOMIAL
En la distribución binomial que es n y que es P. se supone que se realizan ciertos número (n)
de experimentos aleatorios y en cada experimento se registra uno de dos resultados posibles,
éxito o fracaso, donde el éxito tiene una cierta probabilidad, (p) de ocurrencia , conocido como
ensayo Bernoulli
A que es igual la esperanza y la varianza en esta distribución.
DISTRIBUCION DE POISSON
Que tipos de conteos se trabaja con la distribución de Poisson. Variables discretas, los
conteos se refiere al número de veces que u evento ocurre en una unidad de tiempo o espacio,
dada ( hora, kilo, planta, 𝑚2 etc.
La distribución de Poisson también sirve como modelo probabilístico para variables discretas de
tipo conteo. A diferencia de la Binomial, donde el conteo se realizaba sobre n experimentos
independientes, en el caso de la Poisson, los conteos se refieren al número de veces que un evento
ocurre en una unidad de tiempo o espacio dada (hora, kilo, m^2, m^3, planta, etc.) y por tanto los
valores de la variable no están acotados.
En agronomía se usa para que tipo de conteos, les recuerdo los ácaros por ejemplo se
pueden trabajar con esta distribución. La distribución de Poisson
En Agronomía, la distribución Poisson suele usarse para modelar el número de insectos sobre una
planta, o en un golpe de red, el número de manchas defectuosas en un mosaico, o en un metro
cuadrado de piso, el número de colémbolos en 100 g de suelo, o en 1000 cm^3 de suelo o el
número de coliformes en 1 ml de agua, entre otros conteos de interés
Esta distribución tiene un único parámetro, que representa la esperanza y también a la varianza,
es decir que cuando Y~ Poisson(), se cumple:
Revisando el ejercicio de la tabla 3.1 del libro de Balzarini como se obtiene λ en este caso a
que es igual la media y la varianza.
En este caso es adecuado para no confundirse leer el texto indicado
2. Aplicación de conceptos
Estudie el ejercicio de velocidad del viento de la del texto y explicar por qué hay un
sitio mejor para el objeto del estudio, pueden tomar pantallazos del gráfico.
Desarrolle el ejercicio 2.1 del texto de Balzarini y en el caso del punto e revise la
presentación de probabilidad obtener la tabla de frecuencias relativas f(y) y la tabla de
frecuencias relativas acumuladas que es la misma F(Y), este ejercicio se puede desarrollar
en una tabla de Word.
Figura 2.3: Gráfico de la distribución empírica de la velocidad del viento (km/h)
en dos zonas de un establecimiento agrícola, denominadas zona sur (izquierda) y
zona norte (derecha). Balzarini, M. (2013), Estadística y biometría. Pag 77.
En función de la velocidad del viento, la zona norte como aquella con mejores
aptitudes para usar la energía eólica puesto que la velocidad del viento es
aproximadamente de 46 km/h, esto es equivalente a decir que el 50% de las
veces, el viento alcanzó una velocidad promedio de 46 km/h o menor. El 10% de
las veces, la velocidad del viento superó 48 km/h. El rango de velocidades en la
zona norte varió entre 37 km/h hasta 54 km/h, mientras que, en la zona sur se
registraron velocidades del viento que oscilaron entre los 18 y 29 km/h. Sólo el
10% de las veces la velocidad del viento superó los 26 km/h.
Ejercicio 2.1: Supongamos que se toma una muestra aleatoria con reposición de
tamaño n=2 a partir del conjunto {1,2,3} y se produce el siguiente espacio
muestral con 9 puntos muéstrales:
El evento A conformado por los puntos muéstrales cuya suma sea un número par,
es decir:
El evento B conformado por los puntos muéstrales cuya suma sea número impar,
siendo:
1, porque:
5
𝑃(𝐴) =
9
4
𝑃(𝐵) =
9
5 4
(𝐴𝑜𝐵) = + =1
9 9
4/9
Y F(Y)
2 1/9
3 3/9
4 6/9
5 8/9
6 1
Preguntas:
110
𝑃(𝐴) =
260
25 10 35
(𝐴) = (𝑥 = 3) + (𝑥 = 4 𝑜 𝑚á𝑠) = = 0,1346
+ =
260
260 260
e) ¿Cuál es la probabilidad que en los próximos dos días venda 3 tractores?