Clase 1
Clase 1
Clase 1
Probabilidad y Estadística
2 de agosto de 2021
Ideas Generales
Estadística
La estadística surge como ciencia en los siglos XVI-XVII con la introducción del cálculo de pro-
babilidades, que es la base de la estadística matemática. Si bien la estadística maneja un lenguaje
matemático, sus aplicaciones pueden extenderse a la sociología, la psicología, la demografía, la
biología, la física, la medicina, entre otras, de hecho, donde se tienen datos hay estadística. Se
tiene entonces la existencia de la estadística teórica y la estadística aplicada.
1 La estadística teórica o también conocida como estadística matemática es la disciplina que
se encarga de estudiar de manera teórica las leyes del comportamiento de los fenómenos
aleatorios, las extiende y las utiliza para hacer una inferencia de los resultados. El funda-
mento de la estadística matemática es la teoría de probabilidad.
2 La estadística aplicada tiene como objetivo estudiar el comportamiento de una o más carac-
terísticas de los objetos de una población. Es así como características tales como: el peso,
la estatura, tiempo de falla de algún tipo de componente electrónico, tiempo de vida de un
paciente con alguna enfermedad terminal, ruido en un barrio, el color del cabello de los
niños de cierta comunidad, entre otras, son de interés para un investigador.
Ideas Generales
Observación
La estadística aplicada toma como base argumentativa la estadística teórica y de esta manera
proporciona métodos y técnicas para:
1 Recoger y organizar datos que provienen de las observaciones de ciertas características
asociadas a los objetos de las poblaciones.
2 Esquematizar el comportamiento de las poblaciones, con relación a determinadas caracte-
rísticas asociadas a sus objetos, mediante tablas, gráficas o dibujos.
3 Resumir la información obtenida a partir de las observaciones mediante algunos datos que
son representativos.
4 Analizar la relación de dependencia entre los objetos de la misma población.
5 Predecir el comportamiento de una población o un conjunto de poblaciones a partir de un
subconjunto representativo de objetos de la población.
6 Resumir las poblaciones mediante algunos números representativos, llamados parámetros.
7 Evaluar las estimaciones de los parámetros poblaciones a partir de funciones de los datos
muestrales.
8 Estudiar la fiabiliadad y validez de hipótesis estadísticas.
Ideas Generales
Definición. Población.
Una población P se entiende como un conjunto de elementos u objetos de interés sobre el cual se
realizan las observaciones. Dado que los objetos o cosas cuentan con una cantidad finita o infinita
de proyecciones, se entiende una población como una característica asociada a los objetos que
pertenecen a P.
1 La población no es un concepto absoluto, es decir, no solo existe una sola población, de he-
cho existen infinitas poblaciones. Por otro lado, los objetos que pertenecen a una población
pueden ser objetos de naturaleza física o de naturaleza abstracta.
2 De manera informal, puede entenderse una población como el conjunto referencia o como
el conjunto universal.
3 La estadística teórica manipula poblaciones infinitas y hace sus construcciones con base en
dichos objetos. Por otro lado, la estadística aplicada estudia poblaciones finitas.
Ideas Generales
4 Cuando se estudia toda una población finita, se dice que se está haciendo un censo, sin
embargo, dicho trabajo es costoso en diferentes aspectos, tales como el económico o el
temporal. Es por esta razón que la estadística se hace de técnicas que permiten estudiar
aspectos de interés de una población a partir de subconjuntos representativos de la misma.
5 Cuando se delimita claramente la población de interés y el alcance de la investigación, se
debe tener claro que característica o características en particular se van a estudiar en dicho
conjunto, dado que una misma población es susceptible de someterse a diferentes estudios.
Por esta razón en estadística, se asume que la población no es el conjunto formado por
las cosas en términos de todas sus proyecciones, sino que se asume o se supone que la
población es la característica de interés de dichos objetos.
Ideas Generales
Ideas Generales
Definición. Muestra
Dada una población de interés P, una muestra M es un subconjunto representativo de la
población.
Se puede pensar en que en cada uno de los casos del ejemplo anterior el interés principal se centra
en estudiar, por ejemplo, las siguientes características.
1 El nivel de estudios de una persona con nacionalidad colombiana ó el peso de una persona
con nacionalidad colombiana.
2 La precipitación en un punto (x, y) del territorio colombiano o la cantidad de epífitas pre-
sentes en un árbol ubicado en un punto (x, y) de dicho territorio.
3 El tiempo de falla de un televisor cualquiera.
4 El ruido presente en un punto de coordenadas (x, y) sobre la región R.
Ideas Generales
Ideas Generales
Definición. Variable.
Las características asociadas a los objetos de una población, reciben el nombre de variable. Las
variables se clasifican en:
1 Cualitativas. Es una característica que no es susceptible de medida y describe un atributo
o cualidad de los objetos de la población. La intención de las variables cualitativas es cla-
sificar los objetos de la población en categorías. Las variables cualitativas se clasifican en
nominales y ordinales. La diferencia entre las variables cualitativas nominales y ordinales
es que en las variables ordinales existe un orden establecido en las categorías, mientras que
en las variables nominales no hay un orden establecido en las categorías.
2 Cuantitativas. Es una característica que es susceptible de medida, esto es, son caracterís-
ticas de los objetos de la población que se pueden medir con un número. Las variables
cuantitativas se clasifican en discretas y continuas. Una variable se dice discreta si el con-
junto de todos los posibles valores que toma es un conjunto finito o contablemente infinito.
Una variable se dice continua si el conjunto de todos los posibles valores que toma es un
intervalo continuo de los reales R.
Ideas Generales
Ideas Generales
Ideas Generales
Definición. Parámetro.
Un parámetro es un valor numérico θ que resume una población P. Un parámetro es una carac-
terística de la población.
Observación.
A partir de la definición anterior se tiene que cuando se hace el estudio de una población en parti-
cular, lo que se pretende en principio es hacer una estimación de los parámetros que la resumen.
Existen poblaciones con un solo parámetro, poblaciones con dos parámetros, en general, pobla-
ciones con k parámetros. Debe existir un vínculo entre las muestras y la población de manera que
se logren estimaciones adecuadas de dichos parámetros a partir de los datos muestrales. Es lógi-
co pensar que existen valores numéricos que resumen una muestra y que además dichos valores
representativos, son el vinculo entre las muestras y las poblaciones para estimar los parámetros.
Definición. Estadístico
Un estadístico es una valor numérico que resume una muestra. Por otro lado, un estadístico es
una función de los datos muestrales.
Ideas Generales
Ideas Generales
Ejemplo
Considere lanzar al aire una moneda una sola vez con la intención de determinar que cae. Para
este experimento claramente se tiene que:
1 Se puede replicar las veces que se desee, bajo condiciones análogas y de manera indepen-
diente, esto es, que caiga cara en un lanzamiento no implica que caiga cara el siguiente
lanzamiento.
2 El conjunto de todos los resultados posibles es el conjunto {C, S}, donde C representa caer
cara y S representa caer sello.
3 Cuando se lanza una moneda al aire no se puede afirmar con certeza que caerá cara C o
sello S.
Ideas Generales
Ejemplo
Considere lanzar al aire tres monedas simultaneamente y determinar que caen. Se tiene que esta
acción satisface las tres condiciones de experimento aleatorio donde el conjunto de todos los
posibles resultados es el conjunto:
esto es, pueden caer tres caras, dos caras y un sello, una cara y tres sellos o tres sellos. No se
puede asegurar con certeza que el resultado caer a lo sumo una cara se de en dicho experimento.
Ideas Generales
Ejemplo
Considere lanzar al aire tres monedas, una a la vez, y determinar si caen cara o sello. Al igual que
en los dos ejemplos anteriores, esta acción satisface las tres condiciones de experimento aleatorio
donde el conjunto de todos los posibles resultados, es el conjunto:
En este experimento aleatorio no se puede afirmar a priori que el resultado caer cara en los tres
lanzamientos se de.
Ideas Generales
Ejemplo
Suponga que se tienen un dado y una moneda. Primero se lanza el dado al aire y se observa
que cae en la cara superior. Si el dado cae en un número impar entonces se lanza la moneda
y se determina que cae. si el dado cae en un número par en la cara superior entonces se lanza
nuevamente el dado. El conjunto de todos los posibles resultados de este experimento aleatorio,
es el conjunto:
{(x, y) : x ∈ {1, 3, 5}, y ∈ {C, S}} ∪ {(x, y) : x ∈ {2, 4, 6}, y ∈ {1, · · · , 6}}.
Ideas Generales
Ejemplo
Suponga que un restaurante de menú ejecutivo ofrece a su clientes los siguientes ingredientes:
1 A = {Res, Cerdo, Pollo}.
2 B = {Frijoles, Sopa}.
3 C = {Arroz, Pastas}
4 D = {Limonada, Mazamorra}.
5 E = {Torta, Bocadillo}.
La condición en el momento de elegir el menú, es que el cliente debe elegir un ingrediente y sólo
un ingrediente de los conjuntos A, B, C y D, respectivamente. El experimento consiste en elegir
un cliente al azar y determinar que elige.
Claramente esta acción representa un experimento aleatorio, donde el conjunto de todos los po-
sibles resultados, es el conjunto:
{(x1 , x2 , x3 , x4 , x5 ) : x1 ∈ A, x2 ∈ B, x3 ∈ C, x4 ∈ D, x5 ∈ E}.
Ideas Generales
Ejemplo
La Universidad de San Buenaventura ofrece un curso de estadística 1 a los estudiantes de la
facultad de ingeniería. Considere que se lleva a cabo la primera evaluación parcial de dicho
curso y el interés se concentra en determinar el tiempo que un estudiante elegido al azar gasta
en desarrollar dicha prueba. En este experimento aleatorio el conjunto de todos los posibles
resultados es el intervalo [0, tmáx ], donde tmáx denota el tiempo máximo que tiene el estudiante
para desarrollar la prueba.
Ideas Generales
Ejemplo
Considere una región R de la Universidad de San Buenaventura, sede Medellín. Un estudiante
de ingeniería de sonido selecciona al azar un punto (x, y) de dicha región y desea medir el nivel
de presión sonora presente en dicho punto.
Se sabe de la física que la presión atmosférica es constante. El experimento aleatorio consiste en
perturbar el medio y la perturbación genera variaciones de presión sobre la presión atmosférica
que son conocidas como sonido. Dichas perturbaciones pueden ser causadas por ejemplo por la
caída de un alfiler, que en teoría no generaría mucha variación, hasta el despegue de un cohete
u otro suceso que generaría en teoría una variación mucho mayor. De esta manera se tiene una
acción tal que:
1 Se puede replicar de manera independiente e infinitas veces pues se parte del hecho de que
la presión atmosférica es constante.
2 Como se mencionó arriba, se conoce la gama de todos los posibles resultados.
3 No se puede afirmar con certeza la ocurrencia de un resultado en particular.
Ideas Generales
Ejemplo
Considere un bosque de Colombia que puede ser representado geométricamente por una región
R. Suponga que un estudiante de ingeniería ambiental de la Universidad de San Buenaventura
elige un punto (x, y) de dicha región y observa la cantidad de epífitas presentes en un árbol de
una especie de su interés. En este caso el conjunto de todos los posibles resultados es el conjunto
de números enteros que empiezan en cero y alcanzan un máximo según el contexto.
Ideas Generales
Ejemplo
Suponga que se tienen 4 focos de 40W, 5 de 60W y 6 de 75W. El experimento aleatorio consiste
en elegir focos uno por uno hasta elegir uno de 75W. El conjunto de todos los posibles resultados
de este experimento aleatorio es un conjunto formado por 1-tuplas, 2-tuplas, · · · y 10-tuplas,
donde la última componente de una k-tupla elegida al azar es un bombillo de 75W.
Ejemplo
Suponga que se tienen dos cajas, una con 8 pelotas verdes y 2 rojas y la otra con 6 pelotas rojas
y 4 verdes. Se elige una pelota al azar de la primera caja y se coloca en la segunda. Luego se
elige una pelota al azar de la segunda caja y se coloca en la primera. El experimento consiste en
determinar cual es la configuración final de pelotas en las dos cajas. De esta manera el conjunto
de resultados en este experimento es el conjunto de todas las posibles configuraciones finales de
pelotas en las dos cajas. Claramente la configuración final puede o no cambiar.