Informe Investigación
Informe Investigación
Informe Investigación
Conceptos Preliminares:
Variable aleatoria es una variable que tiene un valor numérico único, determinado por el azar,
para cada resultado de algún experimento.
Distribución de probabilidad es la enumeración de todos los valores posibles de una variable
aleatoria junto con la probabilidad asociada a cada uno de ellos. En otras palabras, describe la
probabilidad para cada valor de la variable aleatoria.
Variable aleatoria discreta: toma un conjunto finito o numerable de valores distintos. Es
posible asignar probabilidades específicas a cada uno de estos valores, y la suma de todas estas
probabilidades es igual a 1. Ejemplos: Número de caras obtenidas al lanzar una moneda; Número de
personas en una familia; Cantidad de errores en un libro impreso.
Variable aleatoria continua: toma una infinidad de valores. Debido a la continuidad, la
probabilidad de que la variable tome un valor específico es siempre cero, en cambio, calculamos la
probabilidad de que la variable caiga dentro de un rango o intervalo de valores continuos. Ejemplos:
Altura de las personas; Tiempo de respuesta en que tarda en responder una máquina; Peso de los
productos en una fábrica.
1
I.F.D. N°7 TP de investigación - Cepeda C.
∞ El área total bajo la curva de 𝑓(𝑥) debe ser igual a 1, lo que significa
2. ∫ 𝑓(𝑥)𝑑𝑥 = 1 que la suma total de todas las probabilidades posibles es 1.
−∞
Distribución Normal
𝑓(𝑥) = ·𝑒
σ 2π
Características
● Simétrica: La distribución normal es simétrica alrededor de la media, lo que significa que la
probabilidad de que una variable tome un valor igualmente alejado a la derecha o a la
izquierda de la media es la misma.
● Forma de Campana: La distribución normal tiene una gráfica en forma de campana. Significa
que es más probable que los valores se agrupen alrededor de la media.
● Media y Mediana Iguales: La media y la mediana de una distribución normal son iguales y
están ubicadas en el centro de la campana.
2
I.F.D. N°7 TP de investigación - Cepeda C.
● Asíntota: Las colas de la distribución normal nunca tocan el eje x. En otras palabras, la
probabilidad de que una variable normal tome un valor extremadamente alto o
extremadamente bajo es baja pero no es igual a cero.
● Parámetros: La distribución normal está definida por dos parámetros.
Media Aritmética (μ)
○ En una distribución normal simétrica, la media coincide con el punto en el que la curva de
la distribución está dividida en dos partes iguales.
○ Representa el punto central o el valor promedio de los datos.
Desvío Estándar (σ)
○ Es la dispersión o la variabilidad de los datos alrededor de la media.
○ En una distribución normal, se cumple que el 68,26% de los datos caen
dentro de un desvío estándar de la media, el 95,45% caen dentro de dos
desvíos estándar, y el 99.73% caen dentro de tres desvíos estándar.
Ejemplo:
Se mide la altura de una población de adultos y se quiere modelar la distribución de alturas
utilizando una Distribución Normal. Se sabe que la media de altura en esta población es de 170
centímetros y la desviación estándar es de 10 centímetros.
• TÉCNICA: Para calcular la probabilidad de que un adulto aleatorio de la población estudiada tenga
altura entre 160-180 cm, se integra la función de densidad de probabilidad para ese
intervalo específico utilizando la fórmula de Distribución Normal:
<• RESULTADO: Hay una probabilidad de 68.3% aprox. de que un adulto aleatorio tenga una altura entre
160 cm y 180 cm en la población estudiada.
3
I.F.D. N°7 TP de investigación - Cepeda C.
La Distribución Normal Estándar, también conocida como “Distribución Z”, es una forma
específica de la distribución normal que cumple características especiales.
Si tenemos una variable aleatoria continua con distribución normal, en la que la media es 0 y
la desviación estándar es 1, es decir, μ = 0 y σ = 1, entonces la variable aleatoria X tiene distribución
normal estándar y se denota 𝑋 ∼ 𝑁(0, 1) que significa que “la variable aleatoria X sigue una
distribución normal con media 0 y desviación estándar 1”.
Características:
● Media y Desvío estándar: la media (μ) es 0, y el desvío estándar (σ) es 1.
● Simétrica: La distribución normal estándar es simétrica alrededor de la media.
● Forma de Campana: También tiene una gráfica en forma de campana.
Tabla Z:
Dado que esta distribución es ampliamente utilizada, se han construido tablas llamadas
"Tabla de distribución normal Z" que proporcionan valores críticos para el cálculo de probabilidades en
distribución normal estándar. Estas tablas representan las áreas bajo las curvas y, por lo tanto,
permiten determinar de manera rápida las probabilidades de que el valor de una variable aleatoria se
encuentre en un intervalo específico. Para realizar cálculos se utiliza esta tabla que permite
determinar la probabilidad de que una variable aleatoria con distribución normal estándar sea menor
que un valor dado 𝒛, es decir, 𝑃(𝑋 < 𝒛).
Si una variable normal X no es estándar, entonces sus valores deben ser estandarizados
mediante su transformación a Puntajes Z. Un puntaje Z se calcula como:
𝑋− μ
𝑍= σ
donde (μ) es la media y (σ) es el desvío estándar.
4
I.F.D. N°7 TP de investigación - Cepeda C.
Puntuación Z:
Es un método para unificar diferentes conjuntos de datos que se midieron con escalas
distintas a un lenguaje común, es decir, tomar una puntuación Z es asignar los datos en una
distribución cuya media sea 0 y desviación estándar sea 1.
El objetivo es permitir la comparación directa entre datos y ayudar a detectar valores atípicos.
Una vez que los datos están centrados y reajustados, cualquier valor que se aleje demasiado de cero
(umbral suele ser puntuación Z de 3 o -3) se considera un valor atípico. Si los datos siguen una
distribución normal, casi todos los datos (99,7%) estarán dentro de la media más o menos 3
desviaciones estándar, y cualquier valor fuera de este rango se considera una anomalía.
Referencias