Resumen Parcial Prob - Estadisc

RESUMEN DE PROBABILIDAD Y ESTADÍSTICA
CONCEPTOS BÁSICOS DE ESTADÍSTICA

DEFINICIÓN DE ESTADÍSTICA:
La estadística es una rama de las matemáticas que se encarga de recolectar, analizar,
interpretar, presentar y organizar datos. Se utiliza para tomar decisiones informadas
basadas en datos.
¿Qué es un experimento comparativo?
Es un diseño de estudio donde se comparan dos o más grupos sometidos a diferentes
tratamientos o condiciones para evaluar sus efectos. Un ejemplo de esto:Un estudio donde
se compara el efecto de dos medicamentos diferentes en la reducción de la presión arterial.
¿Qué es una encuesta por muestreo?
Es un método de recolección de datos en el que se selecciona una muestra representativa
de una población más grande para inferir conclusiones sobre la población total. Un ejemplo
de esto sería encuestar a 5000 personas en Santa Rosa sobre sus hábitos alimenticios para
ingerir los hábitos de toda la población de la ciudad.
¿Qué es un estudio observacional?
Es un tipo de investigación donde el investigador observa y recolecta datos sin intervenir ni
manipular las variables de interés. Un ejemplo de esto sería: Observar el comportamiento
de los clientes en una tienda sin intervenir en sus decisiones de compra.
División de la estadística.
La estadística se divide en dos grandes áreas: estadística descriptiva y estadística
inferencial.
Estadística Descriptiva: Se encarga de describir y resumir los datos mediante

gráficos, tablas y medidas descriptivas (como la media, mediana, moda).
Estadística Inferencial: Se utiliza para hacer generalizaciones, estimaciones,

predicciones y tomar decisiones sobre una población basándose en una muestra de
datos.
Inferencia estadística
Es el proceso de utilizar datos de una muestra para hacer generalizaciones o
estimaciones sobre una población. Involucra el uso de probabilidades para inferir
características de la población. Un ejemplo de esto : Estimar la media de estatura de
todos los estudiantes de una universidad basándose en una muestra de 100
estudiantes.
Teoría de decisión
Es una rama de la estadística que se enfoca en el proceso de tomar decisiones
óptimas bajo condiciones de incertidumbre. Involucra la evaluación de diferentes
alternativas y la elección de la mejor opción basándose en criterios predefinidos.
Un ejemplo de esto sería : Decidir cuánto inventario mantener en una tienda para
maximizar las ganancias y minimizar el riesgo de quedarse sin stock.
Población
Es el conjunto total de individuos u objetos de interés sobre los que se desea
obtener información.( Todos los estudiantes de una universidad).
1
Etapas de la recopilación de datos
1-Definición del problema y objetivos: Clarificar qué se quiere estudiar y por qué.
2-Diseño del estudio: Planificar cómo se recolectarán los datos (tipo de estudio,
métodos de muestreo, etc.).
3-Recolección de datos: Obtener los datos mediante encuestas, experimentos,
observación, etc.
4-Análisis de datos: Procesar y analizar los datos recolectados utilizando métodos
estadísticos.
5-Interpretación y presentación de resultados: Extraer conclusiones y comunicar
los hallazgos de manera comprensible.
Muestra aleatoria
Es una muestra obtenida de tal manera que cada miembro de la población tiene una
probabilidad conocida y no nula de ser seleccionado. Esto garantiza que la muestra
sea representativa de la población.
Un ejemplo de esto sería: Seleccionar al azar a 50 empleados de una empresa para
participar en una encuesta sobre satisfacción laboral.
Parámetros aleatorios
Son valores numéricos que resumen datos para una población completa, pero cuya
estimación se basa en una muestra. En el contexto de inferencia estadística, los
parámetros pueden ser variables aleatorias.
Un ejemplo de esto sería : La media de la altura de toda la población de una ciudad
es un parámetro, y su estimación a partir de una muestra de 200 personas es una
estimación puntual de ese parámetro.
Enfoque clásico
También conocido como enfoque frecuentista, este enfoque de la probabilidad y la
estadística se basa en la frecuencia o proporción de ocurrencia de eventos. Se
enfoca en la recolección de datos y su análisis sin tener en cuenta conocimientos
previos.
Un ejemplo de esto sería : Estimar la probabilidad de sacar un número par al lanzar
un dado basándose en la proporción de veces que se obtiene un número par en
muchos lanzamientos.
Enfoque Bayesiano.
Este enfoque de la probabilidad y la estadística incorpora información previa (a
priori) junto con la evidencia de los datos (a posteriori) para actualizar las
probabilidades y hacer inferencias.
Un ejemplo de esto sería : Si se sabe que históricamente el 60% de las personas

en una ciudad prefieren café sobre té, y se obtiene una nueva muestra de
preferencias, el enfoque bayesiano combinaría esta información previa con los
nuevos datos para hacer una inferencia actualizada sobre las preferencias de toda
la ciudad.
2
DESCRIPCIÓN DE DATOS
Datos agrupados y no agrupados
-DATOS AGRUPADOS: Son datos que se han organizado en grupos o intervalos.

Esto se hace para simplificar y resumir grandes conjuntos de datos. Un ejemplo de
esto es : Las edades de 100 personas agrupadas en intervalos como 0-10, 11-20,
21-30, etc.
-DATOS NO AGRUPADOS: Son datos presentados en su forma original sin ningún

tipo de agrupación. Son los datos tal como se recolectaron. Un ejemplo de esto es:
Las edades de 10 personas presentadas individualmente: 5, 8, 12, 15, 19, 23, 25,
30, 34, 40.
Frecuencia de clase
Es el número de observaciones en un conjunto de datos que caen dentro de un
intervalo específico o clase. Un ejemplo de esto: Si en un grupo de edades 0-10,
hay 15 personas, la frecuencia de clase para el intervalo 0-10 es 15.
Frecuencia relativa
Es la proporción o fracción del número total de observaciones que caen dentro de
una clase específica. Se calcula dividiendo la frecuencia de clase entre el total de
observaciones.
Ejemplo: si hay 100 personas y 15 están en el grupo de edades 0-10, la frecuencia

relativa para ese grupo es 15%.
Punto medio
Es el valor central de un intervalo de clase. Se calcula sumando el límite inferior y el
límite superior del intervalo y dividiéndolo por dos. Un ejemplo sería: Para el
intervalo de edades 0-10, el punto medio 5.
Límites
Son los valores que delimitan los intervalos de clase. Hay dos tipos: límites
inferiores y límites superiores.
● Límite Inferior: Es el menor valor que puede pertenecer a la clase.

● Límite Superior: Es el mayor valor que puede pertenecer a la clase.
Para el intervalo de edades 0-10, el límite inferior es 0 y el límite superior es 10.
Histograma
Es una representación gráfica de la distribución de datos agrupados en intervalos.
Se parece a un gráfico de barras, pero las barras están unidas, y cada barra
representa la frecuencia de un intervalo.
3
Histograma de frecuencia relativa
Es similar a un histograma, pero las alturas de las barras representan la frecuencia
relativa de cada intervalo en lugar de la frecuencia absoluta.
MEDIDAS DE TENDENCIA CENTRAL
Media aritmética, geométrica y ponderada

Media Aritmética: Es el promedio de un conjunto de números. Se calcula sumando
todos los valores y dividiéndolos entre la cantidad de valores.
Por Ejemplo: Si tus calificaciones en cinco exámenes son 80, 85, 90, 95 y 100, la
media aritmética es 450/5=90. Esto significa que tu calificación promedio es 90.
Media Geométrica: Es una forma de calcular el promedio que se usa cuando los
números están multiplicativamente relacionados, como en tasas de crecimiento.
Por Ejemplo: Si una inversión crece un 10% el primer año (1.10), decrece un 20% el
segundo año (0.80) y crece un 30% el tercer año (1.30), la media geométrica se
calcula como (1.10×0.80×1.30)= 1.144 a la raíz cúbica= 1.05.
Media Ponderada: Es un promedio en el que se da más importancia a algunos

valores. Se usa cuando diferentes valores tienen diferentes pesos.
Por ejemplo: si los valores son 2,3 y 5 con pesos de 1,2 y 3 respectivamente, la
media ponderada se calculadora con (2*1+3*2+5*3) / 1+2+3 =23/6 = 3.8
Mediana
Es el valor que divide un conjunto de datos ordenados en dos partes iguales. Si el
número de observaciones es impar, es el valor central. Si es par, es el promedio de
los dos valores centrales.
Por ejemplo: Para los números 1,3,3,6,7,8,9 la mediana es 6. Para los números
1,2,3,4,5,6 la mediana es 3+4/2= 3.5
Moda
Es el valor que más se repite en un conjunto de datos. Puede haber más de una
moda si varios valores tienen la misma frecuencia máxima, o puede no haber moda
si todos los valores son diferentes.
Por ejemplo:
moda: 1 , 2, 2, 3, 4, 4, 4, 5 en este conjunto de datos la moda es 4.
4
más de una moda:1, 2, 2, 2, 3, 4, 4, 4, 5, 6 en este conjunto las modas son 2 y 4,
son los que más se repiten.
Sin moda: 1, 2, 3, 4,5 ,6 ,7 , 8 en este conjunto no hay moda, no se repite ningún

número.
MEDIDAS DE DISPERSIÓN
Varianza
La varianza mide cuánta variabilidad hay en un conjunto de datos. Indica qué tan
lejos están los valores de la media (promedio). Cuanto mayor es la varianza, más
dispersos están los datos.
Ejemplo: piensa en un grupo de estudiantes en una clase. Si todos sacan

calificaciones muy similares, como 85, 86, 87, la varianza será baja porque las
calificaciones están cerca del promedio. Pero si algunos sacan 50 y otros 100, la
varianza será alta porque las calificaciones están muy dispersas.
Desviación Estándar
Es una medida que indica cuánto se alejan, en promedio, los valores de un conjunto
de datos de la media. Es la raíz cuadrada de la varianza y se expresa en las mismas
unidades que los datos originales.
Ejemplo de esto es que en un equipo de fútbol, si la mayoría de los jugadores tiene

una altura cercana a 175 cm, la desviación estándar será baja. Pero si hay
jugadores que miden 160 cm y otros 190 cm, la desviación estándar será alta,
indicando una mayor variabilidad en las alturas.
Desviación Media
Es el promedio de las diferencias absolutas entre cada valor y la media del conjunto
de datos. A diferencia de la varianza y la desviación estándar, se calcula usando
valores absolutos para evitar que las diferencias positivas y negativas se cancelen
entre sí.
Ejemplo: Si tienes un grupo de amigos y todos tienen edades cercanas, como 20,
21, 22 años, la desviación media será baja. Pero si las edades varían entre 18 y 29
años, la desviación media será más alta, indicando una mayor dispersión en las
edades.
Desviación Mediana
Es la mediana de las diferencias absolutas entre cada valor y la mediana del

conjunto de datos. Es una medida robusta de dispersión, menos afectada por
valores atípicos.
5
Ejemplo:Si estás midiendo el tiempo que tardan las personas en llegar al trabajo y
la mayoría tarda entre 20 y 30 minutos, la desviación mediana será baja. Pero si
algunos tardan 10 minutos y otros 50 minutos, la desviación mediana será más alta,
reflejando la variabilidad en los tiempos de viaje.
Rango
Es la diferencia entre el valor máximo y el valor mínimo en un conjunto de datos.

Mide la extensión total de los datos.
Ejemplo:Si estás organizando una fiesta y los invitados tienen edades entre 5 y 50
años, el rango de edades es 50 - 5 = 45 años. Esto muestra la amplitud de las
edades de los invitados.
PARÁMETROS PARA DATOS AGRUPADOS

Media para Datos Agrupados: Es el promedio de un conjunto de datos que se ha
organizado en intervalos o clases. Para calcularla, se usa el punto medio de cada
intervalo y la frecuencia de cada clase.
Imagina que trabajas en una empresa y has agrupado los salarios mensuales de
los empleados en intervalos:
● $1000 - $2000: 5 empleados

● $2001 - $3000: 10 empleados
● $3001 - $4000: 15 empleados
● $4001 - $5000: 5 empleados
Para encontrar la media, primero calculas el punto medio de cada intervalo:
● $1500 para $1000 - $2000

● $2500 para $2001 - $3000
● $3500 para $3001 - $4000
● $4500 para $4001 - $5000
Luego, multiplicas cada punto medio por la frecuencia correspondiente y sumas los
resultados:
● $1500 * 5 = $7500
● $2500 * 10 = $25000
● $3500 * 15 = $52500
● $4500 * 5 = $22500
Finalmente, dividir la suma total por el número total de empleados:
● Total = $7500 + $25000 + $52500 + $22500 = $107500

● Número total de empleados = 5 + 10 + 15 + 5 = 35
● Media = $107500 / 35 = $3071.43
Entonces, el salario promedio de los empleados es $3071.43.
Desviación Típica (Desviación Estándar) para Datos Agrupados
6
Mide la dispersión de los datos alrededor de la media en un conjunto de datos
agrupados. Para calcularla, se utiliza el punto medio de cada intervalo, la frecuencia
de cada clase y la media del conjunto de datos.
Siguiendo con el ejemplo de los salarios mensuales agrupados:
Primero, encuentras la media como en el ejemplo anterior ($3071.43).
Luego, calculas la diferencia al cuadrado entre cada punto medio y la media,

multiplicando por la frecuencia de cada clase:
● ($1500 - $3071.43)² * 5 = $12347.87 * 5 = $61739.35

● ($2500 - $3071.43)² * 10 = $327.55 * 10 = $3275.50
● ($3500 - $3071.43)² * 15 = $183.34 * 15 = $2750.10
● ($4500 - $3071.43)² * 5 = $20327.27 * 5 = $101636.35
Luego, sumamos estos valores:
● Total = $61739.35 + $3275.50 + $2750.10 + $101636.35 = $169401.30
Finalmente, divides por el número total de empleados y tomas la raíz cuadrada:
● Varianza = $169401.30 / 35 = $4840.04

● Desviación Típica = √$4840.04 = $69.57
Entonces, la desviación típica de los salarios es aproximadamente $69.57.
DISTRIBUCIÓN DE FRECUENCIAS
Distribuciones Numéricas
Son distribuciones de datos que consisten en valores numéricos. Se utiliza para

datos cuantitativos que pueden ser contados o medidos.
Supongamos que registramos las edades de los asistentes a una conferencia. Las
edades son: 25, 32, 29, 35, 31, 40, 28, 33. La distribución numérica de estas edades
muestra cuántas veces aparece cada edad.
Distribuciones Categóricas
Distribuciones Categóricas: Son distribuciones de datos que consisten en

categorías o grupos. Se utiliza para datos cualitativos que describen atributos o
cualidades.
Si realizas una encuesta a 50 personas sobre su color de automóvil preferido y

obtienes los siguientes resultados: 20 prefieren rojo, 15 prefieren azul, 10 prefieren
negro y 5 prefieren blanco. La distribución categórica muestra la cantidad de
personas que prefieren cada color.
7
Distribuciones Acumuladas
Muestran el número acumulado de observaciones que caen por debajo o en un

determinado valor. Se construye sumando las frecuencias de las clases anteriores y
la frecuencia de la clase actual.
Usando el ejemplo de las edades de los asistentes a la conferencia (25, 32, 29, 35,
31, 40, 28, 33), si las agrupamos en intervalos:
● 20-25: 1 persona
● 26-30: 3 personas
● 31-35: 3 personas
● 36-40: 1 persona
La distribución acumulada sería:
● 20-25: 1
● 26-30: 1 + 3 = 4
● 31-35: 4 + 3 = 7
● 36-40: 7 + 1 = 8
Distribuciones Porcentuales
Muestran la proporción o porcentaje de observaciones que caen en cada categoría

o intervalo en relación con el total de observaciones.
Si en una clase hay 20 estudiantes y las calificaciones se distribuyen así: 4

obtuvieron "A", 8 obtuvieron "B", 6 obtuvieron "C" y 2 obtuvieron "D". La distribución
porcentual es:
Distribuciones Porcentuales Acumuladas
Muestran el porcentaje acumulado de observaciones que caen por debajo o en un

determinado valor. Se construye sumando los porcentajes de las clases anteriores y
el porcentaje de la clase actual.
Utilizando el ejemplo de las calificaciones:
● "A": 20%
● "B": 20% + 40% = 60%
● "C": 60% + 30% = 90%
● "D": 90% + 10% = 100%
8
La distribución porcentual acumulada muestra el porcentaje acumulado de
estudiantes que obtuvieron calificaciones de "A", "B", "C" y "D".
TECNICAS DE AGRUPACION DE DATOS
Límites de Clase
Son los valores que marcan el inicio y el final de cada intervalo en una distribución
de datos agrupados. Se dividen en límites inferiores y superiores.
Ejemplo: Si estás agrupando edades en intervalos de 10 años, un intervalo puede

ser de 20 a 29 años. En este caso, el límite inferior es 20 y el límite superior es 29.
Rango de Clase
Es la diferencia entre el límite superior y el límite inferior de un intervalo de clase.
Ejemplo: Para el intervalo de edades de 20 a 29 años, el rango de clase es

29−20=9.
Fronteras de Clase
Son los puntos que marcan las divisiones exactas entre clases adyacentes. Se
calculan promediando los límites superiores de una clase y los límites inferiores de
la clase siguiente.
Ejemplo: Si tienes un intervalo de 20 a 29 años y el siguiente es de 30 a 39 años, la

frontera de clase entre estos dos intervalos es 29+30/2=29.5
Marca de Clase
Es el punto medio de un intervalo de clase. Se calcula promediando el límite inferior

y el límite superior de la clase.
Ejemplo: Para el intervalo de edades de 20 a 29 años, la marca de clase es

20+29/2=24.5
Intervalo de Clase
Es el ancho o tamaño del intervalo de clase. Se refiere a la amplitud de cada clase

en una distribución de frecuencias.
Ejemplo: Si los intervalos de edades son de 9 años (por ejemplo, 0-9, 10-19,
20-29), entonces el intervalo de clase es 10.
9
Diagrama de Tallos y Hojas
Es una técnica de agrupación de datos que organiza datos numéricos en tallos (los
primeros dígitos) y hojas (los últimos dígitos). Es útil para mostrar la distribución de
datos y sus formas.
Ejemplo: Si tienes las calificaciones de un examen: 75, 78, 82, 84, 90, 91, puedes
organizar un diagrama de tallos y hojas así:
7 | 5, 8
8 | 2, 4
9 | 0, 1
Esto significa que hay calificaciones en los 70s (75, 78), en los 80s (82, 84) y en los
90s (90, 91).
Diagrama de Pareto
Es un gráfico de barras que muestra las frecuencias o valores de diferentes

categorías en orden descendente. Suele incluir una línea de frecuencia acumulada.
Se utiliza para identificar las categorías más importantes.
Ejemplo: Si estás analizando las quejas de clientes en una tienda y las causas son:
"Producto defectuoso", "Entrega tardía", "Atención al cliente", y "Otros", con
frecuencias de 40, 30, 20 y 10 respectivamente, el diagrama de Pareto mostrará las
barras en orden de frecuencia (de mayor a menor), con "Producto defectuoso"
primero.
10
Diagrama de Puntos
Es una representación gráfica donde cada dato se representa como un punto sobre
una línea. Se usa para mostrar la distribución de datos numéricos y es útil para
identificar patrones o clusters.
Ejemplo: Si registras las alturas de estudiantes: 160, 165, 170, 170, 175, 180,
puedes hacer un diagrama de puntos en una línea horizontal, colocando un punto
en cada altura registrada. Si hay alturas repetidas, colocas puntos adicionales
encima de los primeros:
160 165 170 175 180
* * * * *
HISTOGRAMAS
Diagrama de Barras
Es una representación gráfica de datos en la que cada categoría o intervalo se

representa con una barra cuya altura corresponde a la frecuencia o el valor de la
categoría. Se utiliza principalmente para datos categóricos.
Ejemplo: Si encuestas a un grupo de personas sobre su color favorito y obtienes los

siguientes resultados: rojo (10 personas), azul (15 personas), verde (5 personas),
amarillo (8 personas), puedes hacer un diagrama de barras así:
Rojo | ██████████
11
Azul | ███████████████
Verde | █████
Amarillo | ████████
Polígono de Frecuencias
Es una línea que conecta los puntos centrales de las partes superiores de las barras
de un histograma. Se utiliza para mostrar la forma de la distribución de un conjunto
de datos.
Ejemplo: Si tienes las siguientes frecuencias de edades en intervalos: 10-19 (5

personas), 20-29 (15 personas), 30-39 (20 personas), 40-49 (10 personas), puedes
crear un polígono de frecuencias uniendo los puntos:
Edad Frecuencia
10-19 5
20-29 15
30-39 20
40-49 10
Ojivas
También conocidas como curvas de frecuencia acumulada, son gráficos que

muestran la acumulación de frecuencias a lo largo de los intervalos de clase. Se
utilizan para mostrar cuántas observaciones están por debajo de un cierto valor.
Ejemplo: Siguiendo con el ejemplo anterior de edades:
Edad Frecuencia Frecuencia Acumulada
10-19 5 5
20-29 15 20
30-39 20 40
40-49 10 50
12
Gráficas Circulares: También conocidas como gráficos de pastel, son diagramas
en los que cada sector representa una parte proporcional del total de una categoría
o grupo. Se utilizan para mostrar proporciones relativas de un conjunto de datos.
Ejemplo: Si tienes un presupuesto y lo divides en categorías como alimentación
(30%), transporte (20%), entretenimiento (10%), y ahorros (40%), puedes
representar estos datos en una gráfica circular:
TIPOS DE DISTRIBUCIONES MUESTRALES
Distribución Muestral de la Media con Varianza Conocida
Distribución Muestral de la Media con Varianza Conocida: Es la distribución de

las medias de todas las posibles muestras de un tamaño específico extraídas de
una población con una varianza conocida. Si la población es normal, la distribución
muestral de la media es también normal.
Ejemplo: Imagina que conoces la varianza de las puntuaciones de un examen en

una escuela, que es 25. Tomas varias muestras de tamaño 30 de esta población de
estudiantes y calculas la media de cada muestra. La distribución de estas medias
muestrales formará la distribución muestral de la media.
Distribución Muestral de Diferencia de Medias
Distribución Muestral de Diferencia de Medias: Es la distribución de las

diferencias entre las medias de todas las posibles pares de muestras de dos
poblaciones. Se utiliza para comparar las medias de dos grupos distintos.
Ejemplo: Supongamos que quieres comparar las alturas medias de hombres y

mujeres en una ciudad. Tomas varias muestras de hombres y mujeres, calculas la
media de cada muestra y luego encuentras las diferencias entre las medias de los
pares de muestras. La distribución de estas diferencias formará la distribución
muestral de diferencia de medias.
Distribución Muestral de Proporción
13
Distribución Muestral de Proporción: Es la distribución de las proporciones de
éxito de todas las posibles muestras de un tamaño específico extraídas de una
población. Se utiliza para inferir sobre la proporción poblacional.
Ejemplo: Si quieres saber qué proporción de estudiantes en una universidad

aprueba un examen, tomas varias muestras de estudiantes, calculas la proporción
de aprobados en cada muestra, y la distribución de estas proporciones muestrales
formará la distribución muestral de proporción.
Distribución Muestral de Diferencia de Proporciones
Distribución Muestral de Diferencia de Proporciones: Es la distribución de las

diferencias entre las proporciones de éxito de todas las posibles pares de muestras
de dos poblaciones. Se utiliza para comparar las proporciones de éxito entre dos
grupos.
Ejemplo: Si comparas la proporción de hombres y mujeres que aprueban un

examen en una universidad, tomas varias muestras de cada grupo, calculas la
proporción de aprobados en cada muestra y luego encuentras las diferencias entre
las proporciones de los pares de muestras. La distribución de estas diferencias
formará la distribución muestral de diferencia de proporciones.
Distribución Muestral de Varianza
Distribución Muestral de Varianza: Es la distribución de las varianzas de todas las

posibles muestras de un tamaño específico extraídas de una población. Se utiliza
para inferir sobre la varianza poblacional.
Ejemplo: Si estás interesado en la variabilidad de las calificaciones de un examen

en una escuela, tomas varias muestras de estudiantes, calculas la varianza de cada
muestra, y la distribución de estas varianzas muestrales formará la distribución
muestral de varianza.
Distribución Muestral de Razón de Varianza
Distribución Muestral de Razón de Varianza: Es la distribución de las razones

(cocientes) de las varianzas de todas las posibles pares de muestras de dos
poblaciones. Se utiliza para comparar la variabilidad entre dos grupos.
Ejemplo: Si quieres comparar la variabilidad de las calificaciones de exámenes

entre dos clases diferentes, tomas varias muestras de cada clase, calculas la
varianza de cada muestra y luego encuentras las razones de las varianzas de los
pares de muestras. La distribución de estas razones formará la distribución muestral
de razón de varianza.
14
15

Resumen Parcial Prob - Estadisc

Cargado por

Copyright:

Formatos disponibles

Resumen Parcial Prob - Estadisc

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Resumen Parcial Prob - Estadisc

Cargado por

Copyright:

Formatos disponibles

RESUMEN DE PROBABILIDAD Y ESTADÍSTICA

CONCEPTOS BÁSICOS DE ESTADÍSTICA

Estadística Descriptiva: Se encarga de describir y resumir los datos mediante

Estadística Inferencial: Se utiliza para hacer generalizaciones, estimaciones,

Un ejemplo de esto sería : Si se sabe que históricamente el 60% de las personas

Datos agrupados y no agrupados

-DATOS AGRUPADOS: Son datos que se han organizado en grupos o intervalos.

-DATOS NO AGRUPADOS: Son datos presentados en su forma original sin ningún

Ejemplo: si hay 100 personas y 15 están en el grupo de edades 0-10, la frecuencia

● Límite Inferior: Es el menor valor que puede pertenecer a la clase.

Para el intervalo de edades 0-10, el límite inferior es 0 y el límite superior es 10.

MEDIDAS DE TENDENCIA CENTRAL

Media aritmética, geométrica y ponderada

Media Ponderada: Es un promedio en el que se da más importancia a algunos

moda: 1 , 2, 2, 3, 4, 4, 4, 5 en este conjunto de datos la moda es 4.

Sin moda: 1, 2, 3, 4,5 ,6 ,7 , 8 en este conjunto no hay moda, no se repite ningún

Ejemplo: piensa en un grupo de estudiantes en una clase. Si todos sacan

Ejemplo de esto es que en un equipo de fútbol, si la mayoría de los jugadores tiene

Es la mediana de las diferencias absolutas entre cada valor y la mediana del

Es la diferencia entre el valor máximo y el valor mínimo en un conjunto de datos.

PARÁMETROS PARA DATOS AGRUPADOS

● $1000 - $2000: 5 empleados

Para encontrar la media, primero calculas el punto medio de cada intervalo:

● $1500 para $1000 - $2000

Finalmente, dividir la suma total por el número total de empleados:

● Total = $7500 + $25000 + $52500 + $22500 = $107500

Entonces, el salario promedio de los empleados es $3071.43.

Desviación Típica (Desviación Estándar) para Datos Agrupados

Siguiendo con el ejemplo de los salarios mensuales agrupados:

Primero, encuentras la media como en el ejemplo anterior ($3071.43).

Luego, calculas la diferencia al cuadrado entre cada punto medio y la media,

● ($1500 - $3071.43)² * 5 = $12347.87 * 5 = $61739.35

Luego, sumamos estos valores:

● Total = $61739.35 + $3275.50 + $2750.10 + $101636.35 = $169401.30

Finalmente, divides por el número total de empleados y tomas la raíz cuadrada:

● Varianza = $169401.30 / 35 = $4840.04

Entonces, la desviación típica de los salarios es aproximadamente $69.57.

Son distribuciones de datos que consisten en valores numéricos. Se utiliza para

Distribuciones Categóricas: Son distribuciones de datos que consisten en

Si realizas una encuesta a 50 personas sobre su color de automóvil preferido y

Muestran el número acumulado de observaciones que caen por debajo o en un

La distribución acumulada sería:

Muestran la proporción o porcentaje de observaciones que caen en cada categoría

Si en una clase hay 20 estudiantes y las calificaciones se distribuyen así: 4

Distribuciones Porcentuales Acumuladas

Muestran el porcentaje acumulado de observaciones que caen por debajo o en un

Utilizando el ejemplo de las calificaciones:

TECNICAS DE AGRUPACION DE DATOS

Ejemplo: Si estás agrupando edades en intervalos de 10 años, un intervalo puede

Es la diferencia entre el límite superior y el límite inferior de un intervalo de clase.

Ejemplo: Para el intervalo de edades de 20 a 29 años, el rango de clase es

Ejemplo: Si tienes un intervalo de 20 a 29 años y el siguiente es de 30 a 39 años, la

Es el punto medio de un intervalo de clase. Se calcula promediando el límite inferior

Ejemplo: Para el intervalo de edades de 20 a 29 años, la marca de clase es

Es el ancho o tamaño del intervalo de clase. Se refiere a la amplitud de cada clase

Es un gráfico de barras que muestra las frecuencias o valores de diferentes

160 165 170 175 180

Es una representación gráfica de datos en la que cada categoría o intervalo se

Ejemplo: Si encuestas a un grupo de personas sobre su color favorito y obtienes los