Tarea 1-PROB - 2006845

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 16

UNIVERSIDAD AUTONOMA DE NUEVO LEON

FACULTAD DE INGENIERIA MECANICA Y ELECTRICA

PROBABILIDAD Y ESTADÍSTICA

Agosto – Diciembre 2023

M.A. MARTÍN LUNA LÁZARO

TAREA #1
“Definiciones, formulas, teoremas,
descripción, gráficos etc.”

Nombre del Alumno: Sergio Emmanuel Medellin De Lira


Matricula: 2006845
Carrera: Ingeniero Mecánico Administrador (IMA)
Grupo: 023
Hora: M4 a M6
Tarea definiciones, formulas, teoremas, descripción, gráficos etc.: de las sig.
Definiciones
Estadística descriptiva: Es un conjunto de técnicas numéricas y gráficas para
describir y analizar un grupo de datos, sin extraer conclusiones (inferencias) sobre
la población a la que pertenecen, (por ejemplo, edad de una población, altura de
los estudiantes de una escuela, temperatura en los meses de verano, etc.)
Diagrama de tallo y hojas: Se trata de la
organización de datos numéricos según
categoría. Este diagrama suele ser confundido
con histogramas; sin embargo, la diferencia entre
ambas radica en la cantidad de información que
aporta cada una, siendo el diagrama de tallo y
hoja la de mayor aportación.
a) Tallo: este representa la columna izquierda y
lleva los dígitos de la posición más grande.
b) Hoja: esta se trata de la columna opuesta, la
derecha, y llevará los dígitos menores.

Rango: Es un valor numérico que sirve para manifestar la


diferencia entre el valor máximo y el valor mínimo de una muestra poblacional en
Estadística. A través del rango se puede observar la dispersión total en una
muestra en concreto.
Para calcular el rango se ha de utilizar la siguiente fórmula: R = Máxx – Mínx
Donde:
R es el rango.
Máx es el valor máximo, el dato más alto, de la muestra concreta.
Mín es el valor mínimo, el dato más bajo, de la muestra concreta.
X es la variable sobre la que se pretende calcular el rango.

Número de clase: Se trata de los intervalos en los que se agrupan y ordenan los
valores observados en el que cada uno de estos valores está delimitado por dos
valores extremos llamados límites.
Regla de Sturges
K = 1 + 3,3 . log N
Anchura del intervalo: El tamaño o anchura de un intervalo de clase es la
diferencia entre los límites reales de clase que lo forman y se conoce como
anchura de clase, tamaño de clase o longitud de clase. Si todos los intervalos de
clase de una distribución de frecuencias tienen igual anchura, esta anchura común
se representa por c.
Tabla de frecuencia: La tabla de frecuencias (o distribución de frecuencias) es
una tabla que muestra la distribución de los datos mediante sus frecuencias. Se
utiliza para variables cuantitativas o cualitativas ordinales,

¿Cómo funciona la tabla de frecuencia?


La tabla de frecuencias es una tabla donde los datos estadísticos aparecen bien
organizados, distribuidos según su frecuencia, es decir, según las veces que se
repite en la muestra. En esta tabla se representan los diferentes tipos de
frecuencias, ordenados en columnas.
Frecuencia relativa: Se utiliza para expresar la proporción o el porcentaje de
veces que ocurre un evento o valor en relación con el número total de
observaciones o eventos en un conjunto de datos. Se calcula dividiendo el número
de veces que ocurre un evento específico (o un valor) entre el número total de
observaciones en el conjunto de datos.
Formula (fi): fi = ni/N, resultado de dividir la frecuencia absoluta entre el total de la
población. Da el tanto por uno.
(en datos agrupados y no agrupados) Media, moda, mediana: La media, la
mediana y la moda son las tres medidas de tendencia central más usadas para
poblaciones que no cuentan con demasiados datos, es decir, que no necesitan
agruparse. Al hablar de medidas de tendencia central, nos referimos a medidas
estadísticas que pretenden resumir en un único valor a un conjunto de valores. La
media, mediana y moda se expresan en la misma unidad que los datos originales.
Cómo sacar la Media
Para obtener la Media de un conjunto solo tienes que seguir estos sencillos pasos:
1. Determina el conjunto de valores que buscas promediar.
2. Suma los valores para obtener el total
3. Haz el conteo de la cantidad de valores en el conjunto.
4. Divide la suma del conjunto entre la cantidad de números.
Como sacar la Mediana
Los pasos para sacar la mediana son:
1. Ordena todos los números del más pequeño al más grande.
2. Encuentra el número del medio del conjunto.
• Si tienes una cantidad impar: Tacha el número al final de la izquierda,
después el primero a la derecha, y repite el proceso hasta quedarte con un
número, que será la mediana.
• Si tienes una cantidad par, al final quedarás con dos números en el centro.
Súmalos y divídelos entre 2 para obtener la mediana.
Como sacar la Moda
Los pasos para obtener la moda de un conjunto son:
• Escribe todos los números del conjunto.
• Encuentra el número o los números (en los casos bimodales o
multimodales) que aparezcan más veces.
(en datos agrupados y no agrupados) Desviación estándar; como muestra y
población:
La desviación estándar es una medida de dispersión que se utiliza para cuantificar
la variabilidad o la dispersión de un conjunto de datos. Puede calcularse tanto para
una muestra como para una población, y existen fórmulas ligeramente diferentes
según si estás trabajando con una muestra o con toda la población.
Desviación Estándar de una Muestra:
Cuando estás trabajando con una muestra de datos (un subconjunto de la
población), la fórmula para calcular la desviación estándar muestral es la
siguiente:

∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2
𝑠=√
𝑛−1

Donde:
- 𝑠 es la desviación estándar muestral.
- 𝑛 es el número de observaciones en la muestra.
- 𝑥𝑖 son los valores individuales en la muestra.
- 𝑥̅ es la media (promedio) de la muestra, calculada
La diferencia clave en la fórmula para la desviación estándar de una muestra es
que el divisor es 𝑛 − 1 en lugar de 𝑛. Esto se debe a que estamos estimando la
desviación estándar de la población basada en una muestra y utilizamos 𝑛 − 1 en
el denominador para corregir el sesgo muestral.

Desviación Estándar de una Población:


Cuando tienes acceso a todos los datos de la población, la fórmula para calcular la
desviación estándar poblacional es más simple:

∑𝑁
𝑖=1(𝑥𝑖 − 𝜇)
2
𝜎=√
𝑁

Donde:
- 𝜎 es la desviación estándar poblacional.
- N es el número total de observaciones en la población.
- 𝑥𝑖 son los valores individuales en la población.
∑𝑁
𝑖=1 𝑥𝑖
- μ es la media (promedio) de la población, calculada como 𝜇 = 𝑁

La diferencia principal aquí es que el divisor es N, ya que se utiliza para calcular la


desviación estándar de toda la población.
Varianza: La varianza es una medida de dispersión que representa la variabilidad
de una serie de datos respecto a su media. Formalmente se calcula como la suma
de los residuos al cuadrado divididos entre el total de observaciones. También se
∑𝑁 ̅ )2
1 (𝑥𝑖 −𝑋
puede calcular como la desviación típica al cuadrado. 𝜎2= 𝑁

Asimetría: La asimetría, también conocida como sesgo o skewness en inglés, es


una medida estadística que describe la distribución de probabilidad de un conjunto
de datos. Mide la falta de simetría en la distribución de datos alrededor de su
media. En otras palabras, indica si una distribución es más sesgada hacia la
derecha (positiva), más sesgada hacia la izquierda (negativa) o si es
aproximadamente simétrica.
Hay tres tipos principales de asimetría:
1. Asimetría positiva (derecha): Ocurre cuando la cola derecha (lado
positivo) de la distribución es más larga o pesada que la cola izquierda.
Esto significa que hay valores atípicos o extremos en el lado derecho de la
distribución, y la mayoría de los datos se concentran en valores más bajos.
La cola derecha se estira hacia valores mayores.
2. Asimetría negativa (izquierda): Ocurre cuando la cola izquierda (lado
negativo) de la distribución es más larga o pesada que la cola derecha. En
este caso, hay valores atípicos o extremos en el lado izquierdo de la
distribución, y la mayoría de los datos se concentran en valores más altos.
La cola izquierda se estira hacia valores menores.
3. Asimetría cero (simetría): Ocurre cuando la distribución es simétrica, lo
que significa que es igualmente probable que los valores estén por encima
o por debajo de la media, y no hay una cola más larga en un lado que en el
otro.
Para calcular la asimetría en una muestra de datos, se utiliza una fórmula que
involucra la media, la mediana y la desviación estándar. La fórmula más
comúnmente utilizada es la fórmula de Pearson para la asimetría:
3(𝑀𝑒𝑑𝑖𝑎 − 𝑀𝑒𝑑𝑖𝑎𝑛𝑎)
𝐴𝑠𝑖𝑚𝑒𝑡𝑟í𝑎 =
𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝐸𝑠𝑡á𝑛𝑑𝑎𝑟
- Si la asimetría es mayor que 0, la distribución es positivamente asimétrica.
- Si la asimetría es menor que 0, la distribución es negativamente asimétrica.
- Si la asimetría es igual a 0, la distribución es simétrica.

Histograma de frecuencia: Un histograma es una representación gráfica de la


distribución de un conjunto de datos numéricos. Se utiliza comúnmente en
estadísticas para visualizar la frecuencia con la que ocurren ciertos valores en un
conjunto de datos y para examinar la forma de la distribución de esos valores.

Aquí hay algunos conceptos clave relacionados con los histogramas:


• Barras: Un histograma consiste en un conjunto de barras verticales que
representan intervalos o clases de valores. Cada barra representa la
frecuencia o el recuento de valores dentro de ese intervalo.
• Eje X: El eje horizontal (eje X) generalmente representa las categorías o
intervalos de valores. Estos intervalos se llaman "bins" o "clases" y dividen
el rango total de valores en segmentos más pequeños.
• Eje Y: El eje vertical (eje Y) muestra la frecuencia o la densidad de
ocurrencia de los valores en cada intervalo. Puede representar el número
de observaciones en cada intervalo o la densidad de probabilidad,
dependiendo de cómo se normalice el histograma.
• Ancho de las barras: El ancho de las barras en el histograma puede
variar, pero es importante seleccionar un ancho apropiado para que el
histograma refleje adecuadamente la distribución de los datos. Si las barras
son demasiado anchas, se pueden perder detalles importantes; si son
demasiado estrechas, el histograma puede volverse difícil de interpretar.
• Forma de la distribución: La forma general de las barras en el histograma
revela información sobre la distribución de los datos. Pueden tomar
diversas formas, como simétrica, sesgada hacia la derecha, sesgada hacia
la izquierda, bimodal, etc.
Los histogramas son especialmente útiles para identificar patrones en datos
numéricos, como la concentración de valores alrededor de ciertos rangos, la
presencia de valores atípicos y la simetría o asimetría de la distribución.
Para crear un histograma, generalmente se siguen estos pasos:
1. Seleccionar los intervalos (bins) en los que se dividirán los datos.
2. Contar cuántas observaciones caen en cada intervalo (frecuencia).
3. Dibujar las barras del histograma, donde la altura de cada barra representa
la frecuencia de observaciones en ese intervalo.
Diagrama de pastel: Un "diagrama de pastel", también conocido como "gráfico
circular" o "gráfico de sectores", es una representación gráfica que se utiliza para
mostrar la proporción de partes individuales en relación con el todo. Se basa en un
círculo que representa la totalidad de un conjunto de datos y divide este círculo en
sectores o porciones, donde cada sector representa una categoría o componente
específico del conjunto de datos.

Polígono de frecuencia relativa: Un polígono de frecuencia relativa es una


representación gráfica utilizada en estadísticas para mostrar la distribución de
frecuencias relativas de un conjunto de datos. Mientras que un histograma
representa la frecuencia absoluta (el número de observaciones) en cada intervalo
o categoría, un polígono de frecuencia relativa muestra la frecuencia relativa (la
proporción o porcentaje) de observaciones en cada intervalo o categoría en

relación con el total de observaciones.

Curtosis: La curtosis es una medida estadística que se utiliza para describir la


forma de la distribución de datos en un conjunto de datos. En esencia, la curtosis
evalúa cuán "picuda" o "aplanada" es la distribución de datos en comparación con
una distribución normal (también conocida como distribución gaussiana o en forma
de campana).
Hay dos términos principales que se utilizan para describir la curtosis de una
distribución:
1. Leptocúrtica: Una distribución leptocúrtica es aquella que es más
puntiaguda (más concentrada alrededor de la media) que una distribución
normal. En una distribución leptocúrtica, hay valores que se alejan más de
la media, lo que resulta en colas más gruesas y una concentración mayor
en el centro.
2. Platicúrtica: Una distribución platicúrtica es aquella que es más aplanada
(menos concentrada alrededor de la media) que una distribución normal. En
una distribución platicúrtica, los valores tienden a estar más cerca de la
media, lo que resulta en colas más delgadas y una concentración menor en

el centro.
La curtosis se calcula mediante una fórmula específica que implica los momentos
estadísticos de la distribución de datos. Es importante destacar que la curtosis es
una medida relativa, lo que significa que se compara con la forma de una
distribución normal. Una distribución normal tiene una curtosis de 3, por lo que
cualquier valor de curtosis superior a 3 se considera leptocúrtica y cualquier valor
de curtosis inferior a 3 se considera platicúrtica.
Probabilidad: Es una medida numérica que se utiliza en matemáticas y
estadísticas para cuantificar la incertidumbre o el grado de certeza asociado a un
evento futuro. En términos más simples, la probabilidad es una manera de
expresar cuán probable es que ocurra un evento específico. Se expresa como un
número entre 0 y 1, donde:
• 0 significa que el evento es imposible y no ocurrirá.
• 1 significa que el evento es seguro y ocurrirá con certeza.
Los valores entre 0 y 1 indican grados de probabilidad, siendo 0.5 (o 50%) una
probabilidad igual de ocurrencia y valores más cercanos a 0 más improbables y
valores más cercanos a 1 más probables.
Intervalo de confianza: Un intervalo de confianza es un rango de valores que se
utiliza en estadísticas para proporcionar una estimación de un parámetro
desconocido de una población a partir de una muestra de datos. Este rango de
valores se construye de manera que se tenga un cierto nivel de confianza de que

el parámetro poblacional se encuentra dentro de ese intervalo.

Ojiva: Conocida como gráfico de frecuencia acumulativa o curva de frecuencia


acumulada, es una representación gráfica utilizada en estadísticas para mostrar
cómo se acumulan las frecuencias o porcentajes acumulados en un conjunto de
datos. La ojiva es una curva ascendente que se forma al conectar los puntos que

representan la acumulación de frecuencias en función de los valores de los datos.

Población: En el contexto de la estadística y las ciencias sociales, el término


"población" se refiere a un grupo completo de individuos, elementos, objetos o
eventos que comparten una característica común o son objeto de estudio. Esta
característica común puede ser cualquier cosa, como la edad, el género, la
ubicación geográfica, la especie de un organismo, el comportamiento humano, el
rendimiento de una máquina, entre otros.
Muestra: En estadísticas, una "muestra" se refiere a un subconjunto
representativo de una población más amplia que se selecciona con el propósito de
realizar análisis y estimaciones sobre la población completa. La muestra se elige
cuidadosamente para que refleje las características y la variabilidad de la
población de interés de manera precisa y objetiva.

Simbología utilizada en probabilidad y estadística

Nombre del Significado /


Símbolo Ejemplo
símbolo definición

función de probabilidad del


P(A) probabilidad evento A
P ( A ) = 0,5

probabilidad de
probabilidad de que
P(A∩B) intersección de
de los eventos A y B
P ( A ∩ B ) = 0.5
eventos

probabilidad de
probabilidad de que
P(A∪B) unión de
de los eventos A o B
P ( A ∪ B ) = 0.5
eventos

función de probabilidad de que


P(A|B) probabilidad ocurra un evento P ( A | B ) = 0,3
condicional determinado B

función de
densidad de P(a≤x≤b)=∫
f(x) probabilidad f ( x ) dx
(pdf)

función de
distribución
F(x) acumulativa
F(x)=P(X≤x)
(cdf)

media media de los valores


μ poblacional de la población
μ = 10

valor esperado de la
E(X) valor esperado
variable aleatoria X
E ( X ) = 10

valor esperado de la
expectativa
E(X|Y) condicional
variable aleatoria X E(X|Y=2)=5
dado Y

varianza de la
var ( X ) diferencia
variable aleatoria X
var ( X ) = 4
Nombre del Significado /
Símbolo Ejemplo
símbolo definición

varianza de los
σ 2 diferencia valores de la σ2=4
población

desviación estándar
Desviación
estándar ( X ) Estándar
de la variable estándar ( X ) = 2
aleatoria X

valor de desviación
Desviación
σX Estándar
estándar de la σX=2
variable aleatoria X

valor medio de la
mediana
variable aleatoria x

covarianza de
cov ( X , Y ) covarianza variables aleatorias X cov ( X, Y ) = 4
eY

correlación de
corr ( X , Y ) correlación variables aleatorias X corr ( X, Y ) = 0,6
eY

correlación de
ρ X,Y correlación variables aleatorias X ρ X , Y = 0,6
eY

sumatoria: suma de
∑ suma todos los valores en
el rango de la serie

∑∑ doble suma doble suma

valor que ocurre con


Mo modo mayor frecuencia en
la población

MR =
MR rango medio
( x máx. + X mín. ) / 2
Nombre del Significado /
Símbolo Ejemplo
símbolo definición

la mitad de la
mediana de la
Md muestra
población está por
debajo de este valor

25% de la población
inferior / primer
Q1 cuartil
está por debajo de
este valor

50% de la población
mediana / está por debajo de
Q2 segundo cuartil este valor = mediana
de muestras

75% de la población
superior / tercer
Q3 cuartil
está por debajo de
este valor

muestra media / media


x promedio aritmética
x = (2 + 5 + 9) / 3 = 5.333

estimador de
varianza de la
s 2
muestra
varianza de muestras s2=4
de población

estimador de
desviación
desviación estándar
s estándar de la
de muestras de
s=2
muestra
población

puntuación
zx estándar
zx=(x-x)/sx

distribución de distribución de la
X~ X variable aleatoria X
X ~ N (0,3)

distribución distribución
N(μ,σ2) normal gaussiana
X ~ N (0,3)

distribución igual probabilidad en


U(a,b) uniforme el rango a, b
X ~ U (0,3)

distribución f(x)=
exp (λ) exponencial λe - λx , x ≥0
Nombre del Significado /
Símbolo Ejemplo
símbolo definición

distribución f ( x ) = λ cx c-
gamma ( c , λ) gamma 1 - λx
e / Γ ( c ), x ≥0
k / 2-1 -x/
distribución chi- f ( x ) = x e
χ (k)
2
cuadrado 2
/ (2 k / 2 Γ ( k / 2))

F(k1,k2) Distribución F

Distribución f ( k ) = n C k p k (1 -
Bin ( n , p ) binomial p ) nk
distribución de
Poisson (λ) veneno
f ( k ) = λ k e -λ / k !

distribución
Geom ( p ) geométrica
f ( k ) = p (1 -p ) k

distribución
HG ( N , K , n ) hipergeométrica

Distribución de
Berna ( p ) Bernoulli

Símbolos combinatorios

Símbolo Nombre del símbolo Significado / definición Ejemplo

n! factorial n ! = 1⋅2⋅3⋅ ... ⋅ n 5! = 1⋅2⋅3⋅4⋅5 = 120

n Pk permutación 5P 3= 5! / (5-3)! = 60

n Ck
combinación 5C 3= 5! / [3! (5-3)!] = 10
Bibliografía
• Diagramas de Tallos y Hojas. (2021). CK-12. Recuperado de:
https://flexbooks.ck12.org/cbook/ck-12-conceptos-de-%C3%A1lgebra-
nivelb%C3%A1sico-
enespa%C3%B1ol/section/11.10/primary/lesson/diagramas-de-tallos-
yhojas-%3A%3Aof%3A%3A-diagramas-de-tallos-yhojas-
%3A%3Aof%3A%3A-ck-12-conceptos-b%C3%A1sicosde-%C3%A1lgebra-
bsc-alg-spn/
• Zapata, F. (2020). ¿Qué es el rango en estadística? (Con ejemplos). Lifeder.
Recuperado de: https://www.lifeder.com/rango-estadistica/
• Estadística Descriptiva. (2015). UAA. Recuperado de:
https://www.uaa.mx/centros/cem/dmf/wp-
content/uploads/2015/apuntes/4.%20Estadistica%20y%20Principios%20de
%20Probabilidad/Apuntes%20Estadistica.pdf
• Cabral, A., Cimé, F., Cob, R. & Zapata, E. (2020). Probabilidad y
Estadística. CECyTEC. Recuperado de:
https://www.cecytcampeche.edu.mx/BibliotecaVirtual/6toSemestre/06_BAS_
Prob_y_Estadistica_2do_parcial.pdf
• Media y Mediana. (s.f.). GeoGebra. Recuperado de:
http://geogebra.es/cvg_primaria/05/html/mediana.html#:~:text=Si%20se%20
ordenan%20todos%20los,que%20tiene%20la%20mayor%20frecuencia
• Varianza y desviación estándar. (s.f.). INA. Recuperado de: https://www.ina-
pidte.ac.cr/mod/book/view.php?id=13057&chapterid=563#:~:text=La%20vari
anza%20y%20la%20desviaci%C3%B3n,a%20las%20medidas%20de%20p
osici%C3%B3n.&text=La%20desviaci%C3%B3n%20est%C3%A1ndar%20e
s%20simplemente%20la%20ra%C3%ADz%20cuadrada%20positiva%20de
%20la%20varianza.
• Requena, B. (2014). ASIMETRÍA Y CURTOSIS. Recuperado de:
https://www.universoformulas.com/estadistica/descriptiva/asimetria-curtosis/
• HISTOGRAMA. (s.f.) AEC. Recuperado de:
https://www.aec.es/web/guest/centro-
conocimiento/histograma#:~:text=Los%20histogramas%20son%20gr%C3%
A1ficos%20que,una%20distribuci%C3%B3n%20de%20los%20datos.&text=
En%20definitiva%2C%20un%20histograma%20es,frecuencia%20de%20los
%20valores%20representados
• Símbolos estadísticos y símbolos de probabilidad (Μ, Σ, . . .). (s. f.).
https://www.rapidtables.org/math/symbols/Statistical_Symbols.html

También podría gustarte