Fase 2 - Organización

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 6

Títulos de Trabajo

Nombre estudiante

Docente

Nombre

Nombre de institución o universidad

Ciudad

2023
Punto 1

Conceptos Definiciones Ejemplos

Frecuencia Absoluta La frecuencia absoluta es el En un conjunto de datos que

número de veces que un representa las edades de un

valor o categoría específica grupo de personas, la

aparece en un conjunto de frecuencia absoluta de "25

datos. años" es 10, lo que significa

que hay 10 personas de 25

años en el grupo.

Frecuencia relativa La frecuencia relativa es la Si en un grupo de 100

proporción o porcentaje que personas, 10 tienen 25 años,

representa la frecuencia la frecuencia relativa de "25

absoluta de un valor o años" es 10/100 = 0.1 o

categoría en relación con el 10%. Esto significa que el

tamaño total del conjunto 10% de las personas tienen

de datos. Se calcula 25 años.

dividiendo la frecuencia

absoluta entre el tamaño

total de la muestra.

Media La media es el valor En un conjunto de datos de

promedio de un conjunto de calificaciones de

datos. Se calcula sumando estudiantes en una clase, la

todos los valores y media es 85. Esto significa


dividiendo la suma por el que el promedio de las

número de valores. calificaciones es 85.

Medidas de dispersión Las medidas de dispersión En un conjunto de datos de

son estadísticas que ingresos anuales, la

describen la variabilidad o desviación estándar puede

dispersión de un conjunto indicar cuán dispersos están

de datos. Algunas medidas los ingresos en relación con

de dispersión comunes la media. Si la desviación

incluyen la desviación estándar es alta, significa

estándar y el rango que los ingresos varían

intercuartílico. Estas considerablemente en el

medidas ayudan a grupo.

comprender cuánto se

dispersan los valores en

torno a la media.

Regresión lineal La regresión lineal es un En el análisis de ventas, se

método estadístico utilizado puede utilizar la regresión

para modelar la relación lineal para predecir las

entre una variable ventas futuras en función de

dependiente (la que se variables como el precio, la

quiere predecir) y una o publicidad y el tiempo.

más variables

independientes mediante
una ecuación lineal. Se

utiliza para predecir valores

futuros en función de datos

históricos.

Correlación de Pearson La correlación de Pearson Si se quiere evaluar si existe

es una medida estadística una correlación entre la

que evalúa la fuerza y cantidad de horas de estudio

dirección de la relación y el rendimiento en un

lineal entre dos variables examen, se puede calcular

continuas. Puede variar de - la correlación de Pearson.

1 (correlación negativa Si el valor es cercano a 1,

perfecta) a 1 (correlación indica una correlación

positiva perfecta), con 0 positiva, mientras que cerca

indicando una falta de de -1 indica una correlación

correlación lineal. negativa. Un valor cercano

a 0 significa que no hay

correlación lineal.
Punto 2

Medidas Resultado Interpretación

Media 51863.535 El precio promedio de los vehículos es aproximadamente

$51,863.54.

Mediana 42888.0 La mediana es el valor que se encuentra en el medio de la

distribución de precios cuando se ordenan de menor a mayor.

En este caso, la mediana es $42,888.0.

Moda 13888.0 La moda es el valor que aparece con mayor frecuencia en la

distribución de precios. En este caso, la moda es $13,888.0, lo

que indica que ese precio es muy común entre los vehículos.

Min 2995.0 El precio mínimo en el conjunto de datos es $2,995.0.

Max 378888.0 El precio máximo en el conjunto de datos es $378,888.0.

Rango 375893.0 El rango es la diferencia entre el valor máximo y el valor

mínimo. En este caso, el rango es $375,893.0, lo que muestra la

amplitud de los precios en los vehículos.

Q1 18888.0 El primer cuartil (Q1) representa el valor que divide el 25%

inferior de los precios. En este caso, Q1 es $18,888.0.

Q3 57888.0 El tercer cuartil (Q3) representa el valor que divide el 25%

superior de los precios. En este caso, Q3 es $57,888.0.

P(10) 8988.0 El percentil 10 (P(10)) indica el valor por debajo del cual se

encuentra el 10% de los precios más bajos. En este caso, P(10)

es $8,988.0.
1. Varianza: La varianza mide la dispersión de los datos en relación con la media. Si la

varianza es alta, significa que los datos están dispersos. Si es baja, significa que los datos

están agrupados alrededor de la media.

2. Desviación Típica: La desviación típica es simplemente la raíz cuadrada de la varianza.

Mide la dispersión de los datos en la misma unidad que los datos originales.

3. Coeficiente de Variación: El coeficiente de variación es la desviación estándar

expresada como un porcentaje de la media. Ayuda a comparar la variabilidad relativa entre

diferentes conjuntos de datos.

4. Asimetría: La asimetría mide la falta de simetría en la distribución de los datos. Puede

ser positiva (colas largas a la derecha), negativa (colas largas a la izquierda) o cercana a

cero (simetría).

5. Curtosis: La curtosis mide qué tan puntiaguda o achatada es la distribución de los datos

en comparación con una distribución normal. Puede ser leptocúrtica (más puntiaguda),

mesocúrtica (similar a una distribución normal) o platicúrtica (más achatada).

- ¿La distribución es homogénea o heterogénea? Esto se relaciona con la varianza. Si la

varianza es alta, la distribución es heterogénea, y si es baja, es homogénea.

- ¿Qué tipo de concentración y asimetría presentan los datos? La concentración se relaciona

con el coeficiente de variación (si es bajo, hay una alta concentración) y la asimetría se

refiere a si la distribución es si métrica o no, lo que se puede determinar a través de la

asimetría y la curtosis.

También podría gustarte