Cuestionario1 Equipo6

Descargar como pptx, pdf o txt
Descargar como pptx, pdf o txt
Está en la página 1de 53

Universidad Tecnológica de La Habana

“José Antonio Echeverría”

l s
Estadística
s
Descriptiva
Cuestionario 1.
Equipo 6
Ing. Raciel Noel Díaz Cabrera
Ing.
g. Alejandro
ir Ló pez Reyes
án
e
Ing. Raymel Ramos Guerra
Pregunta 1

En estadística se manejan los conceptos de población y de


muestra. ¿Qué se entiende por población? ¿Qué elementos
pueden formar parte de una población?
Población
Conjunto de elementos sobre los que se investiga o
se hacen estudios [1].

Ejemplos
• Población 1: conjunto de calificaciones obtenidas por un
individuo a lo largo de su carrera.
• Población 2: población cubana con problemas cardiacos.
Pregunta 2

¿Qué es una muestra? ¿Cómo se pueden armar muestras


representativas de la población en estudio? ¿Qué propiedades
debe reunir una muestra?
Muestra
La muestra se refiere a cualquier conjunto específico de sujetos u
observaciones procedentes de una población determinada [2] [3].

Una muestra debe:


• Tener un tamaño razonable.
• Ser representativa de la población que
procede (contener todas las
Muestra
Población características de la población).
• Escoger de manera aleatoria.
Pregunta 3
Los datos que pueden adquirirse mediante un muestreo,
pueden ser denominados como cualitativos o cuantitativos; a
su vez, los cuantitativos pueden trabajarse como continuos o
discretos. Elaborar definiciones para cada uno de estos tipos
de datos. Especificar cuál es la diferencia entre ellos.
Muestreo
Datos cualitativos Datos cuantitativos

Características o Se expresan mediante


cualidades que no números.
pueden ser medidas Se pueden realizar
con números. operaciones aritméticas con
ellos.
[4]
Muestreo
Datos cuantitativos

Continuos Discretos
Son aquellos que toman valores
Son aquellos que pueden tomar valores
enteros, es decir, no admite valores
comprendidos entre dos números, no se
intermedios entre dos valores
restringen a valores enteros y se miden
específicos, se cuentan, no se miden.
en lugar de contarse. Ejemplo: la altura
Ejemplo: cantidad de hijos de una
de 3 personas (1.75, 1.63, 1,91).
persona (no se puede tener 2.5 hijos). [4]
Pregunta 4
¿Cómo se pueden organizar los datos cualitativos? ¿Qué tipo de
análisis estadístico se puede realizar con este tipo de datos? ¿Cuáles
son las limitaciones en el tratamiento de este tipo de datos?
Datos cualitativos
Los datos cualitativos o categóricos consisten en etiquetas que
describen las propiedades de los objetos bajo investigación, como
género, color de cabello y ocupación. Los datos categóricos
generalmente se pueden codificar numéricamente [5]. Esta codificación
da lugar a dos subtipos de datos categóricos [6]:

 Datos Nominales.

 Datos Ordinales.
Datos cualitativos

Nominales Ordinales
Variables no numéricas que no admiten Datos no numéricos en los que existe un
un criterio de orden. orden.
Ejemplo: sexo (masculino, femenino) Ejemplo: resultados de una
competencia (primer lugar, segundo
lugar, tercer lugar)
[6]
Análisis estadísticos
El análisis de datos cualitativos es un proceso mediante el cual
se extraen conclusiones de datos no estructurado y
heterogéneo, para ello se utilizan [7]:

 Método exacto de Fisher


 Chi-Cuadrado de Pearson
 McNemar
 Test Q de Cochran
Limitaciones en el tratamiento de los datos
• Pueden realizarse múltiples interpretaciones con muchos
significados y complejos de interpretar.
• Necesita más espacio en memoria para hacer perdurar la
información.
• El tiempo de procesamiento suele ser más largo y con
más necesidad de recursos de procesamiento q los datos
cuantitativos [8].
Pregunta 5
¿Cómo se pueden organizar los datos cuantitativos? ¿Cuál es
el procesamiento posible para este tipo de datos? ¿Qué
diferencias se pueden encontrar entre el tratamiento de
variables discretas y continuas? ¿Qué ocurre con el
procesamiento cuando hay pocos o muchos datos?
Datos cuantitativos
Datos que se pueden medir Datos que se pueden contar
Discretos
Continuos
Ejemplo: Ejemplo:
Altura de una persona Numero de personas
en una familia.
Procesamiento posible:
• Media • Desviación estándar
• Moda • Correlación
• Mediana • Varianza
[3]
Procesamiento de los datos
1. Para un número grande de valores se emplea la Distribución
de frecuencias agrupadas.
2. Para pocas observaciones se realiza un ordenamiento de
los valores.
3. Muchas observaciones y pocos valores se utilizan las tablas
de frecuencia [9].
Pregunta 6
En el procesamiento de datos cuantitativos se pueden
utilizar medidas de ubicación, de dispersión o de forma.
Explicar qué tipo de información brinda cada una.
Medidas
Ubicación Dispersión Forma

Tienen como Las medidas de Son valores que dan a


objetivo de dispersión miden que conocer la manera en
brindar al analista tan dispersos se que los datos se hallan
valores encuentras los datos distribuidos en relación a
cuantitativos de la de una muestra o la media aritmética y
ubicación central población [4]. toman como referencia
de los datos en de comparación a la
una muestra [8]. distribución normal [4].
Pregunta 7
Realizar un resumen de las principales medidas estadísticas y
definir el modo en que se determina cada una. Explicar
además, cuáles son las ventajas y desventajas de cada una de
esas cantidades como medidas descriptivas.
Medidas estadísticas
Medidas de ubicación o tendencia central

 Media: Es la media aritmética o promedio de los valores de una


muestra [4].

Ventajas: medida de tendencia mas usada, fácil de calcular, permite


sacar conclusiones sobre la media de la población.

Desventajas: es sensible a valores extremos, no es recomendable


emplearla en distribuciones muy asimétricas. [8].
Medidas estadísticas
Medidas de ubicación o tendencia central
 Mediana: Es el punto medio de los elementos de una muestra
después de ser ordenados [8].
Si la lista es par
Si la lista es impar

Ventajas: es estable a valores extremos, es recomendable para


distribuciones muy asimétricas.

Desventajas: se emplea solo en variables cuantitativas.


Medidas estadísticas
Medidas de ubicación o tendencia central

 Moda: Es el valor que tiene mayor frecuencia en la muestra [8].

Ventajas: es estable para valores extremos, se puede utilizar en


variables cualitativas y cuantitativas.

Desventajas: puede existir mas de una moda, puede no estar presenta,


en distribuciones muy asimétricas suele ser un dato poco
representativo.
Medidas estadísticas
Medidas de dispersión:
 Varianza: es la media aritmética de las desviaciones cuadráticas de
cada elemento de la población con respecto a su media [4].

Para una población

Para una muestra


Medidas estadísticas
 Varianza: es la media aritmética de las desviaciones cuadráticas de
cada elemento de la población con respecto a su media [4].

Ventajas: proporciona información completa con respecto a cómo varía la


población entre los individuos.

Desventajas: como las unidades de la varianza son al cuadrado


(personas al cuadrado, carros al cuadrado) es difícil explicar que
representan.
Medidas estadísticas
Medidas de dispersión:
 
 Desviación estándar: Es la raíz cuadrada de la varianza [8].
Ventajas: es única, se expresa en las mismas unidades que los datos de
la muestra.
Desventajas: se ve muy afectada por la presencia de valores atípicos.
 
 
Medidas estadísticas
Medidas de dispersión: 
 
 Rango: Se obtiene al establecer la diferencia entre el máximo y mínimo
de los datos cuantitativos. El valor obtenido brinda información en
relación al intervalo entre los valores límites en los que se observaron
los datos [8].

Ventajas: simple, útil y fácil de calcular.

Desventajas: solo emplea dos valores en su calculo, solo da una idea de


la diferencia entre los puntos extremos.
 
Pregunta 8
Determinar qué propiedades deben poseer la media
aritmética o promedio y la varianza.
Media aritmética
 La media aritmética es un valor representativo debido a que es el
centro de gravedad o punto de equilibrio de un conjunto de datos.
 Si se sustituye el valor de cada observación por el valor del promedio
aritmético no varía la suma de todas las observaciones.
 La suma de las desviaciones de las observaciones con respecto al
promedio aritmético es igual a cero.
 Si a cada observación de una muestra se le suma una constante, el
promedio de las nuevas observaciones será igual al promedio de la
muestra original más la constante [10].
Varianza
 La suma de los cuadrados de las desviaciones de las
observaciones con respecto al promedio aritmético es menor o
igual que la suma de los cuadrados de las desviaciones de las
observaciones con respecto a cualquier otro valor.
 Si cada observación se le suma una constante, la varianza no
cambia.
 Si a cada observación se le multiplica por una constante, la
varianza queda multiplicada por dicha constante [10].
Pregunta 9
Los datos de tipo cuantitativo continuo se pueden agrupar en
intervalos. Explicar cuáles son los requisitos que debe tener la
muestra para que este agrupamiento sea factible. Explicar además que
información relevante se puede obtener a partir del agrupamiento.
Agrupamiento de datos cuantitativos

Si los datos corresponden a una variable cuantitativa continua, estudiar


y representar esta variable estadística como si fuera discreta no es la
forma más conveniente, pues son muchos los valores distintos que toma
la variable. En este caso se agrupan los datos por intervalos y se asigna
a cada intervalo una frecuencia absoluta igual al número de
observaciones que caen dentro de él [11].
Requisitos de las muestras

Para realizar el agrupamiento la muestra debe tener una cantidad de


datos cuantitativos considerables, los rangos que se tengan para dividir
los datos pueden pertenecer a un solo grupo y a su vez deben
corresponder al menos a uno de los grupos [11].
Información a partir del agrupamiento
A través del agrupamiento se pueden obtener datos importantes como [12]:

Frecuencia: es el número de veces que se presenta cada valor de la


variable.

Tabla de frecuencias: es una tabla que presenta en forma ordenada los


distintos valores de una variable y sus correspondientes frecuencias.

Representación gráfica: a través de gráficos, resulta más fácil transmitir


conclusiones a personas no habituadas a la interpretación de tablas de
frecuencias.
Pregunta 10
En un proceso productivo se fabrican ruedas de automóviles, después
del balanceo se mide la diferencia de carga en gramos, entre las dos
caras de la cubierta. Los valores obtenidos son los siguientes:

23 22 21 34 31 10 13
Ejemplo
Calcular el promedio y el desvió de esta muestra:

Promedio n=7
Ejemplo 2
S=
𝑛
( 𝑥 − 𝑥)
𝑆 =∑
2 𝑖
Desviación estándar
𝑖=1 (𝑛 −1)
 

 
Ejemplo
Clasificar los datos en intervalos de acuerdo con la siguiente
tabla:
• Obtener la media y desviación estándar para cada grupo.

Intervalo Frecuencia Media Desviación


estándar
10-19.99 2 veces 11.5 2.121
20-29.9 3 veces 22 1
30-40 2veces 32.5 2.121
Ejemplo
Comparar los resultados obtenidos en los dos ítems anteriores. Explicar por qué
motivo son diferentes los resultados. Elaborar una opinión sobre la conveniencia de
calcular las medidas a partir de datos agrupados.

• Existe una diferencia entre los valores arrojados en los promedios y las
desviaciones estándar de una muestra completa con x = 22 y s= 8. 6794 y los
estudios sobre cada uno de los agrupamientos, el cual arrojó valores menores.
• En el caso del promedio el grupo donde los valores están más equilibrados o
consecutivos los resultados son idénticos a cuando el estudio se realiza a todos los
elementos,
• En los otros dos casos el promedio estuvo dado a partir de los valores de los
rangos, ya que los promedios se mantienen siempre dentro del rango de
elementos a estudiar.
Ejemplo

Es conveniente obtener la desviación estándar a partir de datos


agrupados porque se tiene una mejor aproximación de la concentración
de datos entre la media aritmética y un valor de más o menos “k”
desviaciones [4], por lo que podemos apreciar una reducción del valor de
desviación estándar con respecto a la muestra inicial no agrupada.
Pregunta 11
¿Qué tipo de conclusiones se pueden elaborar a partir
del análisis descriptivo de datos? ¿Cuál es su utilidad?
Análisis descriptivo
• El análisis descriptivo de los datos permite obtener diversos
resúmenes de informaciones obtenidas a partir de los datos de una
muestra.

• Permite organizar, sintetizar, ver las características más relevantes y


presentar la información en disímiles variantes como las tablas,
gráficos, figuras, histogramas, diagramas de caja y gráficas de puntos
[6].
Análisis descriptivo
Existen otros métodos descriptivos que implican el cálculo de medidas
numéricas, tales como medias, desviaciones estándar y coeficientes de
correlación, el promedio de los datos, la variabilidad y la naturaleza de la
distribución de la muestra.

Los análisis descriptivos se pueden aplicar en mercadotecnia,


contabilidad, control de calidad , el estudios de consumidores, análisis de
resultados en deportes, administradores de empresas, en la educación,
en la políticas y en la medicina, estudios poblacionales solo por nombrar
algunos. [6]
Pregunta 12
Una de las propiedades que se analizan al estudiar una
muestra de datos cuantitativos continuos, es la asimetría.
Expliquemos qué es lo que representa la asimetría.
Identifiquemos medidas que permiten valorarlas.
Asimetría
• La asimetría es la medida que indica la simetría de la distribución de una variable
respecto a la media aritmética, sin necesidad de hacer la representación gráfica.

• Para obtener la asimetría de una distribución se plantea con respecto a qué valor
se realizará, en este caso es sobre la mediana que quedaría en el centro de todas
las variables continuas.

• Los coeficientes de asimetría indican si hay el mismo número de elementos a


izquierda y derecha de la media identificando si los datos se distribuyen de forma
uniforme alrededor del punto central llamada Media aritmética [13].
Asimetría
La asimetría tiene tres formas diferentes que define la manera de cómo
están distribuidos los datos respecto al eje de simetría [13].
Asimetría
• Asimetría negativa: la cola de la distribución es mayor para
valores inferiores a la media(a la izquierda).
• Simétrica: presenta la misma cantidad de elementos a
izquierda y derecha de la media. En este caso, coinciden la
media, la mediana y la moda. La distribución se adapta a la
forma de la campana de Gauss o distribución normal o de
distribución de frecuencias simétrica.
• Asimetría positiva: la cola de la distribución es mayor para
valores superiores a la media (a la derecha).
Coeficientes de asimetría
 Fisher: evalúa la proximidad de los datos a la media de la
muestra.

Si CAF<0: la distribución tiene


una asimetría negativa.
Si CAF=0: la distribución es
simétrica.
Si CAF>0: la distribución tiene
una asimetría positiva
Coeficientes de asimetría
Pearson: mide la diferencia entre la media y la moda respecto a la
dispersión del conjunto. Se emplea solamente en distribuciones
unimodales y poco asimétricas.

Si CAP < 0: asimetría negativa


Si CAP = 0: la distribución es
simétrica.
si CAP > 0: asimetría positiva
Coeficientes de asimetría
 Bowley: toma como referencia los cuartiles para determinar si la
distribución es simétrica o no. Para aplicar este coeficiente, se supone
que el comportamiento de la distribución en los extremos es similar.

Si CAB<0: asimetría negativa


Si CAB=0: simétrica
Si CAB>0: asimetría positiva
Bibliografía
[1] R. I. Levin, D. S. Rubin, y A. H. F. Samaniego, Estadística para administradores.
Prentice-Hall Hispanoamericana, 1996.
[2] J. Jiménez, «Métodos estadísticos», Obtenido Httpwww Sefh
Esbibliotecavirtualerroresmedicacion010 Pdf, 2011.
[3] R. E. Walpole, R. H. Myers, S. L. Myers, y K. Ye, «Probabilidad y estadística para
ingeniería y ciencias», Norma, vol. 162, p. 157, 2012.
[4] C. Salazar, S. del Castillo, y others, Fundamentos básicos de estadística. Editor no
identificado, 2018.
[5] S. S. Skiena, The data science design manual. Springer, 2017.
[6] E. Acuna, Estadística Elemental. Universidad de Puerto Rico Recinto Universitario
de Mayaguez, 2013.
 
Bibliografía
[7] «Test estadísticos para variables cualitativas: Test exacto de Fisher, chi-cuadrado de
Pearson, McNemar y Q-Cochran».
https://www.cienciadedatos.net/documentos/22.2_test_exacto_de_fisher_chi-
cuadrado_de_pearson_mcnemar_qcochran#Introducci%C3%B3n (accedido jun. 10,
2021).
[8] C. M. Bencardino, Estadística básica aplicada. Ecoe Ediciones, 2019.
[9] Z. Hernández Martín, «MÉTODOS DE ANÁLISIS DE DATOS (APUNTES)», Esp.
Serv. Publicaciones Ed, vol. 519, 2012.
[10] E. R. González, Estadística general. Universidad Central de Venezuela, 1968.
[11] M. T. G. Manteiga, Estadística aplicada: Una visión instrumental. Ediciones Díaz
de Santos, 2012.
[12] «AGRUPAMIENTO DE DATOS», estadisticohouse.
https://estadisticohouse.wordpress.com/tag/agrupamiento-de-datos/ (accedido jun. 10,
2021).
Universidad Tecnológica de La Habana
“José Antonio Echeverría”

l s
Estadística
s
Descriptiva
Cuestionario 1.
Equipo 6
Ing. Raciel Noel Díaz Cabrera
Ing.
g. Alejandro
ir Ló pez Reyes
án
e
Ing. Raymel Ramos Guerra

También podría gustarte