Informe S2 - Clasificación de Datos

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 12

Seminario de Bioestadística

V Ciclo de Estudios Semestre Académico 2021-I

“CLASIFICACIÓN DE DATOS”
GRUPO - 11

ESTUDIANTES

Anton Atavillos Irma Vanessa 2019127702


Barrantes Aguilar Flavia Alessandra 2019120874
Cotrina Vasquez Fiorella Elizabeth 2019152842
Gonzales Vasquez Andrea del Carmen 2016440314
Gutierrez Rivera Shirley Mileiny 2019153018
Monsalve Moreno María Alejandra 2019153192
Montaño Santa Cruz Shantal Niccol 2019121019
Orozco Velásquez Luis Arturo 2015440451

(72791900)
DOCENTE

DR. RODRÍGUEZ LÓPEZ WILBER OMERO

PERÚ
2021
OBJETIVOS

• Identificar tablas estadísticas según tipo de variable.

• Identificar gráficos según tipo de variable.

• Interpretar frecuencias y porcentajes.


INTRODUCCION

En la actualidad la Estadística se ha constituido en una herramienta


importante en los procesos de investigación, puesto que permite
planear la investigación, recolectar, organizar, representar, interpretar y
analizar la información referente a individuos u observaciones de un
fenómeno al cual se le estudian característica en común, en una
población o en una muestra. El análisis permite describir
comportamientos de la información, obtener conclusiones y dar
recomendaciones para la toma de decisiones.

Con su estudio, se analiza los resultados de los fenómenos o


experimentos aleatorios y con ellos es posible tomar decisiones en
presencia de incertidumbre.

Así mismo conocer los diferentes tipos de datos estadísticos es


necesario para realizar un análisis exploratorio de datos, ya que se
puede usar ciertas mediciones estadísticas solo para tipos de datos
específicos.
MARCO TEÓRICO

1. TABLAS O CUADROS:

• Toda tabla debe tener un título com- prensible. No usar abreviaturas.


• Cada título de las tablas se debe nu- merar con números arábigos
sucesivos, pero no es necesario escribir la pala- bra número ni utilizar las
abreviaturas.
• El nombre de la tabla en letra cursiva, con tan sólo la primera letra en ma-
yúscula.
• La tabla no debe tener líneas vertica- les, sólo horizontales
• Cada fila y cada columna deben tener un nombre.

2. GRÁFICAS Y FIGURAS

• Los tipos de gráficas existentes son:


• De tronco y hoja.
• Pirámide de población.
• Diagrama de líneas.
• Gráfica de barras.
• Histograma.
• Polígono de frecuencias.
• Diagrama circular.
• Diagrama de cajas.
• Gráfica de puntos.
• Diagramas de dispersión.
• Distribución de frecuencias.

3. DE TRONCO Y HOJA:

Con la gráfica de tronco y hoja se hacen objetivos los datos, de tal manera que
resaltan los de mayor o menor frecuencia.
4. PIRÁMIDE DE POBLACIÓN:

La pirámide de población es una for- ma gráfica de representar datos estadís-


ticos de la población de un país, que permite comparaciones internacionales y
una fácil y rápida percepción de varios fenómenos demográficos.

5. DIAGRAMA DE LÍNEAS

El diagrama de líneas, que es frecuen- te en estudios de costos y seguimiento


de pacientes, se utiliza para mostrar la ten- dencia de la curva. Es útil en
variables dis- cretas ordinales o nominales y en variables continuas de intervalo
y de razón.

6. GRÁFICA DE BARRAS

• Tiene variables cuantitativas discretas.


• Su forma es horizontal o vertical.
• Su altura es proporcional al porcentaje de frecuencias que necesita.
• Se usan barras simples cuando se re- fiere a una sola variable, y
agrupadas para dos o más variables.

7. GRÁFICA DE BARRAS COMPUESTA

• Utiliza variables categóricas.


• Maneja dos y cinco categorías para una sola variable o para comparar
dos o más variables.

8. HISTOGRAMA

Un histograma es un resumen gráfico de la variación de un conjunto de datos.


La naturaleza gráfica del histograma nos permite ver pautas que son difíciles de
observar en una simple tabla numérica.

9. POLÍGONO DE FRECUENCIAS

• Es una curva de distribución de fre- cuencias o datos continuos.


• Es una línea que une los puntos me- dios de distribución de los puntajes
del histograma.
• Se puede construir de forma conjunta o independiente del histograma.
10. DIAGRAMA DE CAJAS

• Es una representación gráfica de un conjunto de datos, que facilita la per-


cepción visual de su localización, ex- tensión y del grado y la dirección del
sesgo.
• Identifica los datos atípicos.
• Es útil para comparar dos grupos.

11. DIAGRAMA CIRCULAR

• También se denomina pie, pastel o manzana.


• Es un círculo que se divide en tantas porciones como clases tenga la
varia- ble, de modo que a cada clase le corres- ponde un arco de círculo
proporcional a su frecuencia absoluta o relativa.

12. GRÁFICOS DE PUNTOS

• Son gráficos sencillos que permiten comprobar, de forma visual, la


simetría y la distribución de una variable y va- lorar su desviación de la
normalidad.

13. DISTRIBUCIÓN DE FRECUENCIAS

Según la forma, la localización y dispersión de los datos, puede ser:

• Bimodal: dos picos con un mayor número de puntajes cada uno.


• Asimétrica positiva: con relación a la porción central, hay mayor
número de puntajes menores que mayores.
• Asimétrica negativa: lo contrario a la anterior.
CUESTIONARIO

Se realizó un estudio sobre el nivel del colesterol total (mg /100 ml) en 40
hombres adultos que consumen irregularmente embutidos. Los valores
obtenidos fueron:

A. Construir una tabla de frecuencias.


▪ Encontrar la amplitud (A)
A=(Vmax-Vmin) +1
A= (271-200) +1=72
▪ Determinar el número de intervalos (k):
K=1 + 3.322 log (n)
K=1 + 3.322 log (40)
K= 6
▪ Determinar la amplitud del intervalo (c):
C= A/K = 72/6= 12
▪ Determinar los límites:
Vmin + (C-1) = 200 + (12-1) = 200-211
Vmin + C = 212-223…. Así sucesivamente con los demás datos

Tabla de Frecuencias:
Fórmulas para obtención de valores:

• Xi=200+211/2=205.5
• fi= # valores
• Fi= fi+ valores iguales o menores
• hi%= fi/#total de pacientes x 100
Tabla estadística del nivel de colesterol total (mg/dL) en 40 hombres adultos
que consumen irregularmente embutidos
Clase Colesterol Xi fi Fi hi% Hi% Limites reales
1 200-211 206 5 5 12.5 12.5 199.5-211.5
2 212-223 218 4 9 10 22.5 211.5-223.5
3 224-235 230 6 15 15 37.5 223.5-235.5
4 236-247 242 6 21 15 52.5 235.5-247.5
5 248-259 254 7 28 17.5 70 247.5-259.5
6 260-271 266 12 40 30 100 259.5-271.5
40 100
• Hi%= Fi/#total de pacientes x 100
• Limites reales= V.min intervalo -0.5 - V.max intervalo +0.5

B. Elaborar gráfica de histograma y polígono de frecuencias.

HISTOGRAMA Y POLÍGONO DE FRECUENCIAS


Nivel del colesterol total (mg /100 ml) en 40 hombres adultos que
consumen irregularmente embutidos
14

12

10

0
206 218 230 242 254 266
EJE DE ORDENADAS
fi: Frecuencia absoluta del i-ésimo intervalo, nos indica número de veces que
aparece repetido dicho valor en el conjunto de observaciones estudiadas.
Lo que representa en nuestro gráfico:
Número de veces que aparece repetido los niveles de colesterol de la muestra
de hombres adultos en el intervalo descrito.

EJE DE ABCISAS
Xi: Es la marca de clase de la clase i se determina mediante el promedio de los
límites de dicho intervalo.
Lo que representa en nuestro gráfico:
Niveles de colesterol ordenados por intervalos en orden creciente.

C. Interpretar f3 y h2%
De acuerdo con la tabla de frecuencias construida previamente en el punto A:

Clase Colesterol Xi fi Fi hi% Hi% Limites reales


1 200-211 206 5 5 12.5 12.5 199.5-211.5
2 212-223 218 4 9 10 22.5 211.5-223.5
3 224-235 230 6 15 15 37.5 223.5-235.5
4 236-247 242 6 21 15 52.5 235.5-247.5
5 248-259 254 7 28 17.5 70 247.5-259.5
6 260-271 266 12 40 30 100 259.5-271.5
40 100

• Interpretación de f3 = 6
En el estudio realizado, hay 6 hombres adultos que consumen
irregularmente embutidos, cuyos niveles de colesterol total se
encuentran comprendidos entre 224 y 235 mg/dL.
• Interpretación de h2% = 10
En el estudio realizado, un 10% del total de los hombres adultos que
consumen irregularmente embutidos presentan niveles de colesterol
total comprendidos entre 212 y 223 mg/dL.
D. Interpretar F2 y H5
Según la tabla de frecuencias de los datos de la pregunta 4 de la guía:

Clase Colesterol Xi fi Fi hi% Hi% Limites reales


1 200-211 206 5 5 12.5 12.5 199.5-211.5
2 212-223 218 4 9 10 22.5 211.5-223.5
3 224-235 230 6 15 15 37.5 223.5-235.5
4 236-247 242 6 21 15 52.5 235.5-247.5
5 248-259 254 7 28 17.5 70 247.5-259.5
6 260-271 266 12 40 30 100 259.5-271.5
40 100

• Interpretación de F2 = 9
En el estudio, hay 9 hombres adultos que consumen irregularmente
embutidos, cuyos niveles de colesterol total se encuentran
comprendidos entre 200 – 223 mg/dL.
• Interpretación de H5= 70
En el estudio, un 70% del total de los hombres adultos que consumen
irregularmente embutidos presentan niveles de colesterol total
comprendidos entre 200 - 259 mg/dL.

E. Interpretar la marca de clase del intervalo 2.


Como podemos observar en la tabla de frecuencias superior, directamente la
marca del intervalo 2, que va desde 212 – 223 es 218.
CONCLUSIONES

1. Se elaboró e interpretó una tabla frecuencias, la cual es una de las


herramientas más básicas para mostrar estadísticas descriptivas.
2. Se construyó un histograma y también un polígono de frecuencias, siendo
el histograma una representación gráfica de la variable de interés en el
eje X y la frecuencia en el eje Y; por otro lado, el polígono de frecuencias
se construye conectando todos los puntos medios de la parte superior de
las barras en un histograma mediante una línea recta sin mostrar las
barras, este recurso permite comparar fácilmente dos distribuciones de
frecuencia.

3. Finalmente, en cuanto a la interpretación de una tabla de frecuencias, se


concluye lo siguiente:
• La marca de clase (Xi) se define como el promedio de los límites
superior e inferior de una clase.
• Una frecuencia absoluta (fi) es un simple recuento del número de
casos o elementos.
• Una frecuencia relativa (hi) muestra la proporción del número total
de observaciones asociadas con cada valor o clase de valores y
está relacionada con una distribución de probabilidad, que se usa
ampliamente en estadística.
• Una frecuencia acumulada, ya sea absoluta (Fi) o relativa (Hi), es
el número de veces que ocurre un valor y todos los valores que lo
preceden.
REFERENCIAS BIBLIOGRÁFICAS

1. Manikandan S. Distribución de frecuencias. J Pharmacol Pharmacother


[Internet] 2011 [citado 25 mar 2021]; 2 (1): 54-56. Disponible en:
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3117575/

2. Wayne D, BIOESTADÍSTICA: Base para el análisis de las ciencias de la


salud. Limusa Wiley 4ª Edición

También podría gustarte