MA642 - Cuaderno de Trabajo - Unidad 1 - Semana 1

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 11

Unidad 1: Concepto, organización y presentación de datos

Tema: Conceptos básicos y organización de datos cualitativos


Logro:
Al finalizar la unidad 1, el estudiante elabora y analiza tablas y gráficos para dar respuesta a un problema
relacionado con su especialidad.

Bibliografía:
• Introducción a la Probabilidad y estadística / Mendenhall, Beaver, Beaver. Capítulo 1.1 (pág. 7-11)

1. Conceptos y definiciones básicas

Conceptos

1.1. Estadística
Es la ciencia que proporciona un conjunto de métodos, técnicas y procedimientos para recopilar,
organizar, presentar y analizar datos con el fin de describirlos o realizar generalizaciones válidas.

Recopilar Organizar Presentar Analizar Tomar


datos datos datos datos decisiones

1.2. Estadística descriptiva


Son métodos asociados a la caracterización, resumen y presentación
de datos, que permiten describirlos apropiadamente.
Comprende el uso de gráficos, tablas e indicadores de resumen
obtenidos al realizar algunos cálculos.

1.3. Estadística inferencial


Son métodos y técnicas que hacen posible estimar una o más
características de una población o tomar decisiones referentes a una
población, basados en los resultados obtenidos del estudio de Flash
muestras elegidas adecuadamente. electoral

Estas conclusiones no tienen que ser totalmente válidas, pueden tener


cierto margen de error, por eso se dan con una medida de
confiabilidad o probabilidad.

Definiciones

1.4. Población
Es la totalidad de elementos que queremos estudiar y que están agrupados bajo una o más
características comunes y que conforman el universo a ser investigado. Pueden ser personas,
objetos, conceptos, etc. de los cuales intentamos sacar conclusiones a partir de una o más
características observables de naturaleza cualitativa o cuantitativa que se pueden medir en ellos.

1.5. Muestra
Parte o subconjunto de la población que se selecciona para su análisis y así obtener información
acerca de la población de la que proviene. Una muestra será representativa, en el sentido de que
cada unidad muestreada representará las características de una cantidad conocida de unidades en
la población.

1.6. Unidad elemental


También llamada unidad de análisis, unidad estadística o elemento. Es el objeto sobre el cual se
hace la medición. Por ejemplo, en estudios de poblaciones humanas, con frecuencia ocurre que
las unidades de análisis son los individuos.

1.7. Dato
Son los valores numérico o no numérico que otorga la característica de interés de cada unidad
elemental.

1.8. Observación
Es el conjunto de datos de una unidad elemental. La observación se obtiene para cada unidad
elemental.

Dato
Dato

Observación o Registro

1.9. Variable
Es una característica de interés de la población definida por la investigación estadística y que puede
tomar dos o más valores en distintas unidades de análisis.

Tipos de variables

Cualitativa

Tipos de variables Cuantitativa discreta

Cuantitativa

Cuantitativa continua

a) Variable cualitativa
También son conocidas como categóricas. Son aquellas variables que al ser medidas quedan
expresadas por etiquetas o nombres que se utilizan para identificar una característica o atributo.

2
b) Variable cuantitativa
Son aquellas variables que al ser medidas quedan expresadas por números que se utilizan para
identificar una característica o atributo.
Estas a su vez pueden clasificarse en discretas o continuas.

• Una variable es cuantitativa discreta si el conjunto de posibles valores que toma es finito o
infinito numerable, es decir, que sólo puede tomar ciertos valores en un intervalo
determinado.
• Una variable es cuantitativa continua si el conjunto de posibles valores es infinito no
numerable, es decir, que puede tomar cualquier valor en un intervalo determinado.

Las siguientes variables son de una encuesta aplicada a un postulante de una agencia publicitaria:

Variable cualitativa Variable cuantitativa discreta Variable cuantitativa continua

• Lugar de nacimiento • Número de capacitaciones que • Tiempo que demora para


• Grado de instrucción llevó el año anterior trasladarse de su casa al trabajo
• Número de trabajos que ha (en minutos)
tenido en los últimos dos años • Salario actual (en soles)

1.10. Escala de medición


Otra forma común de clasificar las variables es mediante el uso de cuatro niveles de medición;
nominal, ordinal, de intervalo y de razón. Cuando la estadística se aplica a problemas reales el nivel
de medición de las variables es un factor importante para determinar el procedimiento a usar.

Nominal Ordinal Intervalo Razón


Se usa cuando los datos Se usa cuando los datos Se utiliza cuando los Si los cocientes o
sólo pueden clasificarse que reflejan diferentes datos miden razones de los números
en categorías o grados del atributo de cuantitativamente la asignados a las unidades
modalidades. estudio. Las variables con intensidad del atributo estadísticas reflejan los
escalas ordinales pueden en estudio y, además, cocientes de las cuantías
Si se le identificase ser ordenadas o las diferencias iguales de las propiedades que
mediante un número, clasificadas en relación a entre estos valores se miden.
este sólo se utiliza como la cantidad del atributo indican diferencias
una etiqueta. poseído. Cada categoría iguales en las cuantías En esta escala el cero
puede ser comparada con de los atributos indica la ausencia de
otra en relación de medidos. característica de la
“mayor que” o “menor medida. También se le
que”. Si se le identificase En esta escala el cero conoce como escala de
mediante un número, es relativo, es decir, no proporción o cociente.
este se utiliza para indica la ausencia de la
establecer el orden del característica medida.
atributo estudiado.

3
1.11. Parámetro
Medida que describe una característica resumen de las unidades que componen una población

1.12. Estadístico
Medida que describe una característica resumen de las unidades que componen una muestra.

Algunos parámetros y estadísticos que se pueden calcular son:

4
Después de la revisión de la
infografía
Actividad estudiante con profesor
(Conceptos y definiciones)

Ejercicio 1

Del total de ingenieros industriales colegiados, registrados en la ciudad de Lima durante el año 2019,
se seleccionó al azar a 85 de ellos. A los seleccionados, se les consultó si trabajan en empresas privadas.
Determine:

Población

Muestra

Unidad
elemental

Ejercicio 2

Se realiza un estudio para investigar las fisuras por desgaste que se presentan en las alas de los aviones
del Aeropuerto internacional Jorge Chávez. Para esto, se toma una muestra de 50 aviones a los que se
inspeccionan sus alas. Determine:

Población

Muestra

Unidad
elemental

Ejercicio 3

El Gobierno está preocupado por las terribles consecuencias que podría ocasionar la ocurrencia de un
sismo de alta intensidad en las viviendas ubicadas en el Cercado de Lima. Por esta razón, Defensa Civil
ha decidido realizar un diagnóstico de la situación de las viviendas en este distrito, encuestando a 1200
viviendas seleccionadas al azar. Determine:

Población

Muestra

Unidad
elemental

5
Ejercicio 4
La empresa Star S.A.C. llevó a cabo un estudio entre los usuarios de Internet en Trujillo para analizar
el mercado de posibles compradores a través de este servicio. Como parte del estudio se recolecto una
muestra de 1500 usuarios.

Durante la recolección de datos se registró que uno de los usuarios: tiene 28 años, cuenta con dos
computadoras con servicio de internet, opina que la calidad del servicio prestado es buena,
diariamente utiliza el servicio de internet por 3.5 horas y la computadora con mayor uso del servicio
de internet es de la marca Asus.
De acuerdo con el texto, identifique lo siguiente:

Dato

Observación

Ejercicio 5
Complete la siguiente tabla:

Variable Tipo de variable Escala de medición

Número de celular

Longitud de cable de fibra óptica usado en


una instalación industrial (metros)
Marca de un medidor láser de distancia
(Bosch, Hilti, Suaoki, Leica)

Tiempo de vida útil de una laptop (años)

Peso de un celular, en kilogramos

Grado en el ejército (general, coronel,


comandante, etc.)

Kilometraje de un auto (kilómetros por año)

Tamaño de una bebida (pequeña, mediana,


grande)

6
Ejercicio 6
La gerencia de la empresa Star S.A.C. llevó a cabo un estudio entre los usuarios de Internet en Trujillo
para poder analizar el mercado de posibles compradores a través de este servicio. Como parte del
estudio realizado se analizó la información correspondiente a una muestra de 1500 usuarios.

Por datos históricos de la empresa se sabe que, en promedio los usuarios utilizan el servicio de internet
3.75 horas al día. Además, de la muestra de usuarios se obtuvo que el número promedio de
computadoras que cuentan con el servicio de internet en sus casas es de 2.5 y el 12% piensan que la
calidad del servicio de internet es regular.

En base al enunciado y analizando la encuesta complete lo siguiente:

Nombre del
Parámetro o
Resultado parámetro o Notación Valor
Estadístico
estadístico

En promedio los usuarios utilizan el


servicio de internet 3.75 horas al día.

El 12% de los usuarios piensan que la


calidad del servicio de internet es
regular.

El número promedio de computadoras


que cuentan con el servicio de internet
es de 2.5.

7
Actividades de autoaprendizaje
Organización de datos (variable cualitativa)

2. Organización y presentación de datos

2.1. Tabla de distribución de frecuencias


La forma más simple de resumir un conjunto de datos es la tabla de distribución de frecuencias
que consiste en presentar para cada valor de una variable (cualitativa o cuantitativa) el número de
casos que la componen.

2.2. Frecuencias absolutas, relativas y porcentuales


a) La frecuencia absoluta simple (fi) de una clase es la cantidad de elementos que pertenecen a
esa clase.
b) La frecuencia relativa simple (hi) de una clase es la proporción de elementos que pertenecen a
esa clase.
frecuencia absoluta fi
hi = =
número total de datos n
c) La frecuencia porcentual simple (pi) de una clase es la frecuencia relativa multiplicada por
100%.
pi = hi x 100%
d) La frecuencia absoluta acumulada (Fi) de una clase es la suma de la frecuencia absoluta de un
valor determinado de la variable con las frecuencias absolutas de los valores menores de la
variable. La frecuencia absoluta acumulada del último valor de la variable es igual al total de
casos.
e) La frecuencia relativa acumulada (Hi) de una clase es la suma de la frecuencia relativa de un
valor determinado de la variable con las frecuencias relativas de los valores menores de la
variable. Se puede expresar en porcentaje. La frecuencia relativa acumulada del valor más alto
de la variable es igual a 1.
f) La frecuencia porcentual acumulada (Pi) de una clase es la suma de la frecuencia porcentual
de un valor determinado de la variable con las frecuencias porcentuales de los valores menores
de la variable. La frecuencia porcentual acumulada del valor más alto de la variable es igual a
100%.

2.3. Organización de datos cualitativos


Se deberá presentar en la tabla las diferentes categorías que asume la variable cualitativa y en la
columna de las frecuencias absolutas la cantidad de veces que se repite esta categoría de la
variable.

• Si la medición está hecha en escala nominal sólo deberá mostrarse las frecuencias absolutas
y relativas.
• Si la variable cualitativa está medida en escala ordinal, tendrá sentido mostrar las frecuencias
acumuladas absolutas y relativas.
La distribución de frecuencias es un cuadro que se calcula de la siguiente manera:

8
Distribución de <<unidades elementales>> según <<variable>>
Frecuencia absoluta Frecuencia relativa Frecuencia porcentual
Variable
simple (fi) simple (hi) simple (pi)
f1
Categoría 1 f1 h1 = p1 =h1 ×100
n
f2
Categoría 2 f2 h2 = p2 =h2 ×100
n
. . . .
. . . .
. . . .
fk
Categoría k fk hk = pi =hi ×100
n
Total n 1 100%
Fuente:

Título de una tabla de distribución de frecuencias


De acuerdo con el INEI, para los títulos seguiremos el siguiente esquema:
Distribución de <<unidades elementales>> según <<variable>>

2.4. Representación gráfica de variables cualitativas

a. Gráfico de barras
En el eje horizontal se representa las categorías de la variable y en el
eje de ordenadas las frecuencias absolutas, relativas o porcentuales.

b. Gráfico circular
En este caso las categorías de la variable cualitativa ocupan un espacio
en el círculo que es proporcional a la frecuencia que representan.
También se denomina diagrama de sector circular, gráfico tipo torta o
pastel.

Si la variable cualitativa es de escala ordinal se recomienda usar el gráfico de barras.

Ejemplo 1
La universidad A realizó una encuesta a 30 estudiantes que están terminando el colegio con la finalidad
de conocer sus preferencias profesionales. De los datos obtenidos se construyó la siguiente tabla:

Distribución de estudiantes según su preferencia profesional


Preferencia profesional fi hi pi
Administración 5 0.1667 16.67%
Derecho 4 0.1333 13.33%
Gastronomía 6 0.2000 20.00%
Ingeniería 8 0.2667 26.67%
Negocios 3 0.1000 10.00%
Periodismo 4 0.1333 13.33%
Total 30 1.0000 100.00%
Fuente: Universidad A

9
a. Presente el gráfico de barras de frecuencias porcentuales

Distribución porcentual de estudiantes según su preferencia


profesional
30%
26.67%
Porcenaje de estudiantes

25%
20.00%
20%
16.67%
15% 13.33% 13.33%
10.00%
10%

5%

0%
Administración Derecho Gastronomía Ingeniería Negocios Periodismo
Preferencia profesional
Fuente: Universidad A
b. Presente el gráfico circular de frecuencias porcentuales.

Distribución porcentual de estudiantes según su preferencia


profesional
Periodismo Administración
13% 17%

Negocios
10%

Derecho
13%

Ingeniería
27% Gastronomía
20%
Fuente: Universidad A

10
Ahora, pon a prueba tus conocimientos
aprendidos
Ejercicios complementarios

Ejercicios

1. Una tienda que se dedica a la venta de productos electrónicos realiza un estudio sobre la
marca de laptop que prefieren sus clientes, para lo cual realizaron una encuesta a 30 de sus
clientes. Se obtuvieron los siguientes resultados:

Toshiba Hp Hp Hp Toshiba
Hp Apple Hp Hp Hp
Hp Hp Hp Hp Hp
Toshiba Apple Hp Apple Hp
Hp Hp Hp Hp Apple
Hp Hp Hp Hp Hp

a. Obtenga la tabla de distribución de frecuencias respectiva. Indique todos los elementos de la


tabla.
b. ¿Cuál es el porcentaje de clientes prefieren una laptop Toshiba?
c. ¿Cuál es el número de clientes prefieren una laptop Apple?

2. La siguiente información muestra la distribución de una muestra de viviendas de un determinado


distrito de Lima según material con el cual fue construido.

Distribución de viviendas según material de construcción


Material de construcción fi hi

Adobe 48 0.160
Cemento 100 0.333
Material prefabricado 108 0.360
Quincha

Total 300 1
Fuente: Municipalidad distrital

Complete la tabla e interprete el valor de las siguientes frecuencias:

f2 =

P4 =

11

También podría gustarte