ME_1
ME_1
ME_1
APLICADA
ESTADÍSTICA DESCRIPTIVA
TOPOGRÁFICO
ESCUELA DE CONSTRUCCIÓN
Consideraciones Previas
El contenido que se expone a continuación está ligado a los siguientes
aprendizajes esperados:
WWW.IPLACEX.CL 2
ESCUELA DE CONSTRUCCIÓN
Introducción
La información siempre, y con mayor razón hoy en día, es fundamental para la toma de
decisiones, las que deben ser oportunas y eficientes. Con errada o insuficiente información lo
más probable es que la decisión sea equivocada. En consecuencia, un sólido respaldo para
una acertada toma de decisiones, contempla ambos aspectos: i) información buena y suficiente,
y ii) un debido procesamiento de los datos.
La Estadística es una disciplina que proporciona una metodología fundada en la matemática
para obtener, recopilar, procesar, resumir y presentar datos referentes a un estudio de
interés, transformándolos en estadísticos y parámetros con el fin de interpretarlos para
obtener conclusiones, dando garantía de idoneidad en los procedimientos. También propone
metodologías que permite deducir características poblacionales a partir de muestras de ellas.
WWW.IPLACEX.CL 3
ESCUELA DE CONSTRUCCIÓN
Ideas fuerza
La aplicación del tratamiento estadístico tiene dos fases fundamentales:
La finalidad por tanto de la Estadística Descriptiva no es, extraer conclusiones generales sobre
el fenómeno que ha producido los datos bajo estudio, sino solamente su descripción, de ahí su
nombre.
WWW.IPLACEX.CL 4
ESCUELA DE CONSTRUCCIÓN
Desarrollo
1. Introducción a la Estadística
La Estadística es la ciencia de la toma de decisiones en condiciones de incertidumbre y
como tal, forma parte del método científico. El método científico se basa en tres pilares
fundamentales: observación, razonamiento y experimentación, el cual no debe
entenderse como una simple receta, sino que se trata de un proceso exigente que requiere,
entre otros ingredientes, juicio crítico. De forma resumida, el método científico incorpora las
siguientes facetas:
WWW.IPLACEX.CL 5
ESCUELA DE CONSTRUCCIÓN
característica se denomina variable. Para el caso particular de una muestra que incluye
a todos los elementos de la población es conocido como censo.
Por otro lado, el conocimiento es una mezcla de experiencia, valores, información y saber
hacer, que sirve como marco para la incorporación de nuevas experiencias e información,
y es útil para la acción. Se aplica en la mente de los conocedores. Para concluir, se puede
declarar que, el conocimiento se deriva de la información, así como la información se deriva
de los datos. En estadística, se recolectan los datos, se analizan, y se elabora la
información.
Por lo anterior, es posible concluir que el método estadístico (estadística descriptiva) nos
proporciona las técnicas necesarias para recolectar y analizar la información requerida, en
la que se puede distinguir dos etapas:
WWW.IPLACEX.CL 6
ESCUELA DE CONSTRUCCIÓN
Los pasos que conforman esta etapa del método estadístico son representados y definidos
en la Figura 2.
La etapa de ejecución del trabajo estadístico contempla los siguientes pasos consecutivos: i)
recopilación de los datos, ii) elaboración de la información, el cual consiste en tabular,
graficar y resumir la información, y por último iii) análisis de resultados (temas que serán
abordados en el transcurso de la presente unidad).
Desde una mirada científica, la estadística brinda las herramientas y procedimientos para
ser aplicadas en los siguientes contextos y/o situaciones:
§ Análisis de muestras. Se elige una muestra de una población para hacer inferencias
respecto de esa población a partir de lo observado en la muestra (sondeos de opinión,
control de calidad, etc.).
WWW.IPLACEX.CL 7
ESCUELA DE CONSTRUCCIÓN
§ Predicción. Prever la evolución de una variable estudiando su historia y/o relación con
otras variables.
§ Representar gráficamente los datos para hacer una representación esquemática de estos.
§ Determinar los estadísticos de tal manera de mostrar características propias de los datos.
Para poder realizar adecuadamente estas tres tareas, se debe tener en cuenta el tipo de
dato que se va a medir, es decir, el tipo de tabla, gráfico y estadísticos que se determinarán
(los estadísticos son explicados más adelante en esta unidad); lo cual depende del tipo de
variable que se está analizando estadísticamente.
Dado lo anterior, lo principal será definir los tipos de variables y sus principales
características.
El objeto de interés o estudio pueden ser variables de tipos muy diversos. De ahí que
normalmente se clasifican en: i) variables cuantitativas, son aquellas que toman valores
numéricos, ejemplo de estas son: la altura, la velocidad de móvil, la presión, etc., y ii)
variables cualitativas, también llamadas atributos, son aquellas que, en general, no se
representan numéricamente puesto que describen cualidades. Por ejemplo, la variable
“color” o “estado civil”. Sin bien existen algunas diferencias entre un tipo de variable y otra,
en muchas ocasiones es posible asignar valores numéricos a los diferentes caracteres
cualitativos.
WWW.IPLACEX.CL 8
ESCUELA DE CONSTRUCCIÓN
Por otro lado las variables pueden ser clasificadas según el tamaño del recorrido y la
escala de medición, lo que permite determinar el método más adecuado para tratar los
datos recolectados según su naturaleza.
Como su nombre lo indica, en este caso las variables son clasificadas de acuerdo al número
de valores que éstas pueden tomar, las que se pueden dividir en:
§ Variable binaria o dicotómica. Estas variables sólo pueden tomar dos valores, es decir,
los elementos pueden ser clasificados en dos categorías mutuamente excluyentes. Son
ejemplos de variable binaria o dicotómica: “sexo” (masculino/femenino),
chilenos/extranjeros, etc.
§ Variable discreta. Una variable será cuantitativa discreta cuando sólo pueden tomar una
cantidad finita numerables de valores. Por ejemplo, el número de electrones de un átomo,
el número de estudiantes en una sala, etc.
§ Variable continua. Una variable será cuantitativa continua cuando pueden tomar
teóricamente infinitos valores entre dos valores dados. Por ejemplo entre los número 0 y 1
existe un número infinito de números. Como ejemplo de estas variables se encuentra el
ingreso, el consumo de agua potable, la estatura, etc.
Muchas veces una variable continua se trabaja como variable discreta (para propósitos de
análisis). Así por ejemplo, la variable “ingreso” puede tratarse en subcategorías referidas a
niveles o estratos socio-económicos.
b) Escala de medición
§ Escala nominal. Las observaciones para una variable sólo pueden ser clasificadas en
“una” de varias clases mutuamente excluyentes y exhaustivas. Una clase se define como
el rango de intervalos, en la que se debe agrupar una variable. Por ejemplo, supongamos
que se realiza esta pregunta: “¿podrías seleccionar el grado de incomodidad de tu
enfermedad?”. Las opciones de respuesta utilizadas para este tipo de escala serían: (1)
Leve, (2) Moderado y (3) Severo.
§ Escala ordinaria (ordinal). También llamada escala de orden jerárquico, con ella se
establecen posiciones relativas de los objetos o fenómenos de estudio, respecto de alguna
característica de interés, sin que se reflejen distancias entre ellos. Por ejemplo, suponga
que a los clientes en un almacén se les formulan unas preguntas para valorar la calidad del
servicio. Los clientes valoran la calidad de acuerdo a las siguientes respuestas previas: 1
(excelente), 2 (bueno), 3 (regular), 3 (malo) y 4 (pésimo). Estos datos son ordinales. Nótese
WWW.IPLACEX.CL 9
ESCUELA DE CONSTRUCCIÓN
que una valoración de 1 no indica que el servicio es dos veces mejor que cuando se da una
valoración de 2. Sin embargo podemos decir que la valoración de 1 es preferiblemente
mejor que 2, y así lo mismo para los demás casos.
§ Escala de razón. Cuando una escala tiene todas las características de una escala de
intervalo y además un punto cero real en su origen, se llama escala de razón. Además de
distinción, orden y distancia, ésta es una escala que permite establecer en qué proporción
es mayor una categoría de una escala que otra. El cero absoluto o natural representa la
nulidad de lo que se estudia.
Variable Cuantitativa
Continuas Discretas
Variable Cualitativa
Ordinales Nominales
Por otra parte, las variables se pueden asimismo clasificar en unidimensionales, cuando
solo se mida un carácter o atributo de los elementos de la muestra, o bidimensionales,
tridimensionales, y en general n-dimensionales, cuando se estudien simultáneamente
varios caracteres de cada elemento.
WWW.IPLACEX.CL 10
ESCUELA DE CONSTRUCCIÓN
2. Estadística Descriptiva
Cuando primero se le presenta a usted un conjunto de datos, ya sea de una muestra o una
población, necesita encontrar una forma de organizarlo y resumirlo. La rama de la
estadística que presenta técnicas para describir conjuntos de mediciones o datos se
denomina estadística descriptiva. Las gráficas de barras, de puntos, las gráficas
presentadas por un candidato político o las gráficas presentadas en vuestra fuente laboral
es el resultado de la estadística descriptiva.
Como podemos observar, la definición de estadística descriptiva nos invita a aprender las
técnicas utilizadas para resumir y comprender la información entregada por los datos. La
estadística descriptiva formula reglas y procedimientos para la presentación de una serie
de datos en una forma más útil y significativa.
Supongamos que tenemos una muestra de tamaño 𝑛, donde la variable estadística 𝑥 toma
valores distintos 𝑥! , 𝑥" , … , 𝑥# . En primer lugar debemos ordenar los diferentes valores que
toma la variable estadística en orden (normalmente creciente). La diferencia entre el valor
mayor y menor que toma la variable se conoce como recorrido o rango 𝑅.
WWW.IPLACEX.CL 11
ESCUELA DE CONSTRUCCIÓN
𝑥$ 𝑓$ ℎ$ 𝐹$ 𝐻$
§ Frecuencia absoluta 𝑓$ : Definida como el número de veces que aparece repetido el valor
en cuestión de la variable estadística en el conjunto de las observaciones realizadas. Si 𝑛
es el número total de observaciones (o tamaño de la muestra), las frecuencias absolutas
cumplen las siguientes propiedades:
0 ≤ 𝑓$ ≤ 𝑛 ; . 𝑓$ = 𝑛
$&!
La frecuencia absoluta, aunque nos dice el número de veces que se repite un dato, no nos
informa de la importancia de este. Para ellos se realiza la siguiente definición.
𝑓$
ℎ$ =
𝑛
WWW.IPLACEX.CL 12
ESCUELA DE CONSTRUCCIÓN
%
ℎ$
0 ≤ ℎ$ ≤ 1 ; . =1
𝑛
$&!
Esta frecuencia relativa se puede expresar también en tantos por ciento del tamaño de la
muestra, para lo cual basta con multiplicar por 100. En este caso habitualmente recibe el
nombre de frecuencia relativa porcentual.
ℎ$ (%) = 100 ∙ ℎ$
Así por ejemplo, si ℎ$ = 0,25, esto quiere decir que la variable 𝑥$ se repite en el 25% de la
muestra.
𝐹𝒊 = 𝐹$(! + 𝑓$ ; 𝐹𝟏 = 𝑓𝟏
𝐹% = 𝑛
Nótese que la frecuencia relativa acumulada del último valor es 1, o 100% si está expresada
en porcentaje.
WWW.IPLACEX.CL 13
ESCUELA DE CONSTRUCCIÓN
Ejemplo 1:
2 1 1 3 1 2 5 1 2 3
4 2 3 2 1 4 2 3 2 1
𝐹! 𝐻!
N° 𝑥! 𝑓! ℎ! ! !
𝑓! ⁄𝑛 ) 𝑓% ) ℎ%
" "
1 1 6 0,30 6 0,30
2 2 7 0,35 13 0,65
3 3 4 0,20 17 0,85
4 4 2 0,10 19 0,95
5 5 1 0,05 20 1,00
Algunas conclusiones que se pueden obtener a partir de la tabla de frecuencias son las
siguientes:
WWW.IPLACEX.CL 14
ESCUELA DE CONSTRUCCIÓN
𝑎$ − 𝑎$&" 𝑚$ 𝑓$ ℎ$ 𝐹$ 𝐻$
ii. Decidir el número 𝑘 de intervalos de clase en que se van a agrupar los datos. Dicho número
se debe situar normalmente entre 5 y 20, dependiendo del caso. En general el número será
más grande cuantos más datos tenga la muestra. Existen dos reglas para orientar la
decisión del número de intervalos 𝑘. La primera de estas reglas corresponde a elegir 𝑘
como el entero más próximo a √𝑛, donde 𝑛 corresponde al número total de medidas o
datos. La segunda corresponde a la Regla de Sturges, la cual determina el número de
intervalos 𝑘 mediante la siguiente expresión:
WWW.IPLACEX.CL 15
ESCUELA DE CONSTRUCCIÓN
Así por ejemplo, si el estudio corresponde a la estatura de 142 niños de octavo básico, el
número de intervalos 𝑘 utilizando la Regla de Sturges será:
𝑘 = 8,1 … ≈ 8
Así para este estudio podrían emplearse 8 intervalos (también podría aproximarse al entero
superior. Dependerá del criterio del analista).
iii. Dividir el rango 𝑅 entre el número de intervalos 𝑘 para determinar la amplitud 𝐴 (constante)
de cada intervalo. Dicha amplitud no es necesariamente que sea exactamente el resultado
de esa división, sino que normalmente se puede redondear hacia el número entero
superior.
𝑅
𝐴=
𝑘
iv. Determinar los extremos o límites de los intervalos de clase. Evidentemente el extremo
superior de cada intervalo ha de coincidir con el extremo inferior del siguiente. Es
importante que ninguna observación coincida con algunos de los extremos, para
evitar así una ambigüedad en la clasificación de ese dato (observación). Una forma de
conseguir esto es asignar a los extremos de los intervalos una cifra decimal más que las
medidas de la muestra. Así por ejemplo, si la variable estadística toma valores enteros tales
como: 10, 11, 12…., los intervalos se podrían elegir: 9,5 – 11,5; 11,5 – 13,5,… y así
sucesivamente.
v. Calcular las marcas de clase de cada intervalo como el valor medio entre los límites inferior
y superior de cada intervalo de clase. Una consideración a tomar en cuenta a la hora de
establecer el límite superior del último intervalo, es que éste no debe ser superior al dato
máximo de la muestra. Esto es, si el dato máximo es 45,5, el límite superior del último
intervalo debiera ser 45,55. Recuerde la orientación iv.
vi. Una vez determinados los intervalos se debe hacer un recuento cuidadoso del número de
observaciones que caen dentro de cada intervalo, para construir así la tabla de distribución
de frecuencias.
WWW.IPLACEX.CL 16
ESCUELA DE CONSTRUCCIÓN
Ejemplo 2:
En la siguiente tabla se listan los datos medidos por James Short en 1763 sobre la paralaje
del Sol en segundos de arco. La paralaje es el ángulo subtendido por la Tierra vista desde
el Sol. Se midió observando tránsitos de Venus desde diferentes posiciones y permitió la
primera medida de la distancia Tierra-Sol, que es la unidad básica de la escala de
distancias en el Sistema Solar (la unidad astronómica).
𝑘 = 5,36 ≈ 5
Para efectos de este ejemplo, se utilizará el primer cálculo, es decir, 𝑘 = 5. Como el valor fue
redondeado hacia arriba, la amplitud del intervalo multiplicada por el número de intervalos
será mayor que el rango y no tendremos problemas en los extremos.
WWW.IPLACEX.CL 17
ESCUELA DE CONSTRUCCIÓN
𝑅
𝐴=
𝑘
3,33
𝐴= → 0,7
5
Con el objetivo de evitar coincidencias se debe tomar un decimal más. Observemos que el
dato mínimo es 7,47; un decimal más corresponderá 7,470. Si el primer intervalo tendrá
como límite inferior el valor 7,465, y el límite superior del intervalo será 7,465 + 0,700 =
8,165, de este modo el segundo intervalo comenzará desde el valor 8,165; y así
sucesivamente.
Marca de
Intervalo Clase 𝑓$ ℎ$ 𝐹$ 𝐻$
𝑚$
7,465 – 8,165 7,815 9 0,43 9 0,43
8,165 – 8,865 8,515 7 0,33 16 0,76
8,865 – 9,565 9,215 2 0,10 18 0,86
9,565 – 10,265 9,915 1 0,05 19 0,90
10,265 – 10,805 10,535 2 0,10 21 1,00
Algunas conclusiones que se pueden obtener a partir de la tabla de frecuencias son las
siguientes:
WWW.IPLACEX.CL 18
ESCUELA DE CONSTRUCCIÓN
Una tabla multidimensional, o tabla de contingencia, es una de las formas más comunes de
resumir datos categóricos. En general, el interés se centra en estudiar si existe alguna
asociación entre una variable fila y otra variable columna y/o calcular la intensidad de dicha
asociación.
Ejemplo 3:
Ataque No
Ataque Mortal No Ataque
Mortal
Placebo 18 171 10845
Cardioaspirina 5 99 10933
WWW.IPLACEX.CL 19
ESCUELA DE CONSTRUCCIÓN
Conclusión
Podemos finalizar el estudio de la primera semana del curso reforzando que la estadística
descriptiva es la rama de la matemática que recolecta, presenta y caracteriza un conjunto
de datos, con el fin de describir apropiadamente las diversas características de este
conjunto. Las variables, en su primera clasificación, pueden ser del tipo cualitativas o
cuantitativas, las cuales también pueden clasificarse como unidimensionales,
bidimensionales y n-dimensionales.
Los datos corresponden a medidas y/o números recopilados a partir de la observación, los
cuales pueden concebirse como información numérica para ayudar a tomar una decisión
con más bases en una situación particular. Para que los datos entreguen información deben
ser suficientes en calidad y cantidad, además deben ser procesados y tabulados en tablas
de distribución de frecuencia, las cuales permiten visualizar aspectos relevantes para la
toma decisiones. En este sentido se deben considerar, básicamente, la frecuencia absoluta,
la frecuencia relativa, la frecuencia absoluta acumulada y relativa acumulada, en tanto por
uno y, si se requiere, también en porcentaje.
WWW.IPLACEX.CL 20
ESCUELA DE CONSTRUCCIÓN
Bibliografía
Canavos, G. (1988). Probabilidad y Estadística: Aplicaciones y Métodos. Mc Graw-Hill.
México D. F., México.
WWW.IPLACEX.CL 21