Qué Es La Estadística

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 17

Qué es la Estadística: conceptos, tipos y ejemplos

La estadística es la ciencia encargada de estudiar los datos. Esta incluye


recolectar, analizar y describir los datos para llegar a conclusiones sobre un
fenómeno en particular.

La estadística emplea herramientas matemáticas y de probabilidades, con las


cuales desarrolla métodos y modelos para analizar los datos. Estos métodos
estadísticos se aplican en diversas áreas de las ciencias naturales y sociales, la
publicidad y el mercadeo, en las industrias y el entretenimiento.

De allí que tras un análisis estadístico se pueda comprender un hecho, tomar


decisiones, estudiar problemas sociales, ofrecer soluciones en determinados
casos, deducir relaciones en una población, entre otros.

La estadística ofrece una variedad de aplicaciones útiles en distintos escenarios:

 Identificar los productos más vendidos en una tienda.

 Realizar pronósticos del tiempo basados en datos climáticos.

 Analizar el desempeño de los equipos deportivos. Esto incluye partidos


ganados, perdidos y empatados, esta información es útil para predecir
resultados en distintos juegos.

 Ayudar a los gobiernos a conocer las características de su población y


economía, lo que les permite tomar decisiones informadas basadas en
datos reales.

 Permitir a las empresas conocer a sus competidores y mejorar su


rendimiento en el mercado.

 Servir como base indispensable para los investigadores científicos, quienes


analizan los datos y sacan conclusiones a partir de ellos.

Principales conceptos en estadística


La estadística emplea sus propios términos para describir y analizar los datos.
Veamos algunos de los más importantes.

 Datos: son los valores observados de las variables.

 Unidades muestrales: son los objetos de interés de un estudio. Las


unidades muestrales pueden ser tornillos, personas o latas de frijoles como
individuos, o pueden ser unidades compuestas por muchos individuos,
como ciudades, escuelas o lotes de tornillos.
 Población en estudio: es el conjunto completo de unidades muestrales
que interesa estudiar con el fin de responder una pregunta de investigación.
Por ejemplo, si estamos estudiando las orquídeas de una reserva natural,
todas las orquídeas corresponden a la población en estudio.

 Muestra de la población: cuando se quiere estudiar una población, pero


es difícil poder acceder a todos los integrantes de la misma, se toma una
porción o un subgrupo que recibe el nombre de muestra. Por ejemplo, en la
ciudad de Monterrey hay más de 5 millones de habitantes. Si queremos
estimar la altura de los adolescentes entre 14 y 16 años de la ciudad de
Monterrey, tenemos que recurrir a una muestra de esta población,
probablemente entre 100 y 500 personas.

 Parámetro: es el valor que describe una población.

 Estadístico: es el valor que se obtiene a partir de una muestra.

 Error de estimación: es la diferencia entre el estadístico de la muestra y el


parámetro de la población.

 Margen de error: mide la diferencia máxima que se espera tener entre un


resultado obtenido a partir de una muestra y su valor poblacional verdadero,
el 95 % de las veces.

 Muestreo: es la forma como se selecciona las unidades muestrales para un


estudio poblacional. El muestreo puede ser aleatorio simple, donde todos
los individuos tienen la misma oportunidad de ser escogidos, o muestreo
sesgado cuando se escogen cierto tipo de individuos.

 Muestreo sistemático: comienza con una unidad elegida al azar y a partir


de allí se toma una unidad cada cierto número fijo. Por ejemplo, se quiere
hacer un estudio de control de calidad en una fábrica de salsa de tomate.
Se escoge un frasco de salsa de tomate cada 50 frascos en un lote de
5000. A estos 100 frascos se les hace las pruebas necesarias para
asegurar que el lote tiene las condiciones adecuadas para salir a la venta.

 Muestreo aleatorio estratificado: la población se divide en grupos


homogéneos llamados estratos, y de cada estrato se hace un muestreo
aleatorio simple. Por ejemplo, en una ciudad la población se podría
estratificar por menores de 10 años, entre 11 y 20 años, entre 21 y 30 años
y mayor de 31 años.

 Muestra representativa: una buena muestra debe ser representativa de la


población. Esto significa, que todas las características importantes de la
población tienen que estar en la muestra en la misma proporción que en la
población.
 Promedio: es el valor característico o central de un conjunto de números.
Dentro de estos valores podemos hablar de la media (se obtiene sumando
todos los valores del conjunto de datos y dividiendo la suma por la cantidad
de datos en ese conjunto) y la mediana (el valor central de conjunto de
datos ordenados).

 Desviación estándar: es una medida de dispersión basada en la media.


Representa una distancia típica de cualquier punto del conjunto de datos a
su centro (medido por la media).

 Intervalos de confianza (IC): se refiere a un rango de valores posibles y


con un cierto porcentaje donde se puede asegurar que se encuentra el
verdadero valor de un parámetro de la población. Por ejemplo, si el
intervalo de confianza al 95% de la altura de una población es (165,175)
quiere decir que si repetimos las mediciones el 95% de las veces caerá
entre los valores de 165 y 175.

 Variables: son características que pueden cambiar de una unidad muestral


a otra. Existen variables numéricas (o cuantitativas) y variables
categóricas (o cualitativos). Por ejemplo, en la siguiente tabla se
muestran las variables de 10 perros que fueron llevados a consulta en un
veterinario. Las variables sexo, raza y presencia de enfermedades son
variables categóricas, mientras la edad y el peso son variables numéricas.
Tipos de estadística
A continuación, se presentan los principales tipos de estadísticas aplicadas en
diversos estudios.

Estadística descriptiva
La estadística descriptiva o deductiva permite presentar de manera resumida y
organizada los resultados obtenidos tras un estudio o análisis en particular. Su
objetivo es describir las características principales de los datos reunidos.

En la estadística descriptiva encuentras el promedio, la desviación estándar, la


frecuencia, los porcentajes, cómo están distribuidos los datos, entre otros
parámetros.

Ejemplo de estadística descriptiva


En un equipo de futbol se obtuvieron los siguientes datos:

El promedio de altura de los jugadores de este equipo es de 1,724 metros con una
desviación estándar de 0,070, el promedio de edad es de 27,72 años y el
promedio de goles es 1,18.

Con respecto a los goles anotados en el último mundial, 53,8 % de los jugadores
no anotó ningún gol, 30,8 % anotó un gol, 7,7 anotó 4 goles y otro 7,7 % anotó 7
goles.
Estadística inferencial
La estadística inferencial o inductiva utiliza técnicas a partir de las cuales se
obtienen generalizaciones o se toman decisiones con base en una información
parcial o completa obtenida mediante la estadística descriptiva.

Por lo general, se aplica estadística inferencial cuando se hacen estudios de


medicamentos o se comparan grupos diferentes.

Ejemplo de estadística inferencial


Supongamos que se realiza un estudio en 100 pacientes con niveles de colesterol
en sangre alto, 50 reciben un placebo y 50 reciben un medicamento. Se miden los
niveles de colesterol luego de 8 semanas. Los resultados son los siguientes:

 Grupo control: media de 250 mg/dL y desviación estándar de 25 mg/dL

 Grupo tratamiento: media de 200 mg/dL y desviación estándar de 30


mg/dL

Para determinar si el nuevo tratamiento es eficaz, se aplican pruebas específicas,


como la t de Student. En este caso, la diferencia entre el grupo control y el grupo
de tratamiento es estadísticamente significativa, lo que quiere decir que el nuevo
tratamiento tuvo un efecto.

Conceptos básicos en la estadística descriptiva


Datos cualitativos y cuantitativos
Los principales tipos de datos estadísticos son los cualitativos o categóricos y los
cuantitativos o numéricos.
Los datos cualitativos representan aspectos de un individuo como el color del
cabello, la nacionalidad, la religión, la marca de teléfono móvil que usa, el sabor
preferido de helado o el tipo de flor que más le gusta, entre otros. Estos datos se
caracterizan porque no pueden ser expresados por números.

Los datos cualitativos sirven para clasificar a los individuos en grupos. Por
ejemplo, si en una comunidad de 1000 personas hay 20 argentinos, 25
venezolanos, 300 guatemaltecos y el resto son mexicanos, podemos calcular el
porcentaje que representa cada nacionalidad.

En cambio, los datos cuantitativos son características que pueden expresarse en


números o cantidades, como el número de horas trabajadas en una semana, la
cantidad de pasos que se camina en un día, la cantidad de personas que asisten a
una obra de teatro o el tiempo que se invierte navegando en Internet.

Media o promedio estadístico


La media o promedio es el valor medio de todos los datos que integran una
muestra. Se representa con una X (equis) con una barra horizontal por arriba (x̄ )
cuando se refiere a una muestra y µ (letra griega mu) cuando se refiere a una
población. Se aplica únicamente a los datos numéricos.

La media es una medida de centralidad de la estadística descriptiva. Se calcula


sumando todos los valores y luego dividiéndolos por la cantidad de datos.

Por ejemplo, si estos son los datos del peso en gramos de 10 manzanas: 225,
230, 242, 233, 267, 212, 222, 290, 233, 236.

El promedio será 239 gramos.

Mediana
Otra variable estadística que se usa para determinar un valor central es la
mediana. La mediana es el valor en la mitad cuando los datos se arreglan de
menor a mayor.
Por ejemplo, en las 10 manzanas del ejemplo anterior, ordenamos los valores de
menor a mayor:

1. 212

2. 222

3. 225

4. 230

5. 233

6. 233

7. 236

8. 242

9. 267

10. 290

Para un número par de datos, se toman los dos datos centrales (en este caso el 5
y el 6) y se promedian. En nuestro caso tenemos los valores 233 y 233, por lo que
la mediana será 233.

Para un número impar de datos, se toma el dato de la mitad. Si tenemos 11 datos,


el valor del dato 5 será la mediana.

Desviación estándar
La desviación estándar es la medida de variabilidad más ampliamente empleada.
Representa la distancia desde cualquier dato hasta el centro y se denota la por la
letra s minúscula.

La desviación estándar es útil para determinar la dispersión y variación de los


datos. Por ejemplo, en estos dos grupos de datos:

1. 0, 200, 400

2. 199, 200, 201

El promedio y la mediana es el mismo en ambos casos, pero nos podemos dar


cuenta que ambos conjuntos de datos tienen una dispersión muy diferente. En el
primer caso, la desviación estándar es 200, mientras en el segundo caso es 1.

Mientras más pequeña es la desviación estándar, más cercanos se encuentran los


datos.
Percentiles
Un percentil es el número de individuos que en los registros de datos se
encuentran por debajo del valor solicitado. Por ejemplo, si un bebé está en el
percentil 90 de peso, significa que el 90 por ciento de los bebés está por debajo
del peso de este bebé.

Un percentil no es un porcentaje, sino un número que representa un dado


porcentaje de los datos ordenados de menor a mayor. Por ejemplo, estos son las
notas de un examen de matemática del 1 al 100:

20, 40, 45, 46, 48, 50, 51, 52, 53, 54, 60, 70, 80, 90, 92, 93, 94, 95, 96, 99

Queremos saber en qué percentil se encuentra la persona que sacó 80 en el


examen. Para esto contamos los datos por debajo de 80, que es igual a 13.
Entonces hacemos el siguiente cálculo:

Esto significa que 65 por ciento de los valores están por debajo del dato 80.

Histograma
El histograma es un tipo de gráfico de barras aplicado a los datos numéricos. Sirve
para visualizar cómo están distribuidos los datos, por ejemplo, si son simétricos,
en forma de campana, con tendencia hacia el lado izquierdo o derecho.

En el ejemplo siguiente, se graficaron las calificaciones de un examen de


matemáticas del tercer año de un salón con 30 estudiantes. El eje horizontal
representa las calificaciones, mientras en el eje vertical se presenta la frecuencia o
el número de veces que se repite un dato. En este caso, 8 personas sacaron 15
de calificación.

El muestreo es un proceso o conjunto de métodos para obtener una muestra finita


de una población finita o infinita, con el fin de estimar valores de parámetros o
corroborar hipótesis sobre la forma de una distribución de probabilidades o sobre
el valor de un parámetro de una o más poblaciones.
Moda
La moda es el valor que más aparece en un conjunto de datos. Se considera
también una medida de la tendencia central.

En el ejemplo anterior, la moda es 15, la calificación que más se repite en este


examen con 8.

Muestreo: Explicación sencilla

En palabras simples, el muestreo es el proceso de escoger ciertos individuos de


una población que se está investigando. Se hace porque las poblaciones suelen
ser demasiado grandes, y recopilar datos de cada persona es costoso e
impráctico.

El objetivo del muestreo es que el grupo seleccionado represente a la población


total. Así, los indicadores clave como edad, ingresos promedio, y distribución de
género deben ser similares o reflejar la composición general.

Tipos de muestreo

Los tipos de muestreo pueden distinguirse en función de distintos criterios. Así,


según la técnica para seleccionar el subgrupo, se pueden diferenciar los
siguientes:
Muestreo probabilístico

Las observaciones son seleccionadas en base a la aleatoriedad, es decir, al azar.


En esta categoría podemos encontrar:

 Muestreo aleatorio simple: Todos los individuos de la población tienen la


misma probabilidad de ser elegidos como parte de la muestra. Tiene
ventajas, como el hecho de que es fácil de llevar a cabo a través de
sistemas informáticos. Sin embargo, se requiere el listado completo de toda
la población y, si la muestra es muy pequeña, la selección podría no ser
representativa.
 Sistemático: Se elige una observación al azar y, para seleccionar el resto
de la muestra, se utilizan intervalos numéricos regulares. Es decir,
supongamos que tengo una población de 10.000 y, aleatoriamente,
selecciono la observación 600, después de lo cual puedo considerar
intervalos de 30 observaciones. En este caso, tomaría las observaciones
600, 630, 660, 690, 720, 750, 780, y así sucesivamente.
 Aleatorio estratificado: Se divide a la población en estratos, que son
grupos que comparten características en común y son más homogéneos,
inclusive, que la población en su conjunto. Entonces, se selecciona una
muestra, ya sea de manera aleatoria o sistemática, dentro de cada estrato.
El objetivo es lograr una representatividad de cada estrato.
 Por conglomerados o clústeres: Consiste en crear grupos más pequeños
que la población, los cuales reflejen o compartan todas las características
de esta. Luego, elegimos alguno de los conglomerados como muestra y lo
analizamos de forma detallada.

Muestreo no probabilístico

La selección de la muestra no depende de la probabilidad, sino de la decisión de


los investigadores. Podemos distinguir algunas subcategorías:

 Por conveniencia: Consiste en que el investigador captará a los sujetos


que estén a su disponibilidad. Por ejemplo, por su proximidad o facilidad de
acceso.
 Método opinático o intencional: El investigador utiliza su juicio o criterio
para elegir a quienes van a participar como parte de la muestra.
 Casual o accidental: El investigador selecciona sin juicio previo a los
individuos que van a formar parte de la muestra. Por ejemplo, esto suele
suceder cuando se hacen encuestas en la calle.
 Bola de nieve: Consiste en que, después de encontrar al primer sujeto (o
primeros sujetos) de la muestra, el investigador le pide ayuda a él (o ellos)
para identificar a otros individuos con esas mismas características. Se trata
de una técnica utilizada cuando es difícil localizar a un grupo específico por
el manejo de datos sensibles, por ejemplo, emigrantes en situación de
ilegalidad.
 Por cuotas: El investigador, tomando en cuenta la composición de la
población, y dividiendo por grupos o estratos, hará una selección
proporcional de la muestra. Por ejemplo, imaginemos que en la población
hay un 40% de personas menores de 25 años, 35% de personas de entre
25 y 50 años, y 25% de individuos con más de 50 años. Entonces, una
muestra de 4.000 personas tendría 1.600 sujetos menores de 25 años,
1.400 de entre 25 y 50 años, y 1.000 adultos mayores de 50 años o más.
Cabe señalar que los individuos que cubrirán cada cuota serán
seleccionados por algún método no probabilístico, es decir, cualquiera de
las técnicas explicadas líneas arriba.

Asimismo, conviene señalar que el muestreo puede ser simple, si se hace una
sola vez; doble, cuando se capturan dos muestras (puede utilizarse la segunda si
la primera no arroja resultados definitivos); o múltiple (es similar a la doble, pero
con más de dos muestras).

¿Qué es un diagrama de Venn?


El diagrama de Venn es un tipo de organizador grafico que muestra cómo se
relacionan dos o más conjuntos de elementos, puesto que, mediante círculos
superpuestos, representa qué características comparten y cuáles no dos o
más categorías, grupos, ideas, conceptos, teorías, entre otros.

En el diagrama de Venn hay:

 Un rectángulo. Representa el universo, es decir, la totalidad de elementos,


y se designa con un título. En algunos diagramas no hay un rectángulo,
pero sí un título.
 Dos o más círculos. Representan los conjuntos las ideas, los conceptos las
categorías que se designan con un título o una oración.
 Palabras o frases. Representan los elementos de un conjunto, los
integrantes de una categoría o una serie de características.
 Una superposición entre los círculos. Representa los vínculos entre los
conjuntos, que pueden ser de intersección, inclusión o disyunción
Por ejemplo, en un diagrama sobre los mamíferos, el universo es características
de los mamíferos y hay dos conjuntos: mamíferos terrestres y mamíferos
acuáticos. En cada círculo, se escriben las características que comparten los
miembros de cada clase y en la superposición de ambos círculos, se anotan las
características en común de ambos conjuntos.
Características del diagrama de Venn
A diferencia de la mayoría de los organizadores gráficos, el diagrama de Venn
permite:

 Identificar qué y cuántos conjuntos hay en relación con un tema.


 Mostrar qué vínculo hay entre los conjuntos.
 Indicar a qué conjunto pertenece cada elemento y, en algunos casos,
identificar elementos que forman parte de dos o más conjuntos.
 Determinar que puede haber elementos que no pertenecen a ningún
conjunto.

¿Para qué sirve el diagrama de Venn?


El diagrama de Venn presenta grandes ventajas y se emplea con distintos fines:

 Muestra información visualmente. Ayuda a organizar la información para


que sea más fácil de comprender.
 Permite graficar la relación entre dos o más conjuntos. Sirve para ver
qué características o qué elementos tienen en común dos o más conjuntos
y cuáles son sus diferencias.
 Es útil para hacer clasificaciones. Sirve para determinar qué elementos
pertenecen a cada categoría.
 Permite hacer comparaciones. Sirve para contrastar las características o
los elementos de objetos, productos, lugares, teorías, entre otros.
 Es una herramienta para tomar decisiones. Permite ver con más claridad
dos o más opciones y reflexionar sobre cuál es la más conveniente.
Tipos de diagrama de Venn
Existen distintos tipos de diagramas de Venn, según el tipo de relación que se
establece entre los conjuntos:

Diagrama de Venn de intersección


Muestra que hay elementos que pertenecen a uno u otro conjunto y elementos
que pertenecen a ambos. Puede haber dos o más círculos, según cuántos
conjuntos sean. Por ejemplo:

El elemento rana está en la intersección, porque es un animal que vive tanto en la


tierra como en el agua.

Diagrama de Venn de inclusión


Muestra que un conjunto incluye a un subconjunto. Por ejemplo:

El conjunto B (seres vivos) incluye al subconjunto A (mamíferos), y, como no


existen mamíferos que no sean seres vivos, se sombrea o se tacha la parte del
círculo mamíferos que no está incluida en seres vivos. Además, el gráfico señala
que existen otros seres vivos que no son mamíferos, como la serpiente, la iguana
y el cóndor.

Diagrama de Venn de disyunción


Muestra que los conjuntos contienen elementos que no pertenecen a otros
conjuntos. Por ejemplo:

Se sombrea o se tacha la superposición de los círculos, para representar que


ningún elemento del conjunto reptiles puede pertenecer al conjunto aves y
viceversa.

¿Cómo hacer un diagrama de Venn?


Para hacer un diagrama de Venn, se puede seguir una serie de pasos:

1. Determinar el tema. Se debe seleccionar el tema y qué aspectos se


buscan comparar. Por ejemplo, se puede contrastar qué características
tienen dos automóviles.
2. Anotar todos los elementos en una lista. Se puede hacer una lluvia
de ideas para anotar todos los elementos o las características. Por
ejemplo, se pueden escribir todas las características más importantes de
los automóviles en general.
3. Determinar los conjuntos. Se debe determinar cuáles son los
conjuntos en los que irán los elementos o las características y dibujar un
círculo por cada conjunto. Si se comparan dos automóviles, habrá dos
círculos superpuestos, uno para el automóvil A y otro para el automóvil
B.
4. Indicar qué elemento pertenece a cada conjunto. Se deben anotar
los elementos o las características en su conjunto correspondiente. Si
algún elemento o característica pertenece a dos conjuntos, se escribe
en el sector donde se superponen los círculos. Por ejemplo, la
característica “veloz” solo está presente en el automóvil A, entonces se
anotará en primer círculo; la característica “confortable” únicamente está
presente en el automóvil B, entonces se escribirá en el segundo círculo;
y la característica “económico” se encuentra en ambos automóviles,
entonces se anotará en la superposición.

Ejemplos del diagrama de Venn

Áreas en que se utiliza el diagrama de Venn


El diagrama de Venn se emplea con distintos objetivos según la disciplina:

 Matemáticas. Sirve para enseñar y aprender de manera didáctica los


conjuntos numéricos y sus vínculos. También se aplica en la resolución de
ecuaciones y problemas y en análisis probabilísticos.
 Estadística. Sirve para comparar datos cuando se analiza cómo se
manifiesta una variable en una población.
 Lógica. Sirve para representar proposiciones y analizar la validez de los
argumentos.
 Enseñanza. Sirve para clasificar distintos elementos y para comparar
teorías, conceptos y características en diversas asignaturas, como lengua,
literatura, ciencias sociales y ciencias naturales.
 Ámbito empresarial. Sirve para analizar y comparar productos, servicios,
necesidades de los clientes, procesos productivos, proyectos, entre otros.
 Informática. Sirve para analizar y comparar distintos tipos de datos, como
algoritmos y preferencias y búsquedas de usuarios.

¿Qué es la probabilidad clásica?


La probabilidad clásica es una medida estadística que indica la probabilidad de
que suceda un evento. La probabilidad clásica es igual al número de casos
favorables de dicho evento dividido entre el número total de casos posibles.

Fórmula de la probabilidad clásica


La fórmula de la probabilidad clásica es el número de casos favorables de un
evento partido por el número total de casos del experimento.

Vista la definición de la probabilidad clásica, a continuación, vamos a explicar un


ejemplo de cómo se calcula este tipo de probabilidad. Así entenderás mejor el
significado de la probabilidad clásica.

Calcula la probabilidad de ocurrencia del evento «obtener el número 5» al lanzar


un dado. Luego determina también cuál es la probabilidad de «obtener un número
menor que 4».
En este caso queremos analizar el experimento aleatorio del lanzamiento de un
dado, que tiene seis posibles resultados (1, 2, 3, 4, 5 y 6). Podemos considerar
que todos los eventos elementales del experimento son equiprobables, ya que se
supone que el dado no está trucado y está en buenas condiciones. Por lo tanto,
podemos usar la regla de Laplace para sacar las probabilidades clásicas.

En el evento «obtener el número 5» solo hay un único caso favorable, que del
dado saquemos la cara con el número 5. Sin embargo, hay seis posibles
resultados, por lo que la probabilidad clásica del evento será:

La probabilidad axiomática es una teoría de probabilidad unificadora. Establece un


conjunto de axiomas (reglas) que se aplican a todos los tipos de probabilidad,
incluida la probabilidad frecuentista y la probabilidad clásica. Estas reglas,
basadas en los Tres Axiomas de Kolmogorov, establecen puntos de partida para
la probabilidad matemática.
Una distribución discreta es un tipo de distribución de probabilidad que muestra
todos los posibles valores individuales que puede tomar una variable aleatoria,
junto con las probabilidades asociadas a cada uno de esos valores. A diferencia
de las distribuciones continuas, las distribuciones discretas solo pueden asumir un
número discreto de valores, lo que significa que no hay ningún valor intermedio o
continuo entre ellos. En otras palabras, solo se pueden obtener ciertos valores
específicos y no hay posibilidad de obtener valores entre ellos.
Una distribución continua es un tipo de distribución de probabilidad en la que la
variable aleatoria puede tomar cualquier valor dentro de un rango o intervalo
continuo. A diferencia de las distribuciones discretas, las distribuciones continuas
pueden tomar infinitos valores entre dos puntos específicos. Esto significa que hay
una infinidad de posibles valores para la variable aleatoria.

También podría gustarte