Estadística

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 15

Estadística

Es la rama de las matemáticas que estudia la variabilidad, así como el proceso


aleatorio que la genera siguiendo las leyes de la probabilidad.2 Como parte de la
matemática, la estadística es una ciencia formal deductiva, con un conocimiento
propio, dinámico y en continuo desarrollo obtenido a través del método científico
formal. En ocasiones, las ciencias fácticas necesitan utilizar técnicas estadísticas
durante su proceso de investigación factual, con el fin de obtener nuevos
conocimientos basados en la experimentación y en la observación. En estos
casos, la aplicación de la estadística permite el análisis de datos provenientes de
una muestra representativa, que busca explicar las correlaciones y dependencias
de un fenómeno físico o natural, de ocurrencia en forma aleatoria o condicional.
La estadística es útil para una amplia variedad de ciencias fácticas, desde
la física hasta las ciencias sociales, desde las ciencias de la salud hasta el control
de calidad. Además, se usa en áreas de negocios o
instituciones gubernamentales con el objetivo de describir el conjunto de datos
obtenidos para la toma de decisiones, o bien para realizar generalizaciones sobre
las características observadas.
En la actualidad, la estadística aplicada a
las ciencias fácticas permite estudiar una
determinada población a partir de
la recopilación de información, el análisis
de datos y la interpretación de resultados.
Del mismo modo, también es una ciencia
esencial para el estudio cuantitativo de
los fenómenos de masa o colectivos.
Población
En biología, el término población hace referencia a todos los organismos del
mismo grupo o especie, que viven en un área geográfica particular.123
En sociología, se refiere a un grupo de seres humanos o a toda la especie.
La demografía es una ciencia social que implica el estudio estadístico de la
población humana. Población, en un
término más simple, es el número de
personas en una ciudad o pueblo,
región, país o mundo; la población
generalmente está determinada por
un proceso llamado censo, es decir,
un proceso de recopilación, análisis,
compilación y publicación de datos
sobre la población y otras variables relacionadas como localidad de residencia,
vivienda, ingreso, nivel educativo y otras.[cita  requerida]
En geografía humana, tiene un significado muy importante como objeto de estudio,
que justifica plenamente la existencia de la geografía de la población.
Muestra
Muestra es una porción de la totalidad de un fenómeno, producto o actividad
que se considera representativa del total también llamada una muestra
representativa.
Muestra viene de mostrar siendo que da a conocer a los interesados o públicos
objetivos resultados, productos o servicios que ejemplifican o sirve como
demostración de un tipo de evento, calidad o la estandarización.
En estadística, una muestra es un subconjunto de casos o individuos de
una población. En diversas aplicaciones, interesa que una muestra
sea representativa, y para ello debe escogerse una técnica de muestra adecuada
que produzca una muestra aleatoria adecuada. También es un subconjunto de la
población, y para ser representativa, debe tener las mismas características de la
población. Si se obtiene una muestra sesgada, su interés y utilidad son más
limitados, en función del grado de sesgos que presente. 1
Como un subgrupo o subconjunto
representativo de la población, extraída
seleccionada por algún método de
muestreo, la muestra siempre es una
parte de la población. Si se tienen varias
poblaciones, entonces se tendrán varias
muestras. La muestra debe poseer toda
la información deseada para tener la
posibilidad de extraerla, y esto solo se
puede lograr con una buena selección de
la muestra y un trabajo muy cuidadoso y de alta calidad en la recogida de datos.
Variable
Una variable es en principio un concepto que determina una cualidad de un objeto,
es un atributo que puede variar de una o
más maneras y que sintetiza conceptualmente lo que se quiere conocer acerca del
objeto de investigación.
Es un símbolo que representa un elemento no especificado de un conjunto dado.
Dicho conjunto es llamado conjunto universal de la variable, universo o dominio de
la variable, y cada elemento del conjunto es un valor de la variable. Sea x una
variable cuyo universo es el conjunto {1,3,5,7,9,11,13}; entonces x puede tener
cualquiera de esos valores: 1,3,5,7,9,11,13. En otras palabras x puede
reemplazarse por cualquier entero positivo impar menor que 14. Por esta razón, a
menudo se dice que una variable es un reemplazo de cualquier elemento de su
universo y sistema solar. Una variable es un elemento de una fórmula, proposición
o algoritmo que puede adquirir o ser sustituido
por un valor cualquiera (siempre dentro de su
universo). Los valores que una variable es
capaz de recibir, pueden estar definidos
dentro de un rango, y/o estar limitados por
criterios o condiciones de pertenencia, al
universo que les corresponde (en estos
casos, el universo de la variable pasa a ser un
subconjunto de un universo mayor, el que
tendría sin las restricciones).
Censo
En estadística descriptiva, se denomina censo al recuento de individuos que
conforman una población estadística, definida como un conjunto de elementos de
referencia sobre el que se realizan las observaciones. El censo de una población
estadística consiste básicamente en obtener mediciones del número total de
individuos mediante diversas técnicas de recuento y se realiza cada determinado
período.
Este tipo de estudios suelen ser utilizados por los Gobiernos para conocer mejor
cómo se conforma la población del país y
cuáles son sus necesidades. Así, puede
identificarse, por ejemplo, qué región tiene un
mayor porcentaje de viviendas sin electricidad.
Los datos que suelen recogerse en un censo
son: edad, sexo, nivel de educación, acceso
a servicios básicos, ingresos mensuales,
características de la vivienda habitada, entre
otros. Es decir, pueden considerarse tanto
variables cualitativas como cuantitativas.
ENCUESTA
Una encuesta es un procedimiento dentro de los diseños de una investigación
descriptiva en el que el investigador recopila datos mediante el cuestionario
previamente diseñado, sin modificar el entorno ni el fenómeno donde se recoge la
información ya sea para entregarlo en forma de tríptico, gráfica o tabla. Los datos
se obtienen realizando un conjunto de preguntas normalizadas dirigidas a una
muestra representativa.
Tipos de encuestas:
 Encuestas descriptivas: Recaba o documentan las actitudes o condiciones
presentes. Esto significa que intentan describir en qué situación se
encuentra una determinada población en el momento en que se realiza la
encuesta.
 Encuestas analíticas: Buscan, además de describir, explicar los por qué de
una determinada situación. En este tipo de encuestas las hipótesis que las
respaldan suelen contrastarse por medio del examen de por lo menos dos
variables, de las que se observan interrelaciones y luego se formulan
inferencias explicativas.
Tipos de preguntas:
 De respuesta abierta: En estas encuestas se le pide al interrogado que
responda él mismo a la pregunta formulada. Esto le otorga mayor libertad al
entrevistado y al mismo tiempo posibilitan adquirir respuestas más
profundas así como también preguntar sobre el porqué y cómo de las
preguntas realizadas. Por otro lado, permite adquirir respuestas que no
habían sido tenidas en cuenta a la hora de hacer los formularios y pueden
crear así relaciones nuevas con otras variables y respuestas.
 De respuesta cerrada: En éstas, los
encuestados deben elegir para
responder una de las opciones que se
presentan en un listado que formularon
los investigadores. Esta manera de
encuestar da como resultado respuestas
más fáciles de cuantificar y de carácter
uniforme. El problema que pueden
presentar estas encuestas es que no se
tenga en el listado una opción que coincida con la respuesta que se quiera
dar, por esto lo ideal es siempre agregar la opción “otros”.
ENTREVISTA
Una entrevista es un diálogo entablado entre dos o más personas: el
entrevistador formula preguntas y el entrevistado las responde. Se trata de una
técnica empleada para diversos motivos, investigación, medicina y selección de
personal. Una entrevista no es casual sino que es un diálogo interesado con
un acuerdo previo e intereses y expectativas por parte tanto del entrevistador
como del entrevistado.
"La entrevista es la más pública de las conversaciones privadas. Funciona con
todas las reglas del diálogo privado, pero está construida para el ámbito público. El
sujeto entrevistado sabe que se expone a la opinión de la gente. Por otra parte no
es un diálogo libre con dos sujetos. Es una conversación radial, o sea centrada en
uno de los interlocutores, y en la que
uno tiene el derecho de preguntar y el
otro de ser escuchado".1sobre la
información
"La entrevista periodística es un
intercambio entre dos personas físicas
y unas cuantas instituciones que
condicionan subjetivamente la
conversación".
OBSERVACION
La observación es la adquisición activa de información a partir del sentido de la
vista. Se trata de una actividad realizada por un ser vivo (humanos, animales, etc),
que detecta y asimila los rasgos de un elemento utilizando sus sentidos como
instrumentos principales. El término también se puede referir a
cualquier dato recogido durante esta actividad.
El primer paso del método empírico, requisito de la investigación científica, es
realizar observaciones de la naturaleza, sea con trabajo de laboratorio o
con trabajo de campo.
La Observación es la técnica de recogida de la información que consiste
básicamente, en observar, acumular e interpretar las actuaciones,
comportamientos y hechos de las personas o objetos, tal y como las realizan
habitualmente. En este proceso se busca contemplar en forma cuidadosa y
sistemática como se desarrolla dichas características en un contexto determinado,
sin intervenir sobre ellas o manipularlas. También se conoce como observación a
la nota escrita que explica, aclara o corrige un dato, error o información que
puede confundir o hacer dudar. Por lo general, esta aclaratoria se encuentra en
libros, textos o escritos.
En el acto de observación se pueden distinguir: el observador, el objeto de
observación, los medios para observar, las condiciones de la observación y,
el sistema de conocimientos relacionados con la finalidad de las
observaciones y las interpretaciones que resulten de ella.
La observación es la técnica más antigua y la
más empleada en investigación, es
el proceso inicial y fundamental del método
científico. La observación científica consiste
en el estudio de un fenómeno específico o
un acontecimiento determinado que se
produce en sus condiciones
naturales. Permite darnos cuenta de los
fenómenos que ocurren a nuestro alrededor
por medio de los sentidos.
CUESTIONARIO
Un cuestionario es una herramienta de investigación que consiste en una serie
de preguntas y otras indicaciones con el propósito de obtener información de los
consultados. Aunque a menudo están diseñados para poder realizar un
análisis estadístico de las respuestas, no es siempre así. El cuestionario fue
introducido por Sir Francis Galton.1
El cuestionario es un documento formado por un conjunto de preguntas que deben
estar redactadas de forma coherente, y organizadas, secuenciadas y
estructuradas de acuerdo con una determinada planificación, con el fin de que sus
respuestas nos puedan ofrecer toda la información necesaria.
La [encuesta] a menudo se realiza en función de un cuestionario con preguntas
{abierta o cerradas}, siendo este por tanto, el [documento] básico para obtener
la información en la gran mayoría de las investigaciones y estudios de [mercado].
Los cuestionarios tienen ventajas sobre otros tipos de encuestas en que estos son
baratos, no requieren de mucho esfuerzo por parte del consultado como por
ejemplo las encuestas orales o telefónicas, y a menudo tienen respuestas
estandarizadas que hacen más simple la tabulación de los datos. Sin embargo,
estas respuestas estandarizadas pueden frustrar a los usuarios. También los
cuestionarios están fuertemente limitados por el hecho de que el consultado deben
ser capaces de leer y responder las preguntas. Es por eso que la realización de
tantas encuestas para algunos
grupos demográficos usando
cuestionarios puede ser no práctica.
Como un tipo de encuesta, el cuestionario
también tiene mucho de los mismos
problemas relacionados con la
construcción y fraseología de las preguntas que existen para otros tipos
de sondeos de opinión.

TABULADOR DE RESULTADOS
Un tabulador de encuestas se encarga de contar y organizar los datos obtenidos
en la aplicación. Esta herramienta abarca las operaciones relacionadas con
conseguir resultados numéricos que se conectan al objeto de estudio.
Tabular la información es uno de los procesos más complicados de realizar
durante la investigación, ya que es necesario contar con una herramienta que
ayude a elaborarlo, de lo contrario, se realiza de forma manual.
El tabulador de encuestas se encarga de ordenar la información y contar las veces
que aparecen algunas características y determinar las cantidades de los datos, un
valor muy importante para obtener la conclusión de la investigación.
Formas de tabular una encuesta
Un tabulador de encuestas puede funcionar de las siguientes formas:
Tabulación manual: Un tabulador de encuestas manual permite agregar a las
tablas los datos obtenidos en las encuestas. Para esto, se utilizan herramientas
como Excel, que permite crear tablas y ecuaciones que deberían hacer más fácil
el trabajo de registrar los datos. Sin embargo, esta herramienta no es
recomendable por las siguientes razones:
 Pueden existir errores de traspaso de datos
 Los datos pueden perderse
 Resultados falsos debido a errores humanos
 Complicación en la arquitectura de datos
 Confusión y dificultad para
interpretar los datos
Tabulación automática: Este método es
el más eficaz para el análisis de datos, ya
que ofrece resultados más completos en infografías, reportes cualitativos y
cuantitativos personalizados  y tablas cruzadas.
DATOS DE FRECUENCIAS NO AGRUPADOS
Datos no agrupados son lo que no aparecen resumidos en distribuciones de
frecuencias.
Distribución o Tabla de Frecuencias es la representación conjunta de los datos en
forma de tabla o subgrupo de datos:  Título, unidades, encabezado, cuerpo
o contenido, nota de pie y referencias. Se elabora colocando en la
primera columna los datos diferentes o subgrupos de       datos  y en la columna
siguiente el número de observaciones que corresponden a cada dato o a cada
grupo de datos.

Frecuencia Absoluta de un dato es el número de veces que se repite ese dato,


también se presenta la frecuencia absoluta de un intervalo que             se refiere al
número de datos que pertenecen a ese intervalo. La denotaremos por f .
Frecuencia Absoluta Acumulada: Hasta un dato específico, es la suma de las
frecuencias absolutas de todos los datos anteriores, incluyendo también la del
dato mismo del cual se desea su frecuencia acumulada. De un intervalo es la
suma de las frecuencias absolutas de todos los intervalos de clase anteriores,
incluyendo la frecuencia del intervalo mismo del cual se desea su frecuencia
acumulada. La denotaremos por a f . La última frecuencia absoluta acumulada
deberá ser igual al número total de datos.
Frecuencia Relativa: De un dato, se obtiene al dividir la frecuencia absoluta de
cada dato entre el número total de datos. De un intervalo se obtiene al dividir la
frecuencia absoluta de cada intervalo entre el número total de datos. La
denotamos por r f .

Frecuencia Relativa Acumulada: Hasta un dato específico, es la suma de las


frecuencias relativas de todos los datos anteriores, incluyendo también la del dato
mismo del cual se desea su frecuencia relativa acumulada. De un intervalo es la
suma de las frecuencias relativas de todos los intervalos de clase anteriores
incluyendo la frecuencia del intervalo mismo del cual se desea su frecuencia
relativa acumulada, La denotaremos por ra f La última frecuencia relativa
acumulada deberá ser igual a la unidad.

Datos diferentes: Consideraremos como un dato diferente, a cada uno de los


distintos datos que se presentan en la muestra, los denotaremos por i x . Y al
número total de datos diferentes lo denotaremos por m.
Datos no Agrupados: Cuando el tamaño de la muestra (n) es finito y el número de
datos diferentes es pequeño (consideraremos pequeño k ≤ 10), es fácil hacer un
análisis de los datos tomando cada uno de los datos diferentes y ordenándolos,
CONSIDERA PARA ELLO EL SIGUIENTE CASO.
Se consideraron los datos y se aplicaron las fórmulas adecuadas para realizar la
tabla.

DATOS DE FRECUENCIAS
AGRUPADOS
La distribución de frecuencias agrupadas o tabla con datos agrupados se emplea
si las variables toman un número grande de valores o la variable es continua. Se
agrupan los valores en intervalos que tengan la misma amplitud denominados
clases. A cada clase se le asigna su frecuencia correspondiente. Límites de la
clase. Cada clase está delimitada por el límite inferior de la clase y el límite
superior de la clase.
La amplitud de la clase es la diferencia entre el límite superior e inferior de la
clase. La marca de clase es el punto medio de cada intervalo y es el valor que
representa a todo el intervalo para el
cálculo de algunos parámetros. En Interval xi ni Ni fi Fi
caso de que el primer intervalo sea de o
la forma (-∞,k], o bien [k,+∞) donde k
es un número cualquiera, en el caso [0, 5) 2.5 1 1 0.025 0.025
de (-∞,k], para calcular la marca de
[5, 10) 7.5 1 2 0.025 0.050
clase se tomará la amplitud del
intervalo adyacente a el (ai+1), y la [10, 15) 12.5 3 5 0.075 0.125
marca de clase será ((k-ai+1) +k)/2. En
el caso del intervalo [k,+∞) también se [15, 20) 17.5 3 8 0.075 0.200
tomará la amplitud del intervalo
adyacente a el (ai-1) siendo la marca [20, 25) 22.5 3 11 0.075 0.275
de clase ((k+ai-1)+k)/2.
[25, 30) 27.5 6 17 0.150 0.425
Construcción de una tabla de datos
agrupados: [30, 35) 32.5 7 24 0.175 0.600
3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 1
36, 34, 29, 25, 17, 7, 34, 36, 39, 44, [35, 40) 37.5 34 0.250 0.850
0
31, 26, 20, 11, 13, 22, 27, 47, 39, 37,
34, 32, 35, 28, 38, 41, 48, 15, 32, 13. [40, 45) 42.5 4 38 0.100 0.950

[45, 50) 47.5 2 40 0.050 1

4
Total: 1
0
1. Se localizan los valores menor y mayor de la distribución. En este caso son
3 y 48.
2. Se restan y se busca un número entero un poco mayor que la diferencia y
que sea divisible por el número de intervalos que queramos establecer.
Es conveniente que el número de intervalos oscile entre 6 y 15.
En este caso, 48 - 3 = 45, incrementamos el número hasta 50 : 5 = 10 intervalos.
Se forman los intervalos teniendo presente que el límite inferior de una clase
pertenece al intervalo, pero el límite superior no pertenece al intervalo, se cuenta
en el siguiente intervalo.

GRAFICA
Una gráfica , representación gráfica o gráfico es un tipo de representación
de datos, generalmente cuantitativos, mediante recursos
visuales (líneas, vectores, superficies o símbolos), para que se manifieste
visualmente la relación matemática o correlación estadística que guardan entre sí.
También es el nombre de un conjunto de puntos que se plasman en coordenadas
cartesianas y sirven para analizar el comportamiento de un proceso o un conjunto
de elementos o signos que permiten la interpretación de un fenómeno. La
representación gráfica permite establecer valores que no se han obtenido
experimentalmente sino mediante la interpolación (lectura entre puntos) y
la extrapolación (valores fuera del intervalo experimental).
GRAFICA CIRCULAR
Un gráfico circular o gráfica circular, también llamado "gráfico de pastel", "gráfico
de tarta", "gráfico de torta" o "gráfica de 360 grados", es un recurso estadístico que
se utiliza para representar porcentajes y proporciones. El número de elementos
comparados dentro de una gráfica circular suele ser de más de cuatro.
El gráfico circular más temprano conocido se atribuye generalmente al
escocés William Playfair, en la obra Statistical Breviary de 1801
Se utilizan en aquellos casos donde interesa no solamente mostrar el número de
veces que se dan una característica o atributo de manera tabular sino más bien de
manera gráfica, de tal manera que se pueda visualizar mejor la proporción en que
aparece esa característica respecto del total.
A pesar de su popularidad, se trata de un tipo de gráfico poco recomendable
debido a que nuestra capacidad perceptual para estimar relaciones de proporción
o diferencias entre áreas de sectores circulares es mucho menor que, por ejemplo,
entre longitudes o posiciones, tal y como sucede en otras gráficas.
EJEMPLOS

Qué es un gráfico de barras


Un gráfico de barras es una forma de resumir un conjunto de datos por categorías.
Muestra los datos usando varias barras de la misma anchura, cada una de las
cuales representa una categoría concreta. La altura de cada barra es proporcional
a una agregación específica (por ejemplo, la suma de los valores de la categoría
que representa). Las categorías podrían ser desde grupos de edad a ubicaciones
geográficas.
Si se aplica al crear el análisis, el gráfico de barras puede mostrar información
adicional en líneas de referencia o varios tipos distintos de curvas. Estas líneas o
curvas podrían, por ejemplo, mostrar si los puntos de los datos se adaptan bien a
un ajuste de curva polinómica determinado, o resumir un conjunto de puntos de
datos de muestra ajustándolos a un modelo que describirá los datos y mostrará
una curva o una línea recta sobre la visualización. La curva normalmente cambia
su aspecto en función de los valores que se hayan filtrado del análisis. Al pasar
por encima el ratón, una sugerencia sobre herramienta mostrará la forma en que
se calcula la curva.
Ejemplo:
Una tabla de datos contiene las cifras de ventas de varias frutas y verduras
distintas. El gráfico de barras puede mostrar la suma total de ventas de varios
años.

GRAFICA DE BARRAS
Un gráfico de columnas muestra una serie como un conjunto de barras verticales
agrupadas por categorías. Los gráficos de columnas resultan de gran utilidad para
mostrar los cambios que se producen en los datos a lo largo del tiempo o para
ilustrar comparaciones entre elementos. El gráfico de columnas sencillo está
estrechamente relacionado con el gráfico de barras, que muestra las series como
conjuntos de barras horizontales, y con el gráfico de intervalos de columnas, que
muestra las series como conjuntos de barras verticales con puntos iniciales y
finales que varían. Para más información, vea Gráficos de barras (Generador de
informes y SSRS) y Rangos de intervalos (Generador de informes y SSRS).
El gráfico de columnas se adapta perfectamente a estos datos porque las tres
series comparten un período de tiempo común, lo que permite llevar a cabo
comparaciones válidas.
GRAFICA DE LINEA
Los gráficos de líneas se utilizan para mostrar el valor cuantitativo en un intervalo
o intervalo de tiempo continuo. Se usa con mayor frecuencia para mostrar
tendencias y relaciones (cuando se agrupan con otras líneas). Los gráficos de
línea también ayudan a dar un «panorama general» en un intervalo, para ver cómo
se ha desarrollado durante ese período.
Los gráficos de líneas se representan dibujando primero los puntos de datos en
una cuadrícula cartesiana, y luego conectando una línea entre estos puntos.
Típicamente, el eje Y tiene un valor cuantitativo, mientras que el eje X tiene una
escala de categoría o secuenciada. Los valores negativos se pueden mostrar
debajo del eje X.
GRAFICAS X Y Y
Como los gráficos X-Y contienen normalmente una o varias expresiones con
variables de intervalo en ambos ejes; defina una variable de intervalo. Cree una
variable de intervalo i que vaya del 1 al 20 en incrementos de 0,1.

Luego, para crear el gráfico X-Y, haga clic donde desee colocar el gráfico. Luego
seleccione Crear gráfico X-Y del menú Gráf., o tambien puede elejir gráficos en el
menú (1) de ventanas de la izquierda
· Haga clic en el espacio en la parte inferior central del gráfico. Escriba "i". Ésta es
la expresión que se trazará en el eje x.
· Haga clic en el espacio en la parte central izquierda del gráfico. Escriba "i^2".
Ésta es la expresión que se trazara en el eje y.
· Haga clic fuera del gráfico, o pulse [F9]. Mathcad trazará la grafica i2 frente i.
Probablemente habrá observado que Mathcad ajusta los límites superior e inferior
de cada eje de un gráfico X-Y automáticamente. Puede sustituir con facilidad los
parámetros de Mathcad por los suyos propios, si desea mostrar un rango de
valores en particular en uno o ambos ejes.

También podría gustarte