Unidad 3 y 4

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 43

ESTADÍSTICAS SOCIALES Y

EMPRESARIALES I

APUNTES DE LA UNIDAD N°3 Y N°4

SEGUNDO PARCIAL

Estudiante: Juliette Mendieta

Docente: Carlos Bolívar Sarmiento

Curso: 3ero “A” Vespertina

Tema: Análisis de Datos


Función promedio
•Sintaxis
PROMEDIO (número1; número2; ...) Devuelve el promedio (media
aritmética) de los argumentos.

• Ejemplos
Si A1:A5 se denomina Puntos y contiene los números 10, 7, 9, 27 y 2:
PROMEDIO (A1:A5) es igual a 11
PROMEDIO(Puntos) es igual a 11
PROMEDIO (A1:A5; 5) es igual a 10
PROMEDIO (A1:A5) es igual a SUMA (A1:A5) /CONTAR (A1:A5), que es igual a 11
Si C1:C3 se denomina Otros Puntos y contiene los números 4, 18 y 7:
PROMEDIO (Puntos; Otros Puntos) es igual a 10,5.

Función Mediana
• Sintaxis
MEDIANA (número1; número 2; ...) Devuelve la mediana de los números. La mediana es
el número que se encuentra en medio de un conjunto de números, es decir, la mitad de los
números es mayor que la mediana y la otra mitad es menor.
• Observaciones
Si la cantidad de números en el conjunto es par, MEDIANA calcula el
promedio de los números centrales. Vea este segundo ejemplo.

• Ejemplos
MEDIANA (1; 2; 3; 4; 5) es igual a 3
MEDIANA (1; 2; 3; 4; 5; 6) es igual a 3,5, el promedio de 3 y 4

Función Moda
• Sintaxis
– MODA (número1; número2; ...) Devuelve el valor que se repite con más
frecuencia en una matriz o rango de datos. Al igual que MEDIANA,
MODA es una medida de posición.
• Observaciones
– Si el conjunto de datos no contiene puntos de datos duplicados, MODA
devuelve el valor de error #N/A.
– En un conjunto de valores, la moda es el valor que se repite con mayor
frecuencia; la mediana es el valor central y la media es el valor
promedio. Ninguna de estas medidas de la tendencia central tomada
individualmente proporciona una imagen completa de los datos.
Supongamos que los datos están agrupados en tres áreas, la mitad de
las cuales es un valor bajo que se repite y la otra mitad consiste en dos
valores elevados. Tanto PROMEDIO como MEDIANA devolverán un valor
situado en una zona central relativamente vacía, y MODA devolverá el
valor bajo dominante.
• Ejemplo
– MODA ({5,6; 4; 4; 3; 2; 4}) es igual a 4.

Funciones MIN () y MAX ()


• Sintaxis
– MIN (número1; número2; ...) Devuelve el valor mínimo de un conjunto de valores.
– MAX (número1; número2; ...) Devuelve el valor máximo de un conjunto de valores.
• Se pueden especificar argumentos que sean números, celdas vacías, valores lógicos o
representaciones textuales de números. Los argumentos que son valores de error o texto
que no se puede traducir a números, causan errores.
• Si los argumentos no contienen números, las funciones devuelven 0.

• Ejemplos
– Si A1:A5 contiene los números 10, 7, 9, 27, y 2:
– MIN (A1:A5) es igual a 2
– MIN (A1:A5; 0) es igual a 0
– MAX (A1:A5) es igual a 27
– MAX (A1:A5;30) es igual a 30

Función VA R ()
• Sintaxis
– VAR (número1; número2; ...) Calcula la varianza de una muestra.
• Observaciones
– La función VAR parte de la hipótesis de que los argumentos representan
una muestra de la población. Si sus datos representan la población
total, utilice VARP para calcular la varianza.
– VAR utiliza la fórmula siguiente:

• Ejemplo
– Supongamos que toma una muestra aleatoria de 10 herramientas forjadas por la misma
máquina durante un ciclo de producción y cuya resistencia a la rotura desea medir. Los
valores de la muestra (1345; 1301; 1368; 1322; 1310; 1370; 1318; 1350; 1303; 1299) se
almacenan en las celdas A2:E3 respectivamente. VAR calcula la varianza de la resistencia
a la rotura de todas las herramientas producidas.
– VAR (A2:E3) es igual a 754,3.

Función DESVEST ()
• Sintaxis
– DESVEST (número1; número2; ...) Calcula la desviación estándar de una muestra. La
desviación estándar es la medida de la dispersión de los valores respecto a la media (valor
promedio).

• Observaciones
– DESVEST parte de la hipótesis de que los argumentos representan la muestra de una
población. Si sus datos representan la población total, utilice DESVESTP para calcular la
desviación estándar.
– DESVEST utiliza la fórmula siguiente:

• Ejemplo
– Supongamos que toma una muestra aleatoria de 10 herramientas forjadas por la misma
máquina durante un ciclo de producción y cuya resistencia a la rotura desea medir. Los
valores de la muestra (1345; 1301; 1368; 1322; 1310; 1370; 1318; 1350; 1303; 1299) se
almacenan en las celdas A2:E3 respectivamente. DESVEST calcula la desviación estándar
de la resistencia a la rotura de todas las herramientas producidas.
– DESVEST (A2:E3) es igual a 27,467

Ejercicio 3.1
• Una fábrica de autos desea determinar con cuanta precisión están siendo maquinados los
cilindros en distintos bloques de motor. Las especificaciones de diseño determinan el
diámetro de un cilindro en 3.500 pulg, con una tolerancia de ±0.005 pulgadas.
• Para determinar la precisión de los cilindros, distintos bloques de motor se toman de la
línea de ensamblado durante la producción y se mide un cilindro en cada bloque. Para
tener datos consistentes, la medida siempre se toma perpendicular al eje del bloque del
motor. Se obtienen los siguientes datos:
Histogramas
• Representa un gráfico de los datos de manera de ilustrar como los valores se distribuyen
dentro del rango analizado. También se los denomina diagrama de frecuencias relativas
• Pasos para crear un Histograma
• Subdividir el rango de los datos en una serie de intervalos adyacentes igualmente,
espaciados.
• El primer intervalo debe comenzar con el valor más pequeño y el último intervalo debe
extenderse hasta el mayor de los valores. Cada intervalo queda definido por el límite
inferior (xi) y un límite superior (xi+1), donde
xi=1=x1+∆x y ∆x representa la amplitud del intervalo.
• Definidos los intervalos, se deben determinar cuántos datos caen dentro de cada
intervalo. Se obtienen las frecuencias relativas definidas por:
ni
fi=
n
fi Frecuencia relativa del intervalo i
¿ Número de datos que caen dentro del intervaloi
n Número total de datos

Ejercicio
• La Agencia de Protección del Medio Ambiente (EPA) ha examinado el
rendimiento promedio del combustible de 24 autos último modelo
equipados con motores V-6 y transmisión automática. Los resultados
obtenidos son los siguientes.
• Ingresar los datos anteriores en una planilla de Excel y realizar los siguientes análisis:
a) Determinar el promedio, mediana, moda, valor mínimo, valor máximo, y la desviación
estándar.
b) Construir un histograma, basados en intervalos razonables.
c) Construir un gráfico de distribución acumulada. Mostrar la distribución
acumulada en la forma de un gráfico x-y
d) Construir un gráfico de frecuencia relativas.
e) Explicar la diferencia entre promedio y mediana
f) ¿A partir de los datos examinados, Qué conclusión puede sacar?

Tema: DIAGRAMA DE FLUJO DE MEDIDAS


DE TENDENCIA CENTRAL
DIAGRAMA DE FLUJO DE MEDIDAS DE DISPERSIÓN
ASIMETRIA Y CURTOSIS
Son aquellos números resúmenes, que indican la morfología de la distribución de los
datos, es decir, de la simetría y apuntamiento que tiene el histograma de la variable en
estudio.
Sólo se pueden calcular en variables medidas en escala intervalo y de razón. Son el:
 SESGO (COEFICIENTE DE ASIMETRIA)
 CURTOSIS
TIPOS DE DISTRIBUCIONES DE FRECUENCIA MÁS COMUNES
DISTRIBUCIÓN ASIMÉTRICA
COEFICIENTE DE ASIMETRÍA
Mide el grado de asimetría de la distribución con respecto a la media. Un valor positivo de
este indicador significa que la distribución se encuentra sesgada hacia la izquierda
(orientación positiva). Un resultado negativo significa que la distribución se sesga a la
derecha.

CURTOSIS
Indica que tan apuntada o achatada se encuentra una distribución respecto a un
comportamiento normal (distribución normal).
Si los datos están muy concentrados hacia la media, la distribución es leptocúrtica
(curtosis mayor a 0).
Si los datos están muy dispersos, la distribución es platicúrtica (curtosis menor a 0). El
comportamiento normal exige que la curtosis sea igual a 0 (distribución mesocúrtica).
TEMA: VARIACIÓN DESVIACIÓN ESTÁNDAR
La desviación estándar o desviación típica es una medida
que ofrece información sobre la dispersión media de una
variable. La desviación estándar es siempre mayor o
igual que cero.
Una desviación estándar baja indica que la mayor parte
de los datos de una muestra tienden a estar agrupados
cerca de su media (también denominada el valor
esperado), mientras que una desviación estándar alta
indica que los datos se extienden sobre un rango de
valores más amplio.
La desviación estándar de una variable aleatoria,
población estadística, conjunto de datos o distribución de
probabilidad es la raíz cuadrada de su varianza. Es
algebraicamente más simple, aunque en la práctica
menos robusta, que la desviación media. Una propiedad
útil de la desviación estándar es que, a diferencia de la varianza, se expresa en las mismas
unidades que los datos a partir de los que se calcula.
Además de expresar la variabilidad de una población, la desviación estándar se usa
comúnmente para medir la fiabilidad de las conclusiones estadísticas. Por ejemplo, el
margen de error en los datos de los sondeos de opinión se determina calculando la
desviación estándar esperada en los resultados si la misma encuesta se llevara a cabo
varias veces. Esta interpretación de la desviación estándar a menudo se denomina "error
estándar" de la estimación o "error estándar de la media" (cuando se refiere a una media).
Se calcula como la desviación estándar de todas las medias que se calcularían a partir de
esa población si se extrajera un número infinito de muestras y se calculase la media para
cada muestra.
Es muy importante tener en cuenta que la desviación estándar de una población y el error
estándar de una estadística obtenida a partir de esa población (como la media) son bastante
diferentes, pero están relacionados (relacionados por la inversa de la raíz cuadrada del
número de observaciones). El margen de error de una encuesta se calcula a partir del error
estándar de la media (o, alternativamente, del producto de la desviación estándar de la
población y la inversa de la raíz cuadrada del tamaño de la muestra, que es lo mismo) y es
por lo general, aproximadamente el doble de la desviación estándar: la mitad del ancho de
un intervalo de confianza del 95 por ciento.

COEFICIENTE DE VARIACIÓN
El coeficiente de variación permite comparar la dispersión entre dos poblaciones distintas
e incluso, comparar la variación producto de dos variables diferentes (que pueden provenir
de una misma población).
Estas variables podrían tener unidades diferentes, por ejemplo, podremos determinar si los
datos tomados al medir el volumen de llenado de un envase de cierto líquido varían más
que los datos tomados al medir la temperatura del líquido contenido en el envase al salir al
consumidor. El volumen los mediremos en centímetros cúbicos y la temperatura en grados
centígrados.
El coeficiente de variación elimina la dimensionalidad de las variables y tiene en cuenta la
proporción existente entre una medida de tendencia y la desviación típica o estándar.
Coeficiente de variación (Cv): Equivale a la razón entre la media aritmética y la
desviación típica o estándar.

Si envés de la media aritmética se emplea la mediana, obtendremos el coeficiente de


variación mediana.
Calculo del coeficiente de variación en Excel
Para calcular el coeficiente de variación con ayuda de Excel, debemos calcular primero la
media aritmética y la desviación estándar. Por ejemplo, calculemos el coeficiente de
variación para los siguientes datos:

Empleando las fórmulas vistas en Excel, se halla la media y desviación (tomando los
valores como muestrales):

El coeficiente de variación es el resulta de la división entre la desviación (C7) y la media


(C6):

TEMA: MEDIDAS DE FORMA


Son indicadores estadísticos que permiten identificar si una distribución de frecuencia
presenta uniformidad.
TIPOS DE DISTRIBUCIONES DE FRECUENCIA MÁS COMUNES
Distribución simétrica
Al dividir una distribución de frecuencia mediante la mediana, ambas áreas resultantes son
iguales, es decir, los datos se distribuyen de la misma forma y el área abarcada por ambos
lados es equivalente (50% de los datos se encuentran distribuidos en ambas secciones).
TEMA: INTRODUCCIÓN A STATA
El software STATA es un paquete estadístico diseñado para el manejo y análisis de datos
que provienen de una muestra seleccionada aleatoriamente. Este paquete permite la
realización tanto de análisis estadístico descriptivo (univariado o multivariado) como de
análisis inferencial, soportando el trabajo con diferentes tipos de datos (e.g. corte
transversal, series de tiempo o panel de datos). Al ser una herramienta de amplia
utilización dentro y fuera del ámbito académico, poseer nociones para su utilización es de
gran aporte para los distintos profesionales que requieren en sus labores de manipulación y
análisis de datos.
Stata permite, entre otras funcionalidades, la gestión de datos, el análisis estadístico, el
trazado de gráficos y las simulaciones. Tiene la ventaja de ejecutar los análisis y tareas
mediante pestañas desplegables o mediante comandos, que lo hace muy amigable.
Además, permite el análisis estadístico de tipo frecuentista y de tipo bayesiano.

El tipo de archivos que utiliza son:


 dta archivos de datos
 do archivos de comandos
 ado programas
 hlp archivos de ayuda
 gph gráficos
 dct archivos diccionarios
 smcl archivos log
El nombre Stata es una "palabra baúl" que combina las palabras statistics (estadística) y
data (datos); no es un acrónimo y por lo tanto no debe ser escrito en mayúsculas (es decir,
no es "STATA" sino "Stata").1

En la pantalla Stata Results se despliegan los resultados a medida que se van ejecutando
los distintos comandos.
La ventana Stata Command permite escribir comandos que se ejecutarán y se desplegarán
en Stata Results al introducir la tecla enter.
La pantalla Review guarda el historial de los comandos ejecutados desde el inicio de la
sesión en Stata. Si se quiere repetir algún comando, puede seleccionarse de allí con el
mousse en vez de escribirlo de nuevo en el Stata Command.
La ventana Variables muestra las variables de la base de datos en la cual se esté
trabajando.
Las variables pueden seleccionarse de allí con el mousse en lugar para no tener que
escribirlas en el Stata Command.
Comandos básicos
Syntax
[prefix :] command [varlist] [=exp] [if] [in] [weight]
[using filename] [, options]
Cambio de directorio
cd c:\practica\stata_1\

Log files guarda los resultados de Stata la extensión es .log se puede cambiar a txt
File/Log/Begin.
Se debe iniciar abriendo este archivo

Crear un archivo con extensión “do”


• Permite editar y ejecutar las instrucciones

Cargando archivos de datos:


Stata mantiene los datos en memoria. Si se ha estado trabajando en una base y se quiere
trabajar sobre otra, es necesario removerla de la memoria.
clear
El comando clear borra todos los datos que se encontraban en memoria. Si la base es
grande, es necesario incrementar la cantidad de memoria disponible para una sesión de
Stata. Esto es necesario si se sabe de antemano que la base es grande o si cuando se intenta
leer la base se obtiene el siguiente mensaje: no room to add more observations
El comando para ampliar la memoria es:
set memory 64m
64m o lo que sea necesario, el límite lo da el computador que se este usando. Luego se lee
la base de datos.
Con el comando memory se puede conocer el monto de memoria que se esta usando.
Lectura de datos:
Existen varios caminos para leer los datos en Stata use es para leer datos que han sido
guardados en formato Stata:
Distintas posibilidades:
a) si los datos están en C:\ECH\2005\
cd "C:\ECH\2005\"
use p2005
o
use C:\ECH\2005\ p2005.dta
b) Si los datos están en un directorio por defecto
use p2005
c) Subir datos parciales de un archivo use e1 e2 using p2005 // solamente selecciona las
variables sexo y edad
use p2005 in 1/5 // selecciona sólo las cinco primeras observaciones, todas las variables
use e1 e2 using p2005 in 1/5 // selecciona dos variables y cinco primeras observaciones
Descripción de datos:
Una vez que se leen los datos, pueden ver las características de la base de datos y las
variables que se seleccionen (si no se seleccionan variables, se muestran todas las
variables de la base de datos que se encuentre actualmente en uso) con el comando
describe.
describe e1 e2 // descripción general de la base de datos y de las variables sexo y edad
El comando codebook informa sobre las variables: estadísticas descriptivas, etiquetas,
detalle de los valores missing, etc. Si no se especifican variables, codebook despliega estas
estadísticas para todas las variables de la base de datos.

codebook // despliega estadísticas para todas las variables de la base de datos


codebook e1 e2 // despliega estadísticas sólo para las variables sexo y edad

El comando summarize informa las estadísticas descriptivas básicas de las variables


especificadas (si no se especifican variables summarize reporta las estadísticas
descriptivas de todas las variables de la base de datos): número de observaciones, media,
desvío estándar, mínimo y máximo.
summarize // despliega estadísticas descriptivas básicas para todas las variables de la base
de datos
summarize e1 e2 // despliega estadísticas descriptivas básicas para el sexo y la edad.

summarize e1, detail // despliega estadísticas descriptivas detalladas para la edad.

El comando tabulate despliega la tabla de frecuencia de una o dos variables. Tiene


distintas opciones tales como porcentajes por fila, columna y celda, además de Chi-
cuadrado y otros estadísticos.
tabulate e1 // despliega tabla de frecuencias para la variable sexo.
Creando archivos do;
En vez de escribir los comandos interactivamente Stata permite coleccionar los comandos
en un archivo do-file y ejecutar el do-file completo o seleccionar partes.
Todos los resultados aparecerán grabados en un archivo log-file para revisar cuando se
ejecute toda la sesión.
Do-files se pueden escribir en cualquier editor de texto como notepad. Stata tiene su
propio editor de texto.
Los comandos se separan por enter o return. También se pueden insertar comentarios
dentro de los do-files, que no serán leídos por Stata. En este sentido, podemos insertar
cometarios de las siguientes formas: una única línea que comienza por *texto de una o
varias líneas entre /* y */ texto en una línea precedido por ///

En general tiene el siguiente formato:


clear
set memory 64m
cd “C:\ECH\2005\”
capture log close
log using ech.log, replace
set more off
listado de diferentes comandos
log close
clear // limpia cualquier dato que se encuentre en memoria.
set more off // cuando los resultados de la corrida de un do-file superan en extensión a una
página del Stata Results, Stata pausa el do-file para dar tiempo a que el usuario pueda
revisar los resultados que va obteniendo en cada página, para continuar observando la
ejecución de los comandos hay que presionar una tecla cualquiera. El comando set more
off ordena a Stata a correr sin pausas el do-file entero, pudiendo ver el usuario el proceso
paso a paso en el archivo log correspondiente. La decisión puede cambiarse en cualquier
momento con el comando set more on.
GRÁFICOS DE DISPERSIÓN: Permite representar la evolución conjunta de ambas
variables
Dadas dos variables (Y, X) tomadas sobre el mismo elemento de la población, el diagrama
de dispersión es simplemente un gráfico de dos dimensiones, donde en un eje (la abscisa)
se sitúa una variable, y en el otro eje (la ordenada) se sitúa la otra variable.
Si las variables están correlacionadas, el gráfico mostraría algún nivel de correlación
(tendencia) entre las dos variables. Si no hay ninguna correlación, el gráfico presentaría
una figura sin forma, una nube de puntos dispersos en el gráfico.

Resumen
En esta primera sesión aprendimos los puntos más básicos del funcionamiento de Stata
incluyendo la importación, transformación y el manejo de bases de datos. Otros puntos
clave consistieron en el procedimiento para cargar las bases de datos en formatos
diferentes a Stata, así como asignar la suficiente memoria y tamaño de matriz para cargar
los datos y llevar al cabo el análisis. La combinación de bases de datos y la generación de
nuevas variables utilizando las expresiones del comando generate fueron entre las tareas
más importantes de la sesión.

TEMA: PROBABILIDADES
Una de las características más especiales de los seres humanos, que nos diferencia del
resto de animales, es nuestra capacidad de “predicción”, de anticiparnos a los
acontecimientos que van a ocurrir. A veces fallamos, pero otras muchas no. Esta
capacidad nos ha permitido llegar hasta donde estamos hoy, pudiendo predecir tanto
peligros como oportunidades. Piénsalo, nuestros antepasados que eran capaces de predecir
el ataque de un depredador fueron los que sobrevivieron. Ahora, decenas de miles de años
después hemos dado un paso más y nos preguntamos ¿qué es la probabilidad?

La probabilidad es el cálculo matemático que evalúa las posibilidades que existen de que
una cosa suceda cuando interviene el azar.

Para qué sirve la probabilidad


La probabilidad se utiliza en muchas áreas como
las matemáticas, la estadística, la física, la
economía, las ciencias sociales, entre otras.
Los primeros estudios de probabilidad se
desarrollaron para resolver problemas de juegos
y es allí donde más se nota su uso, porque te
puede servir para tener más oportunidades de
ganar, o para ahorrarnos dinero (al no jugar
a juegos en los que es muy probable perder).
Ejemplo: Cuando se lanza una moneda, se sabe que solo puede aparecer cara o cruz. Sin
embargo, no se puede predecir al momento de lanzar la moneda en cuál lado caerá.
Ejemplo: Cuando se lanza un dado se sabe que en la cara superior puede aparecer
cualquiera de los números 1,2,3,4,5, o 6 pero no se puede predecir cuál aparecerá.

También puedes calcular la probabilidad de que salga un número par, ya que las caras que
muestran un número par son 3 (2, 4 y 6) de un total de seis caras, es, por tanto, 3/ 6= ½

La teoría de la probabilidad es la rama de la matemática que estudia los experimentos o


fenómenos aleatorios. Se usa extensamente en áreas como la estadística, la física, las
ciencias sociales, la Investigación médica, las finanzas, la economía y la filosofía para
conocer la viabilidad de sucesos y la mecánica subyacente de sistemas complejos.
Tipos de probabilidad
Existen los siguientes tipos de probabilidad:

Frecuencial: Aquella que determina la cantidad de veces que un fenómeno puede ocurrir,
considerando un número determinado de oportunidades, a través de la experimentación.
Matemática. Pertenece al ámbito de la aritmética, y aspira al cálculo en cifras de la
probabilidad de que determinados eventos aleatorios tengan lugar, a partir de la lógica
formal y no de su experimentación.
Binomial. Aquella en la que se estudia el éxito o fracaso de un evento, o cualquier otro
tipo de escenario probable que tenga dos posibles resultados únicamente.
Objetiva. Se denomina así a toda probabilidad en la que conocemos de antemano la
frecuencia de un evento, y simplemente se dan a conocer los casos probables de que
ocurra dicho evento.
Subjetiva. Contrapuesta a la matemática, se sustenta en ciertas eventualidades que
permiten inferir la probabilidad de un evento, aunque alejada de una probabilidad certera o
calculable. De allí su subjetividad.
Hipergeométrica. Aquella que se obtiene gracias a técnicas de muestreo, creando grupos
de eventos según su aparición.
Lógica. La que posee como rasgo característico que establece la posibilidad de ocurrencia
de un hecho a partir de las leyes de la lógica inductiva.
Condicionada. Aquella que se emplea para comprender la causalidad entre dos hechos
distintos, cuando puede determinarse la ocurrencia de uno tras la ocurrencia del otro

Fuente: https://concepto.de/probabilidad/#ixzz7diS7RaB5

Regla de la adición
La regla de la adición o regla de la suma establece que la probabilidad de ocurrencia de
cualquier evento en particular es igual a la suma de las probabilidades individuales, si es
que los eventos son mutuamente excluyentes, es decir, que dos no pueden ocurrir al
mismo tiempo.
Por un lado, si es decir que son mutuamente excluyentes, entonces

Por otro lado, si , es decir que no son mutuamente excluyentes, entonces

Siendo: probabilidad de ocurrencia del evento A, = probabilidad de


ocurrencia del evento B, y probabilidad de ocurrencia simultánea de los
eventos A y B.

Otra forma de verlo, sería expresar la probabilidad de sucesos mutuamente no excluyentes


mediante el sumatorio de las probabilidades de un evento determinado en función de otros
eventos:

Regla de la multiplicación
La regla de la multiplicación establece que la probabilidad de ocurrencia de dos o más
eventos estadísticamente independientes es igual al producto de sus probabilidades
individuales.

siendo P (B|A la probabilidad de que ocurra B habiéndose dado o verificado el evento A.

Aplicaciones de la probabilidad
El cálculo de la probabilidad tiene numerosas aplicaciones en la vida cotidiana, como son:
 El análisis de riesgo empresarial. Según el cual se estiman las posibilidades de
caída de precio de las acciones bursátiles, y se intenta predecir la conveniencia o
no de la inversión en una u otra empresa.
 El análisis estadístico de la conducta. De importancia para la sociología, emplea la
probabilidad para evaluar la posible conducta de la población, y así predecir
tendencias de pensamiento o de opinión. Es común verlo en las campañas
electorales.
 La determinación de garantías y seguros. Procesos en los que se evalúa la
probabilidad de avería de los productos o la fiabilidad de un servicio (o de un
asegurado, por ejemplo), para así saber cuánto tiempo de garantía conviene
ofrecer, o a quiénes conviene asegurar y por cuánto.
 En la ubicación de partículas subatómicas. Según el Principio de Incertidumbre de
Heisenberg, el cual establece que no podemos saber dónde está una partícula
subatómica en un momento determinado y al mismo tiempo a qué velocidad se
mueve, de modo que los cálculos en la materia se realizan normalmente en
términos probabilísticos: existe X por ciento de probabilidades de que la partícula
esté allí.
 En la investigación biomédica. Se calculan porcentajes de éxito y de fracaso de las
drogas médicas o de las vacunas, para así saber si son fiables o no, y si conviene o
no producirlas en masa, o a qué porcentaje de la población podrán causarle
determinados efectos secundarios.

TAREAS
INDIVIDUALES
Y GRUPALES
UNIDAD 3 Y 4

UNIVERSIDAD TECNICA DE MACHALA

FACULTAD DE CIENCIAS EMPRESARIALES

Estadísticas Sociales y Empresariales

Integrantes: Jeniffer Roque, Fiorella Jumbo, Juliette Mendieta.


Curso: Tercero “A” Vespertina.
Fecha: 26-06-2022

TAREA
NRO. 2
MEDIA, MEDIANA Y
MODA
Ejercicios del 17 al 24 (solo pares)
18. Los siguientes son los números de cambios de aceite de los últimos 7
días en Jiffy Lube, que se ubica en la esquina de Elm Street y
Pennsylvania Avenue.

41 15 39 54 31 15 33

DÍAS 7
MEDIA 32,57
MEDIANA 33
MODA 15

20. Las siguientes son las edades de 10 personas en la sala de


videojuegos del Southwyck Shopping Mall a las 10 de la mañana
12 8 17 6 11 14 8 17 10 8

PERSONAS 10
MEDIA 11,10
MEDIANA 11
MODA 8
22. En la siguiente lista aparecen las ventas totales de automóviles (en
millones de dólares) en Estados Unidos durante los pasados 14 años. En
dicho periodo, ¿cuál fue la mediana en el número de automóviles
vendidos? ¿Cuál es la moda?

9,0 8,5 8,0 9,1 10,3 11, 11,5


0
10,3 10, 9,8 9,3 8,2 8,2 8,5
5

AÑOS 14
MEDIANA 9.2
MODA 8.5

Determine la media, la mediana y la moda de los números de


declaraciones elaboradas por cada contador. Si usted elaborara una,
¿qué medida de ubicación recomendaría que se presentara?
24. La demanda de videojuegos suministrados por Mid-Tech Video
Games, Inc., se ha disparado en los últimos siete años. De ahí que el
propietario requiera contratar técnicos que se mantengan a la par con la
demanda. Mid-Tech proporciona a cada solicitante una prueba que el
doctor McGraw, diseñador de la prueba, cree que se relaciona
estrechamente con la habilidad para crear videojuegos. Para la
población en general, la media de esta prueba es de 100. Enseguida
aparecen los resultados de la prueba en el caso de los aspirantes

95 105 120 81 90 115 99 100 130 10

DÍAS 10
MEDIA 94,5
MEDIANA 99,5
MODA NO EXISTE

El presidente se encuentra interesado en las cualidades generales de


los aspirantes al puesto basadas en la prueba. Calcule los resultados
medio y mediano de los diez aspirantes. ¿Qué informaría usted al
presidente? ¿Parece que los aspirantes son mejores que el resto de la
población?
R//. El grupo tiene un promedio del 94.5, además de que la nota media se
encuentre en el
99.5 los aspirantes efectivamente son mejores que el resto de la población

UNIVERSIDAD TECNICA DE MACHALA


FACULTAD DE CIENCIAS EMPRESARIALES
Estadísticas Sociales y Empresariales
Estudiante: Juliette Mendieta.
Curso: Tercero “A” Vespertina.
Fecha: 24-08-2022

TAREA
Ejercicios pares de probabilidad 1-10
2.- Un inspector de control de calidad selecciona una pieza para probarla.
Luego, la declara aceptable, reparable o chatarra. Entonces se prueba otra
pieza. Elabore una lista de los posibles resultados de este experimento relacionado
con dos piezas.

1.Primera pieza aceptable, segunda pieza aceptable


2.Primera pieza reparable, segunda pieza reparable
3.Primera pieza chatarra, segunda pieza chatarra
4.Primera pieza aceptable, segunda pieza reparable
5.Primera pieza aceptable, segunda pieza chatarra
6.Primera pieza reparable, segunda pieza aceptable
7.Primera pieza reparable, segunda pieza chatarra
8.Primera pieza chatarra, segunda pieza aceptable
9.Primera pieza chatarra, segunda pieza reparable

4.- Una compañía grande que debe contratar un nuevo presidente


prepara una lista final de cinco candidatos, todos con las mismas
cualidades. Dos de ellos son miembros de un grupo minoritario. Para evitar
que el prejuicio influya en el momento de elegir al presidente, la compañía
decide elegirlo por sorteo.
a) ¿Cuál es la probabilidad de que no de los candidatos que pertenece a
un grupo minoritario sea contratado?
n =5
2
R=P(A)= n (A)P(A) = = 0.4
5

b) ¿Qué concepto de probabilidad utilizó para hacer este cálculo?


Utiliza un concepto de probabilidad básica

6.- Una empresa promoverá a dos empleados de un grupo de seis hombres y tres
mujeres.
a) Elabore una lista de los resultados de este experimento, si existe un interés
particular por la igualdad de género.
El porcentaje de que dos sean mujeres es del 33%
3
9 ()
El porcentaje de que dos sean hombres es del 66% ( 69 )

Hay un 50 % de que sea un hombre y una mujer a elección.

b) ¿Qué concepto de probabilidad utilizaría para calcular estas probabilidades?


 Utilizamos la probabilidad clásica

8.- Una muestra de 2 000 conductores con licencia reveló la siguiente cantidad de
violaciones al límite de velocidad.

a) ¿En qué consiste el experimento?


Determinar en qué porcentaje de conductores comete violaciones al límite de velocidad.

b) Indique un posible evento


90 de cada 20000 conductores cometen han cometido violaciones al límite de velocidad
equivalente a un 4,5%.

10.- Un inversionista compra 100 acciones de AT&T y registra los cambios de


precio diariamente.
a) Elabore una lista de los posibles eventos de este experimento.
Acciones suba
Acciones bajen
Se mantenga el número de acciones

b) Calcule la probabilidad de cada evento descrito en el inciso

P(A)= (13) =0.333o33

c) ¿Qué concepto de probabilidad utilizó en b?

Se usó el concepto de probabilidad clásica


UNIVERSIDAD TECNICA DE MACHALA
FACULTAD DE CIENCIAS EMPRESARIALES
Estadísticas Sociales y Empresariales

Estudiantes: Juliette Mendieta, Fiorella Jumbo, Jeniffer Roque


Curso: Tercero “A” Vespertina.
Fecha: 25-08-2022

TAREA
Ejercicios de probabilidad 11-22
11. Los eventos A y B son mutuamente excluyentes. Supóngase que P(A)=0.30 y
P(B)=0.20. ¿Cuál es la probabilidad de que ocurra A o B? ¿Cuál es la probabilidad
de que no suceda ni A ni B?
•A y B son mutuamente excluyentes, entonces:
P (A o B) = P(A)+P(B) = 0.30+0.20 = 0.50
•Que no ocurra A ni B1-P (A o B) = 1- 0.50 = 0.50
12. Los eventos X y Y son mutuamente excluyentes. Supóngase que P(X)=0.05 y
P(Y)=0.02. ¿Cuál es la probabilidad de que ocurra X o Y? ¿Cuál es la probabilidad
que no suceda X ni Y?
•X y Y son mutuamente excluyentes, entonces:
P (X o Y) = P(X)+P(Y) = 0.05+0.02 = 0.07 (ESTA ES LA PROBABILIDAD DE QUE
OCURRA)
•Y que no ocurra A ni B1-P (A o B) = 1-0.07=0.93
13. Un estudio en 200 cadenas de tiendas de comestibles revelo estos ingresos (en
dólares), después del pago de impuestos:

Ingreso (en dólares) P (x) Cantidad de empresas


después de impuestos
Menos de 1 millón A 102
De 1 millón a 20 millones B 61
De 20 millones o mas C 37

TOTAL= 200
a) ¿Cuál es la probabilidad de que una empresa de publicidad seleccionada al
azar tenga un ingreso después de impuestos menor que $1 millón?
P(A)= 102/200 = 0.51; 51% >> Es la probabilidad de que una cadena tenga menos
de 1 millón.

b) ¿Cuál es la probabilidad de que una empresa de publicidad seleccionada al


azar tenga un ingreso después de impuestos entre $1 millón y $20 millones o
un ingreso de $20 millones o más? ¿Qué regla de la probabilidad aplicó?

Como son mutuamente excluyentes y colectivamente exhaustivos


61 37
P= (B o C) = P(B)+P(C)= + =0.49
200 200
Esta es la probabilidad de que una tienda tenga entre 1 millón y 20 millones o más.
 Se aplicó la regla especial de la adición: P= (A o B) = P(A)+P(B)

14. El presidente de la junta directiva afirma: “Hay 50% de posibilidades de que


esta compañía obtenga utilidades; 30% de que termine sin pérdidas ni ganancias y
20% de que pierda dinero durante el próximo trimestre.”
a) Aplique una de las reglas de la adición para determinar la probabilidad de que
la compañía no pierda dinero el siguiente trimestre.
Usamos la regla de adición P = (A o D) = P(A)+P(D)
50 30
P (A o D) = + =0.8 Es la probabilidad con la que no se pierde el dinero .
100 100

b) Aplique la regla del complemento para determinar la probabilidad de que no


pierda dinero el próximo trimestre.
Usando la regla del complemento: P(A) + P(~A) = 1
20
P(~C) = 1− =0.8
100
15. Suponga que la probabilidad de que saque una A en esta clase es de 0.25 y que
la probabilidad de obtener una B es de 0.50. ¿Cuál es la probabilidad de que su
calificación sea mayor que C?
P = (A o B) = P(A)+P(B)
P = (A o B) = 0.25 + 0.50 = 0.75
Esto quiere decir que la probabilidad de que mi nota sea mayor a la de c es de 0.75.
16. Se lanzan al aire dos monedas. Si A es el evento “dos caras” y B es el evento
“dos cruces”, ¿A y B son mutuamente excluyentes? ¿Son complementos?
Son mutuamente excluyentes ya que en estos dos casos ningún evento se repite con el
otro por lo tanto son complementarios.
17. Las probabilidades de los eventos A y B son 0.20 y 0.30, respectivamente. La
probabilidad de que A y B ocurran es de 0.15. ¿Cuál es la probabilidad de que A o
B ocurran?
P = (A o B) = P(A) + P(B) – P (A y B)
P = (A o B) = 0.20 + 0.30 – 0.15 = 0.35
Es la probabilidad de que ocurra A o B
18. Sean P(X) = 0.55 y P(Y) = 0.35. Suponga que la probabilidad de que ambos
ocurran es de 0.20. ¿Cuál es la probabilidad de que X o Y ocurran?
P = (A o B) = 0.55 + 0.35 – 0.20 = 0.70
19. Suponga que los dos eventos A y B son mutuamente excluyentes. ¿Cuál es la
probabilidad de que se presenten de forma conjunta?
En este caso no hay probabilidad de ocurrencia conjunta ya que los dos eventos son
mutuamente excluyentes.
20. Un estudiante toma dos cursos, historia y matemáticas. La probabilidad de que
el estudiante pase el curso de historia es de 0.60 y la probabilidad de que pase el
curso de matemáticas es de 0.70. La probabilidad de pasar ambos es de 0.50. ¿Cuál
es la probabilidad de pasar por lo menos uno?
P = (A o B) = 0.60 + 0.70 – 0.50 = 0.8. Esta es la probabilidad de que al menos pase
uno.
21. Una encuesta sobre tiendas de comestibles del sureste de Estados Unidos reveló
que 40% tenían farmacia, 50% tenían florería y 70% tenían salchichonería.
Suponga que 10% de las tiendas cuentan con los tres departamentos, 30% tienen
tanto farmacia como salchichonería, 25% tienen florería y salchichonería y 20%
tienen tanta farmacia como florería.

Probabilidad
A: farmacias 40% 0,4
B: florería 50% 0,5
C: salchichonería 70% 0,7
P (AB) 20% 0,2
P (BC) 25% 0,25
P (AC) 30% 0,3
P ( A n B n C) 10% 0,1
a) ¿Cuál es la probabilidad de seleccionar una tienda de manera aleatoria y
hallar que cuenta con farmacia y florería?
P(A) + P(B) – P (AB) = 0,4 + 0,5 – 0,2 = 0,7 * 100% = 70%
b) ¿Cuál es la probabilidad de seleccionar una tienda de manera aleatoria y
hallar que cuenta con farmacia y salchichonería?
P(A) + P(C) – P (AC) = 0,4 + 0,7 – 0,3 = 0,8 * 100% = 80%
c) ¿Los eventos “seleccionar una tienda con salchichonería” y “seleccionar
una tienda con farmacia” son mutuamente excluyentes?
No son mutuamente excluyentes, ya que puede tener en una tienda las dos
actividades de farmacia y salchichería.
d) ¿Qué nombre se da al evento “seleccionar una tienda con farmacia, florería
y salchichonería”?
Es la intersección de los 3 eventos A, B Y C.
e) ¿Cuál es la probabilidad de seleccionar una tienda que no incluya los tres
departamentos?
1−P (A ∩ B ∩ C) = 1−0,1 = 0,9*100 = 90%
22. Un estudio llevado a cabo por el National Service Park reveló que 50% de los
vacacionistas que se dirigen a la región de las Montañas Rocallosas visitan el
parque de Yellowstone, 40% visitan los Tetons y 35% visitan ambos lugares.
a) ¿Cuál es la probabilidad de que un vacacionista visite por lo menos una de estas
atracciones?
P (Yellowstone o Tetons) = P(Yellowstone)+ P(Tetons) - P (Ambos lugares)
P = 0.50 + 0.40 - 0.35 = 0.55 = 55% R//

b) ¿Qué nombre recibe la probabilidad de 0? 35?


Se lo da a conocer como probabilidad conjunta.
c) ¿Los eventos son mutuamente excluyentes? Explique su respuesta.
Los eventos no son mutuamente excluyentes ya que la conjunción sugiere que puede
ocurrir el evento A o el B, pero también ambos eventos.
UNIVERSIDAD TECNICA DE MACHALA
FACULTAD DE CIENCIAS EMPRESARIALES
Estadísticas Sociales y Empresariales

Estudiante: Juliette Mendieta.


Curso: Tercero “A” Vespertina.
Fecha: 29-08-2022

TAREA
Ejercicios de probabilidad 23-32
23. Suponga que P(A) = .40 y P(B•A) = .30. ¿Cuál es la probabilidad
conjunta de A y B?
Podemos plantear que la probabilidad conjunta de A y B es:
P(AB) = P(A) -P (A o B) = 40-30 = 10
La probabilidad conjunta de A y B es de 10%.

24. Suponga que P(X1) = .75 y P(Y2•X1) = .40. ¿Cuál es la probabilidad


conjunta de X1 y Y2?

P (X1 υ Y2) = P(X1) * P(Y2/Y1)


3
∗2
P (X1 υ Y2) = 4 = 6
5 20

25. Un banco local informa que 80% de sus clientes tienen cuenta de
cheques; 60% tiene cuenta de ahorros y 50% cuentan con ambas. Si se
elige un cliente al azar…
80
 Cuenta de cheques = 80% = = 0.8
100
60
 Cuenta de ahorros = 60% = = 0.6
100
50
 Con ambas cuentas = 50% = = 0.5
100
¿Cuál es la probabilidad de que el cliente tenga ya sea una cuenta de cheques
o una cuenta de ahorros?
P (A o B) = P(A)+(P(B) - P(AYB) P (A o B) = 0.8 + 0.6 - 0.5 P (A o B) = 0.9
26. All Seasons Plumbing tiene dos camiones de servicio que se
descomponen con frecuencia. Si la probabilidad de que el primer camión
esté disponible es de 0.75, la probabilidad de que el segundo camión esté
disponible es de 0.50 y la probabilidad de que ambos estén disponibles es
de 0.30, ¿cuál es la probabilidad de que ningún camión se encuentre
disponible?

Camión 1 Camión 2
0.30
0.75 0.50

P (N o D) = [P(C1) *P(C2) *P (A)] – 1


= (0.75) *(0.50) *(0.30) – 1
= 1.55 - 1
= 0.55
27. Observe la siguiente tabla.

a) Determine P (A1).
b) Estime P (B1•A2).
c) Aproxime P (B2 y A3).

a. P(A1) = 3/10
b.
P( A 2) P (B 1∗A 2)
P (A 1) P( B1∗A 1)+ P( A 2) P( B 1∗A 2)+ P( A 3)P(B 1∗A 3)

3 1 1 1
( )( )
10 6 20 20 1
3 1 3 1 21
=
1 1 1
= 7 7
=
+ + + +
10 3 10 6 5 2 10 20 5 20
c. P (B2 y A3) = p(A3) *p (B2/A3)
P (B2 y A3) =4/10* ¼ P (B2 y A3) = 1/10

28. Clean-brush Products envió por accidente tres cepillos dentales


eléctricos defectuosos a una farmacia, además de 17 sin defectos.
a) ¿Cuál es la probabilidad de que los primeros dos cepillos eléctricos
vendidos no sean devueltos a la farmacia por estar defectuosos?
b) ¿De que los primeros dos cepillos eléctricos vendidos no estén
defectuosos?

16/19 B
Buenos
17/20 3/19 D
3/20

17/19 B
Defectos
2/19 D
a) (3/20) *(2/19) =0.0157
b) (17/20) *(16/19) = 0.71
29. Cada vendedor de Puchett, Sheets, and Hogan Insurance Agency
recibe una calificación debajo del promedio, promedio y por encima del
promedio en lo que se refiere a sus habilidades en ventas. A cada
vendedor también se le califica por su potencial para progresar: regular,
bueno o excelente. La siguiente tablea muestra una clasificación cruzada
de estas características de personalidad a los 500 empleados.

a) ¿Qué nombre recibe esta tabla?


Tabla de contingencia o cruzada.
b) ¿Cuál es la probabilidad de que una persona elegida al azar tenga una
habilidad para las ventas con calificación por encima del promedio y un
excelente potencial para progresar?

c) Construya un diagrama de árbol que muestre las probabilidades,


condicionales y probabilidades conjuntas

30. Un inversionista cuenta con tres acciones ordinarias. Cada acción,


independiente de las demás, tiene la misma probabilidad de: 1)
incrementar su valor; 2) bajar su valor; 3) permanecer con el mismo valor.
Elabore una lista de los posibles resultados de este experimento. Calcule
la probabilidad de que por lo menos dos de las acciones aumenten de
valor.
1. Acción Ordinaria Nº 1 resultados
 Incrementar su valor
 Bajar el valor
 Mantener el valor
2. Acción Ordinaria Nº 2 resultados
 Incrementar su valor
 Bajar el valor
 Mantener el valor
3. Acción Ordinaria Nº 3 resultados
 Incrementar su valor
 Bajar el valor
 Mantener el valor

P (A1)= ( 13 )= 0.33
P (A1 o A2) = P (A1) + P(A2)
P (A1 o A2) = 0.33+0.33
P (A1 o A2) = 0.67
Tiene una probabilidad de que el 67 % de las acciones aumente.

31. La junta directiva de una pequeña compañía consta de cinco


personas. Tres de ellas son líderes fuertes. Si compran una idea, toda la
junta estará de acuerdo. El resto de los miembros débiles no tienen
influencia alguna. Se programa a tres vendedores, uno tras otro, para que
lleven a cabo una presentación frente a un miembro de la junta que el
vendedor elija. Los vendedores son convincentes, aunque no saben
quiénes son los líderes fuertes. Sin embargo, ellos se enterarán a quién le
habló el vendedor anterior. El primer vendedor que encuentre a un líder
fuerte ganará en la presentación. ¿Tienen los tres vendedores las mismas
posibilidades de ganar en la presentación? Si no es así, determine las
probabilidades respectivas de ganar.

3
Probabilidad de ganar la primera presentación = 5 = 0.60

2
∗3
Probabilidad de ganar la segunda presentación = 5 = 0.30
4
2
∗1
5
Probabilidad de ganar la tercera presentación = 4 = 0.10
∗3
3
32. Si pregunta a tres extraños las fechas de sus cumpleaños, ¿cuál es la
probabilidad de que a) todos haya nacido el miércoles; b) todos hayan
nacido en diferentes días de la semana c) todos hayan nacido el sábado?

P (A) = 3/7 = 0.42 o 42%


P (B) = 1/7 = 0.142 o 14%
P (C) = 3/7 = 0.42 o 42%
CLASE EXPLICADA DE LOS COMANDOS EN STATA

Integrantes: Juliette Mendieta, Jennifer Roque, Fiorella Jumbo.

1. El comando Sysuse auto nos permite abrir la base de datos a medida que se
van ejecutando los distintos comandos.

2. El comando summarize informa las estadísticas descriptivas básicas de las variables


especificadas como número de observaciones, media, desvío estándar, mínimo y
máximo.
3. El comando describe nos despliega un resumen de los contenidos de la base
de datos que tenemos abierta.

4. El siguiente comando empleado en la clase es el summarize make. Como vemos


aquí el resultado es 0 porque es una variable nominal.
5. Comando summarize price.

6. El comando summarize mpg es como por ejemplo el número de


reparaciones de algún producto.
7. El siguiente comando es summarize weight.

8. El comando tabulate rep78 generar tablas de frecuencias que nos


informarán de la distribución de la variable elegida.
UNIVERSIDAD TECNICA DE MACHALA

FACULTAD DE CIENCIAS EMPRESARIALES

Estadísticas Sociales y Empresariales


Estudiante: Juliette Mendieta.
Curso: Tercero “A” Vespertina.
Fecha: 01-09-2022

Autoevaluación 5.8
Considere una encuesta a algunos consumidores relacionada con la
cantidad relativa de visitas que hacen a una tienda Circuit City (con
frecuencia, ocasionalmente o nunca) y con el hecho de si la tienda se
ubicaba en un lugar conveniente (sí y no). Cuando las variables son de
escala nominal, tal como estos datos, por lo general los resultados se
resumen en una tabla de contingencias
a) ¿El número de visitas y la ubicación en un lugar conveniente, son
variables independientes? ¿Por qué razón? Interprete su conclusión.

La independencia requiere que


P(BjIAi) = P(Bj) Una posibilidad es: P (visitas frecuentes | si, ubicación
conveniente) = P (visitas frecuentes)
¿60/90 = 80/195? No, las dos variables no son independientes. Por
consiguiente, cualquier probabilidad en la tabla debe calcularse aplicando la
regla general de la multiplicación.

60/90 Con frecuencia 0.31

25/90
90/195 Ocasionalmente 0.13
5/90

Si Nunca 0.03
¿Conveniente?

20/105 Con frecuencia 0.10


No
35/105 Ocasionalmente 0.18
105/195

50/105 Nunca 0.25


60/80 0.31

Con frecuencia
20/80
80/195 0.10

Si
Ocasional 25/60 0.12
60/195
¿Frecuencia? 35/60

0.18
No 5/55
Nunca 0.05
50/55
55/195
0.25

También podría gustarte