Modelos y Simulación Proyecto - GRUPO 1
Modelos y Simulación Proyecto - GRUPO 1
Modelos y Simulación Proyecto - GRUPO 1
Lima, Perú
2024
UNMSM Facultad de Ingeniería de Sistemas e Informática
ÍNDICE
I. INTRODUCCIÓN.....................................................................................................3
II. DESCRIPCIÓN DEL CASO.................................................................................. 4
A. Análisis y diagnóstico del escenario actual..........................................................4
B. Explicación del caso a estudiar.............................................................................6
C. Objetivo de la simulación..................................................................................... 7
D. Justificación e importancia...................................................................................7
E. Revisión de la literatura........................................................................................ 8
F. Definición de variables........................................................................................12
III. PREPARACIÓN DE LOS DATOS.................................................................... 12
A. Base de datos...................................................................................................... 12
B. Identificador de distribución de probabilidad.....................................................16
C. Generador de números pseudoaleatorios............................................................22
Verificación de datos..........................................................................................23
D. Generador de distribución de probabilidad a utilizar......................................... 26
IV. CONSTRUCCIÓN DEL MODELO DE SIMULACIÓN................................. 29
A. Mecanismo de los Eventos discretos..................................................................29
B. Primer Escenario de Simulación.........................................................................31
1) Enunciado, Objetivo y variables a considerar............................................... 31
2) Simular con “n” corridas apropiadas y “r” réplicas (mayor a 30) -
Distribución N................................................................................................... 31
3) Gráfica de Welch........................................................................................... 36
4) Análisis de Resultados - Métodos de Observación....................................... 38
C. Segundo Escenario de Simulación..................................................................... 40
1) Enunciado, Objetivo y variables a considerar............................................... 40
2) Simular las corridas y réplicas.......................................................................40
D. Comparación de los Escenarios..........................................................................45
1) Resumen de los escenarios............................................................................ 45
2) Aplicación de T - Paired Test o Two - Sample Test...................................... 45
3) Diagrama de cajas......................................................................................... 46
4) Simulación en Arena o Promodel e interpretación estadística de resultados
(antes y después)................................................................................................49
5) Conclusión.....................................................................................................50
E. Diagrama TO-BE del mejor escenario e interpretación......................................51
1) Problema presentado..................................................................................... 51
2) Propuesta de mejora (escenario ganador)......................................................52
3) Diagrama TO-BE...........................................................................................54
4) Evaluación de costos o beneficios incluyendo porcentajes de antes y después
56
V. DISCUSIONES Y RESULTADOS........................................................................56
Resultados..........................................................................................................57
VI. CONCLUSIONES................................................................................................ 58
VII. REFERENCIAS BIBLIOGRÁFICAS..............................................................59
I. INTRODUCCIÓN
En la actualidad,el e-commerce ha transformado significativamente nuestra forma de
comprar, permitiendo el acceso a una variedad de productos y servicios a través de
plataformas online. El "e-grocery" (Rappi, Plaza Vea online, Wong online, Vivanda ,
etc) emerge como una modalidad atractiva dentro del comercio electrónico,
especialmente en el sector de comestibles, facilitando a los consumidores realizar sus
compras sin la necesidad de visitar físicamente los supermercados tradicionales.
En la tesis base que estamos analizando nos mencionan esto :"Para futuras
investigaciones, recomendamos evaluar si la variable tiempo de servicio guarda
relación directa con la cantidad de productos que el cliente solicita a fin de tener un
análisis más específico de dicha variable" (Díaz Cortez & Moreno Alcántara, 2019).
Es por ello que vamos a partir de ese punto separando la base de datos en dos
escenarios a partir de la cantidad de productos (Escenario 1 será los pedidos que
tengan cantidad de productos del 1 al 6 y el escenario 2 serán los pedidos que tenga
cantidad de productos del 7 al 35)
C. Objetivo de la simulación
El principal objetivo de esta simulación es desarrollar un modelo de pedidos que
pueda ser aplicado en las empresas de e-grocery y evaluar si la variable tiempo de
servicio guarda relación directa con la cantidad de productos que el cliente solicita.
Este modelo permitirá comprender mejor el comportamiento de la demanda y
optimizar el uso de recursos, mejorando así la eficiencia operativa con una nueva
segmentación que podría ser utilizado como un sistema de “Caja rápida” y por ende
mejorar los tiempos de servicio.
D. Justificación e importancia
El estudio se basa en negocios pequeños debido a que estos son los que la población
más utiliza al momento de hacer e-grocery.
"El número de comercios que venden en línea se ha mantenido relativamente estable;
sin embargo, destacó el crecimiento exponencial de emprendedores que venden a
través de redes sociales como TikTok o Instagram, conversan por WhatsApp y
finalmente cobran mediante una billetera digital" (Gestión, 2023).
Esto se debe a que los negocios pequeños hacen delivery instantáneo mientras que los
negocios grandes tienen un sistema de recojo en tienda o el delivery demora más de lo
deseado.
Esta simulación busca proporcionar un marco práctico y analítico que ayude a las
pequeñas empresas de e-grocery en Lima Metropolitana a mejorar sus procesos de
toma y entrega de pedidos, diferenciándose de las grandes cadenas de supermercados
y aumentando su competitividad en el mercado.
E. Revisión de la literatura
Algunos estudios relacionados a nuestro trabajo y que nos brindan una perspectiva de
puntos relevantes sobre nuestra tesis:
1. Barzola Velasquez, Y. L., Liu, S., & Rios Gamarra, R. O. (2023). Mejora en el
diseño de la cadena logística del e-commerce en Perú: El caso de los
productos electrónicos procedentes de China y EE. UU [Tesis de maestría,
Universidad ESAN]. Repositorio de la Universidad ESAN.
https://repositorio.esan.edu.pe/server/api/core/bitstreams/0ab0a878-b265-4a4a
-b9f3-e20a7aeb3566/content
https://repositorio.ulima.edu.pe/bitstream/handle/20.500.12724/17426/T018_7
0356386_T.pdf?sequence=1&isAllowed=y
https://doi.org/10.26495/icti.v10i2.2651
5. Delgado Herrera, D. D., & Ruiz Lopez, A. B. (2020). Análisis del desarrollo
del comercio electrónico y su relación teórica con la satisfacción de los
clientes de tiendas por departamento en Lima en la actualidad [Tesis de
bachillerato,Pontificia Universidad Católica del Perú]. Repositorio de la
PUCP.
https://tesis.pucp.edu.pe/repositorio/bitstream/handle/20.500.12404/19432/DE
LGADO_HERRERA_RUIZ_LOPEZ.pdf?sequence=1&isAllowed=y
Esta tesis busca cómo aplicar la simulación de sistemas para diseñar un plan
estratégico de marketing destinado a incrementar las ventas en un e-commerce
especializado en seguros. Se enfoca en Socorro.PE, un bróker de seguros en
línea que busca expandir su oferta de productos y mejorar la eficiencia de sus
procesos de ventas. El estudio aborda la optimización de la estructura
Ingeniería de Sistemas 10 Modelos y Simulación
UNMSM Facultad de Ingeniería de Sistemas e Informática
https://tesis.pucp.edu.pe/repositorio/bitstream/handle/20.500.12404/19407/BE
LLIDO_GAZZO_RIVERA_DE_LA_CRUZ%20%283%29.pdf?sequence=1&
isAllowed=y
https://repositorio.usil.edu.pe/server/api/core/bitstreams/28d60261-a857-4741-
a951-e14a8b80b537/content
En esta tesis se investiga cómo el comercio electrónico afecta las Mypes del
sector textil, se ve una mejora significativa en las ventas y competitividad de
las empresas.
https://hdl.handle.net/11537/35505
https://repositorio.ucv.edu.pe/bitstream/handle/20.500.12692/17098/Milla_FJ
L-SD.pdf?sequence=1&isAllowed=y
F. Definición de variables
Las variables que se analizarán serán las siguientes:
Es el tiempo que
Tiempo de servicio demora desde que el Tiempo que tarda
(cuantitativa cliente ingresa su un cliente en ser
continua) pedido hasta que el atendido.
pedido es entregado.
Número de
Es la cantidad de drivers Número de drivers
servidores
que se tienen asignados asignados por
(cuantitativa
por zona geográfica zonas
discreta)
• Columna “#” → Denota el número de cada uno de los pedidos de la base de datos.
• Columna “FECHA” → Muestra la fecha en la que se concretó la venta, es decir la
fecha en la que entró el pedido a la base de datos.
• Columna “DIA SEMANA” → Indica el día de la semana, entre lunes y domingo,
que corresponde a la fecha establecida en el pedido.
• Columna “MES” → Señala el mes del año que corresponde con la fecha de ingreso
del pedido.
Esta base de datos se transformará en dos pequeñas base de datos, usando filtros en la
columna “Cantidad”, separando el primero con las cantidades 1 a 6 y el segundo con
las cantidad de 7 a 35.
Elaboración propia. (2024). Extracto de base de datos de pedidos de empresas e-grocery con
cantidades de 1 a 6
Elaboración propia. (2024). Extracto de base de datos de pedidos de empresas e-grocery con
cantidades de 7 a 35
Primero se observa que los datos no siguen una distribución normal debido a que el
valor p es <0.05, además se observa que tampoco sigue ninguna de las demás
distribuciones por lo que seguirá una distribución empírica para esta variable. El
cuadro de frecuencias acumuladas será el siguiente:
Se observa que esta variable no sigue una distribución normal debido a que su valor p
es menor a 0.05, además tampoco sigue ninguna de las demás distribuciones por lo
que se seguirá de igual manera que el escenario 1 y se trabajara con una distribución
empírica.
Se observa que los datos no siguen una distribución normal debido a que los datos no
siguen una normal debido a que su valor p es menor a 0.05, pero se observa que puede
A continuación se mostrará la función o ecuación que se necesita para que los datos
sigan una distribución normal.
Se observa que tampoco estos datos siguen una distribución normal ya que su valor p
es menor a 0.05, pero así como el escenario 1 se puede aplicar una transformada de
Jhonson debido a que su valor p es mayor a 0.05<0.837 y de esta manera los datos
seguirán una distribución normal.
A continuación se mostrará la función o ecuación que se necesita para que los datos
sigan una distribución normal.
Estos datos nos dan unos números pseudoaleatorios con periodo de 1500.
Planteamiento de las hipótesis para la prueba de Chi Cuadrado. Fuente: Elaboración propia.
Los datos que tenemos son nuestro N de 1500, nuestros intervalos que se aproxima a
39 y nuestra frecuencia esperada de 38.46.
Con esta tabla, se hallará nuestro chi observado y además se calculó el chi esperado
con un nivel de significancia (α) de 0.05 y 38 grados de libertad:
Como nuestro chi observado es menor al calculado, entonces no se rechaza el H0; por
lo tanto, los datos vienen de una distribución uniforme.
● Prueba de promedios
Para la prueba de promedios y verificar la independencia de los datos tenemos las
siguientes hipótesis:
Una vez planteadas nuestras hipótesis, se hallarán los límites superior e inferior y se
verificará que la media de los datos se encuentre en ese intervalo. La fórmula para
hallar los límites es la siguiente:
Para nuestros datos, tomamos un alfa de 0.05 con una cantidad de datos de 1500 y el
promedio de los datos es 0.51168813.
=BUSCARV(L10;'Tiempo de Servicio_ESC1'!$L$73:$M$84;2;VERDADERO)
=BUSCARV(L10;'Tiempo de Servicio_ESC2'!$L$75:$M$88;2;VERDADERO)
=MAX((342,89*EXP((C10-2,63467)/0,843405)-0,964948)/(1+EXP((C10-2,63467)/0,
843405));0)
=MAX(3,41989+7,34465*SENOH((C10+1,55932)/0,78554);0)
Para mecanismo se trabajara hasta tener n=4 demoras en cola, los datos de nuestros
arribos y tiempos de servicio se hallaron en base a las simulaciones y utilización de
los números pseudoaleatorios hallados anteriormente:
Se observa en el gráfico que las barras de color gris se enceuntran en el tiempo antes
de contabilizar 4 demoras en cola, mientras que las barras azules son despues de
contabilizar estas demoras, se hizo las barras azules para graficar la tercera salida que
sera necesaria para nuestras formulas del rendimiento
Se observa en el cuadro que primero se hallan las demoras de los 4 clientes en base a
que nuestro n es 4, por último se sumarán estas demoras y se dividirá entre nuestro n.
Lo que nos indica que en promedio un cliente espera en cola 48.8 minutos
Para hallar el promedio de clientes en cola primero se hallaran los tiempos totales
donde ocurren colas de 0,1,2 y 3 personas que ya se hallaron en el cuadro. Como
resultado final observamos que para n=4 tenemos que el promedio de clientes en cola
es de 1.25.
Por último se hallará la utilización del servidor, esta se halla dividiendo el tiempo en
cual el servidor está ocupado entre el tiempo donde se observaron 4 demoras en cola.
Se observa que nuestro resultado fue de 0.95, es decir que el servidor estuvo ocupado
un 95% del tiempo en la simulación, esto se puede verificar en nuestro gráfico de
avance en el tiempo donde la barra inferior gris siempre permanece arriba con la
excepción de que al inicio aun no llegaba ningún cliente.
Como podemos ver, el valor de p es muchísimo menor al valor de alfa = 0.05 (p<alfa).
Eso quiere decir que hay evidencia para rechazar el H0 y concluir que los datos NO
siguen una distribución normal.
Donde:
s → desviación estándar
α → nivel de confianza (rechazo)
∈ → error permitido
n → tamaño de la corrida de simulación (número de corridas óptimas)
Por lo que la cantidad de corridas a realizar son de 29292 corridas para verificar si con
ese tamaño de corrida de simulación será suficiente para llegar al estado estacionario.
Luego de realizar las 800 corridas, se puede observar que el promedio móvil del
tiempo de servicio llegó al estado estacionario, por tema de no saturar el excel se optó
por no hacer las 29292 corridas pero de igual forma se puede apreciar el estado
estacionario.
Luego de hacer todas las corridas de las 10 réplicas, hallamos los promedios y desviación
estándar de cada réplica.
3) Gráfica de Welch
Se usarán las réplicas de la variable tiempo de servicio para poder determinar el
periodo de calentamiento, se puede observar el Tiempo de servicio durante el
periodo i en la réplica j:
Una vez calculado el tiempo de servicio promedio por periodo, se pasará a hallar el
promedio móvil de tiempo de servicio durante el periodo i.
Gráfico del promedio móvil de la variable tiempo de servicio del escenario 1 para W = 50.
Fuente: Elaboración propia.
Gráfico del promedio móvil de la variable tiempo de servicio del escenario 1 para W = 100.
Fuente: Elaboración propia.
Gráfico del promedio móvil de la variable tiempo de servicio del escenario 1 para W = 250.
Fuente: Elaboración propia.
Tiempo entre llegadas para el método de subintervalos en excel. Fuente Elaboración propia
Se observa en cuadro que también se halló el tiempo de servicio de cada llegada así como el
reloj y el tiempo donde ocurren las salidas respectivas, una vez se tienen estos datos se
empezará a hacer la simulación con una cola.
Se puede observar en el gráfico que se dividieron las barras en dos colores donde el color rojo
inicial representa las colas dentro del periodo transitorio y las barras en blanco representan las
colas que ya se encuentran en el periodo estable. En la horizontal se marco con rojo los
tiempos donde ocurren las salidas, así como el primer número azul representa el fin del
periodo transitorio y los demás tiempos azules representan el fin de los tiempos designados a
los lotes.
Se observa en cuadro que la fina Ai representa el área de las barras en cada lote
respectivamente y la fila Qi representa la longitud promedio de la cola en cada lote, donde se
verifica que con la excepción del lote 1, esta longitud se mantiene estable.
Donde:
s → desviación estándar
α → nivel de confianza (rechazo)
∈ → error permitido
n → tamaño de la corrida de simulación (número de corridas óptimas)
Se encontraron los siguientes valores de los parámetros necesarios y el resultado de
esta fórmula que se utilizó:
Por lo que la cantidad de corridas a realizar son de 82714 corridas para verificar si
con ese tamaño de corrida de simulación será suficiente para llegar al estado
estacionario.
Luego de realizar las 800 corridas, se puede observar que el promedio móvil del
tiempo de servicio llegó al estado estacionario, por tema de no saturar el excel se
optó por no hacer las 82714 corridas pero de igual forma se puede apreciar el
estado estacionario.
Luego de hacer todas las corridas de las 10 réplicas, hallamos los promedios y desviación
estándar de cada réplica.
Si realizamos unas r = 10 repeticiones del modelo, el promedio móvil del Tiempo de Servicio
en el 95% de las mismas, se espera que se encuentre entre 64.5251 y 66,2634 minutos.
Luego de usar una tabla de diferencias, se plantean las siguientes hipótesis para
verificar si presentan o no una diferencia significativa.
3) Diagrama de cajas
Diagrama de cajas de las réplicas entre los 2 escenarios. Fuente: Elaboración Propia
Mediana 60.0121
Mediana 65.2638
➢ Bigotes: Los bigotes se extienden desde aproximadamente 65 hasta casi 66.3, lo que
indica el rango total de los datos.
➢ Valores Atípicos: No se observan valores atípicos significativos.
Para identificar cuál es el escenario ganador, debemos comparar los siguientes puntos
de ambos:
● Mediana de tiempo de Servicio
➢ Primer escenario: 60.0121 minutos
➢ Segundo escenario: 65.2638 minutos
Lo que podemos observar es que la mediana del tiempo de servicio del primer
escenario es menor al del segundo escenario, lo que quiere decir es que los pedidos
en el escenario 1 se entregan con mayor rapidez.
● Bigotes
➢ Primer escenario: 59.2624 - 61.1181
➢ Segundo escenario: 64.9508 - 66.2769
Lo que podemos ver es que los bigotes del escenario 1 son menores a comparación de
los del escenario 2, lo que indica de forma más precisa que los tiempos de entrega
del escenario 1 son menores, o en otros términos, indican un servicio más rápido.
DESPUÉS:
5) Conclusión
● Se confirmó que existe una relación directa entre la cantidad de productos solicitados
y el tiempo de servicio. A mayor cantidad de productos, mayor es el tiempo de
servicio.
Comparación de escenarios:
● La aplicación de la prueba T-Paired mostró una diferencia significativa entre los dos
escenarios analizados.
● El escenario 1, que considera pedidos más pequeños (1-6 productos), presenta un
tiempo de servicio menor comparado con el escenario 2, que maneja pedidos más
grandes (7-35 productos).
● El primer escenario tiene un RIQ de 1.1389, mientras que el segundo escenario tiene
un RIQ de 0.6432. Aunque el segundo escenario tiene un rango intercuartil menor,
indicando una mayor consistencia, los tiempos de servicio más rápidos del primer
escenario lo hacen más ventajoso.
Bigotes:
● Los bigotes del primer escenario (59.2624 - 61.1181) son menores que los del
segundo escenario (64.9508 - 66.2769). Esto refuerza que los tiempos de entrega en el
primer escenario son más rápidos.
● La implementación de una caja rápida para pedidos pequeños permite una mejora
significativa en los tiempos de servicio, ya que estos pedidos se procesan y entregan
más rápidamente.
Implementar una caja rápida y segmentar los pedidos en pequeños (1-6 productos) y
grandes (7-35 productos) permitiría optimizar los tiempos de servicio. La asignación
diferenciada de recursos y procesos para cada tipo de pedido mejoraría la eficiencia
del modelo de simulación, proporcionando un análisis más detallado y preciso en
comparación con la tesis original.
ESCENARIO 1 GANADOR:
Fuente:Elaboración propia.
Después de aplicar la prueba T-Paired para comparar los dos escenarios de simulación, se
concluyó que el escenario 1 es el ganador. Este escenario se caracteriza por:
3) Diagrama TO-BE
Diagrama TO-BE del escenario 1 mejorado con caja rápida. Fuente: Elaboración propia.
Se está automatizando en las siguientes partes del proceso para mejorar la eficiencia y reducir
los tiempos de servicio:
Análisis Revisado
V. DISCUSIONES Y RESULTADOS
Comprobando que la variable tiempo de servicio en este sistemas si guarda relación con la
cantidad de productos, es decir son directamente proporcional, a más cantidad de productos
más tiempo de servicio.
También se obtuvo como resultado que el tiempo entre llegadas es menor cuando el cliente
tiene como cantidad de productos de 1 a 7 eso quiere decir que hay más clientes con
tendencia a comprar cantidades de 1 a 7 productos.
Con esto se puede decir que una sistema de “Caja rápida” ayudaría a los negocios de este tipo
gracias a los análisis que hemos realizado y comprobado.
Nuestra segmentación por cantidad de productos nos dio como resultado analizar y detallar
mejor el modelo de simulación a diferencia de la tesis base.
Segmentación de pedidos:
Resultados
productos con esto se pudo ver de mejor manera el comportamiento del modelo de
simulación y ayudará a la toma de decisiones para la empresa.
VI. CONCLUSIONES
● Asignar el tipo de motorizado para llevar los pedidos,fue útil para reducir el
tiempo de servicio hacia los clientes,ya que no sólo acorto los tiempos de
servicio,sino que mejoró la satisfacción del cliente ,además permitio una
mejora en la logística,minimizando los costos.
https://doi.org/10.26495/icti.v10i2.2651
● Díaz Cortez, G. S., & Moreno Alcántara, G. G. (2019). Desarrollo de un modelo de
simulación de pedidos en la industria del e-grocery en la ciudad de Lima
metropolitana. Universidad Peruana de Ciencias Aplicadas (UPC), Lima, Perú.
https://repositorioacademico.upc.edu.pe/bitstream/handle/10757/625848/diaz_cg.pdf?
sequence=1&isAllowed=y