Este documento describe los conceptos fundamentales de los sistemas de colas y servicios. Explica que la planificación de la capacidad de un centro de servicio requiere recopilar datos históricos, pronosticar la demanda, y recomendar un plan de capacidad que minimice los costos. También introduce conceptos clave de la teoría de colas como el proceso de llegadas, la disciplina de cola, y el proceso de servicio. Finalmente, discute el uso de distribuciones exponenciales para modelar los tiempos entre llegadas y la suposición de
0 calificaciones0% encontró este documento útil (0 votos)
119 vistas45 páginas
Este documento describe los conceptos fundamentales de los sistemas de colas y servicios. Explica que la planificación de la capacidad de un centro de servicio requiere recopilar datos históricos, pronosticar la demanda, y recomendar un plan de capacidad que minimice los costos. También introduce conceptos clave de la teoría de colas como el proceso de llegadas, la disciplina de cola, y el proceso de servicio. Finalmente, discute el uso de distribuciones exponenciales para modelar los tiempos entre llegadas y la suposición de
Este documento describe los conceptos fundamentales de los sistemas de colas y servicios. Explica que la planificación de la capacidad de un centro de servicio requiere recopilar datos históricos, pronosticar la demanda, y recomendar un plan de capacidad que minimice los costos. También introduce conceptos clave de la teoría de colas como el proceso de llegadas, la disciplina de cola, y el proceso de servicio. Finalmente, discute el uso de distribuciones exponenciales para modelar los tiempos entre llegadas y la suposición de
Este documento describe los conceptos fundamentales de los sistemas de colas y servicios. Explica que la planificación de la capacidad de un centro de servicio requiere recopilar datos históricos, pronosticar la demanda, y recomendar un plan de capacidad que minimice los costos. También introduce conceptos clave de la teoría de colas como el proceso de llegadas, la disciplina de cola, y el proceso de servicio. Finalmente, discute el uso de distribuciones exponenciales para modelar los tiempos entre llegadas y la suposición de
Descargue como PPT, PDF, TXT o lea en línea desde Scribd
Descargar como ppt, pdf o txt
Está en la página 1de 45
Diseño e Implementación de
Sistemas de Colas y Servicios
-1 Dr Ing Juan Cevallos 1 Introducción • El rasgo distintivo de un sistema de servicios es que no se puede almacenar su producto en previsión de la demanda inminente. Una organización cuyo principal producto es un servicio puede prepararse para aumento de la demanda sólo mediante el aumento de su capacidad. • Una cuestión importante en la planificación de un sistema de servicio es el tamaño de la capacidad. • ¿Cuántos cajeros, tomadores de ticket, personal en una zona de peaje, líneas telefónicas, computadoras en un proveedor de servicios de Internet, pistas de aterrizaje en un aeropuerto, mesas en un restaurante, estaciones de bomberos, camas en un hospital, coches de policía en una región, instalaciones sanitarias, ascensores, o el personal de mantenimiento de máquinas se necesitan con el fin de ofrecer un servicio aceptable? • La Planificación de la capacidad de un centro de servicio consta de tres pasos: 1. Recopilación de datos. Reunir todos los datos históricos relevantes o la creación de un sistema de recogida continua de los datos de la demanda. 2. Análisis de datos. Pronóstico de la demanda, determinar los componentes probabilística de la demanda, determinar la capacidad mínima aceptable para cada período de la demanda. 3. Recomendación de requisitos. Teniendo en cuenta factores tales como la naturaleza probabilística de la demanda, el costo de la demanda mal atendida, los costos de cambio de la capacidad y el nivel de turnos de trabajo, recomendar un plan de capacidad que minimice todos los costos relevantes esperados 2 Pronóstico de la Demanda de Servicios • Los métodos estándar de pronóstico se aplican tanto a la demanda de servicios como a la demanda de bienes. • Los pronósticos a largo plazo de la demanda de servicios deben incorporar el hecho de que la demanda de servicios no reacciona a los cambios en la situación de la economía en la misma forma que la demanda de bienes. • Por ejemplo, la demanda de bienes como los alimentos es relativamente poco afectada por la situación de la economía, mientras que la demanda de servicios de lujo como de restaurante gourmet tiende a ser afectado por la recesión económica. La demanda de un servicio fast food se ha incrementado por la llegada de la madres trabajadoras. • Pronósticos de más corto rango de la demanda de servicios se refiere en gran parte con la medición de los componentes cíclicos de la demanda. En particular, se quiere identificar (por ejemplo para un servicio que procesa las llamadas telefónicas) el: - Efecto de la hora del día, - Efecto del día de la semana efecto (por ejemplo, el número de llamadas diarias al número de emergencia 911 en Nueva York se ha encontrado variación casi predecible, por un factor de dos en función del día de la semana), - Efecto de la Semana del año, - Efecto de día festivo (por ejemplo, Día de la Madre, Día del Trabajo, Semana Santa, etc), - Promociones publicitarias 3 Línea de espera o teoría de colas La teoría de colas es una rama bien desarrollada de la teoría de la probabilidad de que se ha utilizado en la industria telefónica para ayudar a la planificación de su capacidad. AK Erlang realizó el primer análisis serio de las líneas de espera o colas para el sistema telefónico de Copenhague en el siglo 20. Los Métodos de Erlang son aún ampliamente utilizados en la industria de la telefonía para el establecimiento de diversas capacidades, tales como la dotación turnos de operadores. Para su aplicación en la empresa de venta por correo LL Bean, ver Andrews y Parsons (1993). Gaballa y Pearce (1979) describen sus aplicaciones en línea aérea Qantas. • Una reciente aplicación importante de modelos de colas es en los call center. Hay dos tipos de call center: 1) Call center de llamadas entrantes que se ocupan de las llamadas entrantes, como los pedidos de una empresa de venta por catálogos, o atención al cliente para un producto, y 2) Call center de salida, centros de llamadas telefónicas a posibles clientes para promocionar negocios, o tal vez para recordar a los clientes pagar sus facturas. • Es útil señalar que una línea de espera o cola suele ser el negativo de un inventario. Stocks llevados en el inventario permiten a un cliente que llega ser inmediatamente satisfecho. Cuando el inventario se agota, los clientes deben esperar hasta que las unidades de producto lleguen. Los atrasados o espera de los clientes constituyen un inventario negativo, pero también se puede considerar como una cola. • Un ejemplo más explícito es un paradero de taxis. A veces, los taxis estarán en línea en el paradero en espera por los clientes. En otras ocasiones, los clientes pueden estar en línea de espera por los taxis. Qué considera una cola y que considera un inventario depende de si usted es un conductor de taxi o un cliente de los taxis • En la teoría de colas, un sistema de servicio tiene tres componentes: 1) un proceso de llegada, 2) una disciplina de cola, y 3) un proceso de servicio. La siguiente figura ilustra: • Proceso de llegada (por ejemplo, una llegada cada 7 minutos en promedio.) → • Disciplina de cola (por ejemplo, Primero en llegar, primero en atender), pero si 10 están en espera, a continuación, las llegadas se pierden → • Proceso de servicio (por ejemplo, tres servidores idénticos). La media de tiempo de servicio es de 9 minutos.
Una buena introducción a la teoría de colas se pueden
encontrar en Gross y Harris (1998). 3.1 Proceso de llegadas • Hay que distinguir entre dos tipos de proceso de llegada: i) fuente finita y ii) fuente infinita. Un ejemplo de fuente finita es que 10 máquinas están vigilados por una persona de reparación. • Cuando una máquina se malogra, corresponde con la llegada de un cliente. El número de máquinas malogradas esperando reparación es el número de clientes en espera. Diremos que este sistema tiene una fuente finita de tamaño diez. • Con una población finita, la tasa de llegada se reduce a medida que más clientes entran en el sistema. Cuando ya hay 8 de 10 máquinas en espera para las reparaciones o siendo reparadas, entonces la tasa de llegada de más clientes (máquinas malogradas) es de sólo 2 / 10 de la tasa de llegada, si todas las máquinas estuvieran funcionando y por lo tanto elegibles de malograrse. • Un sistema de reservas telefónicas de una línea aérea, por el contrario, por lo general se considera que tiene una población para llamadas infinita. Con una población infinita, la tasa de llegada no se ve afectada por el número de clientes que ya están en el sistema. • Además al tipo de proceso de llegada, una segunda pieza de información que necesita es el tiempo medio entre las llamadas. Si la población para llamadas es infinita, entonces este es un número único independiente del proceso de servicio. • Sin embargo, para una población finita, hay una posibilidad de ambigüedad, porque la tasa de llegada en cualquier momento depende del número en espera. La ambigüedad se resuelve mediante la concentración en uno solo de los clientes supuestamente idénticos. Es suficiente especificar el tiempo medio que pasa hasta que un determinado cliente genera otra llamada, ya que él acaba de completar el servicio. A esto le llamamos el tiempo medio entre fallos o MTBF por sus siglas. • Un buen punto que estamos pasando por alto es la cuestión de la distribución (en comparación con la media) del tiempo entre llamadas. Dos situaciones pueden tener el mismo tiempo medio entre llamadas, pero las distribuciones ser radicalmente diferentes. • Por ejemplo, supongamos que en la situación 1 cada intervalo entre llamadas es exactamente 10 minutos, mientras que en la situación 2, el 10% de los intervalos son de 1 minuto y 90% de los intervalos de 11 minutos. • Ambos tienen la misma media, pero parece plausible que el sistema 2 será más errático e incurrirá en más tiempo de espera. El supuesto fundamental es que la distribución del tiempo entre llamadas es exponencial. Afortunadamente, parece que esta hipótesis no está muy lejos del registro de la mayoría de las situaciones reales. • La distribución exponencial tiene un papel clave en los modelos que se consideran. Para el caso de la fuente infinita, se supone que los tiempos entre llegadas sucesivas se distribuyen de acuerdo a la distribución exponencial. Una función de densidad exponencial se grafica en la figura 18.1: • Si r es la tasa de llegada, x es un valor de la variable aleatoria, y e es el número 2.718284, entonces la frecuencia o la función de densidad presentada en la figura 18.1, está dada por f (x) = re-rx.
• La media y desviación estándar son ambas 1 / r. La
suposición clave que subyace a la distribución exponencial es que la probabilidad que el evento de interés (por ejemplo, la llegada de un cliente o la avería de una máquina especifica) es una constante que es independiente de cuando el evento anterior ocurrió.
• Otra forma de expresar esta función es a través de la
"propiedad sin memoria". Es decir, independientemente de cuánto tiempo ha pasado desde la llegada anterior, la distribución del tiempo hasta la próxima llegada tiene una distribución exponencial con una media de 1 / r 3.2 Disciplina de la cola • Todos los modelos consideran el uso de la disciplina de cola primero en ser disciplina en llegar – primero en ser servido. La única otra información requerida es la capacidad de espera del sistema. Las llamadas o los clientes que llegan mientras hay espacio esperando para que se unan al sistema y, si es necesario, esperan por el servicio. • Una demanda o clientes que encuentra todos los espacios de espera llenos se pierden. Algunos ejemplos son: una oficina de reservas que tiene 10 líneas telefónicas entrantes, pero sólo cuatro agentes de reservaciones. Un agente de reservaciones pone una llamada en “espera " si todos los encargados de reservas ya están ocupados. Si todas las 10 líneas están ocupadas, la persona que llama recibirá un "ocupado" de la señal. • Un sistema análogo es una estación de gasolina con cuatro bombas y espacio para 6 coches que esperar detrás de los cuatro coches que se sirven. Un posible cliente se dice que abandonará si él o ella se niega a unirse a la cola. Una acción similar, abandono – rechazo, se dice que ocurre si un cliente decide dejar la cola de espera. 3.3 Proceso de servicio • El proceso de servicio se caracteriza por dos atributos: a) el número de servidores (que se supone idénticos). b) la distribución del tiempo de servicio. • El supuesto más común es que los tiempos de servicio siguen una distribución exponencial. • Una consecuencia de esta distribución es que el tiempo medio de servicio es igual a la desviación estándar. • Por lo tanto, la comparación de la media con la desviación estándar es una comprobación de datos simple. • A diferencia de los procesos de llegada, hay poca justificación a priori para esperar cualquier tipo particular de distribución de tiempo de servicio. • Uno debe examinar los datos de cerca para seleccionar la distribución aproximada apropiada • Si la desviación estándar en el tiempo de servicio es mucho menor que el tiempo medio de servicio, entonces un tiempo de servicio constante es una aproximación razonable. Si la desviación estándar es aproximadamente igual a la media, entonces la hipótesis exponencial es razonable.
• La distribución exponencial se ajusta
sorprendentemente bien en muchas situaciones. Coffman y Wood (1969), por ejemplo, encontraron que el trabajo de calcular los tiempos en una computadora tenía una desviación estándar algo superior a la media. Sin embargo, la forma de la distribución era esencialmente exponencial con el pico máximo cerca a cero y una larga cola a la derecha. 3.4 Medición del desempeño de sistemas de servicio • Hay una variedad de medidas de desempeño de un sistema de servicio. Las tres medidas que consideraremos son las siguientes: 1) La probabilidad de servicio inmediato. 2) Tiempo promedio de espera. 3) Número medio en espera. 3.5 Estacionariedad • En general, los modelos de colas suponen que la demanda es estacionario (es decir, tiempo estable) o que el sistema ha alcanzado el estado estacionario. Obviamente, esto no puede ser verdad si la demanda se extiende por un período suficientemente largo de tiempo (por ejemplo, un día entero). • Por ejemplo, por lo general es obvio que el tiempo medio entre llamadas de teléfono a las 11:00 horas en un día determinado no es el mismo que el tiempo medio a las 11:00 pm de ese mismo día. Se define la carga en un sistema de servicio como el producto de la tasa media de llegadas por el tiempo de servicio medio por cliente. • La carga es una cantidad sin unidades, que es un límite inferior del número de servidores que uno necesitaría para el proceso de los trabajos que llegan sin tener en cuenta que la cola crezca sin límite. • Probablemente deberíamos tener cuidado al usar un modelo de colas basado en el estado estable si la carga no es constante durante un intervalo de tiempo razonablemente largo. Lo que constituye un “tiempo razonablemente largo"? Para responder a esta pregunta, vamos a definir una notación que utilizaremos en adelante: R = tasa media de llegadas, T = tiempo de servicio media o esperado, S = número de servidores. La cantidad de T / (S - R * T) es una definición simple de "un período de tiempo razonablemente largo". Tenga en cuenta que se vuelve infinito cuando carga se acerca a S. 3.6 Fórmula de “Little” • Existe una relación general muy simple entre el número promedio en el sistema y el tiempo promedio en el sistema. En los círculos de inventario, esta relación se conoce como la ecuación de la rotación del inventario. En el mundo de los servicios o las colas, se conoce como ecuación de flujo de “Little”, ver a Little (1961). Es decir, la ecuación de Little es: • (número medio en los sistemas) = (tasa de llegada) * (tiempo promedio en el sistema) • Reformulado en la terminología del inventario, esto es: (nivel promedio de inventario) = (tasa de venta) * (tiempo promedio en el sistema) • Los administradores de inventario con frecuencia miden el desempeño en "rotaciones de inventarios", donde: • (rotaciones de inventario) = 1 / (tiempo promedio en el sistema) • Rearreglando según la ecuación de flujo de Little: (nivel promedio de inventario) = (tasa de ventas) / (rotaciones de inventarios) o (rotaciones del inventario) = (tasa de ventas) / (nivel promedio de inventario) La ecuación es muy poco en general. El único requisito imprescindible es que el sistema al que se aplica no puede estar a la deriva hasta el infinito. Ningún supuesto probabilístico en particular se requiere. 3.7 Ejemplo • Los clientes llegan a una tasa de 25 por hora en promedio. Tiempo en el sistema en promedio es de 12 minutos. ¿Cuál es el número promedio de clientes en el sistema? Respuesta: (Nº Promedio en el sistema) = (25/hora) * 12 minutos * 1 hour/60 minutos) = 25 * (1 / 5) = 5 4 Solución de Modelos de Colas • Hay cinco situaciones o modelos que vamos a considerar. • Que se resumen en la Tabla 1. La característica principal de estas situaciones es que hay fórmulas muy sencillas que describen el funcionamiento de estos sistemas. Tabla 1: Modelos resueltos de servicio del sistema • Los cinco modelos están presentados con la notación que se utiliza normalmente para ellos en la literatura de gestión de colas. La notación es de la forma (proceso de llegadas / distribución del servicio / número de servidores [/ número de espacios disponibles], donde: M = distribución exponencial (o de Markov), G = general o arbitraria, D = determinista o fija, y F = fuente finita. • Los dos modelos "caballito de batalla" de esta serie de cinco son: a) el M / G / c / c, también conocido como la pérdida de Erlang o modelo Erlang-B, y b) el M / M / c, también conocido como el modelo Erlang C. LINGO tiene dos funciones incorporadas, @ PEL () y @ PEB () que "resolver" estos dos casos. Su uso se ilustra a continuación: 4.1 Número de líneas salida WATS a través del modelo de pérdida de Erlang • Algunas empresas compran un cierto número de salida WATS (Wide Area Telephone Service: servicio telefónico de área abierta), líneas con el fin de reducir sus cargos de larga distancia. Una línea de salida WATS le permite realizar un número ilimitado de llamadas de larga distancia por una tarifa fija. • La cuota fija es lo suficientemente baja, de modo que, si usted hace un montón de llamadas, el costo por llamada es mucho menor que si usted paga el costo estándar / minuto. Supongamos que nuestra empresa hace un promedio de cinco llamadas de larga distancia por minuto durante el día laboral. La duración media de una llamada es de 4 minutos • El sistema se puede configurar, de modo que, si uno de nuestros empleados marca un número de larga distancia, la llamada será asignado a una línea WATS si una de nuestras líneas WATS está disponible, de lo contrario la llamada utiliza una línea regular a las tarifas regulares durante la duración de la llamada. • Supongamos que adquirimos 20 líneas WATS. ¿Qué fracción de las llamadas encuentran todas las líneas WATS ocupadas y por lo tanto utilizan una línea regular? Un modelo adecuado es: La solución es: • Por lo tanto, aunque tenemos suficiente capacidad de la línea WATS para manejar la demanda promedio, sin embargo, debido a la aleatoriedad, casi el 16% de la demanda se pierde (es decir, se desborda en las líneas regulares). • Existe una economía estadística de escala en la demanda de servicios (es decir, el doble de la demanda no requiere que tengamos el doble de capacidad). • Para ilustrar, supongamos que prevemos un gran crecimiento el próximo año y esperamos que la tasa de llamadas salientes sea de 50 llamadas por minuto en lugar de 5. • Si nuevamente adquirimos las suficientes líneas WATS para manejar la demanda promedio, 50 * 4 = 200, ¿qué fracción de la demanda se desbordará? Si sustituimos R = 50 en el modelo, obtenemos la solución:There is a statistical economy of scale in service demand (i.e., twice the demand does not require us to have twice the The fraction overflow has dropped to approximately, 5%, even though we are still setting capacity equal to the average demand 4.2 Evaluación de la centralización del servicio a través del modelo Erlang C • Ukallus Company toma pedidos telefónicos en dos oficinas independientes y está considerando combinar los dos en una sola oficina, a la que se puede acceder a través de un número "800". • Ambas oficinas tienen volúmenes similares de 50 llamadas telefónicas por hora (= .83333 / minuto) manejadas por 4 tomadores de pedidos en cada oficina. Cada oficina tiene suficientes líneas entrantes que hacen que las llamadas se pongan en cola automáticamente hasta que haya un gestor de pedidos disponible. • El tiempo para procesar una llamada se distribuye exponencialmente con una media de 4 minutos. • ¿Cuánto mejoraría el servicio si estuviera centralizado a una oficina con 8 tomadores de pedidos? Los resultados son: • Así, la oficina centralizada da un servicio notablemente mejor (casi el doble de bueno, dependiendo de su medida), servicio con los mismos recursos totales. Por otra parte, el mismo nivel de servicio se podría lograr con un poco menos recursos. • Las estadísticas anteriores se pueden calcular mediante el modelo de LINGO siguiente. • Note que, se define espera de un cliente como el tiempo del cliente en el sistema hasta que su servicio se inicia. El tiempo de espera no incluye el tiempo de servicio La solución es: 4.3 Un Sistema Mixto de Servicio / inventario via el Modelo M / G / ∞ • Supongamos que nos lleva 6 minutos hacer un producto determinado (por ejemplo, una hamburguesa). La demanda por el producto llega a una tasa del 2 por minuto. Con el fin de dar un buen servicio, hemos decidido que vamos a llevar a 10 unidades en stock en todo momento.
• Por lo tanto, cuando un cliente llega y toma una de nuestras
unidades en stock, de inmediato ponemos un pedido para otro. Tenemos un montón de capacidad, de modo que, aunque tenemos un montón de unidades en proceso, todavía podemos hacer una más en un tiempo promedio de 6 minutos.
• Los clientes que nos encontramos fuera del stock vamos a esperar por una nueva que se haga. Esto se llama una política de stock base con backlogging: La solución es:
Thus, more than 75% will have to wait.
4.4 Número óptimo de reparadores a través del modelo de fuente finita • Una empresa textil cuenta con 10 máquinas semiautomáticas, que de vez en cuando necesita los servicios de un técnico (por ejemplo, si se rompe un hilo) con el fin de poner la máquina en servicio. El tiempo de reparación tiene una distribución exponencial con una media de 1 hora.
• Razones físicas implica que sólo un reparador puede estar en una
máquina a la vez (es decir, un ayudante no ayuda).
• Una vez reparado, el tiempo medio de los atascos de nuevo el
equipo falla es de 5 horas. El costo de un reparador con equipamiento completo es de $ 30 por hora. El costo de oportunidad de una máquina atascada es de $ 350 por hora. ¿Cuántos reparadores deben ser asignados a estas 10 máquinas? Utilizando la función @ PFS de LINGO, se puede construir la siguiente tabla de número esperado de máquinas fuera de servicio en función del número de reparadores: Así, se obtienen que el número óptimo de reparadores es de 4. Un ejemplo de modelo en LINGO para esta tabla es el siguiente Parte de la solución es: • Un modelo similar al de los reparadores de máquinas ha sido utilizada por Samuelson (1999) para analizar los métodos de marcación predictiva en un centro de llamadas.
• En un sistema de marcación predictiva, un marcador automático
puede empezar a marcar el próximo cliente a ponerse en contacto, incluso antes de que haya un agente disponible para hablar con el cliente. Se tarda entre 10 y 30 segundos para marcar un número y la persona llamada contesta el teléfono.
• Por lo tanto, el marcado automático se realiza en la previsión de
que un agente estará disponible en el momento en que una parte llamada contesta el teléfono.
• Un marcador automático puede detectar una señal de ocupado o de
una llamada que no está respondida, y puede pasar a marcar el número siguiente. Samuelson (1999) indica que un buen marcador predictivo puede aumentar el tiempo de conversación del agente (es decir, la utilización) hasta 95% desde menos de 80%. • El gerente de un marcador predictivo tiene al menos dos variables de decisión en el control del marcador predictivo: a) el número de líneas adicionales a usar, más allá del número de agentes, para marcar, y b) el tiempo de demora antes de comenzar a marcar en una línea, una vez que esté disponible. Estas dos decisiones se pueden ser fijadas por el reparador de la máquina de la siguiente manera.
• El número de agentes es igual al número de reparadores.
• El número total de líneas es el tamaño de la población.
• El up time es el tiempo de demora antes de iniciar la marcación + el