8 Lingo 1 Teoria+colas+1

Diseño e Implementación de
Sistemas de Colas y Servicios

-1
Dr Ing Juan Cevallos
1 Introducción
• El rasgo distintivo de un sistema de servicios es que no
se puede almacenar su producto en previsión de la
demanda inminente. Una organización cuyo principal
producto es un servicio puede prepararse para aumento
de la demanda sólo mediante el aumento de su
capacidad.
• Una cuestión importante en la planificación de un
sistema de servicio es el tamaño de la capacidad.
• ¿Cuántos cajeros, tomadores de ticket, personal en una
zona de peaje, líneas telefónicas, computadoras en un
proveedor de servicios de Internet, pistas de aterrizaje
en un aeropuerto, mesas en un restaurante, estaciones
de bomberos, camas en un hospital, coches de policía
en una región, instalaciones sanitarias, ascensores, o el
personal de mantenimiento de máquinas se necesitan
con el fin de ofrecer un servicio aceptable?
• La Planificación de la capacidad de un centro de
servicio consta de tres pasos:
1. Recopilación de datos. Reunir todos los datos históricos
relevantes o la creación de un sistema de recogida
continua de los datos de la demanda.
2. Análisis de datos. Pronóstico de la demanda, determinar
los componentes probabilística de la demanda,
determinar la capacidad mínima aceptable para cada
período de la demanda.
3. Recomendación de requisitos. Teniendo en cuenta
factores tales como la naturaleza probabilística de la
demanda, el costo de la demanda mal atendida, los
costos de cambio de la capacidad y el nivel de turnos de
trabajo, recomendar un plan de capacidad que minimice
todos los costos relevantes esperados
2 Pronóstico de la Demanda de
Servicios
• Los métodos estándar de pronóstico se aplican tanto a
la demanda de servicios como a la demanda de bienes.
• Los pronósticos a largo plazo de la demanda de
servicios deben incorporar el hecho de que la demanda
de servicios no reacciona a los cambios en la situación
de la economía en la misma forma que la demanda de
bienes.
• Por ejemplo, la demanda de bienes como los alimentos
es relativamente poco afectada por la situación de la
economía, mientras que la demanda de servicios de lujo
como de restaurante gourmet tiende a ser afectado por
la recesión económica. La demanda de un servicio fast
food se ha incrementado por la llegada de la madres
trabajadoras.
• Pronósticos de más corto rango de la demanda de
servicios se refiere en gran parte con la medición de los
componentes cíclicos de la demanda. En particular, se
quiere identificar (por ejemplo para un servicio que
procesa las llamadas telefónicas) el:
- Efecto de la hora del día,
- Efecto del día de la semana efecto (por ejemplo, el
número de llamadas diarias al número de emergencia
911 en Nueva York se ha encontrado variación casi
predecible, por un factor de dos en función del día de la
semana),
- Efecto de la Semana del año,
- Efecto de día festivo (por ejemplo, Día de la Madre,
Día del Trabajo, Semana Santa, etc),
- Promociones publicitarias
3 Línea de espera o teoría de colas
La teoría de colas es una rama bien desarrollada de la teoría
de la probabilidad de que se ha utilizado en la industria
telefónica para ayudar a la planificación de su capacidad.
AK Erlang realizó el primer análisis serio de las líneas de
espera o colas para el sistema telefónico de
Copenhague en el siglo 20.
Los Métodos de Erlang son aún ampliamente utilizados en la
industria de la telefonía para el establecimiento de
diversas capacidades, tales como la dotación turnos de
operadores. Para su aplicación en la empresa de venta
por correo LL Bean, ver Andrews y Parsons (1993).
Gaballa y Pearce (1979) describen sus aplicaciones en
línea aérea Qantas.
• Una reciente aplicación importante de modelos de colas
es en los call center. Hay dos tipos de call center:
1) Call center de llamadas entrantes que se ocupan de las
llamadas entrantes, como los pedidos de una empresa
de venta por catálogos, o atención al cliente para un
producto, y
2) Call center de salida, centros de llamadas telefónicas a
posibles clientes para promocionar negocios, o tal vez para
recordar a los clientes pagar sus facturas.
• Es útil señalar que una línea de espera o cola suele ser
el negativo de un inventario. Stocks llevados en el
inventario permiten a un cliente que llega ser
inmediatamente satisfecho. Cuando el inventario se
agota, los clientes deben esperar hasta que las
unidades de producto lleguen. Los atrasados o espera
de los clientes constituyen un inventario negativo, pero
también se puede considerar como una cola.
• Un ejemplo más explícito es un paradero de taxis. A
veces, los taxis estarán en línea en el paradero en
espera por los clientes. En otras ocasiones, los clientes
pueden estar en línea de espera por los taxis. Qué
considera una cola y que considera un inventario
depende de si usted es un conductor de taxi o un cliente
de los taxis
• En la teoría de colas, un sistema de servicio tiene tres
componentes:
1) un proceso de llegada,
2) una disciplina de cola, y
3) un proceso de servicio.
La siguiente figura ilustra:
• Proceso de llegada (por ejemplo, una llegada cada 7
minutos en promedio.) →
• Disciplina de cola (por ejemplo, Primero en llegar,
primero en atender), pero si 10 están en espera, a
continuación, las llegadas se pierden →
• Proceso de servicio (por ejemplo, tres servidores
idénticos). La media de tiempo de servicio es de 9
minutos.
Una buena introducción a la teoría de colas se pueden

encontrar en Gross y Harris (1998).
3.1 Proceso de llegadas
• Hay que distinguir entre dos tipos de proceso de llegada:
i) fuente finita y ii) fuente infinita. Un ejemplo de fuente
finita es que 10 máquinas están vigilados por una
persona de reparación.
• Cuando una máquina se malogra, corresponde con la
llegada de un cliente. El número de máquinas
malogradas esperando reparación es el número de
clientes en espera. Diremos que este sistema tiene una
fuente finita de tamaño diez.
• Con una población finita, la tasa de llegada se reduce a
medida que más clientes entran en el sistema. Cuando
ya hay 8 de 10 máquinas en espera para las
reparaciones o siendo reparadas, entonces la tasa de
llegada de más clientes (máquinas malogradas) es de
sólo 2 / 10 de la tasa de llegada, si todas las máquinas
estuvieran funcionando y por lo tanto elegibles de
malograrse.
• Un sistema de reservas telefónicas de una línea aérea,
por el contrario, por lo general se considera que tiene
una población para llamadas infinita. Con una población
infinita, la tasa de llegada no se ve afectada por el
número de clientes que ya están en el sistema.
• Además al tipo de proceso de llegada, una segunda
pieza de información que necesita es el tiempo medio
entre las llamadas. Si la población para llamadas es
infinita, entonces este es un número único
independiente del proceso de servicio.
• Sin embargo, para una población finita, hay una
posibilidad de ambigüedad, porque la tasa de llegada en
cualquier momento depende del número en espera. La
ambigüedad se resuelve mediante la concentración en
uno solo de los clientes supuestamente idénticos. Es
suficiente especificar el tiempo medio que pasa hasta
que un determinado cliente genera otra llamada, ya que
él acaba de completar el servicio. A esto le llamamos el
tiempo medio entre fallos o MTBF por sus siglas.
• Un buen punto que estamos pasando por alto es la
cuestión de la distribución (en comparación con la
media) del tiempo entre llamadas. Dos situaciones
pueden tener el mismo tiempo medio entre llamadas,
pero las distribuciones ser radicalmente diferentes.
• Por ejemplo, supongamos que en la situación 1 cada
intervalo entre llamadas es exactamente 10 minutos,
mientras que en la situación 2, el 10% de los intervalos
son de 1 minuto y 90% de los intervalos de 11 minutos.
• Ambos tienen la misma media, pero parece plausible
que el sistema 2 será más errático e incurrirá en más
tiempo de espera. El supuesto fundamental es que la
distribución del tiempo entre llamadas es exponencial.
Afortunadamente, parece que esta hipótesis no está
muy lejos del registro de la mayoría de las situaciones
reales.
• La distribución exponencial tiene un papel clave en los
modelos que se consideran. Para el caso de la fuente
infinita, se supone que los tiempos entre llegadas
sucesivas se distribuyen de acuerdo a la distribución
exponencial. Una función de densidad exponencial se
grafica en la figura 18.1:
• Si r es la tasa de llegada, x es un valor de la variable
aleatoria, y e es el número 2.718284, entonces la
frecuencia o la función de densidad presentada en la
figura 18.1, está dada por f (x) = re-rx.
• La media y desviación estándar son ambas 1 / r. La

suposición clave que subyace a la distribución
exponencial es que la probabilidad que el evento de
interés (por ejemplo, la llegada de un cliente o la avería
de una máquina especifica) es una constante que es
independiente de cuando el evento anterior ocurrió.
• Otra forma de expresar esta función es a través de la

"propiedad sin memoria". Es decir, independientemente
de cuánto tiempo ha pasado desde la llegada anterior, la
distribución del tiempo hasta la próxima llegada tiene
una distribución exponencial con una media de 1 / r
3.2 Disciplina de la cola
• Todos los modelos consideran el uso de la disciplina de
cola primero en ser disciplina en llegar – primero en ser
servido. La única otra información requerida es la capacidad
de espera del sistema. Las llamadas o los clientes que
llegan mientras hay espacio esperando para que se unan al
sistema y, si es necesario, esperan por el servicio.
• Una demanda o clientes que encuentra todos los espacios
de espera llenos se pierden. Algunos ejemplos son: una
oficina de reservas que tiene 10 líneas telefónicas
entrantes, pero sólo cuatro agentes de reservaciones.
Un agente de reservaciones pone una llamada en “espera "
si todos los encargados de reservas ya están ocupados. Si
todas las 10 líneas están ocupadas, la persona que llama
recibirá un "ocupado" de la señal.
• Un sistema análogo es una estación de gasolina con cuatro
bombas y espacio para 6 coches que esperar detrás de los
cuatro coches que se sirven. Un posible cliente se dice que
abandonará si él o ella se niega a unirse a la cola. Una
acción similar, abandono – rechazo, se dice que ocurre si
un cliente decide dejar la cola de espera.
3.3 Proceso de servicio
• El proceso de servicio se caracteriza por dos atributos:
a) el número de servidores (que se supone idénticos).
b) la distribución del tiempo de servicio.
• El supuesto más común es que los tiempos de servicio
siguen una distribución exponencial.
• Una consecuencia de esta distribución es que el tiempo
medio de servicio es igual a la desviación estándar.
• Por lo tanto, la comparación de la media con la
desviación estándar es una comprobación de datos
simple.
• A diferencia de los procesos de llegada, hay poca
justificación a priori para esperar cualquier tipo particular
de distribución de tiempo de servicio.
• Uno debe examinar los datos de cerca para seleccionar
la distribución aproximada apropiada
• Si la desviación estándar en el tiempo de servicio es
mucho menor que el tiempo medio de servicio, entonces
un tiempo de servicio constante es una aproximación
razonable. Si la desviación estándar es
aproximadamente igual a la media, entonces la hipótesis
exponencial es razonable.
• La distribución exponencial se ajusta

sorprendentemente bien en muchas situaciones.
Coffman y Wood (1969), por ejemplo, encontraron que
el trabajo de calcular los tiempos en una computadora
tenía una desviación estándar algo superior a la media.
Sin embargo, la forma de la distribución era
esencialmente exponencial con el pico máximo cerca a
cero y una larga cola a la derecha.
3.4 Medición del desempeño de
sistemas de servicio
• Hay una variedad de medidas de
desempeño de un sistema de servicio. Las
tres medidas que consideraremos son las
siguientes:
1) La probabilidad de servicio inmediato.
2) Tiempo promedio de espera.
3) Número medio en espera.
3.5 Estacionariedad
• En general, los modelos de colas suponen que la
demanda es estacionario (es decir, tiempo estable) o
que el sistema ha alcanzado el estado estacionario.
Obviamente, esto no puede ser verdad si la demanda se
extiende por un período suficientemente largo de tiempo
(por ejemplo, un día entero).
• Por ejemplo, por lo general es obvio que el tiempo
medio entre llamadas de teléfono a las 11:00 horas en
un día determinado no es el mismo que el tiempo medio
a las 11:00 pm de ese mismo día. Se define la carga en
un sistema de servicio como el producto de la tasa
media de llegadas por el tiempo de servicio medio por
cliente.
• La carga es una cantidad sin unidades, que es un límite
inferior del número de servidores que uno necesitaría
para el proceso de los trabajos que llegan sin tener en
cuenta que la cola crezca sin límite.
• Probablemente deberíamos tener cuidado al usar un
modelo de colas basado en el estado estable si la carga
no es constante durante un intervalo de tiempo
razonablemente largo. Lo que constituye un “tiempo
razonablemente largo"? Para responder a esta
pregunta, vamos a definir una notación que utilizaremos
en adelante:
R = tasa media de llegadas,
T = tiempo de servicio media o esperado,
S = número de servidores.
La cantidad de T / (S - R * T) es una definición simple de
"un período de tiempo razonablemente largo". Tenga en
cuenta que se vuelve infinito cuando carga se acerca a
S.
3.6 Fórmula de “Little”
• Existe una relación general muy simple entre el número
promedio en el sistema y el tiempo promedio en el
sistema. En los círculos de inventario, esta relación se
conoce como la ecuación de la rotación del inventario.
En el mundo de los servicios o las colas, se conoce
como ecuación de flujo de “Little”, ver a Little (1961). Es
decir, la ecuación de Little es:
• (número medio en los sistemas) = (tasa de llegada) *
(tiempo promedio en el sistema)
• Reformulado en la terminología del inventario, esto es:
(nivel promedio de inventario) = (tasa de venta) *
(tiempo promedio en el sistema)
• Los administradores de inventario con frecuencia miden
el desempeño en "rotaciones de inventarios", donde:
• (rotaciones de inventario) = 1 / (tiempo promedio en el
sistema)
• Rearreglando según la ecuación de flujo
de Little:
(nivel promedio de inventario) = (tasa de
ventas) / (rotaciones de inventarios)
o
(rotaciones del inventario) = (tasa de
ventas) / (nivel promedio de inventario)
La ecuación es muy poco en general. El
único requisito imprescindible es que el
sistema al que se aplica no puede estar a
la deriva hasta el infinito. Ningún supuesto
probabilístico en particular se requiere.
3.7 Ejemplo
• Los clientes llegan a una tasa de 25 por
hora en promedio. Tiempo en el sistema
en promedio es de 12 minutos. ¿Cuál es
el número promedio de clientes en el
sistema?
Respuesta: (Nº Promedio en el sistema) =
(25/hora) * 12 minutos * 1 hour/60
minutos) = 25 * (1 / 5) = 5
4 Solución de Modelos de Colas
• Hay cinco situaciones o modelos que
vamos a considerar.
• Que se resumen en la Tabla 1.
La característica principal de estas
situaciones es que hay fórmulas muy
sencillas que describen el funcionamiento
de estos sistemas.
Tabla 1:
Modelos resueltos de servicio del sistema
• Los cinco modelos están presentados con la notación
que se utiliza normalmente para ellos en la literatura de
gestión de colas. La notación es de la forma (proceso de
llegadas / distribución del servicio / número de
servidores [/ número de espacios disponibles], donde:
M = distribución exponencial (o de Markov),
G = general o arbitraria,
D = determinista o fija, y
F = fuente finita.
• Los dos modelos "caballito de batalla" de esta serie de
cinco son:
a) el M / G / c / c, también conocido como la pérdida de
Erlang o modelo Erlang-B, y
b) el M / M / c, también conocido como el modelo Erlang C.
LINGO tiene dos funciones incorporadas, @ PEL () y @
PEB () que "resolver" estos dos casos. Su uso se ilustra
a continuación:
4.1 Número de líneas salida WATS a través
del modelo de pérdida de Erlang
• Algunas empresas compran un cierto número de salida
WATS (Wide Area Telephone Service: servicio telefónico de
área abierta), líneas con el fin de reducir sus cargos de
larga distancia. Una línea de salida WATS le permite
realizar un número ilimitado de llamadas de larga
distancia por una tarifa fija.
• La cuota fija es lo suficientemente baja, de modo que, si
usted hace un montón de llamadas, el costo por llamada
es mucho menor que si usted paga el costo estándar /
minuto. Supongamos que nuestra empresa hace un
promedio de cinco llamadas de larga distancia por
minuto durante el día laboral. La duración media de una
llamada es de 4 minutos
• El sistema se puede configurar, de modo que, si
uno de nuestros empleados marca un número
de larga distancia, la llamada será asignado a
una línea WATS si una de nuestras líneas
WATS está disponible, de lo contrario la llamada
utiliza una línea regular a las tarifas regulares
durante la duración de la llamada.
• Supongamos que adquirimos 20 líneas WATS.
¿Qué fracción de las llamadas encuentran todas
las líneas WATS ocupadas y por lo tanto utilizan
una línea regular?
Un modelo adecuado es:
La solución es:
• Por lo tanto, aunque tenemos suficiente capacidad de la
línea WATS para manejar la demanda promedio, sin
embargo, debido a la aleatoriedad, casi el 16% de la
demanda se pierde (es decir, se desborda en las líneas
regulares).
• Existe una economía estadística de escala en la
demanda de servicios (es decir, el doble de la demanda
no requiere que tengamos el doble de capacidad).
• Para ilustrar, supongamos que prevemos un gran
crecimiento el próximo año y esperamos que la tasa de
llamadas salientes sea de 50 llamadas por minuto en
lugar de 5.
• Si nuevamente adquirimos las suficientes líneas WATS
para manejar la demanda promedio, 50 * 4 = 200, ¿qué
fracción de la demanda se desbordará? Si sustituimos R
= 50 en el modelo, obtenemos la solución:There is a
statistical economy of scale in service demand (i.e.,
twice the demand does not require us to have twice the
The fraction overflow has dropped to approximately, 5%,
even though we are still setting capacity equal to the
average demand
4.2 Evaluación de la centralización del
servicio a través del modelo Erlang C
• Ukallus Company toma pedidos telefónicos en dos
oficinas independientes y está considerando combinar
los dos en una sola oficina, a la que se puede acceder a
través de un número "800".
• Ambas oficinas tienen volúmenes similares de 50
llamadas telefónicas por hora (= .83333 / minuto)
manejadas por 4 tomadores de pedidos en cada oficina.
Cada oficina tiene suficientes líneas entrantes que
hacen que las llamadas se pongan en cola
automáticamente hasta que haya un gestor de pedidos
disponible.
• El tiempo para procesar una llamada se distribuye
exponencialmente con una media de 4 minutos.
• ¿Cuánto mejoraría el servicio si estuviera centralizado a
una oficina con 8 tomadores de pedidos? Los resultados
son:
• Así, la oficina centralizada da un servicio
notablemente mejor (casi el doble de bueno,
dependiendo de su medida), servicio con los
mismos recursos totales. Por otra parte, el
mismo nivel de servicio se podría lograr con un
poco menos recursos.
• Las estadísticas anteriores se pueden calcular
mediante el modelo de LINGO siguiente.
• Note que, se define espera de un cliente como
el tiempo del cliente en el sistema hasta que su
servicio se inicia. El tiempo de espera no incluye
el tiempo de servicio
La solución es:
4.3 Un Sistema Mixto de Servicio /
inventario via el Modelo M / G / ∞
• Supongamos que nos lleva 6 minutos hacer un producto
determinado (por ejemplo, una hamburguesa). La demanda por el
producto llega a una tasa del 2 por minuto. Con el fin de dar un
buen servicio, hemos decidido que vamos a llevar a 10 unidades en
stock en todo momento.
• Por lo tanto, cuando un cliente llega y toma una de nuestras

unidades en stock, de inmediato ponemos un pedido para otro.
Tenemos un montón de capacidad, de modo que, aunque tenemos
un montón de unidades en proceso, todavía podemos hacer una
más en un tiempo promedio de 6 minutos.
• Los clientes que nos encontramos fuera del stock vamos a esperar
por una nueva que se haga. Esto se llama una política de stock
base con backlogging:
La solución es:
Thus, more than 75% will have to wait.

4.4 Número óptimo de reparadores a través
del modelo de fuente finita
• Una empresa textil cuenta con 10 máquinas semiautomáticas, que
de vez en cuando necesita los servicios de un técnico (por ejemplo,
si se rompe un hilo) con el fin de poner la máquina en servicio. El
tiempo de reparación tiene una distribución exponencial con una
media de 1 hora.
• Razones físicas implica que sólo un reparador puede estar en una

máquina a la vez (es decir, un ayudante no ayuda).
• Una vez reparado, el tiempo medio de los atascos de nuevo el

equipo falla es de 5 horas. El costo de un reparador con
equipamiento completo es de $ 30 por hora. El costo de oportunidad
de una máquina atascada es de $ 350 por hora. ¿Cuántos
reparadores deben ser asignados a estas 10 máquinas?
Utilizando la función @ PFS de LINGO, se puede construir la
siguiente tabla de número esperado de máquinas fuera de servicio
en función del número de reparadores:
Así, se obtienen que el número óptimo de reparadores es de 4.
Un ejemplo de modelo en LINGO para esta tabla es el siguiente
Parte de la solución es:
• Un modelo similar al de los reparadores de máquinas ha sido
utilizada por Samuelson (1999) para analizar los métodos de
marcación predictiva en un centro de llamadas.
• En un sistema de marcación predictiva, un marcador automático

puede empezar a marcar el próximo cliente a ponerse en contacto,
incluso antes de que haya un agente disponible para hablar con el
cliente. Se tarda entre 10 y 30 segundos para marcar un número y
la persona llamada contesta el teléfono.
• Por lo tanto, el marcado automático se realiza en la previsión de

que un agente estará disponible en el momento en que una parte
llamada contesta el teléfono.
• Un marcador automático puede detectar una señal de ocupado o de

una llamada que no está respondida, y puede pasar a marcar el
número siguiente. Samuelson (1999) indica que un buen marcador
predictivo puede aumentar el tiempo de conversación del agente (es
decir, la utilización) hasta 95% desde menos de 80%.
• El gerente de un marcador predictivo tiene al menos dos variables
de decisión en el control del marcador predictivo:
a) el número de líneas adicionales a usar, más allá del número de
agentes, para marcar, y
b) el tiempo de demora antes de comenzar a marcar en una línea,
una vez que esté disponible. Estas dos decisiones se pueden ser
fijadas por el reparador de la máquina de la siguiente manera.
• El número de agentes es igual al número de reparadores.
• El número total de líneas es el tamaño de la población.
• El up time es el tiempo de demora antes de iniciar la marcación + el

tiempo de marcación + tiempo de respuesta.

8 Lingo 1 Teoria+colas+1

Cargado por

Copyright:

Formatos disponibles

8 Lingo 1 Teoria+colas+1

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

8 Lingo 1 Teoria+colas+1

Cargado por

Copyright:

Formatos disponibles

Diseño e Implementación de

Sistemas de Colas y Servicios

Una buena introducción a la teoría de colas se pueden

• La media y desviación estándar son ambas 1 / r. La

• Otra forma de expresar esta función es a través de la

• La distribución exponencial se ajusta

• Por lo tanto, cuando un cliente llega y toma una de nuestras

Thus, more than 75% will have to wait.

• Razones físicas implica que sólo un reparador puede estar en una

• Una vez reparado, el tiempo medio de los atascos de nuevo el

• En un sistema de marcación predictiva, un marcador automático

• Por lo tanto, el marcado automático se realiza en la previsión de

• Un marcador automático puede detectar una señal de ocupado o de

• El número de agentes es igual al número de reparadores.

• El número total de líneas es el tamaño de la población.

• El up time es el tiempo de demora antes de iniciar la marcación + el

También podría gustarte