Teoria de Colas

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 27

Teoría de colas

Artículo
Discusión
Leer
Editar
Ver historial

Herramientas

Diagrama que muestra dos colas y múltiples


nodos servidores. La teoría de colas estudia
los tiempos de espera y capacidad del sistema.
La teoría de colas es el estudio matemático de
las colas o líneas de espera dentro de un
sistema. Esta teoría estudia factores como el
tiempo de espera medio en las colas o la
capacidad de trabajo del sistema sin que
llegue a colapsar. Dentro de las matemáticas,
la teoría de colas se engloba en la
investigación de operaciones y es un
complemento muy importante a la teoría de
sistemas y la teoría de control. Se trata así de
una teoría que encuentra aplicación en una
amplia variedad de situaciones como
negocios, comercio, industria, ingenierías,
transporte y logística o telecomunicaciones.

La teoría de colas permite modelar sistemas


en los que existe una población de agentes
(también llamados clientes o usuarios) que
demandan cierto servicio que es
proporcionado por uno o más servidores
(también llamados recursos). Dado que puede
haber más agentes que recursos, pueden
registrarse esperas desde que un agente llega
al sistema hasta que el servidor atiende su
demanda, o incluso un agente puede ser
rechazado del sistema al no haber espacio
donde esperar (esto es, una cola). La teoría de
colas sirve para modelar procesos tales como
la llegada de datos a una cola en ciencias de la
computación, la congestión en red de
computadoras o de telecomunicación, o la
implementación de una cadena productiva en
la ingeniería industrial.

En el contexto de la informática o de las


tecnologías de la información y la
comunicación son paradigmáticas las
situaciones de espera dentro de una red de
comunicaciones. Así, por ejemplo, los
procesos enviados a un servidor en red
forman colas de espera mientras no son
atendidos; la información solicitada a un
servidor Web a través de Internet puede
recibirse con demora debido a la congestión
en la red o en el servidor; en el caso de
telefonía (fija o móvil), una llamada puede no
ser realizada si alguna central está saturada
(un mensaje típico en este caso es "por
sobrecarga en red rogamos vuelva a llamar
pasados unos minutos").

Historia
El matemático danés Agner Krarup Erlang,
trabajador de la Copenhagen Telephone
Exchange, publicó el primer artículo sobre la
teoría de colas en 1909.1 Específicamente se
preocupó del estudio del problema de
dimensionamiento de líneas y centrales de
conmutación telefónica para el servicio de
llamadas. En su honor, la unidad de medida
estadística del volumen de tráfico se
denomina Erlang, así como un lenguaje de
programación concurrente diseñado por
Ericsson.

Cincuenta años más tarde, el científico


estadounidense y pionero en el análisis de
redes de ordenadores Leonard Kleinrock
desarrolló el uso de herramientas de teoría de
colas para en análisis de redes de
conmutación de paquetes, con su tesis
doctoral presentada en 1962 (y publicada en
forma de libro en 1964).

Proceso básico y causa de formación de colas


Existe una población de clientes que requieren
un servicio. Estos clientes entran al sistema y
se unen a la cola de espera. En determinado
momento se selecciona un miembro de la cola
para proporcionarle el servicio mediante
alguna regla (conocida como disciplina de
cola). Terminado el servicio, el cliente sale del
sistema de colas.

En general, la cola de espera se forma (y


crece) si durante un tiempo la demanda del
servicio es mayor que la capacidad del sistema
para suministrarlo. Por ejemplo, si un usuario
necesita un minuto para ser atendido, pero
llegan dos usuarios en menos de un minuto, el
segundo usuario tendrá que esperar en cola
hasta ser atendido. Estos desequilibrios
temporales entre demanda y capacidad
suceden dado que tanto el proceso de llegadas
de usuarios como el proceso de proporcionar
servicio son procesos estocásticos.

En las formaciones de colas a veces se habla


de clientes, tales como máquinas dañadas a la
espera de ser rehabilitadas. Los clientes puede
que esperen, aunque las instalaciones de
servicio sean adecuadas, porque los clientes
llegados anteriormente están siendo atendidos
(como en el caso mencionado anteriormente).
También puede suceder que los clientes
esperen en cola debido a que los medios
existentes sean inadecuados para satisfacer la
demanda del servicio. Por ejemplo, si un
usuario necesita un minuto para ser atendido
pero los clientes llegan a una tasa mayor de un
cliente por minuto, la cola crecerá
indefinidamente.

Objetivos
La teoría de colas persigue caracterizar las
prestaciones de un sistema compuesto por
uno o más recursos que sirven a una
población de clientes. En general, si un cliente
llega al sistema y todos los recursos están
ocupados, esperará en una cola, salvo que
dicha cola esté llena y entonces será rechazado
(es decir: no es admitido). La caracterización
suele consistir en analizar variables tales como
el tiempo medio de espera en cola, el tiempo
total de estancia en el sistema o la
probabilidad de ser rechazado (o admitido).

Además de esta caracterización de las


prestaciones, otras aplicaciones de la teoría de
colas son:

Calcular el número de recursos necesarios


para mantener la probabilidad de rechazo por
debajo de un límite.
Identificar el nivel óptimo de capacidad del
sistema que minimiza un determinado coste.
Evaluar el impacto de posibles modificaciones
del sistema en sus prestaciones o rendimiento.
Elementos existentes en la teoría de colas
Se pueden identificar los siguientes
elementos:

Figura 1.
Fuente de entrada o población potencial: Una
característica de la fuente de entrada es su
tamaño. El tamaño es el número total de
clientes que pueden requerir servicio en
determinado momento. Puede suponerse que
el tamaño es infinito o finito.
Cliente: Es todo individuo de la población
potencial que solicita servicio como por
ejemplo una lista de trabajo esperando para
imprimirse.
Cola: Espacio donde los clientes esperan (es
decir, están haciendo cola) hasta que
empiezan a ser servidos. Se caracteriza por
una capacidad o tamaño máximo de la cola,
que se puede suponer finita o infinita. Si es
finita, es posible que se llene de clientes por lo
que nuevos clientes son rechazados.
Disciplina de la cola: mecanismo empleado
para seleccionar el siguiente miembro que
recibirá servicio, una vez que queda un
recurso disponible. Por ejemplo, puede ser:
FIFO (first in first out) primero en entrar,
primero en salir, según la cual se atiende
primero al cliente que antes haya llegado.
LIFO (last in first out) también conocida como
pila que consiste en atender primero al cliente
que ha llegado el último.
RSS (random selection of service) que
selecciona los clientes de manera aleatoria, de
acuerdo a algún procedimiento de prioridad o
a algún otro orden.
Processor Sharing – sirve a los clientes
igualmente. La capacidad de la red se
comparte entre los clientes y todos
experimentan con eficacia el mismo retraso.
Recursos o servidores: elementos encargados
de proporcionar el servicio a los clientes. Se
caracterizan por un proceso de servicio que
típicamente define el tiempo necesario para
atender un cliente (por ejemplo, si es un
tiempo aleatorio, la variable aleatoria que lo
caracteriza).
Redes de colas: Sistema donde existen varias
colas y los trabajos fluyen de una a otra. Por
ejemplo: las redes de comunicaciones o los
sistemas operativos multitarea.
Notación de Kendall
David G. Kendall introdujo una notación de
colas A/S/c en 19532 en la que A describe la
distribución del tiempo entre llegada, S la
distribución del tiempo de servicio y c el
número de recursos disponibles. Ha sido
desde entonces extendida a A/S/c/K/N/D34
donde K es la capacidad total de la cola (es
decir, el número máximo de usuarios en el
sistema en cualquier momento), N el número
de usuarios que generan peticiones, y D es la
disciplina de cola.

Para describir la distribución de los tiempos


entre llegadas A o de servicio S se suele
emplear alguno de estos valores:

M para "Markoviano" o "sin memoria", lo que


implica que los tiempos entre llegadas siguen
una distribución exponencial (por lo tanto, el
número de llegadas en un intervalo de tiempo
sigue una distribución de Poisson).
D para unos tiempos entre llegadas
deterministas, es decir, que no siguen un
proceso aleatorio. .
G para una "distribución general" de los
tiempos entre llegadas.
Mientras que para la disciplina de cola D se
suele emplear alguno de estos valores:

First Come First Served (FCFS) o First In First


Out (FIFO)
Last Come First Served (LCFS) o Last In First
Out (LIFO)
Service In Random Order (SIRO)
Processor Sharing
La capacidad del sistema K puede tomar un
valor finito determinado o infinito. Si es finito,
el número máximo de clientes permitidos en
el sistema está acotado, por lo que nuevas
llegadas son rechazadas. Si es infinito, no se
produce rechazo.

Si el tamaño de la población N es finito, esto


supone que cuantos más usuarios se
encuentren en el sistema, menos usuarios
estarán generando peticiones. Si por el
contrario el tamaño N es infinito, la tasa de
generación de peticiones se mantendrá
constante independientemente del número de
usuarios en el sistema.

Los tres primeros parámetros de la notación


de Kendall siempre se indican de forma
explícita, mientras que si los otros tres no
aparecen es porque se suponen unos valores
por defecto. Dichos valores son:5

Para la capacidad K, se supone infinita.


Para la disciplina de cola D, se supone FCFS.
Para la población D, se supone infinita.
Ejemplos

Figura 2.
M/M/1/ (∞/FIFO/∞): Se trata de una de las
colas más sencillas. Las llegadas siguen un
proceso de Poisson, las peticiones tienen un
tiempo de servicio que sigue una variable
aleatoria exponencial y únicamente hay un
servidor. No se suelen especificar los
parámetros K, N y D, lo que supone los
siguientes valores por defecto: la capacidad
del sistema es infinita, la prioridad es FCFS, y
la población que genera las peticiones es
infinita (lo que implica que la tasa de llegadas
es constante). Esta cola se ilustra en el primer
sistema de la figura.
M/M/n/n: No hay cola de espera, sino n
recursos (servidores) y hasta n usuarios como
máximo; si llega el usuario n+1, es rechazado.
Este modelo suele aplicarse para analizar las
prestaciones en telefonía convencional. La
probabilidad de que un usuario sea rechazado
se calcula con la fórmula Erlang-B. También
suele identificarse como M/M/c/c o
M/M/k/k.
M/M/c: La capacidad del sistema es ilimitada,
aunque haya sólo n recursos; en caso de llegar
el usuario n+1, éste no será rechazado sino
que pasará a una cola de espera. Este modelo
puede aplicarse para analizar un call center en
el que un número fijo de operadores resuelven
peticiones, que pueden quedar en espera hasta
ser atendidas. La probabilidad de que un
usuario no sea atendido directamente sino que
tenga que esperar se calcula con la fórmula
Erlang-C. Esta cola se ilustra para el caso de
M/M/3 en el segundo sistema de la figura.
También se identifica como M/M/k o M/M/n.
La notación de Kendall no sirve para
representar redes de colas colas, como es el
caso de los dos últimos sistemas de la figura:

Colas en paralelo: el tercer sistema de la


figura, en el que el proceso de llegada se divide
en varias colas, típicamente independientes.
Se podría corresponder con una estación de
servicio donde cada servidor tiene una cola
independiente y los usuarios no se mueven
entre colas.
Colas en serie (o sistema en tándem): el cuarto
sistema de la figura. El proceso de salida del
primer sistema supone el proceso de entrada
para el segundo sistema. Se podría
corresponder con tareas en un ordenador que
deben ejecutarse en diferentes procesadores.
Medidas de desempeño de estado estable
En teoría de colas se utilizan comúnmente las
siguientes medidas de desempeño, estas se
calculan de forma diferente según el modelo
de la línea de espera:

Ls = Cantidad esperada de clientes en un


sistema

Lq = Cantidad esperada de clientes en una


cola
Ws = Tiempo de espera en el sistema

Wq = Tiempo de espera anticipado en la cola

ρ = Factor de utilización del sistema

Modelos
M/M/1
En este modelo, según la notación de Kendall,
la tasa de llegadas y la tasa de servicio siguen
una distribución de Poisson. Y hay un solo
servidor. Las medidas de desempeño de
estado estable se calculan de la siguiente
forma:


=

�{\displaystyle \rho ={\frac {\lambda }{\
mu }}}
Donde λ es la tasa promedio de arribos al
sistema y μ la tasa promedio de servicio.



=
1


�{\displaystyle Ws={\frac {1}{\mu -\
lambda }}}



=




{\displaystyle Ls=\lambda *Ws}



=



1
�{\displaystyle Wq=Ws-{\frac {1}{\mu }}}



=




=



�{\displaystyle Lq=\lambda *Wq=Ls-\rho }

Cabe resaltar que si λ ≥ μ el sistema es


explosivo, además, Wq nunca será mayor que
Ws.6

M/M/s
Este modelo supone que existen en el sistema
s (entero positivo) servidores, en este caso las
medidas de desempeño se calcularán así:7


=

�{\displaystyle \rho ={\frac {\lambda }{\
mu }}}



=



+
(



)
2



!

1
(
1


)
2


0
{\displaystyle Ls=\rho *s+{\frac {(\rho
*s)^{2}*\rho }{s!}}*{\frac {1}{(1-\
rho )^{2}}}*P_{0}}



=


+

�{\displaystyle Ls=Lq+{\frac {\lambda }{\
mu }}}



=


�{\displaystyle Ws={\frac {Ls}{\lambda }}}



=
(


)
2



!

1
(
1


)
2


0
{\displaystyle Lq={\frac {({\frac {\lambda }{\
mu }})^{2}*\rho }{s!}}*{\frac {1}{(1-\
rho )^{2}}}*P_{0}}



=


�{\displaystyle Wq={\frac {Lq}{\lambda }}}
Las limitaciones del acercamiento matemático
La teoría de formación de una cola es a
menudo demasiado restrictiva
matemáticamente para ser capaz de modelar
todas las situaciones verdaderas a nivel
mundial. Por ejemplo; los modelos
matemáticos a menudo asumen el número de
clientes, o la capacidad de la cola infinitos,
cuando es evidente que deben estar limitados.
Los medios alternativos del análisis de la
teoría de colas consisten generalmente en
simulaciones de ordenador o en el análisis de
datos experimentales.

Aplicación a la telefonía
Las redes telefónicas se diseñan para
acomodar la intensidad ofrecida del tráfico
con solamente una pequeña pérdida. El
funcionamiento de los sistemas depende de si
la llamada es rechazada, de si está perdida,
etc. Normalmente los sistemas de
desbordamiento hacen uso de rutas
alternativas e incluso estos sistemas tienen
una capacidad de carga finita o máxima de
tráfico. Sin embargo, el uso de las colas
permite que los sistemas esperen por las
peticiones de su cliente hasta que los recursos
libres estén disponibles. Esto significa que si
los niveles de la intensidad del tráfico exceden
de la capacidad disponible, las llamadas del
cliente se perderían. La disciplina de colas
determina la manera de cómo manejar las
llamadas de los clientes. Define la manera en
que les servirán, la orden de las cuales se
sirven, y la manera en la que los recursos se
dividen entre los clientes.

Modelos de colas con distribuciones no


exponenciales
En particular, el supuesto de tiempos entre
llegadas exponenciales implica que las
llegadas ocurren al azar (proceso de entrada
de Poisson), lo cual es una aproximación
razonable en muchas situaciones pero no
cuando las llegadas están programadas o
reguladas con todo cuidado. Todavía más, las
distribuciones de tiempos de servicio reales
con frecuencia se desvían bastante de la forma
exponencial, en particular cuando los
requerimientos de servicio de los clientes son
muy parecidos. Por ello, es importante
disponer de otros modelos de colas que usen
otras distribuciones de probabilidad.
Desafortunadamente, el análisis matemático
de los modelos de colas con distribuciones no
exponenciales es mucho más difícil. Sin
embargo, se han podido obtener algunos
resultados útiles con algunos modelos.8

Véase también
Unidad Erlang
Ingeniería industrial
Distribución de Poisson
Throughput
Planificador
Congestión vehicular
Red de flujo
Distribución de Erlang
Distribución Exponencial
Cola (estructura de datos)
Cola de prioridad (estructura de datos)
Congestión de red

También podría gustarte