Appunti Ricerca Operativa
Appunti Ricerca Operativa
Appunti Ricerca Operativa
Indice
Introduzione Che cosa ` la Ricerca Operativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . e Breve storia della Ricerca Operativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . La Ricerca Operativa oggi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 I Modelli della Ricerca Operativa 1.1 Lapproccio modellistico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Modelli di Ottimizzazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3 Esempi di costruzione di modelli di Programmazione Matematica . . . . . . . . . 2 La Programmazione Lineare 2.1 Denizione del problema . . . . . . . . . . . . . . . . . . . 2.2 Semplici esempi di problemi di programmazione lineare . 2.2.1 Un problema di produzione (allocazione di risorse) 2.2.2 Un problema di miscelazione . . . . . . . . . . . . 2.2.3 Un problema di trasporto . . . . . . . . . . . . . . 2.3 Interpretazione graca di un Problema di PL . . . . . . . 2.4 Teorema fondamentale della Programmazione Lineare . . 2.5 Cenni sul Metodo del Simplesso . . . . . . . . . . . . . . . 2.6 Modellazione dei Problemi di Programmazione Lineare . . 2.7 Esempi tipici di PL . . . . . . . . . . . . . . . . . . . . . . 2.7.1 Modelli di allocazione ottima di risorse . . . . . . . 2.7.2 Modelli di miscelazione . . . . . . . . . . . . . . . 2.7.3 Modelli di trasporto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 5 5 6 10 10 13 16 21 21 23 23 24 24 25 33 38 40 42 42 52 59 67 67 71 75 79 79 83 84 86
3 La dualit` nella Programmazione Lineare a 3.1 Teoria della dualit` . . . . . . . . . . . . . . . . . . . . . . . . a 3.1.1 Risultati fondamentali della teoria della dualit` . . . . a 3.1.2 Condizioni di complementarit` . . . . . . . . . . . . . a 3.2 Interpretazione della Dualit` . . . . . . . . . . . . . . . . . . a 3.2.1 Interpretazione economica della dualit` e prezzi ombra a 3.2.2 Il duale del problema di allocazione ottima di risorse . 3.2.3 Il duale del problema di miscelazione . . . . . . . . . . 3.2.4 Il duale del problema dei trasporti . . . . . . . . . . .
4 Problemi di Programmazione Lineare Intera 4.1 Formulazioni Classiche di Problemi Lineari Interi 4.1.1 Knapsack binario . . . . . . . . . . . . . . . 4.1.2 Assegnamento . . . . . . . . . . . . . . . . 4.1.3 Problema del costo sso. . . . . . . . . . . . 4.1.4 Capital Budgeting . . . . . . . . . . . . . . 4.1.5 Localizzazione . . . . . . . . . . . . . . . . 4.1.6 Scheduling (Sequenziamento) . . . . . . . . 4.2 Tecniche di soluzione per problemi di PLI . . . . . 4.2.1 Soluzione per enumerazione totale . . . . . 4.2.2 Soluzione approssimata per arrotondamento 4.2.3 La Tecnica del Branch and Bound . . . . . 4.3 Esempi . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
88 . 88 . 88 . 89 . 89 . 91 . 94 . 97 . 98 . 99 . 99 . 100 . 106
5 Gra: nozioni fondamentali 112 5.1 Denizioni fondamentali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112 5.2 Rappresentazioni di un grafo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117 5.3 Alcuni esempi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119 6 Cammini minimi 6.1 Il problema del cammino minimo e alcuni esempi di applicazioni 6.1.1 Percorso di tempo minimo su una rete stradale . . . . . . 6.1.2 Costruzione di una autostrada . . . . . . . . . . . . . . . 6.2 Cammini minimi e massimi su gra aciclici . . . . . . . . . . . . 6.2.1 Numerazione topologica dei nodi di un grafo . . . . . . . 6.2.2 Un algoritmo per il cammino minimo su gra aciclici . . . 6.2.3 Un algoritmo per il cammino massimo su gra aciclici . . 6.3 Cammini minimi su gra con pesi positivi: algoritmo di Dijkstra 6.4 Due esempi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.4.1 Tecniche reticolari di programmazione delle attivit` . . . a 6.4.2 Gestione delle scorte. . . . . . . . . . . . . . . . . . . . . . 7 Massimo usso 7.1 Il problema del massimo usso. . . . . . . . 7.2 Alcuni risultati preliminari . . . . . . . . . 7.3 Cammini aumentanti . . . . . . . . . . . . . 7.4 Condizioni di ottimalit` . . . . . . . . . . . a 7.5 Lalgoritmo di Ford e Fulkerson. . . . . . . 7.6 Calcolo e scelta dei cammini aumentanti . . 7.7 Esempi . . . . . . . . . . . . . . . . . . . . . 7.8 Accoppiamento bipartito . . . . . . . . . . . 7.9 Il problema di distribuzione di usso a costo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . minimo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125 125 126 126 127 127 129 132 133 137 137 145 151 151 153 155 158 161 162 165 168 170
8 Euristiche per la soluzione di problemi di ottimizzazione combinatoria 8.1 Lottimizzazione combinatoria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.1.1 Il problema dellaccoppiamento massimo su gra bipartiti . . . . . . . . . 8.1.2 Il Problema del Commesso Viaggiatore. . . . . . . . . . . . . . . . . . . . 8.1.3 Il problema del partizionamento di un grafo. . . . . . . . . . . . . . . . . 8.1.4 PL01 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.2 Un sistema multitaxi per il servizio Areoporto Fiumicino - Roma Centro . . . . . 8.3 Euristiche di tipo Greedy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.3.1 Applicazione dellalgoritmo greedy generico al problema del Commesso Viaggiatore. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.3.2 Applicazione dellalgoritmo greedy generico al problema del Partizionamento di Gra (clustering). . . . . . . . . . . . . . . . . . . . . . . . . . . 8.3.3 Una diversa forma del generico algoritmo greedy. . . . . . . . . . . . . . . 8.4 Ricerca Locale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.4.1 Algoritmo generico di Ricerca Locale . . . . . . . . . . . . . . . . . . . . . 8.5 Estensione del modello al caso Roma Centro - Fiumicino Areoporto . . . . . . .
174 175 176 176 177 178 178 182 183 185 189 191 196 197
Nota Queste dispense sono riprese da quelle dei corsi di Ricerca Operativa tenuti dai pro. F. Facchinei, S. Lucidi, C. Mannino e M. Roma.
Introduzione
La Ricerca Operativa (di seguito indicata anche con lacronimo RO) si occupa dello sviluppo e dellapplicazione di metodi quantitativi per la soluzione di problemi di decisione che si presentano nella gestione di imprese e organizzazioni. La Ricerca Operativa ` una disciplina relativamente giovane. Il termine Ricerca Operativa ` stato e e coniato in ambito militare verso la ne degli anni 30 e deriva dal termine inglese Operational Research, ovvero la ricerca sulle operazioni (militari). Quando la complessit` dei sistemi era relativamente contenuta, e la quantit` di dati disponibili esa a tremamente limitata, il personale esperto era suciente a prendere le decisioni necessarie alla conduzione dellimpresa. La crescente complessit` dei sistemi aziendali e lintegrazione internazionale delle imprese, a congiuntamente allenorme quantit` di dati messa a disposizione dallinformatizzazione capillare, ha reso a indispensabile lutilizzo di strumenti automatici di decisione che attraverso la modellazione matematica permettano la soluzione di problemi di grandi dimensioni. La RO, quindi, ` caratterizzata dalluso di modelli matematici deniti e risolti al ne di fornire e indicazioni ai decisori nellatto della scelta. Non a caso, la RO ` anche nota come management science, e e cio` la Scienza della Gestione, denizione che ne sintetizza nalit` e ambizioni. e a
eettu` lultima esercitazione pre-bellica dove si evidenzi` un notevole miglioramento nelle operazioni o o di difesa aerea grazie al contributo del gruppo di scienziati. Nacque quindi una vera e propria sezione che pi` tardi, nel 1941, prese il nome formale di Operational Research Section. Durante il conitto u mondiale ci furono importanti contributi strategici di questa sezione che permisero di salvare piloti e aerei impegnati nel conitto. Nonostante gli scopi bellici, anche se di difesa, del progetto, per la prima volta in questa occasione si ebbe una convergenza di scienziati di diverse discipline con lobiettivo di determinare la pi` eciente utilizzazione di risorse limitate usando tecniche quantitative. u Al termine della guerra, alcuni degli scienziati coinvolti nel progetto formarono nuclei di ricercatori per lo sviluppo post bellico e la loro attivit` si estese a campi diversi da quello militare; in particolare, a con lespandersi delle iniziative industriali e con lavvento dei computer che sono uno strumento essenziale per la risoluzione dei problemi, c` stata unespansione dellutilizzo della RO allinterno di diverse realt` e a applicative. Dagli anni 60 in poi le applicazioni della RO hanno avuto diusione crescente, inizialmente nellambito di grandi gruppi industriali e succesivamente, grazie anche alla disponibilit` di grandi potenze di calcolo a a costi contenuti, in quasi ogni settore industriale, nei servizi e nelle amministrazioni pubbliche.
gestione ottima delle scorte; si tratta di determinare i livelli di produzione e di scorte nella gestione di materiali grezzi, prodotti in lavorazione etc.; quando e quanto conviene riordinare materiali o beni in modo da ottenere il miglior compromesso fra costi di riordino e di produzione/acquisto e costi di immagazzinamento. Conviene, cio`, ordinare o produrre pi` spesso minori quantit` per far fronte alla domanda corrente, oppure e u a ordinare/produrre maggiori quantit` e lasciarle in magazzino per soddisfare anche la domanda a futura? localizzazione e dimensionamento di impianti; dove ci conviene costruire le stazioni di base di una rete GSM/UMTS per coprire ecacemente il territorio e il traco, e con che potenza dovranno trasmettere? Quanti depositi di unimpresa di distribuzione alimentare costruire e dove localizzarli per servire i negozi a dettaglio in unarea dinteresse? Dove costruire degli ospedali (o scuole o stazioni dei vigili del fuoco) in modo da ottimizzare il servizio fornito? In senso lato, si tratta di problemi in cui si deve decidere dove istallare impianti di produzione in modo da rifornire in modo ottimale aree distribuite su un territorio. progetto di reti di telecomunicazione; si tratta di denire i collegamenti e dimensionare le capacit` di una rete di telecomunicazione, a di trasmissione dati, etc., in modo da garantire il traco tra le varie origini e destinazioni e minimizzare il costo complessivo; ad esempio, per instradare le comunicazioni fra Roma e Venezia, conviene costruire una nuova linea ad alta velocit` in bra ottica fra Firenze e Bologna oppure a istallare un ponte radio a larga banda? assegnazione di frequenze di trasmissione; quali frequenze (prese da una banda limitata) devo assegnare a una rete di trasmettitori radiotelevisivi in modo da minimizzare le interferenze reciproche o massimizzare la copertura del territorio? sequenziamento; quali processo o operazione eettuare prima e quali dopo? Per esempio, come sequenziare i treni sulla rete in modo da evitare conitti sulle tratte e minimizzare i tempi morti, le attese alle stazioni, etc.? project planning; come sequenziare le molteplici attivit` di un progetto? Quanto durer` il progetto? Come devono a a essere gestite le risorse? allocazione ottima di componenti elettronici (VLSI design); come disegnare una piastra madre in modo da minimizzare le lunghezze dei percorsi seguiti dai segnali elettrici? determinazione dei turni del personale; si tratta, ad esempio, di assegnare ai convogli il personale viaggiante sui treni (conducenti, bigliettai, etc.) in modo da minimizzare il numero di viaggi a vuoto (necessari per riportare il personale alla loro sede). Un problema analogo si presenta nellassegnazione di equipaggi (piloti, hostess, stewart) a voli. manutenzione di beni; cio` il problema di decidere quando e se eettuare la manutenzione di alcuni beni soggetti ad usura, e in modo da minimizzare il costo complessivo. istradamento di veicoli; quali percorsi devono seguire i veicoli di una otta di automezzi per, ad esempio, raccogliere limmondizia, o rifornire una rete di negozi, in modo da minimizzare le distanze complessive percorse?
studi sulla struttura del DNA; come assegnare sequenze a geni minimizzando la probabilit` dellerrore sperimentale? Come dea terminare un albero logenetico massimizzando la verosimiglianza? progettazione di forme ottime; che forma deve avere una macchina in modo da presentare meno resistenza possibile allaria? Che prolo deve evere lala di un aereo in modo da massimizzare la portanza? calcolo delle traiettorie ottime; qual ` la traiettoria che permette ad un veicolo spaziale di arrivare sulla luna e tornare usando la e quantit` minima di carburante? a ricostruzione di immagini; come si possono visualizzare le informazioni fornite, per esempio, da una TAC in modo da renderle pi` leggibili possibili per il medico? u progettazione strutturale ; qual ` il progetto di un ponte o di un grattacielo che resiste meglio a venti molto forti o alle e sollecitazioni derivanti da un terremoto? Questa lista, lungi dallessere esaustiva, serve a mettere in evidenza le potenzialit` degli strumenti della a RO nella risoluzione di problemi applicativi complessi e disparati. In Italia la penetrazione della RO ` stata piuttosto lenta nonostante linadeguatezza delle tecniche e utilizzate in rapporto a problemi di complessit` crescenti. La situazione ` rovesciata negli Stati Uniti e a e nellEuropa Centro-Settentrionale ove la crescita del settore ` stata formidabile. Le ragioni del ritardo e sono in primo luogo culturali: mancanza di conoscenze approfondite da parte delle aziende, insucente disseminazione dei risultati da parte dellaccademia. Lentamente, questa situazione va modicandosi anche in Italia, e la sensibilit` delle aziende ` fortemente cresciuta negli ultimi due-tre anni. In particolare a e ci si ` resi conto che linformatizzazione capillare e laccresciuta potenza di calcolo non sono sucienti a e risolvere i problemi dellorganizzazione aziendale in modo ottimale. A confermare questo asserto si consideri il seguente, illuminante esempio (dovuto a G. B. Dantzig): si supponga di essere a capo di unazienda che impiega 70 dipendenti e deve assegnare ciascuno di essi a 70 dierenti mansioni; poich le capacit` lavorative di ogni singolo dipendente sono diverse, non ` indierente e a e per lazienda come eettuare lassegnamento. Naturalmente si deve fare in modo che ciascun dipendente sia assegnato ad una sola mansione e che ciascuna mansione sia svolta esattamente da un dipendente. Il problema consiste nel confrontare le 70! possibilit` che ci sono per selezionare quella migliore nel senso a che permetta di ottenere il maggiore utile per lazienda. Le possibilit` sono un numero molto grande, pi` a u grande di 10100 . Ora si supponga di disporre di un calcolatore capace di eettuare un milione di calcoli al secondo e che sia in funzione dal tempo del big bang, 15 milioni di anni f`; avrebbe questo calcolatore a oggi nellanno 2000 esaminato tutte le 70! combinazioni possibili ? La risposta ` no. Supponiamo allora e di disporre di un calcolatore che possa eettuare un bilione di assegnamenti per ogni nano secondo; la risposta sarebbe ancora no. Supponiamo allora di riempire la supercie terrestre di calcolatori di questo tipo che lavorano in parallelo; la risposta sarebbe ancora no. Si dovrebbe disporre in verit` di 1040 terre a ciascuna ricoperta di calcolatori di questo tipo, in funzione dal tempo del big bang no a quando il sole si raredder`. a Da questo esempio facile da enunciare si deduce come in certe situazioni sia assolutamente impossibile esaminare tutti i casi possibili per determinare qual ` il migliore. Per questo, prima dellavvento della e RO, lunica possibilit` era adarsi al buon senso di persone guidate dallesperienza che stabilivano regole a ad hoc di base che dovevano essere seguite per risolvere i problemi (ad hoc ground-rule approach). A questo tipo di approccio si contrappone la RO, il cui contributo centrale consiste nellintroduzione del cosiddetto approccio modellistico-ottimizzatorio per la soluzione di un problema di decisione. In questo approccio si organizza lanalisi di un problema reale in due fasi:
la rappresentazione del problema attraverso un modello matematico che ne astragga gli aspetti essenziali e che schematizzi le interrelazioni esistenti tra i diversi aspetti del fenomeno che si sta studiando; lo sviluppo di metodi matematici ecienti (algoritmi di soluzione) per determinare una soluzione ottima del problema o una sua buona approssimazione. Naturalmente, per costruire correttamente un modello matematico-ottimizzatorio che rappresenti un particolare fenomeno, si devono individuare i parametri di controllo signicativi e un criterio per la valutazione della qualit` della soluzione. La determinazione del modello ` unattivit` complessa e non a e a completamente formalizzabile, che deve far ricorso da una parte a una conoscenza approfondita delle caratteristiche del problema in esame e dallaltra a strumenti che provengono da diverse branche della matematica. Una volta determinato il modello corretto, la RO si occupa di fornire una procedura esplicita per determinare una soluzione di un problema; tale procedura pu` essere rappresentata da metodi matemo atici analitici o, come pi` spesso accade, da metodi numerici che determinano la soluzione del problema u mediante specici algoritmi di calcolo. Da quanto detto si pu` capire come la RO sia una metodologia o tipicamente interdisciplinare, applicabile nei pi` svariati contesti e come proprio dagli stimoli provenienti u da campi anche molto distanti tra di loro tragga una delle principlai ragioni della sua attuale vitalit`. a
Capitolo 1
Il termine modello ` di solito usato per indicare una struttura appositamente costruita per mettere in e evidenza le caratteristiche principali di alcuni oggetti reali. Alcune volte possono essere concreti (come ad esempio i modelli rappresentanti prototipi di aerei o auto), ma pi` spesso, come nella Ricerca Operativa, u si tratta di modelli astratti cio` modelli matematici che usano il simbolismo dellalgebra per mettere in e evidenza le relazioni principali delloggetto che deve essere modellato. I modelli di cui si tratter` in a seguito sono quindi modelli matematici, e sono costituiti da un insieme di relazioni che descrivono in modo semplicato, ma sempre rigoroso, uno o pi` fenomeni del mondo reale. La nozione di modello u matematico per rappresentare il mondo reale non ` certo nuova: gi` Pitagora nel IV secolo a.C. tentava e a di costruire un modello matematico dellUniverso anche se sotto una luce pi` esoterica che scientica. u Linteresse per la modellistica matematica ` notevolmente cresciuto negli anni pi` recenti e ai giorni nostri e u ` sempre pi` viva la convinzione che ricorrendo a modelli matematici sia possibile analizzare i molteplici e u aspetti del mondo reale e studiare linuenza che luomo pu` esercitare su di essi. Ci` ha portato ad o o un enorme sviluppo delle applicazioni della modellistica matematica anche al di fuori delle tradizionali applicazioni alle scienze siche. Si ` cos` avuta di fatto una vasta utilizzazione di modelli matematici in e settori lontani dagli ambiti pi` tradizionali come, ad esempio, le scienze sociali, la biologia, le scienze u ambientali, la psicologia. Come esempi concreti, si pensi agli studi sulla dinamica della popolazione, sulla diusione delle epidemie, sul risanamento ambientale. Questa notevole diusione della modellistica matematica ` anche dovuta al fatto che levoluzione di un modello matematico pu` essere rapidamente e o studiata grazie alluso di moderni calcolatori elettronici. ` E evidente come in molti casi le situazioni rappresentate da un modello sono molto complesse e alcune volte inuenzate da fenomeni di natura aleatoria; per questa ragione, sono state denite diverse classi di modelli matematici: modelli stocastici che considerano grandezze che possono essere inuenzate da fenomeni aleatori e modelli deterministici che considerano grandezze esatte; inoltre a seconda che le interazioni tra le grandezze sono immediate o distribuite nel tempo, si parla di modelli statici e di modelli dinamici. Lapproccio modellistico per risolvere un problema di decisione o, pi` in generale, limpiego di metodi u matematici per la soluzione di problemi applicativi, viene di solito realizzato attraverso diverse fasi. Tali fasi possono essere schematizzate nel seguente modo: Analisi del problema Costruzione del modello Analisi del modello
10
Soluzione numerica Validazione del modello La prima fase consiste nellanalisi della struttura del problema per individuare i legami logico-funzionali e gli obiettivi. Nella succesiva fase di costruzione del modello, chiamata anche formulazione, si descrivono in termini matematici le caratteristiche principali del problema; questa fase di costruzione verr` descritta in dettaglio a nel seguito. Segue lanalisi del modello che prevede la deduzione per via analitica, in riferimento a determinate classi di problemi, di alcune importanti propriet`; le principali sono: a esistenza della soluzione ottima; condizioni di ottimalit`, cio` una caratterizzazione analitica della soluzione ottima; a e stabilit` delle soluzioni al variare dei dati o di eventuali parametri presenti. a La successiva fase di soluzione avviene mediante opportuni algoritmi di calcolo e la soluzione numerica cos` ottenuta deve poi essere interpretata dal punto di vista applicativo in modo da evitare che abbia scarso rilievo pratico; in questo caso le eventuali cause di inaccettabilit` devono essere inglobate nel modello a stesso costruendo cos` un nuovo modello pi` completo del precedente. Tale validazione del modello u pu` avvenire attraverso una verica sperimentale oppure con metodi di simulazione. La denizione di o un modello si congura quindi come un processo di rafnamento iterativo, che pu` essere schematizzato o come rappresentato in Figura 1.1.
ANALISI DEL PROBLEMA
SOLUZIONE NUMERICA
11
Costruzione di un modello matematico Lapproccio modellistico per risolvere un problema di decisione necessita come primo passo della costruzione di un adeguato modello matematico. Infatti, come gi` discusso in precedenza, solo un modello costrua ito tenendo presente tutte le caratteristiche essenziali del fenomeno che si sta studiando permette di comprendere gli aspetti pi` importanti e di esercitare un intervento pratico ecace. u Nella fase di costruzione del modello matematico si deve fornire una descrizione formalizzata del problema di decisione facendo uso del linguaggio formale della matematica. Si dovr` cercare, quindi, una a corrispondenza tra relazioni del mondo reale (relazioni tecnologiche, leggi siche, vincoli di mercato, etc.) e relazioni matematiche (equazioni, disequazioni, dipendenze logiche, etc.). relazioni del mondo reale relazioni matematiche
La costruzione di un modello richiede, quindi, scelte e valutazioni in modo da evidenziare gli aspetti pi` u signicativi del problema reale e che meglio sono suscettibili di una formalizzazione matematica. Tale procedimento di scelta spesso non ` riconducibile ad un procedimento sistematico e quindi ` necessario e e che chi costruisce il modello abbia da un lato una conoscenza approfondita del settore applicativo per evitare che le risposte ottenute dal modello abbiano scarsa rilevanza pratica; dallaltro deve avere una notevole conoscenza dei metodi matematici disponibili per la ricerca della soluzione per evitare che la formulazione matematica porti ad un problema per il quale non esistono algoritmi risolutivi utilizzabili. ` E importante ribadire che un modello ` denito per mezzo delle relazioni che lo costituiscono ed e ` quindi necessario che tali relazioni siano il pi` possibile indipendenti dai dati introdotti nel modello; e u questo perch uno stesso modello deve poter essere usato in dierenti occasioni con dati (cio` costi, e e disponibilit` di risorse, limiti tecnologici, etc.) diversi. Lo studio di questo aspetto, come gi` detto, a a rientra nella fase di analisi del modello sotto il nome di analisi della stabilit` del modello rispetto ai dati a introdotti. Vantaggi dellapproccio modellistico Esistono diverse ragioni per adottare lapproccio modellistico per la soluzione di problemi: si riassumono di seguito le principali. Possibilit` di risolvere matematicamente il problema. a Grazie al modello ` possibile analizzare matematicamente il problema ed ottenere cos` una soluzione e che, soprattutto in riferimento a scopi di pianicazione, permette di adottare strategie che da una sola analisi strutturale del problema non apparirebbero evidenti o che a volte potrebbero essere perno controintuitive. Maggiore comprensione del problema. Il modello ` una rappresentazione semplicata del problema e spesso la sua costruzione consente e di individuare propriet` strutturali del problema che altrimenti non sarebbero aatto evidenti. a Deduzione analitica di importanti propriet`. a Nella fase di analisi del modello ` possibile dedurre per via analitica alcune importanti propriet` e a del problema sulla base dei risultati disponibili per la classe di problemi a cui si fa riferimento. Possibilit` di simulazioni. a Con un modello ` possibile eettuare esperimenti che spesso non ` possibile eettuare direttamente e e nella realt`; ad esempio, luso di un modello consente di studiare gli eetti delladozione di una a particolare misura economica in un paese senza la necessit` di sperimentarla direttamente. a
12
Critiche allapproccio modellistico Le principali critiche allapproccio modellistico e, quindi, alla costruzione di modelli per la soluzione di problemi di decisione possono essere sintetizzate nei seguenti due punti: a Impossibilit` di quanticare soddisfacentemente con opportuni valori numerici alcuni dati richiesti dal modello; questo accade, ad esempio, nel tentativo di quanticare con un costo o con un protto alcuni valori sociali soprattutto in relazione a scopi di pianicazione. La qualit` delle risposte che un modello produce potrebbero dipendere profondamente dallaccuratezza a dei dati introdotti. Il primo punto riguarda la possibilit` di dover trattare concetti non facilmente quanticabili, ma ogni a approccio scientico pu` dicilmente evitare tale dicolt`; il modo migliore per superare tale problema o a consiste nellincorporare tale quanticazione nel modello stesso. La seconda critica riguarda la possibile mancanza di precisione di alcuni dei dati immessi nel modello; tale critica ` meno rilevante della precedente, in quanto anche se alcuni dati introdotti sono poco accurati, e ` ancora possibile che la struttura del modello sia tale da garantire che la soluzione sia sucientemente e accurata. Allestremo opposto di queste critiche si pu` collocare un atteggiamento di totale ducia del modello o che induca ad accettare la prima risposta prodotta dal modello senza ulteriori analisi. Tale atteggiamento, in realt` molto raro, ` assai pericoloso in quanto tale risposta potrebbe rappresentare un piano a e operativo non accettabile nella realt`; in tal caso i motivi della non accettabilit` devono essere evidenziati a a e incorporati in un nuovo modello modicato: si tratta, in realt`, della gi` citata fase di validazione del a a modello che quindi non pu` essere trascurata e che costituisce un valido mezzo per costruire modelli o sempre pi` completi e signicativi. u In conclusione, come spesso accade, latteggiamento corretto si colloca tra le due situazioni estreme precedentemente citate e consiste nel considerare la costruzione del modello un mezzo assai utile per arontare un problema di decisione: rimane il fatto che la qualit` delle risposte che un modello produce a dipende dallaccuratezza della sua struttura e quindi non ` trascurabile la fase di validazione che consente e di interpretare la soluzione numerica ottenuta ed eventualmente permette di completare il modello introducendo elementi trascurati in una prima fase, in assenza dei quali la soluzione risulta non accettabile oppure di scarso rilievo dal punto di vista applicativo.
1.2
Modelli di Ottimizzazione
In questa sezione ci occuperemo pi` nel dettaglio di quei particolari modelli matematici noti come Modu elli di Ottimizzazione che rivestono un ruolo centrale nella RO. In termini generali, data una funzione f : IRn IR, ed S IRn , un problema di Ottimizzazione pu` essere formulato nella forma1 o min f (x) x S.
(P O)
Quindi un problema di Ottimizzazione consiste nel determinare, se esiste, un punto di minimo della funzione f tra i punti dellinsieme S. I problemi di ottimizzazione sono spesso denominati, con terminologia equivalente, problemi di Programmazione Matematica. La funzione f viene chiamata funzione obiettivo e linsieme S insieme ammissibile cio` linsieme delle e possibili soluzioni del problema. Un punto x S si chiama soluzione ammissibile.
1
Si parler` indierentemente di problemi di massimo o di minimo in quanto vale min f (x) = max (f (x)). a
xS xS
13
Linsieme ammissibile S ` un sottoinsieme di IRn e quindi x = (x1 , x2 , . . . , xn )T ` una variabile e e vettoriale n-dimensionale e la funzione obiettivo f ` una funzione di n variabili reali f (x1 , x2 , . . . , xn ). e Si riportano di seguito alcune denizioni fondamentali riguardanti i problemi di Ottimizzazione. Denizione 1.2.1 Il problema di ottimizzazione (PO) si dice inammissibile se S = , cio` se non e esistono soluzioni ammissibili. Denizione 1.2.2 Il problema di ottimizzazione (PO) si dice illimitato (inferiormente) se comunque scelto un valore M > 0 esiste un punto x S tale che f (x) < M . Un esempio di PO illimitato inferiormente ` dato da f (x) = x3 e S = I Infatti, al tendere di x e R. a la funzione obiettivo tende anchessa a . Notiamo che se, con la stessa funzione obiettivo, si cambia linsieme S, e si pone S = {x : x 0}, il problema non ` pi` illimitato inferiormente. e u Denizione 1.2.3 Si dice che il problema di ottimizzazione (PO) ammette soluzione ottima (nita) se esiste un x S tale che risulti f (x ) f (x) per ogni x S. Il punto x ` detto soluzione ottima o e minimo globale e il corrispondente valore f (x ) di dice valore ottimo. Per esempio, se si pone f = x2 e S = I lottimo ` lorigine, e il corrispondente valore ottimo ` zero. Se R, e e si prende S = {x : x 2}, lottimo ` 2 e il valore ottimo 4. e Allinterno dei problemai di Ottimizzazione si possono distinguere le seguenti importanti classi di problemi:
Problemi di Ottimizzazione Continua. Le variabili possono assumere tutti i valori reali (x IRn ); ed inoltre si parla di problemi di ottimizzazione continua vincolata se S IRn non vincolata se S = IRn . Problemi di Ottimizzazione Discreta. Le variabili sono vincolate ad essere numeri interi (x Zn ); si possono distinguere allinterno di questa classe di problemi altre due classi: programmazione a numeri interi se S Zn ottimizzazione booleana se S {0, 1}n . Problemi misti. Solo alcune delle variabili sono vincolate ad essere intere.
Di solito linsieme ammissibile S viene descritto da una numero nito di diseguaglianze del tipo g(x) b, dove g ` una funzione denita su IRn a valori reali e b IR. Cio`, formalmente, date m funzioni e e gi : IRn IR, i = 1, . . . , m ed m scalari bi IR, i = 1, . . . , m si esprime S nella forma S = {x IRn | g1 (x) b1 , g2 (x) b2 , . . . , gm (x) bm } .
14
Ogni diseguaglianza gi (x) bi prende nome di vincolo e linsieme ammissible ` quindi formato da e tutti quei punti x IRn che sono soluzione del sistema di diseguaglianze g1 (x) b1 g2 (x) b2 g3 (x) b3 . . . gm (x) bm Osservazione 1.2.4 In questa formulazione dellinsieme S si sono utilizzati vincoli di diseguaglianza nella forma di minore o uguale, ma ` chiaro che questa notazione include i casi in cui i vincoli sono e espressi con vincoli di disuguaglianza nella forma di maggiore o uguale e vincoli di uguaglianza; infatti si pu` sempre trasformare un vincolo di maggiore o uguale del tipo g(x) b in un vincolo di minore o o uguale semplicemente riscrivendolo nella forma g(x) b. Inoltre un vincolo di uguaglianza g(x) = b pu` essere riscritto nella forma equivalente delle due diseguaglianze g(x) b e g(x) b. o Quindi si pu` riscrivere il problema di ottimizzazione (PO) nella forma o min f (x) gi (x) bi , i = 1, . . . , m. (1.1)
I punti dellinsieme ammissibile di questo tipo di problemi sono quelli per i quali tutti i vincoli sono soddisfatti cio` tutti quei punti x tali che tutte le disuguaglianze gi (x) bi , i = 1, . . . , m sono vericate. e I problemi di Programmazione Matematica si possono classicare in base alla struttura delle funzioni che li deniscono; si parla di problema di Programmazione Lineare (PL) se la funzione obiettivo f (x) e tutte le funzioni che denisco i vincoli gi (x), i = 1, . . . m sono lineari, cio` esprimibili nella forma e c1 x1 + c2 x2 + + cn xn ; problema di Programmazione Non Lineare (PNL) se almeno una delle funzioni che deniscono un problema di Programmazione Matematica non ` lineare. e Si formalizzano nella denizione che segue alcune semplici concetti riguardanti i vincoli di un problema di Programmazione Matematica. Denizione 1.2.5 Si consideri un vincolo di disuguaglianza del tipo g(x) b; esso si dice violato in un punto x se g() < b; esso si dice attivo in un punto x se g() = b. x x Alcuni esempi di problemi di Programmazione Matematica sono i seguenti: Esempio 1.2.6 Si consideri una funzione obiettivo di due variabili f (x1 , x2 ) = x1 + x2 che si vuole minimizzare, con i vincoli 2x1 + x2 1, x1 0, x2 0. Si ottiene il problema min x1 + x2 2x1 + x2 1 x1 0 x2 0 che ` nella forma (1.1) dove g1 (x1 , x2 ) = 2x1 + x2 , g2 (x1 , x2 ) = x1 , g3 (x1 , x2 ) = x2 , b1 = 1, b2 = b3 = 0. e Linsieme ammissibile ` descritto attraverso questi tre vincoli e poich tutte le funzioni che compaiono e e sono lineari nella variabili x1 e x2 , questo problema ` un problema di Programmazione Lineare. e
15
1 Esempio 1.2.7 Si consideri una funzione obiettivo f (x1 , x2 ) = (x1 1 )2 + (x2 2 )2 che si vuole mas2 simizzare, con i vincoli x1 + x2 1, x1 1, x2 1. Si ottiene il problema 1 2 1 2 max(x1 2 ) + (x2 2 ) x1 + x2 1 x1 1 x2 1
che ` un problema di Programmazione Non Lineare (quadratico). e Esempio 1.2.8 Si consideri una funzione obiettivo f (x1 , x2 ) = 3x3 + 7x2 + x2 che si vuole minimizzare, 1 1 1 con vincoli x1 + x2 2 , x1 0, x2 1. Si ottiene il problema 3 2 min 3x1 + 7x1 + x2 x1 + x2 1 2 x1 0 x2 1 che ` un problema di Programmazione Non Lineare che pu` essere facilmente ricondotto nella forma e o (1.1) riscrivendo gli ultimi due vincoli nella forma x1 0 e x2 0. Esempio 1.2.9 Si consideri una funzione obiettivo f (x1 , x2 ) = x1 + x2 che si vuole minimizzare sulla regione ammissibile descritta dal vincolo di uguaglianza 4x1 x2 = 2. Il problema di Programmazione Lineare risultante ` e min x1 + x2 4x1 x2 = 2 che ` un problema di Programmazione Lineare con un solo vincolo di uguaglianza. e In generale, la costruzione formale di un modello di Programmazione Matematica si eettua a partire da una descrizione logica e qualitativa di un problema di decisione e richiede di:
1. Associare opportune variabili di decisione di decisione alle grandezze reali. Tali variabili costituiscono le incognite del problema. 2. Esprimere quantitativamente i legami esistenti tra le variabili e le limitazioni derivanti da considerazioni di carattere sico, economico, etc. Tali legami e limitazioni deniscono i vincoli. Linsieme dei valori delle variabili per cui i vincoli sono soddisfatti costituisce linsieme ammissibile. 3. Esprimere formalmente lobiettivo che si intende minimizzare o massimizzare.
1.3
Come primi esempi di costruzione di modelli verranno ora analizzati un semplice problema di pianicazione della produzione, un problema di pianicazione degli investimenti e un problema di progettazione industriale.
16
Esempio 1.3.1 Unindustria chimica fabbrica 4 tipi di fertilizzanti, Tipo 1, Tipo 2, Tipo 3, Tipo 4, la cui lavorazione ` adata a due reparti dellindustria: il reparto produzione e il reparto confezionamento. e Per ottenere fertilizzante pronto per la vendita ` necessaria naturalmente la lavorazione in entrambi e i reparti. La tabella che segue riporta, per ciascun tipo di fertilizzante i tempi (in ore) necessari di lavorazione in ciascuno dei reparti per avere una tonnellata di fertilizzante pronto per la vendita. Reparto produzione Reparto confezionamento Tipo 1 2 0.5 Tipo 2 1.5 0.25 Tipo 3 0.5 0.25 Tipo 4 2.5 1
Dopo aver dedotto il costo del materiale grezzo, ciascuna tonnellata di fertilizzante d` i seguenti protti a (prezzi espressi in Euro per tonnellata) protti netti Tipo 1 250 Tipo 2 230 Tipo 3 110 Tipo 4 350
Determinare le quantit` che si devono produrre settimanalmente di ciascun tipo di fertilizzante in modo a da massimizzare il protto complessivo, sapendo che settimanalmente il reparto produzione pu` lavorare o al pi` 100 ore mentre il reparto confezionamento pu` lavorare al pi` 50 ore settimanali. u o u Analisi del problema e costruzione del modello. Si tratta di un problema di pianicazione della produzione industriale in cui le incognite, che saranno le variabili del problema, sono le quntit` di fertilizzante di ciascun tipo che si devono produrre. Costruiamo a un modello di Programmazione Matematica rappresentante il problema in analisi supponendo di voler pianicare la produzione settimanale. ` Variabili di decisione. E naturale introdurre le variabili reali x1 , x2 , x3 , x4 rappresentanti rispettivamente le quantit` di prodotto del Tipo 1, Tipo 2, Tipo 3, Tipo 4 da fabbricare in una settimana. a Funzione Obiettivo. Ciascuna tonnellata di fertilizzante contribuisce al protto totale secondo la tabella data. Quindi il protto totale sar` a 250x1 + 230x2 + 110x3 + 350x4 . (1.2)
Lobiettivo dellindustria sar` quello di scegliere le variabili x1 , x2 , x3 , x4 in modo che lespressione (2.2) a del protto sia massimizzata. La (2.2) rappresenta la funzione obiettivo. Vincoli. Ovviamente la capacit` produttiva della fabbrica limita i valori che possono assumere le a variabili xj , j = 1, . . . , 4; infatti si ha una capacit` massima lavorativa in ore settimanali di ciascun a reparto. In particolare per il reparto produzione si hanno a disposizione al pi` 100 ore settimanali e u poich ogni tonnellata di fertilizzante di Tipo 1 utilizza il reparto produzione per 2 ore, ogni tonnellata e di fertilizzante di Tipo 2 utilizza il reparto produzione per 1.5 ore e cos` via per gli altri tipi di fertilizzanti si dovr` avere a 2x1 + 1.5x2 + 0.5x3 + 2.5x4 100. (1.3) Ragionando in modo analogo per il reparto confezionamento si ottiene 0.5x1 + 0.25x2 + 0.25x3 + x4 50. (1.4)
Le espressioni (2.3), (2.4) costituiscono i vincoli del modello. Si devono inoltre esplicitare vincoli dovuti al fatto che le variabili xj , j = 1, . . . 4 rappresentando quantit` di prodotto non possono essere a negative e quindi vanno aggiunti i vincoli di non negativit` a x1 0, x2 0, x3 0, x4 0.
17
La formulazione nale sar` quindi a max (250x1 + 230x2 + 110x3 + 350x4 ) 2x1 + 1.5x2 + 0.5x3 + 2.5x4 100 0.5x1 + 0.25x2 + 0.25x3 + x4 50 x1 0, x2 0, x3 0, x4 0. Questa formulazione ` un problema matematico ben denito e costituisce il modello di Programmazione e Matematica rappresentante il problema di pianicazione della produzione industriale in analisi. Si tratta, in questo caso, di un problema di programmazione lineare.
Esempio 1.3.2 Capital Budgeting. Supponiamo di dover investire 1000 sul mercato nanziario. Supponiamo inoltre che il mercato ora tre tipi diversi di investimenti A, B, C ciascuno caratterizzato da un prezzo dacquisto e da un rendimento netto, che sono riassunti nella seguente tabella: A B C costo 750 200 800 rendimento 20 5 10 Si vuole decidere quali degli investimenti eettuare per massimizzare il rendimento sapendo che gli investimenti A, B, C non si possono eettuare in modo parziale cio` non sono frazionabili. a Analisi del problema e costruzione del modello. Si tratta di un problema di pianicazione degli investimenti. Si devono denire formalmente le variabili di decisione, linsieme delle soluzioni ammissibili e la funzione obiettivo. Variabili di decisione. Si tratta quindi di esprimere matematicamente la scelta elementare: eettuare o non eettuare linvestimento. Una scelta naturale delle variabili di decisione ` la seguente: e xi = 0 non si eetua linvestimento iesimo 1 si eettua linvestimento iesimo i = A, B, C (1.5)
Insieme ammissibile. In base alla denizione delle variabili, le possibili scelte compatibili con il nostro budget sono: (0) non si eettuano investimenti xA = xB = xC = 0 (1) si eettua linvestimento A; xA = 1, xB = xC = 0 (2) si eettua linvestimento B; xA = 0, xB = 1, xC = 0 (3) si eettua linvestimento C; xA = xB = 0, xC = 1 (4) si eettuano gli investimenti A e B; xA = xB = 1, xC = 0 (5) si eettuano gli investimenti B e C; xA = 0, xB = xC = 1. Notiamo che le possibilit` A, C e A, B, C non sono ammissibili in quanto il costo supera la nostra a disponibilit`. a Linsieme ammissibile, ovvero linsieme delle possibili scelte (0) (5) ` dato da: e 1 0 0 1 0 0 S = 0 , 0 , 1 , 0 , 1 , 1 0 0 0 1 0 1 Si tratta quindi di un sottoinsieme dei vettori di IR3 a componenti 0 1 ovvero S {0, 1}3
18
Funzione obiettivo. Lobiettivo che ci proponiamo ` la massimizzazione del rendimento totale. Quindi e dobbiamo esprimere la funzione obiettivo che corrisponde al rendimento netto relativo alla scelta di x = (xA , xB , xC )T in S, cio`: e f (x) = 20xA + 5xB + 10xC . ` possibile ottenere la soluzione ottima valutando esaustivamente la funzione obiettivo per ogni elemento E di S, ottenendo in relazione alle possibili scelte: (0) f0 = 0 (1) f1 = 20 (2) f2 = 5 (3) f3 = 10 (4) f4 = 25 (5) f5 = 15. La soluzione ottima ` ovviamente quella corrispondente alla scelta (4), cio` alleettuare gli investimenti e e A e B, con valore della funzione obiettivo pari a 25. Questo non ` un modello corretto per due motivi: e 1. Linsieme ammissibile S ` rappresentato in modo estensivo, cio` elencando tutte le soluzioni ame e missibili. In questo caso la cardinalit` dellinsieme ammissibile ` al pi` quella di {0, 1}3 cio` 23 , a e u e ma in generale, se la dimensione del problema fosse pi` grande sarebbe impossibile valutare esausu tivamente le soluzioni del problema. Se, ad esempio, il numero degli investimenti fosse stato 100 (che dal punto di vista delle applicazioni reali ` del tutto verosimile) la cardinalit` dellinsieme ame a missibile sarebbe stata 2100 e per la valutazione di 2100 possibilit` anche supponendo di utilizzare a un calcolatore che eettui 1010 valutazioni al secondo (velocit` superiore a quella raggiungibile dai a calcolatori attuali) occorrerebbero 1020 secondi, cio` 3000 miliardi di anni ! e 2. Il modello non ` indipendente dai dati del problema, cio` cambiando i dati del problema (prezzi e e e/o rendimenti) sarebbe necessario cambiare completamente il modello. In generale, in un modello corretto, si cerca di dare una rappresentazione intensiva dellinsieme ammissibile S, cio` individuare le propriet` P (x) che consentono di distinguere le soluzioni ammissibili e a dagli elementi dellinsieme {0, 1}3 che non lo sono. Si vuole quindi scrivere linsieme S in una forma del tipo: S = x {0, 1}3 : vale la propriet` P (x) . a Nellesempio, la propriet` distintiva degli elementi di S ` il costo complessivo che non deve essere superiore a e a 1000. Possiamo esprimere matematicamente questa relazione come: P (x) : 750xA + 200xB + 800xC 1000 e quindi linsieme ammissibile si pu` scrivere o S = x = (xA , xB , xC )T {0, 1}3 : 750xA + 200xB + 800xC 1000 . In conclusione, il modello matematico corretto per il nostro problema di decisione `: e max (20xA + 5xB + 10xC ) 750xA + 200xB + 800xC 1000 xi {0, 1} i = A, B, C. Si tratta di un problema di programmazione lineare intera.
19
Esempio 1.3.3 Unindustria deve costruire un silos di forma cilindrica per contenere grandi quantitativi di un liquido che verr` poi distribuito in piccole confezioni pronte per la vendita al minuto. Tale silos a deve essere posto in un magazzino appoggiato su una delle basi. Tale magazzino ` a pianta rettangolare di e dimensioni metri 2010 ed ha un tetto spiovente lungo il lato di 10 metri, che ha altezza massima di metri 5 e altezza minima di metri 3. Per costruire questo silos deve essere usato del materiale plastico sottile essibile che pu` essere tagliato, modellato e incollato saldamente. Sapendo che si dispone di non pi` di o u 200 m2 di tale materiale plastico si costruisca un modello che permetta di determinare le dimensioni del silos (raggio di base ed altezza) in modo da massimizzare la quantit` di liquido che pu` esservi contenuto. a o Analisi del problema e costruzione del modello. Si tratta di determinare il dimensionamento ottimale di un contenitore cilindrico per uso industriale cercando di massimizzare il suo volume tenendo presente che deve essere contenuto in un magazzino di dimensioni ssate. Si devono denire formalmente le variabili di decisione, linsieme delle soluzioni ammissibili e la funzione obiettivo. ` Variabili di decisione. E immediato introdurre due variabili x e y che rappresentano rispettivamente la lunghezza (in metri) del raggio di base e dellaltezza del contenitore cilindrico. Funzione obiettivo. La funzione obiettivo ` rappresentata dal volume del contenitore cilindrico ed ` e e data da x2 y. Vincoli. Il diametro della base non pu` superare le dimensioni del magazzino e quindi deve essere o 2x 10. La limitazione dellaltezza del contenitore varia al variare del diametro di base in quanto il tetto ` e spiovente. Dato che la pendenza del tetto ` del 20%, dovr` risultare e a y 5 0.2 2x. Inoltre disponendo solo di una quantit` limitata di materiale plastico la supercie totale del contenitore a cilindrico non pu` superare 200m2 e quindi deve risultare o 2x2 + 2xy 200. Si devono inne esplicitare i vincoli di non negativit` x 0, y 0. a La formulazione complessiva risulta quindi 2 max x y x 5 y 5 0.2 2x 2x2 + 2xy 200 x 0, y 0. Il modello ` quindi un modello di programmazione non lineare. e
20
Capitolo 2
La Programmazione Lineare
In questo capitolo esaminiamo in maniera in modo pi` dettagliato il problema di programmazione lineare u e illustriamo una tecnica risolutiva per il caso di due sole variabili che aiuta a comprendere alcune delle caratteristiche pi` importanti dei problemi di programmazione lineare. Queste caratteristiche sono poi u oggetto di una formalizzazione e generalizzazione, che suggeriscono anche i rudimenti per un metodo di soluzione.
2.1
Come gi` detto nel capitolo precedente, ` possibile classicare i modelli di Programmazione Matematica a e in base alla struttura particolare che possono avere la funzione obiettivo e i vincoli. Riprendiamo qui, espandendola, la denizione di problemi di Programmazione Lineare nei quali sia la funzione obiettivo, sia i vincoli sono rappresentati mediante funzioni lineari nelle variabili di decisione. Preliminarmente, richiamiamo il concetto di funzione lineare. Denizione 2.1.1 Una funzione reale di n variabili reali f : IRn IR si dice lineare se pu` essere o scritta nella forma c1 x1 + c2 x2 + . . . + cn xn con c1 , . . . , cn costanti reali. Quindi x1 + 4x2 3.5x3 2x1 + (sin 4)x2 + x3 4x5 , sono funzioni lineari, mentre (x1 )2 + 4x2 3.5x3 x1 + 4x2 3.5ex3 2x1 + sin x2 + x3 4x5 , non sono funzioni lineari. Un problema di Programmazione Lineare (spesso abbreviato in PL) ` carate terizzato da o una singola funzione obiettivo lineare da minimizzare o massimizzare che pu` essere quindi scritta nella forma
n
f (x1 , . . . , xn ) = c1 x1 + . . . + cn xn =
j=1
cj xj .
21
un numero nito di vincoli lineari che, supponendo siano m, possono essere scritti nella forma a11 x1 + a21 x1 + . . . am1 x1 + ... ... ... ... +a1n xn +a2n xn . . . +amn xn b1 b2 . . . bm .
Il fatto di impiegare solo vincoli di minore o uguale `, come visto nellOsservazione 1.2.4, del tutto e convenzionale, e infatti nei problemi di Programmazione Lineare alcuni (o tutti) i vincoli possone essere di maggiore uguale o di uguaglianza. Per esempio, max x1 + x2 x1 + x2 x1 + x2 x1 0, x2 0, e min 2x1 x2 + x3 + 3x4 x1 + x2 x4 x1 + 2x2 x3 + 2x4 x1 0, x2 0, x4 0, sono problemi di PL. Introducendo il vettore c IRn , denito c = (c1 , . . . , cn )T e x IRn denito x = (x1 , . . . , xn )T la funzione obiettivo pu` essere scritta in notazione vettoriale o cT x. Inoltre, introducendo la matrice (m n) a11 . A= . . am1 ... ... a1n . . . amn = 1 3 1 3
e il vettore b = (b1 , . . . , bm )T la formulazione completa di un generico problema di Programmazione Lineare pu` essere scritta nella forma o min cT x Ax b. La Programmazione Lineare ` indubbiamente largomento centrale dellOttimizzazione e fra i vari e modelli della Ricerca Operativa, la Programmazione Lineare ` quello che viene pi` ampiamente utilizzato. e u Infatti, la PL non solo si applica a numerosi problemi reali che hanno di per s una struttura lineare, ma ` e e anche un importante strumento di supporto nellanalisi e nella risoluzione di problemi di programmazione matematica pi` complessi. u Il padre della PL viene comunemente, e giustamente, indicato in George Dantzig che per primo ne ide`, nel 1947, un algoritmo risolutivo (il metodo del Simplesso, cui si fa cenno alla ne del capitolo). o Tuttavia, alcuni dei concetti fondamentali della programmazione lineare possono essere fatti risalire molto pi` indietro nel tempo. Gi` Fourier, nel 1827, aveva studiato come trovare soluzioni ammissibili di un u a sistema di disuguaglianze lineari; un metodo di calcolo destinato a minimizzare gli errori dosservazione e dovuto a Valle Poussin (1910) presenta lati simili al metodo del simplesso; inne lavori di von Neumann e degli anni venti e trenta, sulla teoria dei giochi e su alcuni modelli economici, sono antecedenti diretti del
22
lavoro di Dantzig. Nel 1939, poi, il matematico sovietico Kantorovich aveva pubblicato (in russo) una monograa sulla programmazione della produzione che anticipa, sotto molti aspetti importanti, i temi trattati da Dantzig. Purtroppo questo lavoro fu a lungo ignorato in Occidente essendo riscoperto solo venti anni dopo, quando la PL aveva avuto un grande sviluppo. La caratteristica di tutti i lavori antecedenti quelli di Dantzig era uno scarso interesse verso lapplicabilit` a pratica, dovuta principlamente allimpossibilit` di eettuare i calcoli necessari. Il metodo del Simplesso a proposto da Dantzig si rivel` invece eciente in pratica e questo, unitamente al simultaneo avvento o dei calcolatori elettronici, decret` il successo della PL e, con esso, linizio dello sviluppo rigoglioso della o Ricerca Operativa.
2.2
2.2.1
Unindustria produce un bene di consumo in due versioni, normale e super. Su ogni unit` venduta a lindustria ha un protto di 1200 L per il tipo normale e di 1500 L per il tipo super. Nella produzione sono utilizzati tre tipi di macchinari, che indichiamo convenzionalmente con A, B, C, e che settimanalmente non possono essere in esercizio per un numero di ore maggiore di quello indicato nella Tabella 2; per produrre una unit` di prodotto ` richiesto lutilizzo delle macchine per il tempo indicato nella stessa a e tabella 2. macchinario A B C ore per settimana 1500 2000 1800 ore di lavoro per unit` di prodotto a tipo normale tipo super 1.5 1.5 0.8 1 1 2
Tab. 2 Tempi di lavorazione Lindustria vuole pianicare la produzione settimanale in modo da massimizzare il protto conseguito. Indicando rispettivamente con x1 e x2 le quantit` del bene prodotto settimanalmente nella versione a normale e nella versione super, il protto settimanale ` dato dalla funzione e z(x1 , x2 ) = 1200x1 + 1500x2 . Per non superare la capacit` lavorativa delle macchine di tipo A dovr` risultare a a 1.5x1 + 1.5x2 1500 e disuguaglianze analoghe valgono per le macchine di tipo B e C, per cui si ha 0.8x1 + x2 2000, x1 + 2x2 1800. Poich inne deve risultare x1 0, x2 0, giungiamo alla formulazione del seguente problema di e programmazione lineare: max z = 1200x1 + 1500x2 1.5x1 + 1.5x2 1500 0.8x1 + x2 2000 x1 + 2x2 1800 x1 0, x2 0.
23
2.2.2
Un problema di miscelazione
Consideriamo il problema di una industria alimentare che produce hamburger e che vuole minimizzare il costo delle materie prime, garantendo una buona qualit` del prodotto. Ammettiamo che ogni hamburger a debba pesare almeno 100 grammi e che limpasto sia costituito da carne macinata di manzo e di maiale, in quantit` espresse in grammi che indichiamo rispettivamente con x1 e x2 . Il macinato di manzo contiene a l80% di polpa e il 20% di grasso, e costa allindustria 6000 al Kg; il macinato di maiale contiene il 68% di polpa e il 32% di grasso e costa allindustria 3500 al Kg. Quanta carne di ciascun tipo dovr` a impiegare lindustria in ogni hamburger se vuole minimizzare il costo della carne utilizzata ed evitare che il contenuto grasso dellhamburger superi i 25 grammi? Tale problema pu` essere formulato come o problema di programmazione lineare nel seguente modo. Come funzione obiettivo si pu` considerare o il costo della carne utilizzata in ogni hamburger; tenendo conto del fatto che x1 e x2 sono espresse in grammi, il costo (espresso in migliaia) ` dato da e z(x1 , x2 ) = 6x1 + 3, 5x2 . Il peso di ogni hamburger deve essere di almeno 100 grammi, e ci` vincola le variabili x1 e x2 nel seguente o modo: x1 + x2 100; inoltre ogni hamburger conterr` 0.2x1 grammi di grasso proveniente dalla carne di manzo e 0.32x2 grammi a di grasso provenienti dalla carne di maiale; poich` i grammi di grasso in totale devono essere in ogni e hamburger non pi` di 25, si deve avere: u 0.2x1 + 0.32x2 25. Inne le quantit` x1 e x2 sono per loro natura non negative, cio` deve risultare x1 0, x2 0. In a e denitiva il problema che lindustria deve risolvere ` il seguente: e min z = 6x1 + 3, 5x2 x1 + x2 100 0.2x1 + 0.32x2 25 x1 0 x2 0,
2.2.3
Un problema di trasporto
Consideriamo unindustria che produce un bene di consumo in due stabilimenti di produzione, situati rispettivamente a Pomezia e a Caserta. La produzione viene prima immagazzinata in due depositi, situati uno a Roma e laltro a Napoli. Quindi i prodotti vengono distribuiti alla rete di vendita al dettaglio. Per ogni unit` di prodotto, il costo del trasporto dallo stabilimento al deposito ` dato dalla Tabella 1: a e Trasporto Pomezia-Roma Pomezia-Napoli Caserta-Napoli Caserta-Roma lire 1000 3000 500 3500
Tab. 1 Costi di trasporto La capacit` produttiva dei due stabilimenti ` limitata, per cui ogni settimana il bene in questione non pu` a e o essere prodotto in pi` di 10000 unit` nello stabilimento di Pomezia e in pi` di 8000 unit` nello stabilimento u a u a
24
di Caserta. Inoltre le statistiche di vendita informano che ogni settimana vengono vendute mediamente 11000 unit` tramite il deposito di Roma e 4600 unit` tramite il deposito di Napoli. Lindustria vuole a a minimizzare il costo del trasporto della merce dagli stabilimenti ai depositi, assicurando che i depositi ricevano settimanalmente le quantit` medie prima indicate. a Le variabili di decisione sono le quantit` del bene di consumo trasportate settimanalmente, che a possiamo associare alle variabili x1 , x2 , x3 , x4 nel seguente modo: quantit` a quantit` a quantit` a quantit` a trasportata trasportata trasportata trasportata da da da da Pomezia a Roma Pomezia a Napoli Caserta a Napoli Caserta a Roma x1 x2 x3 x4
La funzione obiettivo ` il costo sostenuto settimanalmente per il trasporto: e z(x1 , x2 , x3 , x4 ) = 1000x1 + 3000x2 + 500x3 + 3500x4 . Poich` i due stabilimenti hanno capacit` produttiva limitata deve essere e a x1 + x2 10000 x3 + x4 8000. Poich` si vuole garantire il rifornimento medio settimanale, deve essere e x1 + x4 = 11000 x2 + x3 = 4600. Inne evidentemente deve risultare xi 0, i = 1, 2, 3, 4, e quindi il problema di programmazione lineare per lindustria dellesempio ` il seguente: e min z = 1000x1 + 3000x2 + 500x3 + 3500x4 x1 + x2 10000 x3 + x4 8000 x1 + x4 = 11000 x2 + x3 = 4600 xi 0, i = 1, 2, 3, 4.
I semplici problemi descritti hanno una funzione essenzialmente esemplicativa. In casi concreti, un problema di programmazione lineare pu` avere un numero di variabili di decisione e un numero di vincoli o dellordine delle decine e centinaia di migliaia.
2.3
Quando il vettore x delle variabili di decisione ha solo due componenti il problema di programmazione lineare pu` essere facilmente risolto per via graca. Gli esempi che seguono, analizzati gracamente, o illustrano le situazioni tipiche che si presentano nella soluzione di problemi di programmazione lineare. Ricordiamo preliminarmente che nel piano cartesiano con assi coordinati (x1 , x2 ) lequazione ax1 + bx2 = c individua una retta. Tale retta al crescere di c si muove parallelamente a se stessa nella direzione individuata dal vettore [a b]T ; e di conseguenza la disequazione ax1 + bx2 c
25
5 4 3 2 1
10x1 + 5x2 25
I vincoli 1), 2) e 3) individuano i semipiani punteggiati rispettivamente nelle gure 2.2, 2.3 e 2.4.
x2 5
10x 1 + 5x2 25
10x 1 + 5x2 25 1 2 3 4 5 6 10x + 5x =25
x2
x1
2. 5 x1
x2
5 x1 4x 1 + 10x 2 20
27
x2
x 1+ 1. 2 4. 5x 5
4. 5
x1
28
x2
3 2
5 2. 5 4. 5 x1
x1
Esercizio 2.3.3 Risolvi il problema di programmazione lineare determinato dalla funzione obiettivo da massimizzare z = x1 + 0.5x2 e dalla regione ammissibile punteggiata in gura 2.13.
29
2 3 5 x2
0. 8
3. 2
x2
x2
z = 10
z = 25
z = 30
2. 5
z = 40
4 z = 10
30
5
4. 5
z = 21. 875
x1
x1
x1
x2
5x1 + 10x 2 = z 3 2 1 x1 z = 10 2 z= 20 z= 0 z= 10
2 1
x2
180
141. 66
120
78. 125
z = 420
100
z = 495. 83
z = 630
70 82, . 63
100 105
125
x1
31
x2 2000
1000 900
(200, 800)
900
500
x2
( 3 , 10 ) (0 , 10) (7 , ) 9
(0 , 7)
(5 , 0)
400
1000
z= 6
32
1200
z = 1440000
(12 , 4)
(10 , 0) z = 10
x1
2.4
Il nostro primo compito ` quello di introdurre, in maniera elementare, alcune idee base di geometria degli e insiemi convessi che ci permetteranno di meglio comprendere la struttura geometrica dei problemi di PL. Questi concetti rendono precise le nozioni di vertice e insieme convesso gi` incontrate nel paragrafo a precedente e sono utilizzabili anche nel caso di problemi con pi` di due variabili. u
Insiemi Convessi
Denizione 2.4.1 Siano x e y due punti in I n . Linsieme dei punti di I n ottenuti come R R z = (1 )x + y, al variare di nellintervallo [0, 1] viene denito come segmento di estremi x e y e viene sinteticamente indicato con [x, y]. Esempio 2.4.2 Nella gura 2.14 ` rappresentato il segmento in I 2 avente per estremi i punti x = (1, 1)T e R e y = (8, 5)T . Per = 0 ritroviamo il punto x, mentre per = 1 ritroviamo il punto y; i punti segnati nella gura come xa , xb e xc corrispondono rispettivamente a valori di pari a 0.25, 0.5 e 0.75. 2
x2 = 0.75
x2
4 = 0.5 3 = 0.25 2 xa =0 1 x1 xb
xc
x1 1 2. 75 4. 5 6. 25 8
33
Esempio 2.4.4 In I 2 gli insiemi (a) , (b) della gura 2.15 sono convessi, mentre gli insiemi (c), (d) della R stessa gura non lo sono. Infatti agli insiemi (c),(d) appartengono coppie di punti, quali quelle segnate nella gura, tali che il segmento che li congiunge presenta dei punti non appartenenti allinsieme; ci` non o avviene invece comunque si prendano coppie di punti negli insiemi (a) e (b). 2
d a b c
Passiamo ora a considerare dei particolari insiemi convessi che rivestono un ruolo importante nella teoria della programmazione lineare. Denizione 2.4.8 Sia a un vettore di I n e b un numero reale. Linsieme R H = {x I n : aT x = b} R ` detto iperpiano denito dallequazione aT x = b. Gli insiemi e S S = = {x I n : aT x b} R {x I n : aT x b} R 2
Nel caso dello spazio I 2 il concetto di iperpiano coincide con quello di retta, mentre nel caso dello spazio R I 3 il concetto di iperpiano coincide con quello di piano. In maniera intuitiva, i semispazi possono essere R pensati come l insieme dei punti che giacciono da una stessa parte rispetto alliperpiano. Esempio 2.4.9 Con riferimento alla gura 2.1, liperpiano (= retta) 10x1 + 5x2 = 25 divide lo spazio (= piano) in due semispazi: S = {x I 2 : 10x1 + 5x2 25}, indicato in grigio nella gura, e R S = {x I 2 : 10x1 + 5x2 25}, indicato in bianco nella gura. R 2 Notiamo che liperpiano H fa parte di tutti e due i semispazi e che lintersezione dei due semispazi coincide con liperpiano. In termini insiemistici abbiamo che H S, H S, S S = H.
34
Teorema 2.4.10 Un semispazio chiuso ` un insieme convesso. e Dimostrazione: Dimostreremo il teorema per un semispazio S = {x I n : aT x b}, la dimostrazione R per il semispazio S ottenuto invertendo il verso della disequazione ` analoga. Consideriamo due generici e vettori x ed y appartenenti ad S , vogliamo dimostrare che ogni vettore z [x, y] appartiene ad S , ovvero soddisfa la relazione aT z b. Sia z = x + (1 )y con 0 1. Poich x ed y appartengono ad S abbiamo che aT x b e e T a y b. Inoltre, poich ed 1 sono reali non negativi abbiamo che e aT (x + (1 )y) = aT x + (1 )aT y b + (1 )b = b e quindi che aT z b 2
Utilizzando il Teorema (2.4.10) e il Teorema (2.4.5) e ora facile dimostrare che anche un iperpiano ` e un insieme convesso. Corollario 2.4.11 Un iperpiano ` un insieme convesso. e Dimostrazione: Un iperpiano ` lintersezione di due semispazi chiusi (S e S ). Per il Teorema (2.4.10) e un semispazio chiuso ` un insieme convesso mentre, per il Teorema (2.4.5), lintersezione di due insiemi e convessi ` un insieme convesso. e 2 Notiamo ora che linsieme ammissibile di un problema di PL ` denito come linsieme di punti che e soddisfa i vincoli, cio` un insieme di equazioni e disequazioni lineari. Usando la terminologia appena e introdotta, possiamo anche dire che l insieme di punti ammissibili di un problema di PL ` dato dall e intersezione di un numero nito di semispazi (disequazioni lineari) e iperpiani (equazioni lineari). Quindi, applicando il Teorema (2.4.10), il Corollario 2.4.11 e il Teorema (2.4.5) abbiamo il seguente risultato. Teorema 2.4.12 Linsieme ammissibile di un problema di programmazione lineare ` un insieme cone vesso. 2 In particolare ` usuale introdurre la seguente denizione: e Denizione 2.4.13 Un insieme P I n ` un poliedro se ` lintersezione di un numero nito di semisR e e pazi chiusi e iperpiani. 2 Usando tale denizione possiamo anche dire che linsieme ammissibile di un problema di programmazione lineare ` un poliedro (convesso). Notiamo che nel caso I 3 possibili poliedri sono i cubi, i tetraedi etc. e R In generale ` usuale denotare un poliedro con P . Usando questa terminologia, possiamo riformulare un e generico problema di PL in forma di minimizzazione come: min cT x x P.
Vertici
In questa sezione formalizziamo il concetto intuitivo di vertice. Questo concetto riveste un ruolo fondamentale nella teoria della programmazione lineare. Denizione 2.4.14 Un vettore x appartenente ad un insieme convesso C ` detto punto estremo di C e se non esistono due punti distinti x1 , x2 C tali che x = x1 , x = x2 ed x [x1 , x2 ] Denizione 2.4.15 Un punto appartenente a un poliedro ` un vertice del poliedro stesso se e solo se ` e e un suo punto estremo. 2
35
Quindi, nel caso dei poliedri, che saranno gli unici insiemi convessi che prenderemo in considerazione in questo corso, vertici e punti estremi coincidono. Esempio 2.4.16 Nellinsieme di gura 2.16 il punto A non ` un punto estremo, in quanto ` interno al e e segmento che congiunge i punti B e C, anchessi appartenenti allinsieme; lo stesso vale per il punto D, interno al segmento [E,F]. Sono invece punti estremi dellinsieme i punti E, F, G, H. Notare che linsieme considerato ` un poliedro solo se la congiungente di F ed H ` intesa come una linea spezzata (numero e e nito di segmenti) approssimante larco di circonferenza. 2
B D
E
Figura 2.16: Vertici di un insieme.
Riprendendo la soluzione graca presentata nel Paragrafo 2.3, notiamo che quando il problema di PL ammette soluzione, esiste un vertice del poliedro convesso ammissibile che ` soluzione. e Tuttavia bisogna porre attenzione al fatto che esistono insiemi convessi e poliedrali che non contengono vertici. Un esempio e dato nella gura 2.17 data dalla parte di piano contenuta tra due rette parallele r1 e r2 . Se si considera un problema di PL che abbia la regione rappresentata in 2.17 come regione ammissibile, ` facile convincersi che sono possibili due soli casi: e 1. Le linee di livello della funzione obiettivo sono parallele a r1 e r2 , nel qual caso linsieme dei punti di massimo o minimo coincidono con r1 o r2 ; 2. Le linee di livello della funzione obiettivo non sono parallele a r1 e r2 , nel qual caso il corrispondente problema di PL ` illimitato sia superiormente che inferiormente. e La peculiarit` di questo esempio nasce dal fatto che il poliedro rappresentato nella gura 2.17 non ha a vertici e quindi, contrariamente a quanto visto nel paragrafo precedente, il problema di PL con regione ammissibile data da una striscia pu` avere soluzioni ottime, ma nessuna su un vertice. Vedremo fra o poco che il caso in cui il poliedro che rappresenta la regione ammissibile di un problema di PL non ha vertici ` lunico caso in cui il problema di PL pu` avere soluzione ottima senza che nessuna soluzione e o coincida con un vertice. Risulta quindi interessante capire quando un poliedro pu` non ammettere vertice. o
36
Supponiamo che questo problema abbia (almeno) una soluzione ottima x . Indichiamo con z = cT x ` il valore ottimo, cio` il valore assunto dall funzione obiettivo allottimo. E evidente che se x ` una e e Teorema 2.4.18 Sia dato un problema di PL. Allora una e una sola delle seguenti aermazioni ` vera: e ` E evidente che il poliedro nella gura 2.17 contiene rette (in particolare contiene, per esempio, r1 , r2 ) e quindi, non contiene vertici. Nelle sezioni precedenti abbiamo visto che spesso in un problema di PL le variabili sono tutte non negative (tra i vincoli compare x 0). Questo implica che la regione ammissibile di questi problemi di PL ` interamente contenuta nel primo ortante e quindi non pu` contenre rette. Quindi, in base al teorema e o precedente, tutti i poliedri contenuti nel primo ortante o sono vuoti o hanno dei vertici. Notiamo che questa ` sicuramente la classe di poliedri che pi` frequentemente si incontra nelle applicazioni. e u A valle di questa discussione possiamo ora enunciare il cosiddetto Teorema Fondamentale della Programmazione Lineare, che riassume e precisa tutte le osservazioni e intuizioni maturate nora. ` E interessante approfondire un poco la natura dellinsieme delle soluzioni. Nel paragrafo precedente abbiamo notato che sembra essere vero che se un problema di PL ha pi` di una soluzione ottima, allora u ne ammette innite. Ci proponiamo qui di precisare questa aermazione. Sia dato un poliedro P I n e un corrispondente problema di PL: R Se il problema ammette soluzioni ottime e il poliedro che denisce la regione ammissibile ha dei vertici, allora almeno una soluzione ottima cade su un vertice. Teorema 2.4.17 Un poliedro P non ha vertici se e solo se contiene una retta. La caratterizzazione dei casi in cui un poliedro non ammette vertici ` molto semplice ed ` riportata nel e e seguente risultato, di cui omettiamo la prova.
x2 r1 r2
2. Il problema ` illimitato; e
min cT x
x P.
37
x1
qualunque altra soluzione ottima, risulta z = cT x . Vice versa, se un punto x ` ammissibile, cio` e e se x P e risulta cT x = z , allora x ` una soluzione ottima per denizione. Riassumendo possiamo e aermare che linsieme delle soluzioni ottime del problema di PL dato ` e P {x I n : cT x = z }. R Questo mostra immediatamente che liniseme delle soluzioni ottime di un problema di PL ` un poliedro e contenuto in P , in quanto intersezione di P , denito da un insieme di equazioni e disequazioni lineari con liperpiano {x I n : cT x = z }. R In eetti ` facilmente possibile dire qualcosa di ancora pi` preciso riguardo allinsieme di soluzioni ottime e u di un problema di PL, come riportato nel seguente teorema. Teorema 2.4.19 Sia dato un problema di PL min cT x x P. Denotiamo con SOL linsieme di soluzioni ottime di questo problema. Allora 1. SOL ` un poliedro contenuto in P ; e 2. Se v ` un vertice di SOL, allora v ` anche un vertice di P . e e Dimostrazione: Se SOL ` vuoto le aermazioni sono ovvie. Supponiamo che SOL non sia vuoto, supe poniamo cio` che il problema di PL abbia soluzioni ottime. La prima aermazione ` stata dimostrata e e nelle considerazioni svolte prima del teorema. Passiamo quindi a dimostrare la seconda aermazione. Sia v un vertice di SOL. Ovviamente v appartiene a P . Supponiamo per assurdo che v non sia un vertice di P . Allora esistono due vettori x, y P ambedue dierenti da v, tali che v = x + (1 )y (2.1)
per qualche (0, 1). Indichiamo come al solito con z il valore ottimo del problema. Notiamo che, siccome x e y appartengono al poliedro ammissibile P , si deve avere cT x z Inoltre possiamo scrivere z = cT v = cT [x + (1 )y] = cT x + (1 )cT y. Da queste relazioni discende che deve essere cT x = z , cT y = z e quindi x, y SOL. Ma siccome abbiamo supposto che x e y sono diversi da v abbiamo che la (2.1) contraddice il fatto che v sia un vertice di SOL. Ci` conclude la prova. o 2 In conseguenza di quanto appena visto possiamo osservare che se un problema ha due soluzioni ottime distinte, x e y , allora sicuramente ne contiene innite. Infatti, poich` SOL ` convesso, esso contiene e e sicuramente almeno tutto il segmento [x , y ] , composto da inniti punti. e cT y z .
2.5
Dato un problema di PL ` ovviamente necessario, se il modello fatto deve essere di qualche utili`, essere e a capaci di riolverlo. Nel caso della programmazione lineare si dice che un algoritmo risolve un problema di PL se esso ` capace di determinare correttamente se il problema dato ` vuoto oppure illimitato oppure, e e
38
se nessuno di queste due casi risulta vericato, sia capace di individuare una soluzione ottima. Esistono molti algoritmi per la risoluzione di problemi di PL, spesso implementati in pacchetti software molto diusi e utilizzati. In questo paragrafo ci limitiamo ad esporre alcune considerazioni molto generali sul Metodo del Simplesso, che verr` approfondito in altri corsi. Come gi` accennato, il Metodo del Simplesso a a ` stato il primo algoritmo pratico per la risoluzione di problemi di PL ed ` tuttora il pi` usato e uno dei e e u pi` ecienti in pratica. u Per capire il modo di operare del Metodo del Simplesso iniziamo con losservare che si pu` dimostrare il o fatto, per altro abbastanza intuitivo, che un poliedro ha sempre un numero nito di vertici. Eventualmente i vertici, come abbiamo gi` avuto modo di osservare, possono essere zero. Comunque, bench` nito, il a e numero di vertici di un poliedro pu` essere arbitrariamente alto. Basta pensare all area racchiusa da o un poligono nel piano. Allaumentare del numero dei lati cresce il numero di vertici. Per fare un altro esempio, consideriamo il poliedro I = {x I n : 0, xi 1, i = 1, 2, . . . , n}. R Se n = 1 abbiamo ovviamente un segemento, con 2 vertici (2 = 21 ). Se n = 2 abbiamo un quadrato, con 4 vertici (4 = 22 ). Se n = 3 abbiamo un cubo con 8 vertici (8 = 23 ). In generale, per n > 3 linsieme I ` noto come ipercubo di dimensione n ` ha un numero di vertici pari a 2n , che quindi cresce e e esponenzialmente con la dimensione dello spazio. Supponiamo di avere un problema di PL min cT x x P, dove P ` un poliedro che non contiene rette, e di sapere che il problema ammette (almeno) una soluzione e ottima. Allora, il Teorema Fondamentale della Programmazione Lineare ci autorizza a limitare la ricerca di una soluzione ottima ai vertici del poliedro P . Una procedure teorica per la ricerca dellottimo, potrebbe essere quindi 1. Calcola tutti i vertici v1 , v2 , . . . , vq del poliedro P . 2. Valuta la funzione obiettivo in tutti i vertici e denota con v il vertice per cui si raggiunge il valore minimo: cT v cT vi i = 1, 2, . . . , q. 3. v ` una soluzione ottima del problema. e Ovviamente questa strategia deve essere completata da procedure in grado di dterminare se P ` vuoto e o se il problema ` illimitato. Inoltre bisogna essere in grado di calcolare i vertici. Ma in nuce questa e ` una procedure teoricamente valida. Il problema principale di questo modo di procedere ` che siccome e e il numero di vertici pu`, ed in generale `, altissimo, essa pu` diventare computazionalmente cos` oneroso o e o da risultare impraticabile. Il Metodo del Simplesso, nella sostanza, ` un modo un po pi` ranato di e u realizzare lo schema precedente e pu`, molto grossolonamente, essere schematizzato come segue. o
Determina un vertice iniziale v del poliedro P . Decidi se v ` una soluzione ottima. e Se v non ` una soluzione ottima allora determina in modo intelligente un nuovo e vertice v di P e torna al Passo 1.
39
Il cuore del metodo ` racchiuso nella frase in modo intelligente. Questo modo intelligente di determinare e un nuovo vertice, una volta stabilito che quello corrente non ` ottimo, deve essere tale da garantire che, e almeno nella maggioranza dei casi pratici, il metodo non debba visitare che una piccola frazione dei ` vertici di P prima di trovare un vertice ottimo. E inoltre necessario integrare questo schema con procedure in grado di determinare se il poliedro ` vuoto oppure se il problema ` illimitato inferiormente. Deve essere e e inoltre specicato un criterio di ottimalit` al Passo 1 che permetta allalgoritmo di arrestarsi. a Il Metodo del Simplesso ` di fondamentale importanza sia dal punto di vista storico, sia dal punto di e vista dellutilizzo pratico. Infatti, introdotto da G. Dantzig nel 1947, ha aperto la strada allo sviluppo e alla diusione della Programmazione Lineare e tuttoggi ` ampiamente utilizzato attraverso implemene tazioni sosticate nella maggior parte dei package commerciali pi diusi e pi ecienti. u u Il Metodo del Simplesso sfrutta la possibilit` di poter ricondurre un qualsiasi problema di Programa mazione Lineare nella forma min cT x Ax = b x0 che viene chiamata forma standard. ` E sempre possibile trasformare un problema di Programmazione Lineare dalla forma generale alla forma standard, eventualmente introducendo nuove variabili. La struttura particolare dellinsieme ammissibile di un problema di Programmazione Lineare in forma standard pu` essere sfruttata per identicare in maniera pi semplice i vertici. Tale possibilt` viene o u a sfruttata dal metodo del simplesso per determinare ecientemente, ad ogni iterazione, un nuovo vertice. Inoltre tale metodo selezione in maniera accurata i vertici che visita. Infatti, nelle varie iterazioni vengono scelti solamente i vertici in cui si ottiene una signicativa decrescita della funzione obiettivo mentre vengono trascurati gli altri, generando cos` una successione di valori della funzione obiettivo strettamente decrescente e questo implica che una volta esaminato un vertice, il metodo non pu` tornarvi. Perci` in un o o numero nito di passi viene raggiunto un vertice che ` ottimo oppure viene selezionato uno spigolo del e poliedro descritto dallinsieme ammissibile lungo il quale la funzione obiettivo ` illimitata inferiormente. e Concludiamo ripetendo che questi pochi cenni non vogliono servire ad altro che a dare una sia pur vaga idea del Metodo del Simplesso, che ` attualmente, nelle implementazioni commerciali, un algoritmo e ranatissimo e molto complesso, capace di risolvere problemi con decine e centinaia di migliaia di varibili.
2.6
Le applicazioni della Ricerca Operativa che possono essere formulate mediante luso di modelli di programmazione lineare sono molto frequenti e importanti. Lo scopo di questa parte ` quello di illustrare alcune e classi di problemi di programmazione lineare tipici che si incontrano frequentemente nelle applicazioni reali. Consigliamo allo studente, al ne di impratichirsi nella formulazione di problemi di PL, di provare da solo a formulare i problemi descritti prima di leggere la formulazione fornita. Ricordiamo che un modello di Programmazione Lineare ` costituito da: e una singola espressione lineare (la funzione obiettivo) che deve essere minimizzata o massimizzata. un numero nito di vincoli lineari, vincoli cio` espressi nella forma e f (x1 , . . . , xn ) b o f (x1 , . . . , xn ) b
40
dove f ` una funzione lineare e b una costante reale, (in questo caso si parla di vincoli di disue guaglianza) oppure f (x1 , . . . , xn ) = b sempre con f funzione lineare e b costante reale; (in questo caso si parla di vincoli di uguaglianza). In riferimento alle applicazioni di tipo economico la funzione obiettivo ha di solito il signicato di protto (da massimizzare) oppure di costo (da minimizzare). Protti e costi sono ottenuti come somma dei protti e costi marginali cio` di quelli relativi a ciascuna unit` di prodotto. e a Quando ` richiesta la massimizzazione di un protto, il modello contiene, di solito, vincoli che espe rimono limitazioni superiori sulle risorse (vincoli di capacit` produttiva, disponibilit` di materie prime); a a se invece ` richiesta la minimizzazione di un costo sono di solito presenti vincoli sulla domanda (richieste e ` di mercato) che impongono limitazioni inferiori alle variabili. E possibile la presenza di vincoli di continuit` che esprimono conservazione o riduzione di masse o volumi ed hanno spesso la forma di vincoli di a uguaglianza. Le ipotesi che vengono assunte nel formulare un problema di Programmazione Lineare sono le seguenti: a e proporzionalit`: il contributo di una variabile di decisione alla funzione obiettivo e ai vincoli ` proporzionale secondo una costante moltiplicativa alla quantit` rappresentata dalla variabile stessa; a additivit`: il contributo delle variabili di decisione alla funzione obiettivo e ai vincoli ` dato dalla a e somma dei contributi di ogni singola variabile. a o continuit`: ogni variabile di decisione pu` assumere tutti i valori reali nellintervallo di ammissibilit`, e quindi le variabili possono assumere valori frazionari. a La particolare attenzione dedicata ai modelli di Programmazione Lineare deriva dai numerosi vantaggi che essa presenta e che possono essere cos` sintetizzati: a a 1. Generalit` e essibilit`. I modelli di Programmazione Lineare possono descrivere moltissime situazioni reali anche assai diverse tra loro e quindi hanno un carattere di universalit` e di adattabilit` alle diverse realt` a a a applicative e anche quando lipotesi di linearit` non ` accettabile, il modello lineare costituisce una a e buona base di partenza per successive generalizzazioni. 2. Semplicit`. a I modelli di Programmazione Lineare sono espressi attraverso il linguaggio dellalgebra lineare e quindi sono facilmente comprensibili anche in assenza di conoscenze matematiche pi` elevate. u 3. Ecienza degli algoritmi risolutivi. Come accennato in precedenza i modelli reali hanno dimensioni molto elevate ed ` quindi indise pensabile luso del calcolatore che con opportuni programmi di calcolo possa rapidamente fornire una soluzione numerica. Relativamente ai modelli di Programmazione Lineare esistono programmi molto ecienti e largamente diusi che sono in grado di risolvere rapidamente problemi con migliaia di vincoli e centinaia di migliaia di variabili. a 4. Possibilit` di analisi qualitative. I modelli di Programmazione Lineare permettono di ottenere, oltre la soluzione numerica del problema, anche ulteriori informazioni relative alla dipendenza della soluzione da eventuali parametri presenti, che possono avere signicative interpretazioni economiche.
41
2.7
Esempi tipici di PL
Esamineremo nel seguito tre grandi classi di modelli di Programmazione Lineare che rappresentano situazioni molto diuse del mondo reale e che abbiamo gia incontrato nel paragrafo 2.2; si tratta dei modelli di allocazione ottima di risorse, modelli di miscelazione, modelli di trasporto. I modelli reali sono ovviamente molto pi` grandi in termini di dimensioni (numero delle variabili e u dei vincoli) e pi` complessi di quelli analizzati qui, noi, per ovvie ragioni didattiche ci limiteremo alla u presentazione di esmpi piccoli, che tuttavia colgono le caratteristiche essenziali dei modelli usati in pratica. Va inoltre sottolineato come nella realt` i problemi che si incontrano spesso possono combinare a insieme pi classi di problemi; la divisione che si ` eettuata in problemi di allocazione ottima, problemi u e di miscelazione e problemi di trasporti ha, evidentemente, scopi essenzialmente didattici e dovrebbe fornire la possibilit` di arontare anche situazioni in cui conuiscono simultaneamente problematiche a riconducibili a dierenti classi di modelli. Inne segnaliamo che esistono e vengono comunemente incontrati casi pratici il cui modello di PL non rientra in nessuna delle classi sopra indicate o in una loro combinazione. Quindi, ripetiamo, lo scopo di questo capitolo e solo di presentare, in forma didattica, alcuni dei pi` comuni tipi di problemi formulabili u come modelli di PL.
2.7.1
Si tratta di problemi in cui disponendo di determinate risorse (disponibilit` di macchinari, materie a prime, mano dopera, energia, etc.), si deve pianicare la produzione di un certo numero di prodotti niti, cercando di massimizzare il protto ricavato dalla loro vendita.
Esempi introduttivi
Esempio 2.7.1 Un coloricio produce due tipi di coloranti C1 e C2 utilizzando 3 preparati base P1, P2, P3. Tali preparati devono essere acquistati e subiscono un processo di ranazione prima di essere utilizzati. Le quantit` (in litri) di preparati base da acquistare per produrre un litro di colorante di ciascuno a dei due tipi ` riportato nella seguente tabella e C1 P1 P2 P3 1 1 C2 1 2 1
Ogni mese la quantit` di preparati base (in litri) che possono essere acquistati ` la seguente a e P1 750 P2 1000 P3 400
Il prezzo di vendita del colorante C1 ` di 7000 lire al litro, mentre il colorante C2 viene venduto a 10000 e lire al litro. Determinare la strategia ottimale di produzione mensile in modo da massimizzare i ricavi ottenuti dalla vendita dei due coloranti. Formulazione.
42
Si vuole costruire il modello di Programmazione Lineare che rappresenti il problema in analisi considerando le limitazioni date dalle produzioni eettivamente realizzabili. ` E immediato associare le variabili di decisione ai quantitativi di coloranti prodotti. Siano, quindi, rispettivamente x1 e x2 i quantitativi (in litri) da produrre mensilmente dei due coloranti. Nel formulare il modello di Programmazione Lineare si deve vericare che siano soddisfatte le ipotesi fondamentali: Proporzionalit`. a I consumi dei preparati base e i ricavi ottenibili sono proporzionali ai quantitativi di coloranti prodotti. Ad esempio, per produrre una quantit` x2 di colorante C2 si consumano 2x2 litri di P2 a e dalla vendita di x2 litri di C2 si ricavano 10x2 migliaia di lire indipendentemente dalla quantit` a prodotta e venduta dellaltro tipo di colorante. Additivit`. a I consumi dei preparati base e i ricavi rispettivamente associati alla produzione dei due coloranti sono additivi, nel senso che per produrre x1 litri di colorante C1 e x2 di C2 si consumano x1 + 2x2 litri di preparato di base P2 e si ricavano 7x1 + 10x2 migliaia di lire. Continuit`. a Ogni variabile introdotta nel modello pu` assumere tutti i valori reali nellintervallo di ammissio bilit`. a Queste ipotesi devono valere in generale e quindi dovranno essere sempre vericate nella costruzione di un modello di (PL). Variabili. Come gi` detto, prendiamo come variabili di decisione x1 e x2 , rispettivamente i quantitativi a (in litri) di colorante C1 e C2 da produrre mensilmente. ` Funzione obiettivo. E rappresentata dal protto totale che per le ipotesi fatte ` dato (in migliaia di e lire) da 7x1 + 10x2 . Vincoli. Poich il consumo di preparati base non pu` essere superiore alla disponibilit` si deve avere e o a x1 + x2 750 x1 + 2x2 1000 x2 400. Inoltre si deve esplicitare il vincolo di non negativit` sulle variabili a x1 0, x2 0. Quindi la formulazione nale ` e max (7x1 + 10x2 ) x1 + x2 750 x + 2x2 1000 1 x2 400 x1 0, x2 0.
Esempio 2.7.2 Unindustria manifatturiera pu` fabbricare 5 tipi di prodotti che indichiamo genericao mente con P1, P2, P3, P4, P5 usando 2 processi di produzione che avvengono mediante luso di due macchine che indichiamo con M1 e M2. Dopo aver dedotto il costo del materiale grezzo, ciascuna unit` a di prodotto d` i seguenti protti (in migliaia di lire) a
43
P1 250
P2 300
P3 500
P4 450
P5 180
Ciascuna unit` di prodotto richiede un certo tempo di ciascuno dei 2 processi; la tabella che segue riporta a i tempi (in ore) di lavorazione di ciascuna macchina per ottenere una unit` di ciascuno dei prodotti niti a P1 M1 M2 10 9 P2 15 13 P3 7 P4 18 P5 20
Inoltre, lassemblaggio nale per ciascuna unit` di ciascun prodotto richiede 18 ore di lavoro di un operaio. a La fabbrica possiede 4 macchine M1 e 3 macchine M2 che sono in funzione 5 giorni alla settimana per 2 turni di 8 ore al giorno. Gli operai impiegati nellassemblaggio sono 10 e ciascuno di essi lavora 5 giorni alla settimana per un turno di 8 ore al giorno. Trovare la quantit` che conviene produrre di ciascun a prodotto per massimizzare il protto totale. Formulazione. Costruiamo un modello di Programmazione Matematica rappresentante il problema in analisi supponendo ` di voler pianicare la produzione settimanale. E immediato vericare che anche in questo caso le ipotesi fondamentali della Programmazione Lineare sono soddisfatte. ` Variabili di decisione. E naturale introdurre le variabili reali x1 , x2 , x3 , x4 , x5 rappresentanti rispettivamente le quantit` di prodotto P1, P2, P3, P4, P5 che conviene fabbricare in una settimana. a Funzione Obiettivo. Ciascuna unit` di prodotto nito contribuisce al protto totale secondo la tabella a data. Quindi il protto totale sar` a 250x1 + 300x2 + 500x3 + 450x4 + 180x5 . (2.2)
Lobiettivo della fabbrica sar` quello di scegliere le variabili x1 , x2 , x3 , x4 , x5 in modo che lespressione a (2.2) del protto sia massimizzata. La (2.2) rappresenta la funzione obiettivo. Vincoli. Ovviamente la capacit` produttiva della fabbrica sia dal punto di vista delle macchine, sia dal a punto di vista degli operai, limita i valori che possono assumere le variabili xj , j = 1, . . . , 5. Si hanno solo 4 macchine M1 che lavorano per un totale di 320 ore settimanali e poich ciascuna unit` di prodotto P1 e a usa per 10 ore la macchina M1, ciascuna unit` di prodotto P2 la usa per 15 ore e cos` via per gli altri a prodotti, si dovr` avere a 10x1 + 15x2 + 7x3 + 18x4 320. (2.3) Ragionando in modo analogo per la macchina M2 si ottiene 9x1 + 13x2 + 20x5 240. (2.4)
Inoltre si hanno solo 10 uomini per lassemblaggio, ciascuno dei quali lavora 40 ore a settimana e quindi si ha una capacit` lavorativa settimanale di 400 ore. Poich ciascuna unit` di prodotto prevede 18 ore di a e a lavoro di assemblaggio si dovr` avere a 18x1 + 18x2 + 18x3 + 18x4 + 18x5 400. (2.5)
Le espressioni (2.3), (2.4) e (2.5) costituiscono i vincoli del modello. Ci sono inoltre vincoli impliciti dovuti al fatto che le variabili xj , j = 1, . . . 5 rappresentando quantit` di prodotto non possono essere a negative. Questa limitazione va esplicitata e quindi vanno aggiunti i vincoli x1 0, x2 0, x3 0, x4 0, x5 0.
44
La formulazione nale sar` quindi a max (250x1 + 300x2 + 500x3 + 450x4 + 180x5 ) 10x1 + 15x2 + 7x3 + 18x4 320 9x + 13x2 + 20x5 240 1 18x1 + 18x2 + 18x3 + 18x4 + 18x5 400 x1 0, x2 0, x3 0, x4 0, x5 0. Questa formulazione ` un problema matematico ben denito e costituisce il modello di Programmazione e Matematica rappresentante il problema di pianicazione della produzione industriale in analisi.
Formulazione. ` E utile ribadire le ipotesi gi` esposte in precedenza le quali devono valere in generale per la costruzione a di modelli di Programmazione Lineare: proporzionalit`, additivit`, continuit` cio` i consumi delle risorse a a a e e i ricavi ottenibili sono proporzionali ai quantitativi di prodotto fabbricati; i consumi globali di risorse e i ricavi totali si ottengono come somma dei consumi e dei ricavi marginali; le variabili possono assumere valori frazionari. Variabili di decisione. Si introducono le variabili di decisione x1 , x2 , . . . , xn rappresentanti (in unopportuna unit` di misura) la quantit` di ciascun prodotto P1 , P2 , . . . , Pn . Queste saranno le incognite del proba a lema. Tali variabili di decisione sono i cosiddetti livelli di attivit`. Introducendo come spazio delle variabili a lo spazio delle nuple reali IRn si pu` considerare un x IRn denendo x = (x1 , . . . , xn )T . o Funzione obiettivo. Per le ipotesi fatte la funzione obiettivo (da massimizzare) pu` essere scritta o
n
z = c1 x1 + . . . + cn xn =
j=1
cj xj .
45
Introducendo c IRn , denito c = (c1 , . . . , cn )T la funzione obiettivo pu` essere scritta in notazione o vettoriale z = cT x. Vincoli. Si devono introdurre i seguenti vincoli: Vincoli di capacit` produttiva: a tenendo conto delle limitazioni delle risorse si hanno i seguenti m vincoli a11 x1 + a21 x1 + . . . am1 x1 + ... ... ... ... +a1n xn +a2n xn . . . +amn xn b1 b2 . . . bm .
Vincoli di non negativit`: a le variabili devono essere non negative in quanto esse rappresentano livelli di produzione e quindi si hanno i vincoli xi 0, i = 1, . . . , n. Introducendo la matrice (m n) a11 . . A= . am1 ... ... a1n . . . amn
e il vettore b = (b1 , . . . , bm )T la formulazione completa del problema pu` essere scritta nella forma o max cT x Ax b x 0. ` E una formulazione generale (con solo vincoli di disuguaglianza e vincoli di non negativit`) in cui si pu` a o porre un generico problema di allocazione ottima di risorse. Nella pratica, potrebbe essere necessario imporre ulteriori vincoli: Vincoli di domanda - limitazioni inferiori sulle variabili xi cio` e xi li i = 1, . . . , n
con li 0 per assicurare che i prodotti siano fabbricati in quantit` signicative. In questo a caso, per ogni indice i per il quale li > 0 il vincolo di non negativit` xi 0 ` ridondante. a e e - limitazioni superiori sulle variabili, cio` xi ui i = 1, . . . , n
dovute ad eventuali possibilit` limitate di assorbimento dei prodotti da parte del mercato. a Introducendo le notazioni vettoriali l = (l1 , . . . , ln )T e u = (u1 , . . . , un )T questi vincoli possono essere scritti nella forma l x u, x IRn . Vincoli di interezza. Se inoltre non ha senso considerare i prodotti quantit` divisibili allora si deve denire un modello di a programmazione a numeri interi. Cio` nel caso in cui non si possa supporre che i livelli di attivit` e a siano frazionari (ad es. se i prodotti sono quantit` indivisibili come motori, lavatrici etc.), allora si a deve aggiungere il vincolo che le quantit` xi siano intere. a
46
I robot A e B sono disponibili per 8 ore al giorno mentre il robot C ` disponibile per 5 ore al giorno. e Il numero di autovetture di lusso prodotte non deve superare il 20% del totale mentre il numero di autovetture economiche deve costituire almeno il 40% della produzione complessiva. Supponendo che tutte le autovetture vengano vendute, formulare un problema di Programmazione Lineare che permetta di decidere le quantit` giornaliere (non necessariamente intere) da produrre per ciascun modello in modo tale a da massimizzare i protti rispettando i vincoli di produzione. Formulazione. ` E un problema di allocazione ottima di risorse e pu` essere formulato in termini di Programmazione o Lineare nel seguente modo. Variabili. Indichiamo con x1 , x2 , x3 , rispettivamente il numero di autovetture del modello economico, normale e di lusso. ` Funzione obiettivo. E data dal protto globale e quindi ` data da e 1000x1 + 1500x2 + 2200x3 . Vincoli. I vincoli sulla capacit` produttiva sono a 20x1 + 30x2 + 62x3 480 31x1 + 42x2 + 51x3 480 16x1 + 81x2 + 10x3 300. I vincoli sul numero totale dei singoli tipi di autovetture sono x3 0.2 (x1 + x2 + x3 ) x1 0.4 (x1 + x2 + x3 ) . Si devono inoltre esplicitare i vincoli di non negativit` a x1 0 x2 0 x3 0.
47
Quindi la formulazione completa pu` essere scritta o max (1000x1 + 1500x2 + 2200x3 ) 20x1 + 30x2 + 62x3 480 31x1 + 42x2 + 51x3 480 16x1 + 81x2 + 10x3 300 x3 0.2 (x1 + x2 + x3 ) x1 0.4 (x1 + x2 + x3 ) x1 0 x2 0 x3 0.
Esempio 2.7.4 Unindustria produce 4 tipi di elettrodomestici E1, E2, E3, E4 ed ` divisa in 3 reparti. e Ciascun reparto pu` fabbricare ciascuno tipo di elettrodomestico. Questa industria dispone di 100 operai o cos ripartiti: 40 nel reparto 1, 35 nel reparto 2 e 25 nel reparto 3. Ciascun operaio lavora 5 giorni la settimana, per 8 ore al giorno. La tabella che segue riporta, per ciascun tipo di elettrodomestico e per ciascun reparto, il tempo di lavorazione (in ore) necessario per ottenere un elettrodomestico pronto per la vendita, insieme al prezzo di vendita unitario in migliaia di lire. E1 1 1.2 0.8 800 E2 1.5 1.3 1.7 1200 E3 0.5 0.6 0.7 950 E4 1.6 1 1.3 1100
Questa industria deve pianicare la sua produzione settimanale, deve cio` determinare il numero di e ciascuno degli elettrodomestici che deve essere fabbricato da ciascun reparto in modo da soddisfare un ordine di almeno 1000, 600, 300, 200 elettrodomestici rispettivamente del tipo E1, E2, E3, E4 e in modo da massimizzare il protto complessivo ricavato dalla vendita. Formulazione. ` E un problema di allocazione ottima di risorse con la dierenza rispetto a quelli no ad ora esaminati, che ciascun reparto ` in grado di fornire prodotti niti pronti per la vendita, cio` non ` necessaria e e e la lavorazione su tutti i reparti per ottenere un prodotto nito. Questa dierenza ` di fondamentale e importanza nella scelta delle variabili di decisione. Variabili. Si devono distinguere il numero di elettrodomestici prodotti in ciascun reparto e quindi una naturale associazione delle variabili di decisione ` la seguente: si indica con xij , i = 1, . . . , 4, j = 1, 2, 3, e il numero di elettrodomestici del tipo Ei da produrre settimanalmente nel reparto j-esimo. Funzione obiettivo. Sar` data dal protto complessivo ricavato dalla vendita e quindi ` a e 800(x11 + x12 + x13 ) + 1200(x21 + x22 + x23 ) + 950(x31 + x32 + x33 ) + 1100(x41 + x42 + x43 ) Vincoli. Si devono considerare i vincoli dovuti alla limitata disponibilit` settimanale di ore lavorative; a in particolare, vista la distribuzione degli operai nei reparti si hanno al pi le seguenti disponibilit` orarie: u a 1600 ore nel reparto 1, 1400 ore nel reparto 2 e 1000 ore nel reparto 3. Pertanto in base ai tempi di lavorazione riportati nella tabella i vincoli da considerare sono: x11 + 1.5x21 + 0.5x31 + 1.6x41 1600
48
1400 1000.
Inoltre si devono considerare dovuti allordine da soddisfare che possono essere scritti nella forma x11 + x12 + x13 x21 + x22 + x23 x31 + x32 + x33 x41 + x42 + x43 Inne devono essere esplicitati i vincoli di non negativit` delle variabili xij 0, i = 1, . . . , 4, j = 1, 2, 3 a interezza delle variabili xij Z, i = 1, . . . , 4, j = 1, 2, 3. Quindi la formulazione completa `: e max (800(x11 + x12 + x13 ) + 1200(x21 + x22 + x23 ) + 950(x31 + x32 + x33 ) + 1100(x41 + x42 + x43 )) x11 + 1.5x21 + 0.5x31 + 1.6x41 1600 1.2x12 + 1.3x22 + 0.6x32 + x42 1400 0.8x13 + 1.7x23 + 0.7x33 + 1.3x43 1000 x11 + x12 + x13 1000 x21 + x22 + x23 600 x31 + x32 + x33 300 x41 + x42 + x43 200 xij 0, xij Z, i = 1, . . . , 4, j = 1, 2, 3. . 1000 600 300 200.
Per la produzione di questi pneumatici la fabbrica dispone di due macchine M1 e M2. Per avere un pneumatico nito e pronto per essere venduto, ` necessaria la lavorazione di materiale grezzo su solo una e delle due macchine. Il numero di ore in cui le macchine sono disponibili ciascun mese sono riportate nella seguente tabella
49
I tempi necessari per produrre questi pneumatici varia a seconda del tipo e della macchina usata. Tali tempi sono riportati nella seguente tabella (in ore) tipo A tipo B M1 0.10 0.18 M2 0.12 0.15
Il costo di lavorazione per ogni ora di macchina usata ` uguale per entrambe le macchine ed ` pari a lire e e 6000. Il costo del materiale grezzo necessario per produrre ciascun pneumatico ` di lire 2500 per il tipo e A e di lire 4000 per il tipo B. Nel primo e nel secondo mese del trimestre ` possibile produrre pi` di quanto richiesto nello stesso mese; e u la produzione in eccesso deve essere immagazzinata per essere usata nel mese successivo. Ogni mese, il costo di tale immagazzinamento ` di lire 350 per ciascun pneumatico immagazzinato. Si assuma che e allinizio del trimestre non ci sia nessun prodotto immagazzinato e analogamente alla ne del trimestre non rimanga nessun prodotto immagazzinato. Costruire un modello lineare che permetta di pianicare la produzione trimestrale minimizzando il costo complessivo trascurando linterezza dei prodotti. Formulazione. Si tratta di un problema di allocazione ottima di risorse nel quale si deve tenere presente la possibilit` a dellimmagazzinamento del prodotto in eccesso. Variabili. Si introducono le variabili Aotti , Anov , Adic che indicano la quantit` di pneumatici di tipo a M Mi Mi A prodotti dalla iesima macchina (i = 1, 2) rispettivamente nei mesi di ottobre, novembre e dicembre. ott nov dic Analogamente BM i , BM i , BM i indicheranno le quantit` di pneumatici di tipo B prodotti dalla iesima a macchina (i = 1, 2) rispettivamente nei mesi di ottobre, novembre e dicembre. Si indichino inoltre con ott nov Aott , Anov , Bim , Bim le quantit` di pneumatici di tipo A e B da immagazzinare nei mesi di ottobre e a im im novembre. Funzione obiettivo. La funzione obiettivo da minimizzare ` data dal costo complessivo di produzione. e Poich unora di lavorazione su una macchina costa lire 6000, e poich i tempi di lavorazione cambiano a e e seconda delle macchine usate, per produrre ciascun pneumatico di tipo A si spende lire 600 se si utilizza la macchina 1, lire 720 se si utilizza la macchina 2. Analogamente, il costo di ciascun pneumatico del tipo B ` di lire 1080 se si utilizza la macchina 1, e di lire 900 se si utilizza la macchina 2. Quindi tenendo e conto del costo del materiale grezzo e dellimmagazzinamento, il costo complessivo sar` a 600(Aott1 + Anov + Adic ) + 720(Aott2 + Anov + Adic )+ M M1 M1 M M2 M2
ott nov dic ott nov dic +1080(BM 1 + BM 1 + BM 1 ) + 900(BM 2 + BM 2 + BM 2 )+
50
Si hanno inoltre i seguenti vincoli dovuti alla richiesta e allimmagazzinamento: Aott1 + Aott2 M M nov AM 1 + Anov + Aott M2 im Adic + Adic + Anov M1 M2 im = 4500 + Aott im = 5000 + Anov im = 2000
ott ott BM 1 + BM 2 nov nov ott BM 1 + BM 2 + Bim dic dic nov BM 1 + BM 2 + Bim
Si hanno inoltre i vincoli di non negativit` sulle variabili. a Quindi il modello nale `: e min 3100(Aott1 + Anov + Adic ) + 3220(Aott2 + Anov + Adic )+ M M1 M1 M M2 M2 +5080(B ott + B nov + B dic ) + 4900(B ott + B nov + B dic )+ M1 M1 M1 M2 M2 M2 +350(Aott + Anov + B ott + B nov ) im im im im 0.10Aott + 0.18B ott 1000 M1 M1 0.10Anov + 0.18B nov 1500 M1 M1 0.10Adic + 0.18B dic 600 M1 M1 ott 0.12Aott2 + 0.15BM 2 800 M nov nov 0.12AM 2 + 0.15BM 2 1800 dic 0.12Adic + 0.15BM 2 1100 ott M 2 ott A M 1 + AM 2 = 4500 + Aott im nov A M 1 + Anov + Aott = 5000 + Anov im im M2 dic A M 1 + Adic + Anov = 2000 im M2 ott B ott ott M 1 + BM 2 = 3000 + Bim nov B nov ott nov M 1 + BM 2 + Bim = 3500 + Bim dic B dic nov M 1 + BM 2 + Bim = 8000 ott A 0, Anov 0, Adic 0, i = 1, 2 Mi Mi Mi ott nov dic BM i 0, BM i 0, BM i 0, i = 1, 2.
51
2.7.2
Modelli di miscelazione
Si tratta di problemi in cui si hanno a disposizione un certo numero di sostanze ciascuna delle quali ha un certo costo ed un determinato contenuto di componenti utili. Si vuole ottenere la miscela pi` economica u di queste sostanze in modo che contenga una certa quantit` di ciascuno dei componenti utili. a
Esempi introduttivi
Esempio 2.7.6 Unindustria conserviera deve produrre succhi di frutta mescolando polpa di frutta e dolcicante ottenendo un prodotto nale che deve soddisfare alcuni requisiti riguardanti il contenuto di vitamina C, di sali minerali e di calorie. La polpa di frutta e il dolcicante vengono acquistati al costo rispettivamente di Lire 400 e Lire 600 ogni ettogrammo. Inoltre dalle etichette si ricava che 100 grammi di polpa di frutta contengono 140 mg di vitamina C, 20 mg di sali minerali e 50 calorie mentre 100 grammi di dolcicante contengono 10 mg di sali minerali, 100 calorie e non contengono vitamina C. I requisiti che il prodotto nale (cio` il succo di frutta pronto per la vendita) deve avere sono i seguenti: il e succo di frutta deve contenere almeno 70 mg di vitamina C, almeno 30 mg di sali minerali e un contenuto calorico di almeno 150 calorie. Si devono determinare le quantit` di polpa di frutta e di dolcicante da a utilizzare nella produzione del succo di frutta in modo da minimizzare il costo complessivo dellacquisto dei due componenti base. Formulazione. Si vuole costruire un modello di Programmazione Lineare che rappresenti il problema in analisi tenendo presente i requisiti di qualit` richiesti. Si verica facilmente che le ipotesi fondamentali di un modello di a Programmazione Lineare sono soddisfatte. ` Variabili. E naturale associare la variabili di decisione alle quantit` di polpa di frutta e di dolcicante a da utilizzare per la produzione del succo di frutta. Quindi siano x1 e x2 rispettivamente le quantit` a espresse in ettogrammi di polpa di frutta e di dolcicante che devono essere utilizzate. ` Funzione obiettivo. E rappresentata dal costo complessivo dellacquisto dei due componenti base e quindi ` data da 400x1 + 600x2 . Questa espressione naturalmente deve essere minimizzata. e Vincoli. Poich un ettogrammo di polpa contiene 140 mg di vitamina C e il dolcicante non contiene e vitamina C, il primo vincolo da considerare riguardante il contenuto di vitamina C del succo di frutta si pu` scrivere nella forma o 140x1 70. Analogamente per rispettare il requisito sul contenuto di sali minerali del succo di frutta si dovr` imporre a il vincolo 20x1 + 10x2 30. Inne il vincolo sul contenuto calorico del succo di frutta si pu` esprimere nella forma o 50x1 + 100x2 150. Inne si deve esplicitare il vincolo di non negativit` sulle variabili cio` a e x1 0, x2 0. Quindi la formulazione nale ` e min(400x1 + 600x2 ) 140x1 70 20x1 + 10x2 30 50x1 + 100x2 150 x1 0, x2 0
52
Esempio 2.7.7 Il Problema della Dieta Una dieta prescrive che giornalmente devono essere assimilate quantit` predeterminate di calorie, proteine a e calcio, intese come fabbisogni minimi giornalieri, disponendo di cinque alimenti base (pane, latte, uova, carne, dolce). Tali fabbisogni minimi sono di 2000 calorie, 50 g. di proteine, 700 mg. di calcio. Dalle tabelle dietetiche si ricavano i seguenti contenuti di calorie (in cal.), proteine (in g.), calcio (in mg.) per ogni singola porzione di ciascun alimento, intendendo come porzione una quantit` espressa in grammi e a quindi frazionabile. Pane calorie proteine calcio 110 4 2 Latte 160 8 285 Uova 180 13 54 Carne 260 14 80 Dolce 420 4 22
I costi (in migliaia di lire) e il numero massimo di porzioni tollerate giornalmente sono i seguenti Pane costo porz. 2 4 Latte 3 8 Uova 4 3 Carne 19 2 Dolce 20 2
Determinare una dieta a costo minimo che soddis le prescrizioni richieste. Formulazione. Poich si ` supposto che le porzioni siano frazionabili ed inoltre valgono le ipotesi di linearit`, si pu` e e a o costruire un modello di Programmazione Lineare per rappresentare il problema in analisi. ` Variabili. E ovvio introdurre le variabili x1 , x2 , x3 , x4 , x5 indicanti le quantit` di porzioni dei singoli a alimenti da includere giornalmente nella dieta. ` Funzione obiettivo. E rappresentata dal costo complessivo ed ` quindi data da e 2x1 + 3x2 + 4x3 + 19x4 + 20x5 . Vincoli. Poich sono prescritti i fabbisogni minimi giornalieri, si avranno i seguenti vincoli: e calorie proteine calcio 110x1 + 160x2 + 180x3 + 260x4 + 420x5 2000 4x1 + 8x2 + 13x3 + 14x4 + 4x5 50 2x1 + 285x2 + 54x3 + 80x4 + 22x5 700
Inoltre i vincoli sul numero massimo di porzioni giornaliere di ciascun alimento e di non negativit` a 0 x1 4, 0 x2 2, 0 x3 3, 0 x4 2, 0 x5 2. La formulazione completa sar` quindi a min (2x1 + 3x2 + 4x3 + 19x4 + 20x5 ) 110x1 + 160x2 + 180x3 + 260x4 + 420x5 2000 4x + 8x2 + 13x3 + 14x4 + 4x5 50 1 2x1 + 285x2 + 54x3 + 80x4 + 22x5 700 0 x1 4, 0 x2 8, 0 x3 3, 0 x4 2, 0 x5 2. Se inoltre si vuole supporre, ad esempio, che nella dieta sia presente almeno una porzione di dolce e due di latte si dovranno imporre i vincoli x5 1 e x2 2 da aggiungere alla precedente formulazione. In questo caso, i vincoli gi` presenti x5 0 e x2 0 sono ridondanti. a
53
si desidera ottenere la miscela pi` economica che soddis alcuni requisiti qualitativi, cio` contenga una u e quantit` non inferiore a bi di ciascun Ci , i = 1, . . . , m a C1 b1 C2 b2 Cm bm .
Si indichi con aij , i = 1, . . . , m, j = 1, . . . , n la quantit` di componente Ci presente nella sostanza Sj . Si a pu` cos` costruire la seguente tabella o C1 . . . Ci . . . Cm S1 a11 . . . ai1 . . . am1 Sj a1j . . . aij . . . amj Sn a1n . . . ain . . . amn
Formulazione. Supponendo che valgano le ipotesi di proporzionalit`, additivit` ed inoltre assumendo che le quantit` di a a a sostanze da utilizzare siano frazionabili, si pu` formulare questo problema in termini di un problema di o Programmazione Lineare. ` Variabili. E naturale introdurre le variabili di decisione x1 , x2 , . . . , xn rappresentanti la quantit` di a ciascuna sostanza S1 , S2 , . . . , Sn da utilizzare nella miscela. Queste saranno le incognite del problema. Introducendo come spazio delle variabili lo spazio delle nuple reali IRn si pu` considerare un x IRn o denendo x = (x1 , . . . , xn )T . Funzione obiettivo. Per le ipotesi fatte, la funzione obiettivo pu` essere scritta o
n
z = c1 x1 + . . . + cn xn =
j=1
cj xj .
Introducendo c IRn , denito c = (c1 , . . . , cn )T , la funzione obiettivo pu` essere scritta in notazione o vettoriale z = cT x. Vincoli. Si devono introdurre i seguenti vincoli: Vincoli di qualit`. a Tenendo conto del fatto che la miscela deve contenere una quantit` non inferiore a bi di ciascun a componente Ci si dovr` avere a
n
aij xj bi ,
j=1
i = 1, . . . , m.
54
Vincoli di non negativit`. a Si devono infatti considerare i vincoli di non negativit` sulle variabili cio` xj 0, j = 1, . . . , n. a e Introducendo la matrice (m n) a11 . A= . . am1 ... ... a1n . . . amn
e il vettore b = (b1 , . . . , bm )T la formulazione completa del problema pu` essere scritta nella forma o min cT x Ax b x 0. Nella pratica, potrebbe essere necessario introdurre ulteriori vincoli: possono essere presenti limitazioni superiori o inferiori sulle variabili cio` xj L, xj M , j = e 1, . . . , n; se ` richiesto anche che la miscela contenga una quantit` non superiore ad un valore di di ciascun e a componente Ci si dovr` aggiungere alla formulazione un altro vincolo di qualit`: a a
n
aij xj di ,
j=1
i = 1, . . . , m;
in alcuni casi si richiede che una certa sostanza appartenga alla miscela solo se unaltra sostanza vi appartiene (o non vi appartiene). Questi vincoli richiedono luso di variabili booleane come descritto in seguito.
Il prodotto nale viene venduto a 350 migliaia di lire per quintale. Determinare come va pianicata la produzione settimanale per massimizzare il protto netto.
55
Formulazione. Variabili. Introduciamo le variabili di decisione x1 , x2 , x3 , x4 , x5 rappresentanti le quantit` (in quintali) a di N1, N2, N3, S1, S2 che devono essere comprate e ranate in una settimana. Inoltre introduciamo una ulteriore variabile y che indica la quantit` di prodotto nale che deve essere fabbricato. a Funzione obiettivo. La funzione obiettivo da massimizzare sar` data dal protto netto cio` da a e 350y 300x1 190x2 250x3 200x4 230x5 . Vincoli. Sono presenti tre tipi di vincoli capacit` di ranamento a x1 + x2 + x3 500 x4 + x5 300; limitazioni sulla gradazione 6.0x1 + 1.9x2 + 8.5x3 + 5.0x4 + 3.5x5 7y 6.0x1 + 1.9x2 + 8.5x3 + 5.0x4 + 3.5x5 2y; a vincolo di continuit` x1 + x2 + x3 + x4 + x5 = y. Questo vincolo di continuit` esprime il fatto che il peso nale del prodotto deve essere uguale alla a somma dei pesi degli ingredienti. Inoltre si devono esplicitare i vincoli di non negativit` delle variabili. a La formulazione nale risulta quindi max (300x1 190x2 250x3 200x4 230x5 + 350y) x1 + x2 + x3 500 x4 + x5 300 6.0x1 + 1.9x2 + 8.5x3 + 5.0x4 + 3.5x5 7y 0 6.0x1 + 1.9x2 + 8.5x3 + 5.0x4 + 3.5x5 2y 0 x1 + x2 + x3 + x4 + x5 y = 0 x1 0, x2 0, x3 0, x4 0, x5 0, y 0
Osservazione 2.7.9 Un errore comune ` quello di scrivere i vincoli sulla gradazione e 6.0x1 + 1.9x2 + 8.5x3 + 5.0x4 + 3.5x5 7 6.0x1 + 1.9x2 + 8.5x3 + 5.0x4 + 3.5x5 2. Queste relazioni sono evidentemente dimensionalmente errate: il primo membro ha le dimensioni di gradazione quantit` mentre il secondo membro ha le dimensioni della gradazione. Tuttavia, invece a delle variabili xi in queste due disuguaglianze si potevano usare le variabili xi /y per rappresentare le proporzioni degli ingredienti, piuttosto che le quantit` assolute xi ; ovviamente, in questo caso si dovevano a modicare anche le altre espressioni. Comunque, luso delle variabili xi /y ` ovviamente possibile solo nel e caso in cui la quantit` di prodotto fabbricato ` non nulla, cio` y = 0. a e e
56
Esempio 2.7.10 Una raneria produce quattro tipi di benzine grezze (B1 , B2 , B3 , B4 ) e le miscela allo scopo di ottenere carburanti di due diverse qualit` (C1 , C2 ). Le quantit` di benzine grezze non utilizzate a a nella produzione delle miscele possono essere vendute direttamente. La seguente tabella riassume i dati delle benzine grezze, cio` il numero di ottani, la quantit` (in ettolitri) che si pu` produrre al giorno e il e a o costo (in migliaia di lire) di un ettolitro di ciascuna benzina. B1 n. ottani ettolitri costo 90 3500 260 B2 73 6000 210 B3 79 4500 190 B4 86 5200 220
Nella seguente tabella sono riportate le caratteristiche che devono avere le miscele cio` il minimo numero e di ottani e il prezzo di vendita di un ettolitro di carburante (in migliaia di lire) C1 min. n. ottani prezzo 80 350 C2 85 520
Inoltre il mercato ` in grado di assorbire non pi` di 25000 ettolitri al giorno del carburante C1 , mentre e u richiede almeno 10000 ettolitri al giorno di carburante C2 . Inne, i quantitativi di benzine grezze prodotti ma non utilizzati nella preparazione delle miscele sono rivenduti al prezzo di 280 migliaia di lire per ettolitro se il numero di ottani ` non inferiore a 80, e a 250 migliaia di lire per ettolitro altrimenti. e Occorre pianicare la produzione giornaliera della raneria, cio` le quantit` e le composizioni delle due e a miscele, massimizzando il protto ottenuto dalla vendita dei prodotti. Assumere che il numero di ottani di ciascuna miscela dipenda in modo lineare dalle gradazioni delle benzine componenti. Formulazione. ` Variabili. E conveniente scegliere come variabili di decisione le quantit` (in barili) di benzina grezza a Bi utilizzate nella miscela Cj che indichiamo con xij , i = 1, . . . , 4, j = 1, 2. Inoltre denotiamo con yi , i = 1, . . . , 4 le quantit` di benzine grezze prodotte ma non utilizzate nelle miscele. a Funzione obiettivo. La funzione obiettivo da massimizzare ` data dal ricavo ottenuto dalla vendita dei e prodotti sottratto dei costi di produzione. Quindi ` data da e z = + 350(x11 + x21 + x31 + x41 ) + 520(x12 + x22 + x32 + x42 ) + 280(y1 + y4 ) + 250(y2 + y3 ) + 260(x11 + x12 + y1 ) 210(x21 + x22 + y2 ) + 190(x31 + x32 + y3 ) 220(x41 + x42 + y4 ).
Vincoli. I vincoli sulla capacit` produttiva sono a x11 + x12 + y1 3500 per quanto riguarda la benzina B1 e analoghi per le altre benzine. Tuttavia tali vincoli possono essere imposti, senza perdere generalit`, come vincoli di uguaglianza considerando che non vi ` alcuna convenienza a e a sotto-utilizzare le capacit` produttive della raneria: a x11 + x12 + y1 = 3500 x21 + x22 + y2 = 6000
57
x31 + x32 + y3 = 4500 x41 + x42 + y4 = 5200. Analizziamo ora i vincoli dovuti al minimo numero di ottani che devono avere le miscele; essi sono dati da 90x11 + 73x21 + 79x31 + 86x41 80(x11 + x21 + x31 + x41 ) (2.6) 90x12 + 73x22 + 79x32 + 86x42 85(x12 + x22 + x32 + x42 ). A queste espressioni si pu` anche arrivare considerando che il numero degli ottani di ciascuna miscela, per o ipotesi, dipende linearmente dalle gradazioni delle benzine componenti e quindi ` dato dalla media pesata e dei numeri di ottani delle benzine componenti, con pesi costituiti dalle quantit` di ciascun componente; a quindi il numero di ottani della jesima miscela ` dato da e 90x1j + 73x2j + 79x3j + 86x4j . x1j + x2j + x3j + x4j Questa espressione ` valida solamente se la miscela ` prodotta in quantit` non nulla, perch in questo caso e e a e il denominatore ` non nullo. Esprimendo con una disequazione la richiesta che il numero di ottani di tale e miscela sia non inferiore al rispettivo limite minimo e moltiplicando entrambi i membri della disequazione per il denominatore della frazione si ottengono i vincoli richiesti nella forma data dalle (2.6) che valgono anche nel caso di produzione nulla delle miscele. Svolgendo i calcoli nelle (2.6) si ottengono i seguenti vincoli 10x11 7x21 x31 + 6x41 0 5x12 12x22 6x32 + x42 0. Si devono inoltre esprimere vincoli di mercato, cio` e x11 + x21 + x31 + x41 25000 x12 + x22 + x32 + x42 10000 e i vincoli di non negativit` sulle variabili a xij 0, yi 0, i = 1, . . . , 4; j = 1, . . . , 3.
Quindi, la formulazione completa ` e max 90x11 + 140x21 + 160x31 + 130x41 + 260x12 + 310x22 + +330x32 + 300x42 + 20y1 + 40y2 + 60y3 + 60y4 x11 + x12 + y1 = 3500 x21 + x22 + y2 = 6000 x31 + x32 + y3 = 4500 x + x42 + y4 = 5200 41 10x11 7x21 1x31 + 6x41 0 5x12 12x22 6x32 + 1x42 0 x11 + x21 + x31 + x41 25000 x12 + x22 + x32 + x42 10000 xij 0, yi 0, i = 1, . . . , 4;
j = 1, 2.
58
2.7.3
Modelli di trasporto
Si tratta di problemi in cui si hanno un certo numero di localit` (origini) ciascuna delle quali ha una a quantit` ssata di merce disponibile e un certo numero di clienti residenti in altre localit` (destinazioni) a a i quali richiedono quantitativi precisi di merce. Quindi conoscendo il costo unitario del trasporto della merce da ciascuna localit` origine a ciascuna localit` destinazione ` necessario pianicare i trasporti, a a e cio` la quantit` di merce che deve essere trasportata da ciascuna localit` origine a ciascuna localit` e a a a destinazione in modo da soddisfare lordine dei clienti minimizzando il costo complessivo derivante dai trasporti.
Esempio introduttivo
Esempio 2.7.11 Unindustria dellacciaio dispone di due miniere M1 e M2 e di tre impianti di produzione P1 P2 P3 . Il minerale estratto deve essere giornalmente trasportato agli impianti di produzione soddisfacendo le rispettive richieste. Le miniere M1 e M2 producono giornalmente rispettivamente 130 e 200 tonnellate di minerale. Gli impianti richiedono giornalmente le seguenti quantit` (in tonnellate) di a minerale P1 80 P2 100 P3 150
Il costo (in migliaia di lire) del trasporto da ciascuna miniera a ciascun impianto di produzione ` e riportato nella seguente tabella P1 M1 M2 10 12 P2 8 20 P3 21 14
Formulare un modello che descriva il trasporto dalle miniere agli impianti di produzione in modo da minimizzare il costo globale del trasporto. Analisi del problema. ` E un problema di trasporti con 2 origini (M1 , M2 ) e 3 destinazioni (P1 P2 P3 ). Poich risulta a1 + a2 = e 130 + 200 = 330 e b1 + b2 + b3 = 80 + 100 + 150 = 330, ` soddisfatta lipotesi di ammissibilit` richiesta e a dal Teorema 2.7.14 Formulazione. Variabili. Associamo le variabili di decisione alle quantit` di minerale che deve essere trasportato; a indichiamo con xij i = 1, 2, j = 1, 2, 3, le quantit` (in tonnellate) di minerale da trasportare giornalmente a da ciascuna miniera Mi a ciascun impianto di produzione Pj . Funzione obiettivo. La funzione obiettivo da minimizzare ` data dalla somma dei costi dei trasporti e cio` da e z = 10x11 + 8x12 + 21x13 + 12x21 + 20x22 + 14x23 . Vincoli. I vincoli di origine esprimono il fatto che la somma della quantit` di minerale trasportato dalla a miniera Mi deve essere uguale alla disponibilit` giornaliera della miniera stessa: a x11 + x12 + x13 x21 + x22 + x23 = 130 = 200.
59
I vincoli di destinazione esprimono il fatto che la somma delle quantit` di minerale trasportato allimpianto a di produzione Pj deve essere pari alla richiesta giornaliera di tale impianto: x11 + x21 x12 + x22 x13 + x23 = = = 80 100 150.
Inne si devono considerare i vincoli di non negativit` xij 0, i = 1, 2, j = 1, 2, 3. a La formulazione completa ` quindi e min (10x11 + 8x12 + 21x13 + 12x21 + 20x22 + 14x23 ) x11 + x12 + x13 = 130 x21 + x22 + x23 = 200 x11 + x21 = 80 x12 + x22 = 100 x13 + x23 = 150 xij 0, i = 1, 2, j = 1, 2, 3.
Supponiamo che il costo del trasporto di una unit` di merce da Oi a Dj sia pari a cij . Tali costi nella a realt` sono spesso collegati alle distanze tra origini e destinazioni. a Il problema consiste nel pianicare i trasporti in modo da soddisfare le richieste delle destinazioni minimizzando il costo del trasporto complessivo nella seguente ipotesi: la disponibilit` complessiva uguaglia la richiesta complessiva, cio` a e
m n
ai =
i=1 j=1
bj ;
(2.7)
si escludono possibilit` di giacenze nelle origini, cio` tutta la merce prodotta in una origine deve essere a e trasportata in una delle destinazioni; si escludono possibilit` di giacenze nelle destinazioni, cio` la quantit` a e a totale che arriva in una destinazione Dj deve uguagliare la richiesta bj . Formulazione. Si vuole dare una formulazione del problema in esame in termini di un problema di programmazione lineare supponendo quindi che siano vericate le ipotesi di linearit` e continuit`. a a Variabili. Per ogni coppia di origine e destinazione Oi , Dj si introducono le variabili di decisione xij rappresentanti la quantit` di merce da trasportare da Oi , a Dj . Si tratta di mn variabili a
60
O1 . . . Oi . . . Om
Funzione obiettivo. La funzione obiettivo da minimizzare sar` data da costo totale del trasporto e a quindi da
m n
z=
i=1 j=1
cij xij .
Vincoli. Per le ipotesi fatte, si avranno due tipi di vincoli: vincoli di origine
n
xij = ai
j=1
i = 1, . . . , m;
(2.8)
impongono che tutta la merce prodotta in una origine sia trasportata alle destinazioni; si tratta di m vincoli; vincoli di destinazione
m
xij = bj
i=1
j = 1, . . . , n;
(2.9)
impongono che la quantit` totale di merce che arriva in ciascuna delle destinazioni uguaglia la a richiesta; si tratta si n vincoli. Si devono inne considerare i vincoli di non negativit` delle variabili a xij 0 i = 1, . . . , n; j = 1, . . . , m.
Si ` cos` ottenuta una formulazione del problema dei trasporti con mn variabili e m + n + mn vincoli: e m n min cij xij i=1 j=1 n xij = ai i = 1, . . . , m (2.10) j=1 m xij = bj j = 1, . . . , n i=1 xij 0 i = 1, . . . , n; j = 1, . . . , m. ` a Osservazione 2.7.12 E chiaro che per le ipotesi fatte dovr` risultare
m n n m m n
xij =
i=1 j=1 j=1 i=1
xij =
i=1
ai =
j=1
bj .
61
Osservazione 2.7.13 Sempre nellipotesi (2.7), una equazione dei vincoli di bilanciamento ` ridondante e e si pu` eliminare. Si pu` facilmente comprendere ci` esaminando direttamente un esempio particolare o o o con m = 3 ed n = 4; in questo caso i vincoli possono essere scritti x11 + x12 + x13 + x14 = a1 x21 + x22 + x23 + x24 = a2 x31 + x32 + x33 + x34 = a3 x11 + x21 + x31 = b1 x12 + x22 + x32 = b2 x13 + x23 + x33 = b3 (A) (B) (C) (D) (E) (F )
x14 + x24 + x34 = b4 . (G) ` facile osservare come sommando le equazioni (D), (E), (F ), (G) e sottranedo da questa somma la somma E delle equazioni (B) e (C) e tenendo presente che per ipotesi a1 + a2 + a3 = b1 + b2 + b3 + b4 , si ottiene lequazione (A); quindi lequazione (A) ` ridondante e pu` essere eliminata dalla formulazione. e o Ci` vale in generale e quindi gli m + n vincoli di origine e di destinazione per un generico problema di o trasporti possono essere ridotti a m + n 1 equazioni indipendenti in mn variabili; infatti analogamente al caso particolare ora analizzato si pu` considerare la formulazione generale; sommando la (2.9) per o j = 1, . . . , n si ottiene
n m n
xij =
j=1 i=1 j=1
bj
(2.11)
xij =
j=1
i=1 i=io
ai .
m
(2.12)
n
Sottraendo membro a membro la (2.11) e la (2.12) e tenendo conto che per ipotesi vale
i=1
ai =
j=1
bj si
ottiene lequazione
xio j = aio
j=1
che quindi ` ridondante. e Esaminiamo, ora, un risultato che ` una condizione necessaria e suciente anch un generico probe e lema dei trasporti scritto nella forma (2.10) con ai 0 e bj 0 abbia soluzione; tale risultato chiarisce perch nella formulazione classica del problema dei trasporti si adotta lipotesi (2.7) cio` che la disponie e bilit` complessiva uguagli la richiesta complessiva. a
Teorema 2.7.14 Condizione necessaria e suciente anch il problema (2.10) ammetta soluzione, e cio` che esista una soluzione ammissibile, ` che risulti e e
m n
ai =
i=1 j=1
bj .
(2.13)
62
Dim.: Dimostriamo innanzitutto la necessit`, cio` che se esiste una soluzione ammissibile xij allora la a e condizione (2.13) deve essere vericata; poich xij deve soddisfare i vincoli, dalle equazioni dei vincoli e nella (2.10) si ottiene
m n m
xij =
i=1 j=1 n m i=1 n
ai
xij =
j=1 i=1 j=1 n
bi ,
ai
i=1 j=1
bj = 0
che ` la (2.13). e Dimostriamo ora la sucienza; supponiamo quindi che valga la (2.13) e poniamo
m n
ai =
i=1 j=1
bj = A.
ai bj Si vuole allora dimostrare che esiste una soluzione ammissibile; infatti, sia xij := ; allora xij ora A denito ` una soluzione ammissibile per il problema dei trasporti. Infatti risulta innanzitutto xij 0 per e ogni i = 1, . . . , m e j = 1, . . . , n per la non negativit` degli ai e dei bj ; inoltre a
n n
xij =
j=1 m j=1 m
ai ai bj = A bj ai bj = A
n j=1 bj
A
m i=1
= ai
xij =
i=1 i=1
ai
= bj
e quindi xij soddisfando i vincoli del problema ` una soluzione ammissibile. e Il teorema appena dimostrato garantisce quindi che, se ` soddisfatta lipotesi (2.7) allora il problema dei e trasporti ammette sempre soluzione. Osservazione 2.7.15 La soluzione ammissibile del teorema, ovviamente, non ` lunica soluzione del e problema. Riportiamo di seguito, senza dimostrazione, un altro risultato di fondamentale importanza nella trattazione del problema dei trasporti.
Teorema 2.7.16 Se nel problema dei trasporti le ai , i = 1, . . . , m e le bj , j = 1, . . . , n sono intere e se il problema ammette soluzione ottima, allora ha una soluzione ottima intera.
63
Passiamo, ora, ad analizzare alcune varianti della formulazione classica del problema dei trasporti; pu` infatti accadere che non tutte le rotte di trasporto siano disponibli: se non ` possibile il trasporto da o e una certa origine Oi ad una destinazione Dj si pone, per convenzione, cij = . Oppure possono esistere rotte di trasporto in cui vi sono limitazioni sulle quantit` massima di merci trasportabili. a Inne, si pu` supporre che la disponibilit` complessiva possa essere superiore alla domanda cio` o a e
m n
ai
i=1 j=1
bj .
(2.14)
In tal caso, possono essere ammesse giacenze nelle origini e/o nelle destinazioni; se si accetta di avere giacenze nelle origini, allora i vincoli di origine diventano
n
xij ai
j=1
i = 1, . . . , m;
xij bj
i=1
j = 1, . . . , n.
nel caso in cui vale la (2.14), per porre il problema dei trasporti nella sua formulazione classica, cio` con e vincoli di uguaglianza, si pu` introdurre una destinazione ttizia che abbia una richiesta pari a o
m n
ai
i=1 j=1
bj
ponendo uguale a zero il costo per raggiungere questa destinazione ttizia da qualsiasi origine.
Nella seguente tabella si riportano i costi (in migliaia di lire) necessari per trasportare un quintale di preparato chimico da ciascun magazzino a ciascun centro di distribuzione. M1 M2 D1 33 27 D2 31 30 D3 36 28 D4 30 31
Limpianto di produzione I1 pu` fabbricare al pi 3000 quintali di preparato, limpianto I2 pu` fabbrio u o care al pi 2000 quintali di preparato. I prezzi di vendita allingrosso eettuati presso i magazzini M1 e u
64
M2 sono rispettivamente di Lit. 150000 e 170000 al quintale. Per ragioni commerciali i quantitativi di preparato chimico venduti allingrosso in ciascun magazzino devono essere pari ad almeno 500 quintali ed inoltre tutto il preparato contenuto nei magazzini dovr` essere o venduto o trasportato ai centri di a distribuzione per non avere rimanenze non vendute. Costruire un modello lineare che permetta di determinare le quantit` di preparato chimico che devono essere prodotte in ciascun impianto e come esse a devono essere ripartite tra i magazzini e i centri di distribuzione in modo da massimizzare il protto netto complessivo.
Formulazione. Si tratta di un problema di pianicazione industriale che unisce ad un problema di trasporti dagli impianti di produzione ai magazzini e dai magazzini ai centri di distribuzione, un problema di allocazione ottima di risorse. Variabili. Si introducono le variabili xij , i, j = 1, 2 per rappresntare la quantit` (in quintali) di preparato a chimico da produrre e quindi da trasportare dallimpianto Ii al magazzino Mj. Inoltre si introducono le variabili ykh , k = 1, 2, h = 1, 2, 3, 4, per rappresentare la quantit` (in quintali) di preparato chimico da a trasportare dal magazzino Mk al centro di distribuzione Dh. Inne si devono introdurre due variabili z1 , z2 per rappresentare la quantit` (in quintali) di preparato chimico venduto allingrosso rispettivamente a nel magazzino M1 e M2. ` Funzione obiettivo. E data dal protto netto, quindi dalla dierenza tra ricavo ottenuto dalla vendita (presso i centri di distribuzione e allingrosso presso i magazzini) e le spesa complessiva dei trasporti. Il ricavo ` dato da e 350(y11 + y21 ) + 280(y12 + y22 ) + 200(y13 + y23 ) + 270(y14 + y24 ) + 150z1 + 170z2 mentre la spesa complessiva dei trasporti (dagli impianti ai magazzini e dai magazzini ai centri di distribuzione) ` data e 21x11 + 25x12 + 27x21 + 22x22 + 33y11 + 31y12 + 36y13 + 30y14 + 27y21 + 30y22 + 28y23 + 31y24 . La funzione obiettivo sar` quindi data dalla dierenza di queste due espressioni. a Vincoli. Si hanno i seguenti vincoli vincoli dovuti alla capacit` massima produttiva dei due impianti a x11 + x12 x21 + x22 3000 2000
vincoli dovuti alle richieste dei centri di distribuzione y11 + y21 y12 + y22 y13 + y23 y14 + y24 150 190 220 170
vincoli derivanti dal quantitativo minimo di preparato che deve essere venduto allingrosso nei magazzini z1 500, z2 500
65
vincoli dovuti al fatto che tutto il preparato contenuto nei magazzini dovr` essere o venduto a allingrosso oppure trasportato ai centri di distribuzione in modo da non avere rimanenze non vendute; questi vincoli si esprimono imponendo che in ciascun magazzino la quantit` di preparato a chimico che arriva trasportato dagli impianti sia uguale alla somma del quantitativo di preparato trasportato dal magazzino ai centri di distribuzione e del quantitativo di preparato venduto allingrosso direttamente nel magazzino. Si hanno quindi i vincoli x11 + x21 x12 + x22 = = y11 + y12 + y13 + y14 + z1 y21 + y22 + y23 + y24 + z2
Quindi la formulazione completa sar` a max 350(y11 + y21 ) + 280(y12 + y22 ) + 200(y13 + y23 ) + 270(y14 + y24 ) + 150z1 + 170z2 + (21x11 + 25x12 + 27x21 + 22x22 + 33y11 + 31y12 + 36y13 + 30y14 + 27y21 + 30y22 + 28y23 + 31y24 ) x11 + x12 3000 x21 + x22 2000 y11 + y21 150 y12 + y22 190 y + y23 220 13 y14 + y24 170 x11 + x21 = y11 + y12 + y13 + y14 + z1 x12 + x22 = y21 + y22 + y23 + y24 + z2 z1 500 z2 500 xij 0, i, j = 1, 2, ykh 0, k = 1, 2, h = 1, 2, 3, 4 I vincoli di non negativit` delle variabili zi sono ovviamente implicati dai vincoli z1 , z2 500. a
66
Capitolo 3
3.1
Un modo di introdurre il problema duale pu` essere quello di far riferimento alla possibilit` di determinare o a delle stime inferiori del valore ottimo della funzione obiettivo di un problema di Programmazione Matematica (in forma di problema di minimizzazione). In particolare, dato un problema di Programmazione Lineare min cT x (3.1) Ax b (dove c IRn , x IRn , A IRmn e b IRm ) se si dispone di un punto ammissibile x pu` risultare o molto interessante capire se esso rappresenta una buona stima di un punto di ottimo senza risolvere il problema esattamente. Infatti se si conoscesse una buona stima del valore ottimo potremmo capire la bont` del punto x confrontando il valore cT x con la stima . a A questo scopo, sia x una soluzione ottima del problema (3.1); allora per ogni u IRm , u 0, poich Ax b risulta e cT x
1
Questo capitolo ` tratto da: Stefano Lucidi, Massimo Roma, Lezioni di Ricerca Operativa, Universit` di e a Roma La Sapienza, Corso di Laurea in Ingegneria Informatica, A.A.2000-2001.
67
Se si restringe ulteriormente la scelta del vettore u si pu` eliminare la prresenza di x dal membro di o destra della (3.2). Infatti, per ogni u IRn , u 0, tale che AT u = c, la (3.2) si riduce a bT u e quindi risulta cT x bT u. (3.3)
Per rendere quanto pi` possible stringente la stima della limitazione inferiore del valore ottimo della u funzione obiettivo cT x si pu` rendere quanto pi` possibile grande il termine di destra della disuguaglianza o u (3.3), cio` si pu` massimizzare la quantit` bT u al variare del vettore u IRn , tra tutti i vettori che e o a soddisfano AT u = c, u 0. Pi formalmente si ha u cT x bT u dove u ` soluzione del problema e max bT u AT u = c u0 (3.4)
Questo problema viene denito problema duale del problema dato (3.1) che viene denominato problema primale. La possibilit` di denire un problema duale non ` legato al fatto che il problema dato abbia solo a e vincoli di diseguaglianza e variabili non vincolate in segno come ` il problema (3.1). Infatti, si consideri e un problema Programmazione Lineare scritto nella forma pi` generale possibile cio` nella forma u e T T min c x + d y Cx + Dy = h (P) Ex + F y g x0 con x IRp , c IRp , y IRnp , d IRnp ; C matrice q p, D matrice q (n p) e h IRq ; E matrice (mq)p, F matrice (mq)(np) e g IRmq . La notazione in cui ` scritto questo generico problema e di Programmazione Lineare (P) ` tale da evidenziare separatamente gli elementi che intervengono nella e formulazione: le variabili sono partizionate nella variabili x vincolate in segno e y non vincolate in segno e corrispondentemente anche i coecienti di costo della funzione obiettivo sono partizionati in c e d; i vincoli sono scritti suddividendo quelli di uguaglianza e quelli di disuguaglianza (nella forma di maggiore o uguale). Per costruire il problema duale del problema (P) ` suciente ripetere i ragionamenti fatti in relazione e al problema (3.1) dopo aver trasformato il problema (P) in un problema equivalente con soli vincoli di disuguaglianza cio` nella forma (3.1). A tale scopo riscriviamo il problema (P) nella forma equivalente e min cT x + dT y Cx + Dy h Cx Dy h Ex + F y g Ip x 0 dove Ip ` la matrice identit` di ordine p. I vincoli di questo problema possono essere scritti in forma e a matriciale C D h D x C h , E F y g Ip 0 0
68
quindi il problema (P) ` stato ricondotto nella forma (3.1). Siamo quindi in grado di scrivere il duale di e questo problema nella forma (3.4) cio`: e T T T max h t h w + g v T T T C t C w + E v + Ip z = c DT t DT w + F T v = d t 0, w 0, v 0, z 0 T T max h (t w) + g v T T C (t w) + E v + Ip z = c DT (t w) + F T v = d t 0, w 0, v 0, z 0.
che ` equivalente a e
Eliminando la variabile z ed eettuando il cambio di variabili t w = u si ottiene il seguente problema nelle variabili (u, v), con u non vincolata in segno e v 0: T T max h u + g v T T C u+E v c (D) DT u + F T v = d v0 con u IRq e v IRmq . Il problema (D) ` il problema duale del problema (P) che viene detto problema primale. Le variabili (x, y) e sono dette variabili primali; le variabili (u, v) sono dette variabili duali. I due problemi (P) e (D) vengono chiamati coppia primaleduale. In maniera del tutto simmetrica, il problema (P) risulter` il problema a duale del problema (D). Dallosservazione dei due problemi (P) e (D) si deducono facilmente le propriet` fondamentali di una a coppia primaleduale; innanzitutto un problema ` di minimizzazione mentre laltro ` di massimizzazione. e e Inoltre poich la matrice dei coecienti dei vincoli di un problema si ottiene trasponendo quella dellaltro, e si ha che ad ogni variabile di un problema corrisponde un vincolo nellaltro. Si osserva inoltre uno scambio tra i termini noti di un problema e i coecienti della funzione obiettivo dellaltro. Queste propriet` possono essere cos` schematicamente riassunte: a e il problema duale di un problema di minimizzazione ` un problema di massimizzazione e simmetricamente, il problema duale di un problema di massimizzazione ` un problema di minimizzazione; e ad ogni vincolo di uguaglianza del problema primale ` associata una variabile nel problema duale e non vincolata in segno che ha come coeciente nella funzione obiettivo duale il termine noto del vincolo primale associato; e ad ogni vincolo di disuguaglianza (di maggiore o uguale) del problema primale ` associata una variabile nel problema duale vincolata in segno che ha come coeciente nella funzione obiettivo duale il termine noto del vincolo primale associato; ad ogni variabile vincolata in segno del problema primale ` associato un vincolo di disuguaglianza e (di minore o uguale) del problema duale il cui termine noto ` dato dal coeciente della funzione e obiettivo primale; ad ogni variabile non vincolata in segno del problema primale ` associato un vincolo di uguaglianza e del problema duale il cui termine noto ` dato dal coeciente della funzione obiettivo primale. e Queste corrispondenze possono essere riassunte nella tabella che segue dove gli insieme I, J, M e N sono insiemi di indici:
69
PRIMALE min cT x
DUALE max bT u
Un importante caso di coppia primaleduale ` ottenuto considerando nel problema primale solamente i e vincoli di disuguaglianza e solamente variabili vincolate in segno. In questo caso si ottiene la seguente coppia di problemi: max bT u min cT x (D) (P) AT u c Ax b u0 x0 con x IRn , c IRn , b IRm , u IRm e A IRmn . Tale coppia di problemi viene detta coppia primale duale simmetrica. A tale coppia particolare primaleduale si far` spesso riferimento nel seguito anche a in relazione a considerazioni riguardanti linterpretazione della dualit` per problemi di Programmazione a Lineare che sono formulazioni di importanti classi di modelli lineari. Seguono ora alcuni esempi di costruzione del problema duale di un problema di Programmazione Lineare assegnato. Esempio 3.1.1 Si consideri il seguente problema di Programmazione Lineare min 2x1 + 3x2 + 4x3 + x4 x1 5x3 + 2x4 7 2x1 + 4x2 6x3 9. Il problema duale associato ` e max 7u1 + 9u2 u1 + 2u2 = 2 4u2 = 3 5u1 6u2 = 4 2u1 = 1 u1 0, u2 0.
Esempio 3.1.2 Si consideri il seguente problema di Programmazione Lineare max 4x1 + 3x2 + 2x3 x1 + 2x2 + 3x3 8 2x1 x3 7 3x1 + 4x2 x3 5 x2 + x3 6 x2 0
70
Il problema duale ` il seguente problema di minimizzazione e min 8u1 + 7u2 + 5u3 + 6u4 u1 + 2u2 + 3u3 = 4 2u1 + 4u3 + u4 3 3u1 u2 u3 + u4 = 2 u1 0, u2 0, u3 0, u4 0. Esempio 3.1.3 Si consideri il seguente problema di Programmazione Lineare min 2x1 3x2 + x3 3x1 + x2 + 5x3 7 x1 + x2 6x3 9 4x1 x2 2x3 = 8 x1 0, x2 0. Dopo aver riscritto il secondo vincolo come x1 x2 + 6x3 9 si pu` formulare facilmente il problema o duale associato max 7u1 9u2 + 8u3 3u1 u2 + 4u3 2 u1 u2 u3 3 5u1 + 6u2 2u3 = 1 u1 0, u2 0
3.1.1
Una coppia primaleduale di problemi di Programmazione Lineare gode di propriet` importanti sia dal a punto di vista teorico sia da quello pratico. I risultati che verrano di seguito analizzati valgono per una generica coppia primaleduale, ma per brevit` e semplicit` di notazioni essi sono enunciati e dimostrati a a facendo riferimento alla coppia primale duale simmetrica max bT u min cT x (3.5) (D) (P) AT u c Ax b u0 x0 con x IRn , c IRn , b IRm , u IRm e A IRmn . Il primo risultato che si vuole analizzare discende in maniera naturale dal modo in cui ` stato ine trodotto il problema duale.
` Teorema 3.1.4 Teorema della Dualita debole Per ogni soluzione ammissibile x del problema primale (P) ed ogni soluzione ammissibile u del problema duale (D) si ha bT u cT x cio` il valore della funzione obiettivo duale in u ` minore o uguale del valore della fuzione obiettivo e e primale in x.
71
Dim.: Poich x ` soluzione ammissibile per il problema primale (P), deve risultare A b; tale e e x disuguaglianza pu` essere riscritta nella forma xT AT bT . Eettuando il prodotto scalare di entrambi i o membri di questa disuguaglianza per u (che ` non negativo perch u ` ammissibile per il problema duale) e ee si ottiene xT AT u bT u. (3.6) In modo del tutto analogo, poich u ` soluzione ammissibile per il problema duale (D), deve risultare e e AT u c che pu` essere riscritta nella forma uT A cT . Eettuando il prodotto scalare di entrambi o i membri di questa disuguaglianza per x (che ` non negativo perch u ` ammissibile per il problema e e e primale) si ottiene uT A cT x. x (3.7) Dalla (3.6) e dalla (3.7) si ottiene bT u xT AT u = uT A cT u x che ` quanto si voleva dimostrare. e Da questo importante teorema discendono due conseguenze immediate che sono riportate nei corollari che seguono.
Corollario 3.1.5 Se x ` una soluzione ammissibile del problema primale (P) e u una soluzione e ammissibile del problema duale (D) tali che cT x = bT u (3.8)
allora x e u sono soluzioni ottime rispettivamente per il problema primale (P) e per il problema duale (D).
Dim.: La dimostrazione procede per assurdo. Infatti, supponiamo per assurdo che u non sia soluzione ottima del problema duale (D). Questo signica che esiste una soluzione ammissibile del problema duale (D) che indichiamo con u tale che bT u > bT u. Per la (3.8) si avrebbe bT u > bT u = cT x
contraddicendo il Teorema 3.1.4 (Teorema della Dualit` debole). a Simmetricamente, si ottiene una contraddizione supponendo che x non sia soluzione ottima del problema primale (P).
Corollario 3.1.6 Se il problema primale (P) ` illimitato (inferiormente) allora il problema duale e (D) ` inammissibile. Viceversa, se il problema duale ` illimitato (superiormente) allora il problema e e primale ` inammissibile. e
72
Dim.: Supponiamo che il problema primale (P) sia illimitato e che, per assurdo, il problema duale (D) non sia inammissibile, cio` che esista una soluzione ammissibile u del problema duale (D). Per il e Teorema 3.1.4 (Teorema della Dualit` debole), per ogni soluzione ammissibile x del problema primale a (P) deve valere bT u cT x (3.9) e, poich si ` supposto che il problema primale (P) ` illimitato inferiormente, con la (3.9) si ottiene una e e e contraddizione al fatto che u ` una soluzione ammissibile del problema duale (D). In modo del tutto e simmetrico si dimostra il viceversa. Oltre alle propriet` no ad ora esaminate, nel caso di problemi di Programmazione Lineare ` vera a e anche unaltra propriet` che ` solitamente chiamata dualit` forte che fornisce una caratterizzazione ima e a portante nel caso in cui esista soluzione ottima di uno dei due problemi della coppia primale duale. Questa propriet` ` descritta nel seguente teorema che si riporta senza dimostrazione in quanto la dimostrazione ae richiederebbe la conoscenza di ulteriori risultati preliminari la cui trattazione esula dallo scopo di queste note.
` Teorema 3.1.7 Teorema della Dualita Forte Se il problema primale (P) ammette una soluzione ottima x allora anche il problema duale (D) ammette una soluzione ottima u . Simmetricamente, se il problema duale (D) ammette una soluzione ottima u allora anche il problema primale (P) ammette una soluzione ottima x . Inoltre i valori delle funzioni obiettivo dei due problemi allottimo sono uguali cio` risulta e cT x = bT u .
Siamo ora in grado di formulare delle condizioni di ottimalit` in riferimento alla coppia primaleduale a simmetrica; esse costituiscono una caratterizzazione analitica delle soluzioni ottime del problema primale e del problema duale; enunciamo queste condizioni nel seguente teorema che discende immediatamente dai risultati gi` ottenuti: a
` Teorema 3.1.8 Condizioni di Ottimalita Siano dati x IRn e u IRm . Allora x e u sono soluzioni ottime rispettivamente per il problema primale (P) e per il problema duale (D) se e solo se valgono le seguenti condizioni (i) A b, x 0 x (ii) A u c, u 0 (iii) cT x = bT u.
T
(ammissibilit` primale) a (ammissibilit` duale) a (coincidenza dei valori delle funzioni obiettivo)
Sulla base dei risultati no ad ora esaminati si evince che data un coppia primaleduale di problemi di Programmazione Lineare possono vericarsi le seguenti situazioni: o entrambi ammettono soluzione
73
ottima, oppure se uno ` illimitato laltro ` inammissibile, oppure sono entrambi inammissibili. Queste e e possibilit` sono riportate schematicamente nella tabella che segue. a
DUALE
ottimo finito
illimitato superior.
inammissibile
ottimo finito
SI
NO
NO
PRIMALE
illimitato inferior.
NO
NO
SI
inammissibile
NO
SI
SI
Ribadiamo che tutti i risultati ottenuti nel caso di una coppia primaleduale simmetrica (3.5) si estendono facilmente ad una qualsiasi coppia primaleduale. Seguono alcuni esempi che illustrano i risultati teorici ora esaminati. Esempio 3.1.9 Si consideri il problema di Programmazione Lineare min x1 + 3x2 x1 + 4x2 24 5x1 + x2 25 x1 0, x2 0 Geometricamente si ricava facilmente che questo problema ammette soluzione ottima nel punto (x1 , x2 ) = (4, 5) e il valore ottimo della funzione obiettivo ` pari a 19. Se si considera il problema duale e max 24u1 + 25u2 u1 + 5u2 1 4u1 + u2 3 u1 0, u2 0; si ricava facilmente (geometricamente) che, in accordo con quanto previsto dal Teorema della Dualit` a 14 1 Forte, anche questo problema ammette soluzione ottima nel punto (u1 , u2 ) = , e il valore 19 19 ottimo della funzione obiettivo vale 19. Esempio 3.1.10 Si consideri il problema di Programmazione Lineare max 2x1 + 3x2 2x1 + x2 3 1 x1 + x2 6 2 x1 0, x2 0;
74
Geometricamente si ricava che il problema ` illimitato superiormente. Quindi, per lanalisi teorica vista e deve risultare che il suo duale ` inammissibile. E infatti se si considera il problema duale associato e min 3u1 + 6u2 2u1 1 u2 2 2 u1 + u2 3 u1 0, u2 0 si vede facilmente che questo problema non ammette soluzioni ammissibili. Esercizio 3.1.11 Risolvere gracamente i problemi di Programmazione Lineare proposti nellEsempio 3.1.9 e nellEsempio 3.1.10 e vericare le conclusioni tratte negli esempi.
3.1.2
Condizioni di complementarit` a
Unulteriore propriet` della coppia primaleduale ` la cosidetta complementariet`. Tale propriet` ` di a e a a e fondamentale importanza anche negli sviluppi algoritmici in quanto ` alla base dei cosiddetti metodi e primali duali per soluzione dei problemi di Programmazione Lineare. Anche in questo caso si far` riferimento alla coppia primaleduale simmetrica a max bT u min cT x (D) (P) AT u c Ax b u0 x0 con x IRn , c IRn , b IRm , u IRm e A IRmn , ma tutti i risultati sono validi nel caso di una qualsiasi coppia primaleduale. In particolare, riportiamo di seguito un teorema fondamentale che caratterizza ulteriormente le soluzioni ottime di una coppia primaleduale di problemi di Programmazione Lineare.
Teorema 3.1.12 Sia x un punto ammissibile del problema primale (P) e sia u un punto ammissibile del problema duale (D). Allora x e u sono soluzioni ottime rispettivamente del problema primale (P) e del problema duale (D) se e solo se soddisfano le seguenti condizioni: uT (Ax b) = 0 T x (c AT u) = 0. (3.10) (3.11)
Dim.: Iniziamo supponendo che x e u sono soluzioni ammissibili rispettivamente per il problema pri male (P) e per il problema duale (D) e che valgano le (3.10) e (3.11), e mostrando che allora x e u sono soluzioni ottime rispettivamente del problema primale (P) e del problema duale (D). Infatti se valgono le (3.10) e (3.11) allora dalla (3.10) si ha uT A = uT b e dalla (3.11) si ha xT c = xT AT u da cui x bT u = uT b = uT A = xT AT u = xT c = cT x. x Quindi risulta bT u = cT x e dal Teorema 3.1.8 si ha che x e u sono soluzioni ottime rispettivamente del problema primale (P) e del problema duale (D). Supponiamo ora che x e u siano soluzioni ottime rispettivamente del problema primale (P) e del problema duale (D) e dimostriamo allora che devono valere le condizioni (3.10) e (3.11). Se x e u sono
75
soluzioni ottime per i rispettivi problemi, dal Teorema 3.1.8 si ha che deve valere cT x = bT u. Ora, poich e x e u sono ammissibili rispettivamente per il problema (P) e per il problema (D) si ha A b, x AT u c, x0 u 0. (3.12) (3.13)
Eettuando il prodotto scalare di entrambi i membri della (3.12) per u e di entrambi i membri della (3.13) per x si ha uT A uT b x T T x A u xT c. Da queste due disuguaglianze segue che uT b uT A = xT AT u xT c x e poich stiamo supponendo cT x = bT u allora la (3.14) diventa e uT b = uT A = xT AT u = xT c x dalla quale discende immediatamente uT (Ax b) = xT (c AT ) = che sono le condizioni (3.10) e (3.11). Le condizioni (3.10) e (3.11) vengono chiamate condizioni di complementarit` e costituiscono, di fatto, a delle condizioni di ottimalit` per i problemi della coppia primaleduale. a Dal precedente risultato seguono facilmente i seguenti corollari. 0 0 (3.14)
Corollario 3.1.13 Sia x un punto ammissibile del problema primale (P) e sia u un punto ammissi bile del problema duale (D). Allora x e u sono soluzioni ottime rispettivamente del problema primale (P) e del problema duale (D) se e solo se soddisfano le seguenti condizioni: uj (AT x b)j xi (c AT u)i i = 1, . . . , n, j = 1, . . . , m. = = 0 0. (3.15) (3.16)
Dim.: scalari
Per il Teorema 3.1.12 x e u sono soluzioni ottime dei rispettivi problemi se e solo se i prodotti uT (A b) x T x (c AT u)
sono nulli. Ora, poich per lammissibilit` primale risulta A b 0 e x 0 e per lammissibilit` duale e a x a risulta c AT u 0 e u 0, si ha che anch ciascuno dei prodotti scalari risulti nullo, ogni termine dei e due prodotti deve essere nullo e quindi il corollario ` dimostrato. e
76
Il Corollario (3.1.13) pu` essere formulato in maniera del tutto equivalente nella seguente forma: o
Corollario 3.1.14 Sia x un punto ammissibile del problema primale (P) e sia u un punto ammissi bile del problema duale (D). Allora x e u sono soluzioni ottime rispettivamente del problema primale (P) e del problema duale (D) se e solo se soddisfano le seguenti propriet`: a (i) per ogni variabile del problema (P) che assume valore non nullo il corrispondente vincolo del problema duale (D) deve essere soddisfatto alluguaglianza; (ii) per ogni variabile del problema (D) che assume valore non nullo il corrispondente vincolo del problema primale (P) ` soddisfatto alluguaglianza. e
Il Teorema 3.1.12 e i successivi corollari forniscono delle condizioni di ottimalit` per i problemi Proa grammazione Lineare; essi infatti forniscono delle condizioni necessarie e sucienti che caratterizzano analiticamente la soluzione ottima di un problema di Programmazione Lineare. Per completezza riportiamo queste condizioni (gi` dimostrate) formalizzate nel seguente teorema. a
` Teorema 3.1.15 Condizioni di Ottimalita Due punti x IRn e u IRm sono soluzioni ottime rispettivamente del problema (P) e (D) se e solo se valgono le seguenti condizioni: (i) A b, x 0 x (ii) AT u c, u 0 (iii) u (A b) = 0 x (iv) xT (c AT u) = 0.
T
Ribadiamo che tutti i risultati no ad ora enunciati e dimostrati nel caso di una coppia primaleduale simmetrica, valgono in generale per ogni coppia primaleduale. Osservazione 3.1.16 Si osservi che in relazione alla coppia primaleduale min cT x Ax b le condizioni di complementarit` si riducono alla sola condizione a uT (Ax b) = 0, mentre per una coppia primaleduale min cT x Ax = b x0 max bT u AT u = c
max bT u AT u c
77
Seguono alcuni esempi di applicazione della complementarit`. a Esempio 3.1.17 Si consideri il problema di Programmazione Lineare min 3x1 + 2x2 + x3 + 4x4 . x1 3x3 + 2x4 5 2x1 + x2 x3 3 Il problema duale associato ` e max 5u1 + 3u2 u1 + 2u2 = 3 u2 = 2 3u1 u2 = 1 2u1 = 4 u1 0, u2 0
Poich il duale ha solo vincoli di uguaglianza, le condizioni di complementarit` si riducono a e a uT (Ax b) = 0 che in questo caso sono u1 (x1 3x3 + 2x4 5) = 0 u2 (2x1 + x2 x3 3) = 0. Esempio 3.1.18 Dato il problema di programmazione lineare min 2x1 + 3x2 + x3 + x4 x1 + x2 + x3 = 2 2x1 + 3x4 = 1 x1 0, x2 0, x3 0, x4 0
(3.17)
si consideri il punto x = (0, 0, 2, 1/3) soluzione ammissibile per il problema (3.17) e il punto u = (1, 1/3) soluzione ammissibile per il problema duale associato a (3.17). Attraverso le condizioni di complementarit` si vuole vericare se x ` una soluzione ottima del problema del problema (3.17). Innanzitutto a e scriviamo il problema duale del problema dato; esso ` e max 2u1 + u2 u1 + 2u2 2 u1 3 u1 1 3u2 1. Poich il problema (3.17) presenta solo vincoli di uguaglianza, le condizioni di complementarit` si riducono e a a xT (c AT u) = 0 che in questo caso sono x1 (2 u1 2y2 ) = 0 x2 (3 u1 ) = 0 x3 (1 u1 ) = 0 x4 (1 3u2 ) = 0 Sostituendo i valori delle soluzioni ammissibili x, u rispettivamente per il primale ed il duale, le condizioni di complementarit` risultano vericate. Quindi la soluzione x ` eettivamente ottima per il primale e u a e ` ottima per il duale. e
78
Esempio 3.1.19 Si consideri il problema di Programmazione Lineare min c1 x1 + c2 x2 + c3 x3 x1 + 2x2 + 2x3 2 x1 + 4x2 + 2x3 3 x1 0, x2 0, x3 0 con c1 IR, c2 IR, c3 IR. Utilizzando la teoria della dualit`, si vuole stabilire se esistono valori (non a tutti nulli) di c1 , c2 , c3 tali che il punto x = (0, 0, 1/2)T sia una soluzione ottima del problema. Innanzitutto scriviamo il problema duale associato che ` e max 2u1 3u3 u1 u2 c1 2u1 4u2 c2 2u1 2u2 c3 u1 0, u2 0. e le condizioni di complementarit` a u1 (2 + x1 + 2x2 + 2x3 ) = 0 u2 (3 + x1 + 4x2 + 2x3 ) = 0 x1 (c1 + u1 + u2 ) = 0 x2 (c2 + 2u1 + 4u2 ) = 0 x3 (c3 + 2u1 + 2u2 ) = 0 Sostituendo il punto x anch siano soddisfatte tutte le equazioni deve essere e u1 = 0, u2 = 0, 1 (c3 + 21 + 22 ) = 0 u u 2
e quindi c3 = 0 (dove u ` soluzione ottima del problema duale). Quindi le condizioni di complementarit` e a sono soddisfatte per qualuque c1 e c2 e c3 = 0. Quindi il punto dato x ` soluzione ottima del problema e per qualsiasi valore di c1 e c2 e c3 = 0.
3.2
Nei modelli reali le variabili (primali) possono rappresentare, ad esempio, livelli di produzione e i coecienti di costo possono essere associati ai protti ricavati dalla vendita dei prodotti. Quindi la funzione obiettivo di un problema primale indica direttamente come un aumento della produzione pu` inuenzare o il protto. Sempre in relazione, ad esempio, ad un modello per la piancazione della produzione, i vincoli di un problema (primale) possono rappresentare una limitazione dovuta alla limitata disponibilit` delle a risorse; ora, un aumento della disponibilit` delle risorse pu` consentire un aumento della produzione e a o quindi anche del protto, ma questa relazione tra aumento della disponibilit` delle risorse e aumento del a protto non si deduce facilmente dal problema formulato (il problema primale). Uno dei possibili usi della dualit` ` quello di rendere esplicito leetto dei cambiamenti nei vincoli (ad esempio in quelli di a e disponibilit` di risorse) sul valore della funzione obiettivo. Questo perch, come vedremo, le variabili duali a e possono essere anche interpretate come i cosiddetti prezzi ombra in quanto misurano i costi impliciti associati ai vincoli.
3.2.1
Per introdurre il concetto delle variabili duali come prezzi ombra facciamo riferimento ad un semplice esempio di modello di pianicazione della produzione che brevemente descriviamo.
79
Esempio 3.2.1 Unindustria produce due tipi di prodotti: un tipo de luxe e un tipo standard. Per avere un prodotto nito di ciascuno dei due tipi sono necessari due ingredienti grezzi I1 e I2 e la lavorazione su una macchina. La tabella che segue riporta le quantit` in Kg di ciascuno degli ingredienti e le ore di a lavorazione sulla macchina necessarie per ottenere un prodotto nito di ciascuno dei due tipi. I1 I2 ore lavoraz. de luxe 3 4 2 standard 2 1 1
Settimanalmente si hanno a disposizione al pi 1200 Kg dellingrediente I1 e al pi 1000 Kg dellingrediente u u I2 mentre la disponibilit` massima settimanale di ore lavorative della macchina ` pari a 700. Un prodotto a e de luxe ` venduto a 24 Euro e un prodotto standard ` venduto a 14 Euro. Si vuole pianicare la produzione e e settimanale in modo da massimizzare il protto complessivo assumendo che i prodotti siano frazionabili. Si tratta di un problema di allocazione ottima di risorse limitate che pu` essere formulato come problema o di Programmazione Lineare nel seguente modo: max 24x1 + 14x2 3x1 + 2x2 1200 4x1 + x2 1000 2x1 + x2 700 x1 0, x2 0 dove le variabili x1 e x2 rappresentano le quantit` di prodotti ripettivamente del tipo de luxe e del tipo a standard da fabbricare settimanalmente. Consideriamo, ora, il problema duale del problema ora formulato; esso ` e min 1200u1 + 1000u2 + 700u3 3u1 + 4u2 + 2u3 24 2u1 + u2 + u3 14 u1 0, u2 0, u3 0. La soluzione ottima del primale ` e x1 = 160, La soluzione ottima del duale ` e u1 = 6.4, u2 = 1.2, u3 = 0 x2 = 360 e il valore ottimo della funzione obiettivo primale ` pari a 8880. e
e il valore ottimo della funzione obiettivo duale ` pari a 8880. (Si veda lEsercitazione di Laboratorio e n. 4) Quindi il Teorema della Dualit` Forte ` vericato. a e Scriviamo, ora, le condizioni di complementarit`: a x1 (3u1 + 4u2 2u3 24) = x2 (2u1 + u2 + u3 14) = u1 (1200 3x1 2x2 ) = u2 (1000 4x1 x2 ) = u3 (700 2x1 x2 ) = 0 0 0 0 0
Si verica immediatamente che tali condizioni sono soddisfatte. Si osservi che tutte le equazioni tranne lultima sono vericate in quanto si annulla il secondo dei due fattori moltiplicativi. Questo signica,
80
in particolare, che il primo e il secondo vincolo del problema primale sono attivi nella soluzione ottima, cio` vericati alluguaglianza. Lultima equazione invece ` vericata per il fatto che ` nulla allottimo la e e e variabile duale u3 mentre il vincolo corrispondente primale (cio` il terzo vincolo del problema primale) e non ` vericato alluguaglianza. Infatti in corrispondenza della soluzione ottima il valore ottenuto ` e e 2x1 + x2 = 680. Poich la disponibilit` di ore lavorative ` pari a 700 ore, si hanno ancora 20 ore e a e disponibili (surplus). Quindi lindustria, per aumentare il protto, potrebbe acquistare altre quantit` a di ingredienti grezzi e quindi aumentare la disponibilit` settimanale di questi ingredienti e utilizzare le a ore di lavorazione ancora rimaste disponibili. Poich i valori allottimo della funzione obiettivo primale e e della funzione obiettivo duale coincidono e poich la funzione obiettivo duale ` e e 1200u1 + 1000u2 + 700u3 , essendo u1 = 6.4, u2 = 1.2, u3 = 0, laumento di 1 Kg della disponibilit` di ingrediente I1 (da 1200 a a 1201 Kg) porta ad un incremento di 6.4 Euro nel protto complessivo. Analogamente per lingrediente I2 : un incremento di 1 Kg (da 1000 a 1001 Kg) porta ad un incremento del protto complessivo di 1.2 Euro. Questo ` il motivo per cui le variabili duali sono anche chiamate prezzi ombra e determinano il valore e a marginale delle risorse. Ovviamente il fatto che u3 = 0 signica che laumento della disponibilit` di ore lavorative non porta a nessun incremento del protto, ma questo ` ovvio in quanto ore lavorative e inutilizzate sono gi` disponibili. a Nellipotesi che, ad esempio, si possa incrementare la disponibilit` di una sola delle risorse, naturala mente esaminando i prezzi ombra, si deduce che conviene aumentare la disponibilit` dellingrediente I1 a che porta ad un maggiore incremento del protto complessivo. Si osservi che il fatto che ad un incremento pari a nel termine noto del primo vincolo corrisponda un incremento pari a 6.4 nel valore ottimo della funzione obiettivo, ` valido n tanto che la variabile e duale allottimo u1 associata al primo vincolo rimane pari al valore 6.4. Infatti, ovviamente la variazione del termine noto del vincolo corrispondente alla disponibilit` dellingrediente I1 porta anche ad un cama biamento nella formulazione del problema duale: infatti un cambiamento nel termine noto di un vincolo primale corrisponde ad un cambiamento in un coeciente della funzione obiettivo del problema duale. Pertanto c` la possibilit` che se la variazione ` ampia, cambi il punto di ottimo del problema duale e e a e quindi, in particolare, cambi il prezzo ombra u1 associato al primo vincolo. In questo caso, naturalmente, la variazione del valore del valore della funzione obiettivo allottimo non pu` essere pi proporzionale al o u valore 6.4 (si veda lEsercitazione di Laboratorio n.4). Quindi come visto nellesempio, in generale, le variabili duali (i prezzi ombra) rappresentano leetto di cambiamenti nel termine noto dei vincoli. Si consideri, infatti un generico problema di Programmazione Lineare (in forma standard) (P), il suo duale (D) ed inoltre si consideri il problema (P ) ottenuto modicando il termine noto da b a b + (con IRm ) e il corrispondente problema duale (D ): min cT x Ax = b x0 min cT x Ax = b + x0
(P)
(D)
max bT u AT u c
(P )
(D )
max(b + )T u AT u c
Siano x e u rispettivamente la soluzione ottima del problema (P) e del problema (D). Siano inoltre x () e u () rispettivamente la soluzione del problema (P ) e del problema (D ) Dalle formulazioni di questi problemi si possono facilmente dedurre due osservazioni:
81
la variazione del termine noto b nel problema primale si riette in un cambiamento dei coecienti della funzione obiettivo del problema duale; la regione ammissibile del problema (D) e del problema (D ) sono uguali; da questo segue che se u IRm ` soluzione ottima del problema (D) allora u ` ammissibile per il problema (D ), ma e e non necessariamente ` ottima per (D ). e Inoltre per il Teorema della dualit` forte applicato alla coppia primaleduale (P)(D) deve essere a cT x = bT u , (3.18)
mentre, sempre per il della dualit` forte ma applicato alla coppia primaleduale (P )(D ) deve essere a cT x () = (b + )T u (). (3.19)
Se la soluzione ottima x soddisfa unopportuna ipotesi (cio` che in x non ci siano pi` di n vincoli e u attivi) e se il vettore ha componenti sucientemente piccole allora si pu` dimostrare che: o u () = u . Utilizzando la (3.18), la (3.19) e la (3.20) si ha: cT x () = bT u + T u = cT x + T u , che pu` essere riscritta nella seguente forma: o cT x () cT x = 1 u1 + 2 u2 + . . . + m um , (3.22) (3.21) (3.20)
dove = (1 , . . . , m )T . Dalla precedente relazione segue che una possibile interpretazione della variabile duale ui ` quella di e essere un prezzo associato ad un incremento unitario del termine noto bi . Per questa ragione le variabili duali ui , i = 1, . . . , m, vengono denominate prezzi ombra o costi marginali. Sebbene la (3.20) (e di conseguenza la (3.22)) valga solamente sotto opportune ipotesi, in molte situazioni pratiche, le variabili duali ui , i = 1, . . . , m, forniscono delle utili indicazioni su quale componente bi variare per migliorare il valore ottimo della funzione obiettivo. Si consideri, ora (come nellEsempio 3.2.1) la variazione del termine noto di un solo vincolo che si ottiene prendendo = ei (dove ei IRm ` il vettore con li-esima componente uguale a 1 e le altre e componenti nulle). In questo caso, naturalmente ad una variazione del termine noto delli-esimo vincolo corrisponde una variazione del valore della funzione obiettivo pari a ui . Nellesempio precedente era stato infatti osservato come una variazione di eettuata nel termine noto del primo vincolo porta ad una variazione della funzione obiettivo pari a u1 = 6.4. Si deve tuttavia ribadire un fatto molto importante: linterpretazione delle variabili duali come prezzi ombra e quindi come strumento per valutare la variazione del valore della funzione obiettivo al variare del termine noto di un vincolo a partire da una soluzione ottima ` vera solamente per piccole variazioni del termine noto; esiste cio` un intervallo entro il quale e e deve rimanere. Esula dallo scopo di queste note la motivazione teorica dettagliata della validit` dellinterpretazione a data delle variabili duali, a partire da una soluzione ottima, come prezzi ombra rappresentanti i valori marginali dei termini noti dei vincoli solo per piccole perturbazioni di questi termini noti ed anche la determinazione dellintervallo [l , u ] in cui pu` variare rimanendo valida tale linterpretazione. o Queste considerazioni fanno parte della cosiddetta analisi post-ottimale. Un altro scopo di questo tipo di analisi ` quello di indagare la sensibilit` del modello al variare dei del termine noto dei vincoli; e a questo rientra nella cosiddetta analisi della sensibilit` che aronta lo studio di come varia la soluzione a ottima di un problema al variare oltre che dei termini noti dei vincoli, anche al variare dei coecienti di costo della funzione obiettivo, oppure aggiungendo nuove variabili o nuovi vincoli. Ovviamente una trattazione rigorosa di queste problematiche esula dallo scopo di queste note e perci` si rimanda ai testi o di approfondimento specici.
82
3.2.2
Si consideri nuovamente il semplice problema di allocazione ottima dellEsempio 2.7.1 che ` rappresentato e dal seguente problema di Programazione Lineare: max (7x1 + 10x2 ) x1 + x2 750 (3.23) x + 2x2 1000 1 x2 400 x1 0, x2 0. Ricordiamo che le variabili x1 e x2 sono associate rispettivamente ai quantitativi di colorante C1 e C2 da produrre e che la produzione avviene utilizzando tre preparati base P1, P2 e P3 dei quali si ha una disponibilit` massima rispettivamente pari a 750, 1000 e 400 ettogrammi. Supponiamo, ora di voler a sottrarre preparati base dalla produzione dei coloranti per venderli direttamente. Indichiamo con u1 , u2 e u3 i prezzi associati rispettivamente alla vendita diretta di un ettogrammo di preparato base P1, P2 e P3. Supponendo di destinare tutti i preparati alla vendita diretta, il protto che si otterrebbe sarebbe 750u1 + 1000u2 + 400u3 . (3.24)
Naturalmente si vorr` fare in modo che questa operazione di sottrazione dei preparati base dalla proa duzione dei coloranti e vendita diretta risulti economicamente conveniente e quindi mentre si vuole minimizzare lespressione (3.24) anch i prezzi di vendita risultino competitivi sul mercato, si imporr` che il e a protto ottenuto vendendo direttamente i quantitativi di preparato base necessario per ottenere un litro di colorante sia maggiore o uguale del protto associato alla vendita di un litro di colorante stesso; quindi, utilizzando i dati del problema riportati nella tabella dellEsempio 2.7.1, si deve imporre che risulti u1 + u2 7 per quanto riguarda il colorante C1 e u1 + 2u2 + u3 10 per quanto riguarda il colorante C2 e naturalmente deve essere u1 0, u2 0 e u3 0. Quindi il modello lineare che rappresenta loperazione sopra descritta ` il seguente: e min (750u1 + 1000u2 + 400u3 ) u1 + u2 7 u1 + 2u2 + u3 10 u1 0, u2 0, u3 0. Esaminando questo problema si vede immediatamente che esso rappresenta il problema duale del problema dato (3.23). In generale, se si considera un generico problema di allocazione ottima di m risorse Ri , i = 1, . . . , m con la possibilit` di fabbricare n prodotti Pj , j = 1, . . . , n, come abbiamo gi` esaminato nel capitolo a a precedente si pu` formulare questo problema come o max cT x (3.25) Ax b x0 dove ricordiamo x IRn ` il vettore avente per componenti i livelli di produzione di ciascuno dei prodotti, e c IRn il vettore dei protti netti e b IRm il vettore delle disponibilit` massima di ciascuna delle risorse. a Supponiamo ora di voler sottrarre risorse alla produzione per venderle direttamente e siano ui , i = 1, . . . , m i prezzi unitari associati alla vendita delli-esima risorsa. Supponendo che per ciascuna risorsa
83
si voglia destinare alla vendita una quantit` pari alla disponibilit` massima di quella risorsa, si ottiene a a un protto pari a b1 u1 + b2 u2 + + bm um . Per rendere competitivi sul mercato i prezzi unitari ui da assegnare alle risorse vendute direttamente, si vogliono scegliere i valori pi bassi possibile per le ui , ma naturalmente, anch questa operazione di u e vendita diretta in luogo della fabbricazione dei prodotti risulti conveniente si deve imporre che il protto ottenuto vendendo direttamente le risorse necessarie per fabbricare un prodotto sia maggiore o uguale al protto che si ricaverebbe dalla vendita del prodotto nito. Quindi per ogni prodotto, si deve imporre che valga a11 u1 + a12 u1 + . . . a1n u1 + ... ... ... ... +am1 um +am2 um . . . +amn um c1 c2 . . . cn
con ui 0, i = 1, . . . , m e dove le quantit` aij rappresentano la quantit` di risorsa Ri necessaria per a a fabbricare una unit` di prodotto Pj . a Quindi il problema da risolvere pu` essere scritto nella forma o min bT u AT u c u0 che ` il problema duale del problema (3.25). e
3.2.3
Si consideri il problema di miscelazione dellEsempio 2.7.6 che ` rappresentato dal seguente problema di e Programmazione Lineare: min(400x1 + 600x2 ) 140x1 70 20x1 + 10x2 30 25x1 + 50x2 75 x1 0, x2 0. Ricordiamo che le variabili x1 e x2 rappresentano le quantit` di polpa di frutta e di dolcicante da a utilizzare nella produzione del succo di frutta che deve avere come requisito un contenuto minimo di 70 mg di vitamina C, 30 mg di sali minerali e 75 grammi di zucchero. Supponiamo ora che unindustria farmaceutica venda compresse di nutrimenti puri, cio` compresse di vitamina C, di sali minerali e di e zucchero e che vuole immettere queste compresse su un ipotetico mercato come oerta sostitutiva al succo di frutta per lacquisizione di vitamina C, di sali minerali e di zucchero. Naturalmente questa industria farmaceutica vuole massimizzare il protto ricavato dalla vendita delle compresse, ma al tempo stesso deve dare un prezzo alle compresse tale da essere competitiva. Siano allora u1 , u2 e u3 i prezzi di vendita rispettivamente di 1 mg di vitamina C, di 1 mg di sali minerali e di 1 grammo di zucchero; supponendo che la vendita di questi nutrimenti puri sia pari ai fabbisogni minimi (cio` a 70 mg di e vitamina C, a 30 mg di sali minerali e a 75 grammi di zucchero), lespressione del protto dellindustria farmaceutica che dovr` essere massimizzata ` a e 70u1 + 30u2 + 75u3 . Anch i prezzi di vendita dei componenti puri in compresse ssati dallindustria siano concorrenziali, e si deve imporre che il costo unitario dei nutrimenti puri sia minore o uguale al prezzo che si dovrebbe
84
pagare per avere la stessa quantit` di componente attraverso gli ingredienti del succo di frutta, cio` dalla a e polpa di frutta e dal dolcicante. Quindi si devono imporre i seguenti vincoli 140u1 + 20u2 + 25u3 10u2 + 50u3 Inoltre dovr` essere u1 0, u2 0, u3 0. a Quindi il problema complessivo formulato dallindustria farmaceutica ` e max(70u1 + 30u2 + 75u3 ) 140u1 + 20u2 + 25u3 400 10u2 + 50u3 600 u1 0, u2 0, u3 0 che ` il problema duale del problema di miscelazione considerato. e In generale, consideriamo un generico problema di miscelazione in cui si hanno n sostanze Sj , j = i, . . . , n ciascuna delle quali contiene una quantit` aij di componente utile Ci , i = 1, . . . , m. Come a abbiamo gi` esaminato nel capitolo precedente un problema di miscelazione di questo tipo si pu` formulare a o come min cT x (3.26) Ax b x0 dove ricordiamo che x IRn ` il vettore avente per componenti le quantit` di ciascuna sostanza da e a introdurre nella miscela, c IRn il vettore dei costi unitari delle sostanze, b IRm il vettore dei requisiti minimi di componenti utili da introdurre nella miscela, e A IRmn la matrice i cui elementi sono le aij . Supponiamo ora che unindustria sia in grado di fornire componenti utili allo stato puro e che voglia immettere sul mercato questi componenti utili e siano ui , i = 1, . . . , m i prezzi unitari da assegnare a ciascuno di essi. Supponendo che la richiesta del mercato sia pari ai fabbisogni minimi della miscela, cio` e per ciascun componente pari a bi , il protto totale dellindustria che vende i componenti utili allo stato puro ` e b1 u1 + b2 u2 + + bm um . Inoltre, anch i prezzi ui assegnati dallindustria ai componenti puri siano concorrenziali, si deve imporre e che il costo dei componenti puri sia minore o uguale al prezzo che dovrebbe pagare per avere la stessa quantit` di componente ottenuto attraverso le sostanze e quindi deve valere a
m
400 600.
aij ui cj ,
i=1
j = 1, . . . , n.
Inoltre si deve imporre ui 0, i = 1, . . . , m. Quindi il problema formulato si pu` scrivere nella forma o max bT u AT u c u0 che ` immediato vericare essere il problema duale del problema di miscelazione assegnato (3.26). e
85
3.2.4
Si consideri il problema di trasporto dellEsempio ?? che ` rappresentato dal seguente problema di e Programmazione Lineare: min(250x1 + 100x2 + 85x3 + 120y1 + 80y2 + 150y3 ) x1 + x2 + x3 = 50 y1 + y2 + y3 = 55 x1 + y1 = 30 x2 + y2 = 40 x3 + y3 = 35 x1 0, x2 0, x3 0, y1 0, y2 0, y3 0. dove x1 , x2 , x3 rappresentano rispettivamente la quantit` di acqua da trasportare dal primo stabilimento a ai tre impianti e y1 , y2 , y3 rappresentano rispettivamente la quantit` di acqua da trasportare dal secondo a stabilimento ai tre impianti. Ricordiamo inoltre che la disponibilit` giornaliera di acqua presso i due a stabilimenti ` rispettivamente di 50 e 55 ettolitri di acqua, mentre le richieste giornaliere di acqua presso e i tre impianti sono rispettivamente di 30, 40 e 35 ettolitri. Supponiamo ora che una compagnia specializzata in trasporto di acqua (esterna allindustria) voglia proporsi allindustria di acque minerali per eettuare il trasporto dellacqua dagli stabilimenti agli impianti. Naturalmente la compagnia di trasporti, per convincere lindustria di acque minerali ad avvalersi del servizio di trasporto esterno, dovr` proporre dei prezzi di trasporto vantaggiosi. A tale scopo a la compagnia dei trasporti propone allindustria di prelevare un ettolitro di acqua da ciascuno dei due stabilimenti per un prezzo unitario (in migliaia di lire) rispettivamente pari a u1 e u2 e di consegnare un ettolitro di acqua a ciascuno dei tre impianti per un prezzo unitario (in migliaia di lire) rispettivamente pari a v1 , v2 e v3 . Quindi la compagnia dei trasporti vorr` massimizzare la funzione che fornisce il suo a protto complessivo che ` data da e 50u1 + 55u2 + 30v1 + 40v2 + 35v3 . Tuttavia anch loerta della compagnia dei trasporti risulti vantaggiosa per lindustria delle acque e minerali i prezzi del traporto proposti dovranno risultare non superiori a quelli che lindustria avrebbe eettuando in proprio i trasporti stessi. Quindi dovr` risultare a u1 + v1 u1 + v2 u1 + v3 u2 + v1 u2 + v2 u2 + v3 Quindi, la compagnia dei trasporti max (50u1 u1 + u1 + u1 + 250 100 85 120
80 150.
dovr` risolvere il problema a + 55u2 + v1 v1 v2 v3 30v1 + v2 v3 u2 u2 u2 + + + 40v2 + 35v3 ) 250 100 85 120 80 150
86
che si verica immediatamente essere il problema duale del problema dei trasporti assegnato. In generale, consideriamo ora un generico problema dei trasporti gi` esaminato nel capitolo precea dente. Supponiamo che unazienda voglia provvedere in proprio ad eettuare il trasporto di materiali e che quindi cerchi di risolvere il problema dei trasporti (2.10) cio` e m n min cij xij i=1 j=1 n xij = ai i = 1, . . . , m (3.27) j=1 m xij = bj j = 1, . . . , n i=1 xij 0 i = 1, . . . , n; j = 1, . . . , m dove, ricordiamo, che le cij rappresentano il costo del trasporto dallorigine i alla destinazione j, le ai le disponibilit` alli-esima origine e le bj le richieste alla j-esima destinazione. a Supponiamo, ora che una compagnia che esegue trasporti voglia proporsi a questa azienda, come alternativa vantaggiosa alleettuazione dei trasporti in proprio; a tale scopo questa compagnia propone allazienda di prelevare ununit` di prodotto dallorigine i per un prezzo unitario ui e di consegnare una a unit` di prodotto alla destinazione j per un prezzo unitario vj . Per assicurare che i suoi prezzi siano a competitivi rispetto a quelli che lazienda avrebbe eettuando i trasporti in proprio, la compagnia di trasporti deve fare s` che risulti ui + vj cij per ogni i = 1, . . . , m e j = 1, . . . , n. Daltra parte la compagnia di trasporti vuole scegliere i prezzi da proporre u1 , . . . , um e v1 , . . . , vn in modo da massimizzare il suo protto complessivo. Poich le quantit` e a ai e bj di prodotto rispettivamente disponibili allorigine i e richieste alla destinazione j sono note alla compagnia di trasporti, questa cercher` di massimizzare la funzione a
m n
max
i=1
ai ui +
j=1
b j vj .
Quindi il problema che la compagnia di trasporti formula per determinare quali prezzi ui e vj proporre allazienda ` il seguente e m n max ai ui + bj vj (3.28) i=1 j=1 ui + vj cij i = 1, . . . , m, j = 1, . . . , n che ` il problema duale del problema dei trasporti (3.27). e
87
Capitolo 4
4.1
In questo paragrafo vengono presentati esempi classici di problemi che possono essere formulati come problemi di PLI. Lo scopo di questi esempi ` quello di mostrare come le variabili intere e le disequazioni e che le collegano possano essere usate come linguaggio formale per esprimere una serie di relazioni tra eventi.
4.1.1
Knapsack binario
Il primo uso delle variabili intere (binarie) che esamineremo ` anche il pi` naturale. Si supponga di e u dover modellare il fatto che un dato evento possa vericarsi oppure no. La natura binaria del problema suggerisce immediatamente lidea di modellare questa dicotomia per mezzo di una variabile x che pu` o assumere solo valori 0, 1. In particolare, si porr` x = 1 se levento si verica e x = 0 altrimenti. a Supponiamo di avere n oggetti. Il j-esimo oggetto, j = 1, . . . , n, ha un valore pari a cj e un peso pari a pj . Supponiamo di avere una bisaccia (knapsack in inglese) in cui vogliamo mettere alcuni degli oggetti. La bisaccia pu` portare al massimo un peso b. Il problema di scegliere un sottoinsieme degli o
88
oggetti allo scopo di massimizzare la somma dei valori senza superare il limite imposto dal peso ` il e cosiddetto problema di knapsack binario: max
n j=1 cj xj n j=1 pj xj
b j = 1, . . . , n.
xj {0, 1}
In questo caso levento ` costituito dalla scelta (o meno) del singolo oggetto. In generale, questi problemi di e scelta tra progetti possono avere pi` vincoli (si pensi al caso in cui la bisaccia abbia un limite dovuto al peso u e uno dovuto al volume degli oggetti); in tal caso il problema viene detto di knapsack multidimensionale.
4.1.2
Assegnamento
Un altro problema classico di pianicazione riguarda lassegnamento di lavori a persone. Supponiamo che n persone debbano svolgere n lavori. Ciascun lavoro deve essere svolto esattamente da una persona; inoltre, ciascuna persona pu` svolgere al pi` un lavoro. Il costo della persona j assegnata al lavoro i ` o u e cij . Il problema ` quello di assegnare i lavori alle persone minimizzando il costo totale di realizzazione di e tutti i lavori. Per formulare questo problema, che ` noto come problema di assegnamento, introduciamo e le variabili binarie xij , i = 1, . . . , n, j = 1, . . . , n corrispondenti allevento ij denite come segue xij = 1 se la persona j ` assegnata al lavoro i e 0 altrimenti
Poich esattamente una persona deve essere assegnata al lavoro i, avremo i vincoli: e
n
xij = 1,
j=1
i = 1, . . . , n.
Inoltre, poich ciascuna persona non pu` svolgere pi` di un lavoro, avremo i vincoli: e o u
n
xij = 1,
i=1
j = 1, . . . , n.
` E facile vericare che un vettore x {0, 1}mn che soddisfa tutti i vincoli appena descritti individua un assegnamento ammissibile di persone ai lavori. La funzione obiettivo, ovviamente da minimizzare, m n pu` essere scritta come i=1 j=1 cij xij . o
4.1.3
Nei modelli di Programmazione Lineare le variabili di decisione rappresentano usualmente i livelli ai quali le varie attivit` vengono svolte e la funzione obiettivo da minimizzare ` una funzione lineare di a e tali variabili. In molti problemi pratici, tuttavia, tale ipotesi non ` giusticata in quanto il costo di una e attivit`, in funzione del livello cui essa viene svolta, pu` avere un andamento come quello riportato in a o Figura 4.1. In particolare, il costo dellattivit` j ` zero se xj = 0 (cio` se lattivit` non ` avviata) ed ` invece a e e a e e uguale a fj + cj xj se xj > 0 con fj positivo. La funzione relativa allattivit` j ` quindi a e zj (x) = 0 fj + cj xj se xj = 0 se xj > 0
89
costo
coeff. ang. c
x : livello dell'attivit
cj xj +
jJf
zj (x)
Ax = b x 0n Chiaramente la funzione z(x) ` discontinua nellorigine e quindi il problema non ` di Programmazione e e Lineare. Una possibile formulazione alternativa del Problema di Costo Fisso come problema di PLI si ottiene introducendo, per ciascuna attivit`, una variabile yj che valga 1 quando xj > 0 e 0 quando xj = 0, a cio` e 0 se xj = 0 yj = 1 altrimenti In questo modo la funzione obiettivo pu` essere scritta o
n
z(x) =
j=1
cj xj +
jJf
yj fj = cT x + f T y,
dove y {0, 1}|Jf | ` il vettore le cui componente sono yj e z(x) ` una funzione lineare. e e Si tratta ora di imporre un vincolo che consenta di modellare la condizioni logiche xj > 0 yj = 1 xj = 0 yj = 0 Se supponiamo di conoscere un limite superiore per la variabile xj , cio` un valore positivo maggiore e del pi` grande valore che pu` assumere la xj , il vincolo u o xj yj 0
90
forza la variabile yj ad assumere valore 1 se xj > 01 . Per quanto riguarda la seconda condizione xj = 0 yj = 0, osserviamo che se xj = 0 la variabile yj il processo di minimizzazione far` in modo che yi sia nulla allottimo poich` fj 0. a e Il problema di costo sso pu` essere quindi formulato, assumendo che tutti i costi ssi fj siano positivi, o nel modo seguente: (F C2) min z(x) = cT x + f T y Ax = b xj yj , x 0n yj {0, 1}, j Jf j Jf
dove ` un numero positivo maggiore del pi` grande valore che pu` essere assunto da ciascuna delle e u o variabili xj in una soluzione ottima. Se xj > 0 la variabile yj sar` forzata ad assumere il valore 1 ed il suo a ` costo sso si aggiunger` al valore della funzione obiettivo. E quindi evidente che una soluzione ottima a del problema FC1 ` anche ottima per FC2 e viceversa. e
4.1.4
Capital Budgeting
Questo esempio illustra lapplicazione della PLI al problema della pianicazione degli investimenti (Capital Budgeting in inglese). Si tratta di uno degli esempi pi` signicativi di applicazione della PLI alle u problematiche della pianicazione nanziaria. Un azienda genera continuamente, nello svolgimento delle sue attivit`, proposte di investimento e a spesa (progetti nel seguito). Alcuni di questi progetti richiedono limpiego di risorse nanziarie per consentire lo sviluppo dei prodotti e della produzione; altre proposte possono invece riguardare il miglioramento delle strutture produttive dellazienda. Usualmente la decisione di attivare o meno un progetto condiziona la possibilit` di attivare altri progetti, sia per la presenza di limitazioni sulla disponibilit` dei capitali a a (Razionamento dei Capitali), sia per la presenza di vincoli sulla disponibilit` di personale, macchine etc. a Un azienda che si appresti a operare delle scelte individua solitamente un orizzonte temporale T entro il quale intende limitare lanalisi. Per esempio si decide di considerare gli investimenti e le loro conseguenze limitando lanalisi ai prossimi tre anni, T = 3 anni. Lorizzonte temporale viene poi suddiviso in periodi 1, 2, . . . t. Per esempio, se T = 3 anni, e i periodi sono i trimestri abbiamo dodici periodi, cio` t = 12. e Il progetto i pu` essere caratterizato dal vettore ai = (ai1 , ai2 , . . . , ait ) del Flusso di Cassa. Il valore o aij rappresenta il usso di cassa (positivo o negativo) generato dal progetto i nel periodo j. Assumiamo che un usso di cassa positivo corrisponda a una spesa, mentre uno negativo a un guadagno. Quindi se il vettore di usso di cassa relativo a un certo progetto su un orizzonte temporale diviso in 5 periodi ` e (5, 2, 1, 3, 8), vorr` dire che lattivazione del progetto richiede una spesa di 5 nel primo periodo, di a 2 nel secondo, e d` quindi un guadagno di 1, 3, 8 nel terzo, quarto e quinto periodo rispettivamente. a Notiamo per inciso che questa ` una struttura tipica (anche se esistono certamente delle eccezioni) dei e ussi di cassa. Nei primi periodi lattivazione di un progetto richiede degli investimenti, e quindi delle spese, una volta superata questa fase, si inziano ad avere guadagni. Lesborso totale generato dal progetto ` dato dalla somma dei ussi di cassa nei vari periodi. In questo caso, lesborso totale ` 5+2138 = 5. e e Ricordiamo che con la nostra convenzione sui segni un numero negativo rappresenta un guadagno2 In
1 Osserviamo che la condizione xj > 0 yj = 1 ` equivalente a yj = 0 xj = 0. Inoltre, volendo modellare e la condizione yj = 1 xj = 0, si pu` imporre il vincolo xj (yj 1) 0. o 2 E evidente che un guadagno (o un costo) allistante j ha un valore diverso da un guadagno (o un costo) di pari importo ottenuto allistante k > j. Per esempio, chiunque, dovendo scegliere tra lavere un milione oggi o tra 2 anni, preferirebbe avere un milione oggi. Infatti, un milione oggi pu` essere investito in modo sicuro, o (per esempio in buoni del tesoro) in modo di avere, tra due anni, pi` di un milione. Nel valutare una proposta u
91
una situazione reale, per ogni periodo j = 1, 2, . . . , t abbiamo un budget cio` un limite agli esborsi e (ussi di cassa positivi) che possiamo fare. Tali limiti derivano, ad esempio, da scelte aziendali o dalla limitata capacit` dellazienda di accedere al credito. Indichiamo con bj il limite di budget nel periodo a j-esimo. Cerchiamo di formulare adesso il problema di scegliere un sottoinsieme di progetti da attivare con il vincolo che in ogni periodo il vincolo di budget sia rispettato e in modo tale da rendere massimo il guadagno totale. A questo ne possiamo introdurre una variabile binaria xi per ognuno degli n progetti possibili. Le variabili sono denite nel seguente modo: xi = 1 se il progetto i ` attivato e 0 altrimenti
Possiamo a questo punto formulare facilmente il problema come problema di PLI: max
n i=1 n i=1
xi
t j=1
aij j = 1, . . . , t
aij xi bj ,
xi {0, 1}
t
i = 1, . . . , n.
Per capire la funzione obiettivo, bisogna ricordare che con la nostra convenzione di segni i guadagni sono numeri negativi. Quindi il termine j=1 aij rappresenta, per ogni i, il guadagno derivante dallattivazione del progetto i. Il cambio di segno serve a far diventare i guadagni numeri positivi e le perdite numeri negativi. I vincoli sono t, uno per ciascun periodo in cui ` diviso lorizzonte temporale e e impongono che in ogni periodo non si superi il budget disponibile. La formulazione del problema come problema di PLI permette di tenere facilmente conto di vincoli logici tra le attivit`. Facciamo alcuni esempi. a 1. Se vogliamo imporre che il progetto 1 venga sicuramente attivato, basta aggiungere alla formulazione precedente il vincolo x1 = 1. 2. Se vogliamo dire che almeno uno tra i progetti 2, 5, 89 deve essere attivato, basta aggiungere alla formulazione precedente il vincolo x2 + x5 + x89 1. 3. Se vogliamo dire che uno e uno solo tra i progetti 2, 5, 89 deve essere attivato, basta aggiungere alla formulazione precedente il vincolo x2 + x5 + x89 = 1. 4. Se vogliamo dire che al pi` uno tra i progetti 2, 5, 89 deve essere attivato, basta aggiungere alla u formulazione precedente il vincolo x2 + x5 + x89 1. In questo, e nel precedente caso, i progetti di dicono alternativi. 5. Se vogliamo modellare il fatto che il progetto 7 pu` essere attivato solo se ` stato attivato il progetto o e 9, basta aggiungere il vincolo x7 x9 . Se il progetto 7 pu` essere attivato solo se sono stati attivati i progetti 9 e 10, si pu` aggiungere il o o vincolo 1 x7 (x9 + x10 ). 2
di investimento ` fondamentale riportare i ussi di cassa nei vari periodi a una base comune. Questo processo e ` detto attualizzazione. Senza approfondire largomento, noi supponiamo che i vari aij siano stati attualizzati e e siano quindi tra loro pienamente confrontabili. La procedure di attualizzazione ` una procedure standard, molto e semplice che non riportiamo qui solo perch` non aggiunge nulla agli argomenti cui siamo interessati. e
92
Questi esempi possono essere facilmente generalizzati, e rappresentano il prototipo di come le variabili intere (e in particolare le variabili binarie) possano essere usate per modellare relazioni logiche tra eventi (in questo caso levento consiste nellattivazione o meno di un progetto). Facciamo un esempio di quanto visto nora. Supponiamo che il nostro orizzonte temporale di un anno sia diviso in 6 bimestri (T = un anno, t = 6), e che allinizio dellanno si debba decidere quali tra 5 progetti attivare. Nella tabella seguente si riportano i dati di interesse. La riga relativa ad ogni progetto riporta, per ogni periodo, il usso di cassa generato dal progetto, mentre nellultima riga ` riportato, per e ogni periodo, il budget disponibile (le cifre sono tutte in milioni di euro e sono state attualizzate). Periodo 1 2 3 1 0 4 8 Periodo 2 1 3 3 4 -1 8 Periodo 3 0 1 -1 0 -3 5 Periodo 4 -2 -4 2 -5 -2 2 Periodo 5 -3 -3 -3 -1 -1 2 Periodo 6 -1 -4 -4 0 -1 1
6 j=1
Indichiamo con ai la somma dei ussi di cassa generati dal progetto nei sei periodi i: ai = Abbiamo a1 = 3, a2 = 4, a3 = 2, a4 = 2, a5 = 4.
aij .
Notiamo che gli ai sono tutti negativi, e questo corrisponde al fatto che i progetti considerati, al termine dellorizzonte temporale, danno dei guadagni. A questo punto possiamo scrivere facilmente il problema di PLI che ci permette di determinare la scelta ottima. Il probelma ha cinque variabili, una per ogni progetto, e sei vincoli di budget, uno per ogni periodo. max 3x1 + 4x2 + 2x3 + 2x4 + 4x5 2x1 + 3x2 + x3 + 4x5 x1 + 3x2 + 3x3 + 4x4 x5 x2 x3 3x5 2x1 4x2 + 2x3 5x4 2x5 3x1 3x2 3x3 x4 x5 x1 4x2 4x3 x5 xi {0, 1} i = 1, . . . , 5. 8 8 5 2 2 1
Supponiamo ora che il progetto 4 copra solo 4 periodi dei 6 considerati. Questo ` congruente col e fatto che nel primo e nel sesto periodo quel progetto genera un usso di cassa nullo.3 Pi` precisamente, u possiamo supporre che il progetto 4 copra il secondo, terzo, quarto e quinto periodo. Ci possiamo allora porre il problema di posizionare temporalmente il progetto. In particolare ci possiamo domandare se ` e conveniente far partire il progetto 4 e, nel caso, se sia pi` conveniente farlo partire nel primo nel secondo u
Attenzione, per`, non ` detto che un usso di cassa nullo debba necessariamente corrispondere al fatto che o e un progetto non copra tutti i periodi. Un usso di cassa zero pu` benissimo indicare semplicemente il fatto che in o quel periodo le spese e i guadagni si equilibrano (vedi per esempio il progetto 1 nel periodo 3, o lo stesso progetto 4 sempre nel terzo periodo). In altre parole, linformazione sulla durata eettiva dei progetti non ` interamente e ricavabile da una tabella come quella riportata. Per esempio, sarebbe stato congruente con la tabella data sapere che il progetto 4 copre 5 periodi (dal secondo al seto), ma che nellultimo periodo non genera n guadagni n e e perdite. Al contrario, dalla tabella si pu` dire con certezza che il progetto 5 copre tutti e sei i periodi considerati, o perch esso genera un usso di cassa non nullo in ogni periodo. e
3
93
o nel terzo periodo. Notiamo che nella versione attuale il progetto 4 viene fatto iniziare nel secondo periodo. Per analizzare questo caso possiamo introdurre, al posto del progetto 4, tre progetti, che non sono altro che copie del progetto 4 posizionate temporalmente in modo diverso. La tabella con i dati del problema diventa allora la seguente. Progetto 1 Progetto 2 Progetto 3 Progetto 4a Progetto 4b Progetto 4c Progetto 5 budget Periodo 1 2 3 1 4 0 0 4 8 Periodo 2 1 3 3 0 4 0 -1 8 Periodo 3 0 1 -1 -5 0 4 -3 5 Periodo 4 -2 -4 2 -1 -5 0 -2 2 Periodo 5 -3 -3 -3 0 -1 -5 -1 2 Periodo 6 -1 -4 -4 0 0 -1 -1 1
In corrispondenza il probelma di PLI diventa: max 3x1 + 4x2 + 2x3 + 2(x4a + x4b + x4c ) + 4x5 2x1 + 3x2 + x3 + 4x4a + 4x5 x1 + 3x2 + 3x3 + 4x4b x5 x2 x3 5x4a + 4x4c 3x5 2x1 4x2 + 2x3 x4a 5x4b 2x5 3x1 3x2 3x3 x4b 5x4c x5 x1 4x2 4x3 x4c x5 x4a + x4b + x4c xi {0, 1} . Notiamo che, oltre allovvio incremento di variabili, abbiamo aggiunto il vincolo x4a + x4b + x4c 1, che ci dice che al pi` una delle copie del progetto 4 pu` essere attivata, non avendo ovviamente senso u o dire che bisogna far partire lo stesso progetto in due periodi dierenti.
7
8 8 5 2 2 1 1
4.1.5
Localizzazione
I modelli di localizzazione sono uno dei principali strumenti per la pianicazione territoriale di reti di servizio. Lobiettivo generico ` quello di decidere dove localizzare dei centri di servizio, quali impianti di e produzione, depositi per la distribuzione, sportelli bancari, ospedali, allo scopo di soddisfare una domanda distribuita sul territorio, minimizzando unopportuna funzione di costo. Si consideri lesempio di unamministrazione cittadina che debba decidere dove costruire un numero pressato di centri di pronto soccorso per servire i quartieri della citt`. Per ogni possibile sito di locala izzazione sono noti i tempi medi di percorrenza da ciascun quartiere. Per ssare le idee, supponiamo che il numero di centri da costruire sia p, il numero di quartieri sia m e il numero di possibili siti per la localizzazione degli impianti sia n. Inoltre, indicheremo con cij il tempo medio di percorrenza dal quartiere i {1, . . . , m} al sito j = {1, . . . , n}. Lobiettivo degli amministratori e quello di non sfavorire (troppo) nessuno dei potenziali utenti. In altri termini, a) tutti i quartieri devono essere serviti da un pronto soccorso e b) si deve minimizzare il tempo di percorrenza necessario allutente pi` sfavorito (e cio` u e quello che impiega pi` tempo di tutti) a raggiungere il pronto soccorso. u
94
Per poter modellare il problema di localizzazione come problema di programmazione lineare intera dobbiamo innanzitutto decidere le associazioni fra variabili ed eventi da rappresentare. In primo luogo si deve stabilire quali siti vengono scelti per localizzare i centri: associamo quindi una variabile booleana con ogni possibile sito, e cio` introduciamo una variabile booleana xj {0, 1} per j = 1, . . . , n, con la e convenzione che: 1 se il sito j ` scelto e xj = 0 altrimenti. La seconda informazione necessaria ` a quale centro viene assegnato ciascun quartiere. Introduciamo e quindi una nuova variabile booleana yij per ogni quartiere i {1, . . . , m} e per ogni possibile sito j {1, . . . , n}, ove 1 se il quartiere i ` servito da un centro localizzato nel sito j e 0 altrimenti. Poich` verranno costruiti esattamente p centri di pronto soccorso, sar`: e a yij = x1 + x2 + . . . + xn = p Inoltre, poich` ogni quartiere deve essere assegnato ad (esattamente) un sito, si deve avere e yi1 + yi2 + . . . + yin = 1 per i = 1, . . . , m. (4.2) (4.1)
I vincoli (4.2) assicurano che ogni quartiere sia servito da un sito. Ovviamente, anch` un quartiere e possa essere servito da un determinato sito, occorre che in tale sito sia eettivamente localizzato un centro di pronto soccorso. Questo fatto pu` essere espresso dai seguenti vincoli lineari: o yij xj per ogni i = 1, . . . , m, j = 1, . . . , n. (4.3)
Si osservi infatti che, qualora si abbia xj = 0 per qualche j {1, . . . , n} - e cio` nel sito j-esimo non e ` localizzato un centro di pronto soccorso, il vincolo (4.3) comporta yij = 0 per i = 1, . . . , n e quindi e nessun quartiere pu` essere assegnato a un sito non selezionato per la localizzazione di un centro. o I vincoli nora descritti assicurano che ogni quartiere sia servito da qualche sito in cui sia localizzato un centro di pronto soccorso. Per descrivere la funzione obiettivo, abbiamo bisogno di qualche considerazione (e di una variabile) aggiuntiva. In particolare, se x, y ` una soluzione che soddisfa i vincoli (4.1),(4.2) e e (4.3), qual ` il tempo di percorrenza t(i, y ) dalli-esimo quartiere al sito assegnatogli? Si osservi che e se yij = 1, il quartiere i-esimo ` servito dal centro localizzato nel sito j-esimo, e quindi il tempo di e percorrenza sar` cij . Quindi, grazie al vincolo (4.2), il generico tempo di percorrenza t(i, y) pu` essere a o espresso come t(i, y) = ci1 yi1 + ci2 yi2 + . . . + cin yin per i = 1, . . . , m.
Lobiettivo ` quello di trovare la soluzione (x, y) che minimizza il pi` grande t(i, y) per i = 1, . . . , m. e u Introduciamo quindi una nuova variabile z I + che rappresenta (un limite superiore per) il massimo R tempo di percorrenza associato alla soluzione (x, y). Poich` z deve essere (maggiore o) uguale al massimo e tempo di percorrenza, sar` maggiore o uguale di ogni tempo di percorrenza t(i, y) per i = 1, . . . , m. a Quindi introduciamo i seguenti m vincoli lineari: z ci1 yi1 + ci2 yi2 + . . . + cin yin per i = 1, . . . , m. (4.4)
Per minimizzare il massimo tempo di percorrenza ` suciente minimizzare il suo limite superiore z e e la funzione obiettivo si scriver` semplicemente a min z Riepilogando, il modello di localizzazione pu` essere scritto come segue: o
95
min z
n j=1 n j=1
xj = p yij = 1
n j=1 cij yij n
i = 1, . . . , m i = 1, . . . , m y {0, 1}
mn
x {0, 1} ,
Esempio. Siano dati 3 siti candidati e 4 quartieri e supponiamo si vogliano localizzare 2 centri di pronto soccorso. I tempi di trasporto da quartiere a sito sono espressi nella seguente tabella Sito 1 Sito 2 Sito 3 quart. 1 7 10 9 quart. 2 6 10 5 quart. 3 7 1 4 quart. 4 8 1 1
Scriviamo innazitutto il vincolo (4.1): x1 + x2 + x3 = 2 Scriviamo ora i vincoli (4.2) y11 + y12 + y13 y21 + y22 + y23 y31 + y32 + y33 y41 + y42 + y43 y11 y12 y13 y21 y22 y23 y31 y32 y33 y41 y42 y43 z z z z x1 x2 x3 x1 x2 x3 x1 x2 x3 x1 x2 x3 =1 =1 =1 =1
7y11 + 10y12 + 9y13 6y21 + 10y22 + 5y23 7y31 + 1y32 + 4y33 8y41 + 1y42 + 1y43
Si osservi che per un problema cos` piccolo ` facile calcolare la soluzione ottima enumerando tutte e le soluzioni. A tal scopo, notiamo innanzitutto che, una volta scelti i due siti ove costruire i centri, la soluzione ottima ` ottenuta assegnando ciascun cliente al sito pi` vicino. Ad esempio, se scegliamo il sito e u 1 e il sito 2 (x1 = 1, x2 = 1, x3 = 0, ci converr` assegnare il quartiere 1 e 2 al sito 1 , mentre i quartieri a 3 e 4 al sito 2 (y11 = y21 = y32 = y42 = 1). Il quartiere pi` svantaggiato ` il quartiere 1, con un tempo u e di percorrenza pari a 7. Se scegliamo il sito 1 e il sito 3, ci converr` assegnare il quartiere 1 al sito 3 , a
96
mentre i quartieri 2, 3 e 4 al sito 2. Anche in questo caso il quartiere pi` svantaggiato ` il quartiere 1 u e con tempo medio di percorrenza pari a 9. Inne, se scegliamo il sito 2 e il sito 3, ci converr` assegnare a i 1 e 2 al sito 3 , mentre i quartieri 3 e 4 al sito 2. Anche in questo caso il quartiere pi` svantaggiato ` u e il quartiere 1 con tempo medio di percorrenza pari a 9. Quindi, la soluzione che minimizza il tempo di percorrenza del quartiere pi` svantaggiato ` la prima, in corrispondenza alla scelta dei siti 1 e 2. u e Per comprendere il signicato dellintroduzione della variabile z, si consideri ancora lesempio descritto. Si ` visto che la soluzione ottima corrisponde alle seguenti assegnazioni ottime per il vettore e (x,y): x1 = 1, x2 = 1, x3 = 0, y11 = y21 = y32 = y42 = 1, yij = 0 altrimenti. Sostituendo nei vincoli (4.4), otteniamo: z 7 z6 z 1 z1 Quindi si deve avere z 7 che corrisponde al tempo di percorrenza del quartiere pi` svantaggiato. u Naturalmente, siccome si sta cercando il minimo valore di z, e non ci sono ulteriori vincoli sulla variabile z, allottimo avremo z = 7. Questa particolare classe di problemi di programmazione lineare in cui si vuole minimizzare il massimo di una famiglia di funzioni lineari, viene detta problema di min-max: come visto, problemi di questo tipo possono essere risolti mediante lintroduzione di una variabile articiale. Generalizzando leggermente, quello che abbiamo appena mostrato ` che, se abbiamo un problema di min-max del tipo e min (maxi cT x) i Ax (x b intero),
lo possiamo riscrivere come problema lineare introducendo una nuova variabile z: min z cT x i Ax (x z, b intero). i
Se (z , x ) ` una soluzione di questo problema, allora x ` una soluzione del problema di min-max. e e Unultima osservazione riguarda una naturale e pi` realistica estensione del problema di localizzazione. u Infatti, molto spesso si devono aggiungere nuovi centri a un insieme di centri gi` attivi e localizzati sul a territorio. Supponiamo ad esempio che k centri di pronto soccorso siano gi` localizzati nella citt` e che se a a ne vogliano attivare altri q. Allora, ` possibile ancora una volta risolvere un problema di localizzazione in e cui si vogliano attivare p = k+q centri; nel modello, tuttavia, si porr` xj = 1 per ogni sito j corrispondente a a un centro gi` attivato. a
4.1.6
Scheduling (Sequenziamento)
Concludiamo questa sezione sulle formulazioni con un esempio di utilizzazione delle variabili binarie per modellare vincoli disgiuntivi. Nellusuale denizione di un problema di ottimizzazione si assume che tutti i vincoli debbano essere soddisfatti da una soluzione ammissibile. Tuttavia, in molte applicazioni capita che solo un sottoinsieme dei vincoli debba essere soddisfatto e che tale sottoinsieme sia specicato dal valore assunto da una opportuna variabile di decisione. In questo caso si dice che i vincoli sono disgiuntivi. Un esempio di applicazione di tali vincoli disgiuntivi ` fornito dal problema di Scheduling. e
97
Vincoli di tipo disgiuntivo sorgono abbastanza naturalmente in problemi di sequenziamento. In tali problemi si ha lobiettivo di decidere lordine di processamento di un certo numero di lavori su una macchina a capacit` unitaria. I vincoli disgiuntivi appaiono in quanto due lavori i e j non possono essere a processati contemporaneamente sulla macchina e quindi uno solo dei vincoli (i precede j) o (j precede i) deve essere soddisfatto. Supponiamo che debbano essere sequenziati n lavori su una macchina. Sia pi il tempo di processamento del lavoro i sulla macchina. Poich` la macchina ha capacit` unitaria, essa dovr` completare e a a un lavoro prima di iniziare il lavoro successivo. Sia ti listante in cui la macchina eettivamente inizia la lavorazione del lavoro i. Formulare il problema di scheduling consiste nel determinare vincoli sulle variabili ti in modo tale che esse rappresentino sequenze eettivamente realizzabili sulla macchina. Se il lavoro i ` iniziato sulla macchina prima del lavoro j, dobbiamo avere tj ti + pi . Daltra parte, e se il lavoro j inizia prima del lavoro i, dobbiamo avere ti tj + pj . Sia un numero positivo molto grande e sia yij = 1 se i precede j e yij = 0 se j precede i. Considera il seguente sistema di vincoli: yij + ti tj (1 yij ) + tj ti pj , pi , 1i<jn 1i<jn
Osserviamo che se yij = 1 (cio` se i precede j) allora il primo vincolo ` sempre soddisfatto poich` e e e >> pj + tj ti , mentre il secondo vincolo esprime la condizione che la lavorazione di j pu` iniziare o solo dopo il completamento di i. Una situazione analoga si avr` quando yij = 0. a Se un vettore (t, y) con t I n ed y {0, 1}nn soddisfa questo sistema allora, per quanto detto, R ciascuna componente del vettore t rappresenta un istante ammissibile di inizio processamento per il corrispondente lavoro. Viceversa, per ogni vettore ammissibile t esiste sicuramente un vettore y (che rappresenta lordine di processamento dei lavori sulla macchina) tale che il vettore (t, y) ` ammissibile e per il precedente sistema di vincoli. Vincoli di precedenza o altre restrizioni temporali possono essere facilmente inseriti nel modello aggiungendo vincoli lineari sulle variabili t ed y.
4.2
In forma del tutto generale un problema di PLI pu` essere scritto come o
(P LI)
dove U ` un vettore a n componenti che limita superiormente il valori che possono essere assunti dalle e variabili. La presenza di questo vincolo implica che la regione ammissibile del problema PLI ` limitata. e Questa assunzione semplicher` le considerazioni svolte in questo paragrafo. Essa `, peraltro, non limia e tativa, in quanto in ogni problema reale il valore assunto dalle componenti delle soluzioni ammissibili ` e sempre limitato superiormente da qualche costante. In questo paragrafo consideriamo alcune tecniche risolutive per problemi di PLI. In particolare, dopo alcune brevi considerazione sulla soluzione per enumerazione totale e sulla soluzione approssimata per arrotondamento di problemi di PLI, descriveremo una delle pi` note famiglie di algoritmi per la soluzione u esatta di problemi di PLI: gli algoritmi di Branch and Bound. Prima di procedere vogliamo introdurre un concetto molto importante, quello di problema rilassato, che verr` ampiamento ripreso e utilizzato nel seguito. Dato il problema PLI si denisce suo rilassamento a lineare (o problema rilassato associato) il seguente problema. max cT x Ax b 0 x U. (P R)
98
Si tratta cio` di un problema di PL ottenuto eliminando dal problema PLI il vincolo di interezza. La e regione di un Problema di PLI ` ovviamente contenuta in quella del suo rilassamento PR (che ` ottenuto, e e lo ripetiamo, eliminando un vincolo da PLI) e quindi ne segue che il valore ottimo di PR ` sicuramente e maggiore o uguale di quello di PLI. In particolare, se la soluzione ottima di PR ` intera allora questa ` e e anche la soluzione ottima di PLI. Per chiarire ulteriormente quanto detto facciamo un semplice esempio informale. Supponiamo di voler trovare lo studente pi` alto della facolt` di economia e commercio. Si tratta di trovare lo studente u a (punto ammissibile) che massimizza la funzione obiettivo che associa ad ogni studente la sua altezza. Consideriamo poi il problema di trovare lo studente pi` alto di tutta luniversit` (problema rilassato). u a Ovviamente linsieme ammissibile di questo nuovo problema ` pi` ampio di quello del problema precee u dente, comprendendo tutti gli studenti di economia e commercio pi` gli studenti di tutte le altre facolt`. u a Se noi risolviamo il problema rilassato il valore ottimo che troviamo (altezza dello studente pi` alto di u tutta luniversit`) ` ovviamente maggiore o tuttal pi` uguale al valore ottimo del problema di trovare a e u lo studente pi` alto della facolt` di economia e commercio. Se poi risulta che lo studente pi` alto di u a u tutta luniversit` ` proprio uno studente della facolt` di economia e commercio, allora ` ovvio che questo ae a e studente ` anche la soluzione ottima del primo problema, ` cio` lo studente pi` alto della facolt` di e e e u a economia e commercio.
4.2.1
Nelle ipotesi fatte la regione ammissibile di PLI ` costituita da un insieme nito di punti: linsieme di e punti a cordinate intere contenuti nellinsieme costituito dai punti che soddisfano i vincoli espressi dalle disequazioni lineari di PLI (che coincide con linsieme ammissibile di PR) limitato per ipotesi. In linea e di principio ` quindi sempre possibile risolvere PLI calcolando il valore della funzione obiettivo in ogni e punto ammissibile e scegliendo quello che la massimizza. Deniremo questo metodo Enumerazione Totale. Se la cardinalit` dellinsieme ammissibile di PLI ` piccola allore lenumerazione totale non solo ` a e e possibile, ma ` certamente il modo migliore di risolvere un problema di PLI. Se, viceversa, la cardinalit` e a dellinsieme delle soluzioni ammissibili ` molto grande, lenumerazione totale diviene non proponibile. e Osserviamo che se abbiamo un problema di PLI con dieci variabili e supponiamo che ognuna di queste variabili possa assumere dieci valori diversi, il numero di possibili punti ammissibili ` di 1010 , cio` 10 e e miliardi. Questo semplice esempio mostra che lenumerazione totale ` raramente utile nei casi pratici, e dove spesso il numero di variabili intere ` dellordine delle centinaia se non delle migliaia. e
4.2.2
Abbiamo gi` avuto modo di osservare, nellintroduzione di questo paragrafo, che se la soluzione ottima a del rilassamento lineare di PLI, x, ` intera allora x ` la soluzione ottima di PLI. Se, invece, anche una e e sola delle componenti di x non ` intera x non ` nemmeno ammisibile per PLI. e e Si pu` allora essere tentati di concludere che la soluzione ottima di PLI pu` essere ottenuta arrotono o dando x a un punto a coordinate intere vicino a x. Questo metodo di arrotondamento pu` essere un metodo pratico di grande utilit` per la soluzione di o a PLI, se tutte variabili del problema sono variabili intere che rappresentano il numero di oggetti indivisibili usati o prodotti, ed ` ragionevole aspettarsi che le variabili stesse abbiano valori abbastanza grandi e allottimo. Inoltre i vincoli lineari dovrebbero essere tali da poter facilmente decidere se lammissibilit` a ` preservata arrotondando una variabile non intera al pi` vicino valore intero (o, per esempio, al pi` e u u vicino valore intero inferiore). Per esempio, se x1 rappresenta il numero di automobili di un certo modello che devono essere assemblate durante un mese e se esiste una limitazione inferiore su x1 , ` e ragionevole aspettarsi che un valore x1 = 1000.1 possa essere arrotondato a 1001 senza che venga violata lammissibilit`. Se tutte le variabili del problema sono di questo tipo e se esiste un metodo semplice di a passare dalla soluzione non intera x di PR a una soluzione vicina, intera e ammisibile per PLI, allora
99
un ragionevole approccio pratico alla soluzione di PLI ` quello di risolvere il suo rilassamento lineare ed e arrotondare quindi la soluzione. Tuttavia, se il valore delle variabili della soluzione ottima del rilassamento lineare ` presumibilmente e piccolo, questa tecnica non ` molto sensata. Se, per esempio, x1 rappresenta il numero di portaaeri che e devono essere costruite dallesercito italiano, ` intuitivo capire che ` molto dicile decidere se si debba e e arrotondare x1 = 2.5 a 2 o a 3, e che le due possibilit` portano a risultati completamente diversi. La a situazione diventa ancora pi` drammatica quando le variabili intere sono, in realt`, variabili binarie. u a Abbiamo visto nel primo paragrafo di questo capitolo che questa ` una situazione abbastanza frequente. e In questi problemi le variabili 0-1 sono variabili che indicano quale di due possibili scelte alternative deve essere attuata. In questo caso larrotondamento ` totalmente privo di senso logico. Se x I n , possono e R esistere 2n vettori interi ottenuti arrotondando le componenti non intere di x al valore intero superiore o inferiore pi` prossimo, e non si vede con quale criterio si possa sceglierne uno quale soluzione di PLI. u Inoltre molti ( se non tutti) di questi 2n vettori possono non essere ammissibili per PLI, e il problema di determinare un vettore a componenti intere, ammissibile per PLI, e vicino a x pu` essere, in generale, o un problema di dicolt` paragonabile alla soluzione di PLI. a
4.2.3
Abbiamo gi` visto che una possibile, semplice tecnica di soluzione per PLI, purtroppo quasi mai utilizza abile in pratica, ` l enumerazione totale. e Il Branch and Bound (BB) fornisce, allora, una metodologia di ricerca della soluzione ottima che eettua una esplorazione parziale dellinsieme delle soluzioni ammisibile. In particolare la funzione obiet-
100
b a
Si = S0
i=1 Evidentemente, la soluzione ottima del problema originario ` data dal massimo tra i valori z1 = cT x , . . . , zr = e 1 T c xr dove xi ` la soluzione ottima del sottoproblema P LIi denito dal problema di massimizzare la fune zione obiettivo del problema PLI sulla regione ammissibile Si (nel seguito, con un piccolo abuso di notazione, indicheremo spesso con Si sia la regione ammissibile sia il sottoproblema P LIi ). Se un certo sottoproblema P LIi risulta, a sua volta, di dicile soluzione si partiziona ulteriormente linsieme Si producendo nuovi sottoproblemi ed iterando la procedura no a che il problema originario non risulti decomposto in problemi elementari di facile soluzione. Cerchiamo di chiarire la procedura con un esempio informale. Supponiamo di dover trovare la persona pi` alta delluniversita. Risolvere questo problema confrontando le altezze di tutti gli studenti fra loro u (enumerazione totale) pu` risultare in un processo troppo lungo. Si pu` allora chiedere ai presidi di ogni o o facolt` qual ` lo studente pi` alto delle loro facolta e scegliere il pi` alto tra questi studenti. Abbiamo a e u u decomposto il problema originario in pi` sottoproblemi: la determinazione dello studente pi` alto di ogni u u facolt`. In alcuni casi la risoluzione di questi sottoproblemi pu` essere agevole. Per esempio il preside a o della facolt` di Noia Applicata non ha dicolt` alcuna ad individuare lo studente pi` alto tra i suoi tre a a u iscritti. Anche il preside della facolt` di Bel Turpiloquio non ha dicolt` ad individuare il suo studente a a pi` alto, avendo appena dovuto rompere le porte di tutte le aule del primo anno per permettere (come da u regolamento) il passaggio senza chinare la testa della matricola Amilcare Basso. In altri casi il preside pu` o non essere in grado di fornire facilmente il nome dello studente pi` alto. In questo caso si pu` scomporre u o ulteriormente il problema. Per esempio, il preside della facolt` di Dilapidazione e Latrocinio chiede a a tutti i direttori dei suoi istituti di fornirgli il nome dello studente pi` alto che frequenta listituto stesso. u Da questi egli potr` cos` risalire al nome dello studente pi` alto della facolt`. E cos` via. a u a
101
` E evidente che la procedura appena descritta non compie una totale enumerazione dellinsieme S ed ` computazionalmente eciente solo se il numero dei sottoproblemi generati si mantiene estremamente e limitato e quindi solo se la strategia di soluzione dei sottoproblemi ` sucientemente ecace. e In generale per`, risolvere un sottoproblema pu` essere altrettanto gravoso che risolvere il problema o o ` originario. E per questo che, in luogo della soluzione esatta del problema Si si preferisce calcolare un upper bound di zi e cio` un valore Ui zi . Tale valore viene poi confrontato con il miglior valore z e ( ad un certo passo della procedura) della funzione obiettivo calcolata in un punto ammissibile (ottimo corrente). Se il valore approssimato risulta non superiore a quello dellottimo corrente, ovvero se
z Ui zi
si deduce che non esiste nellinsieme Si un punto in cui la funzione obiettivo abbia un valore migliore di z . Un tale riultato ci permette di sospendere lesame dellinsieme Si e di eliminarlo dalla lista dei sottoproblemi da risolvere. Per tornare allesempio informale precedente, supponiamo che il preside della facolt` di Bel Torpiloa quio abbia comunicato che Amilcare Basso ` alto 2 metri e 10 centimetri (ottimo corrente). Supponiamo e anche che il preside della facolt` di Occultismo, pur senza sapere esattamente qual ` laltezza esatta del a e suo studente pi` alto, sia riuscito ad avere la certezza, con mezzi solo a lui noti, che ogni studente della sua u ` facolt` non ` alto pi` di 2 metri (upper bound). E evidente che ` inutile fare lo sforzo di cercare di trovare a e u e laltezza esatta del pi` alto studente della facolt` di Occultismo, tanto Amilcare Basso ` comunque pi` u a e u alto. Evidentemente la soluzione del problema originario sar` tanto pi` eciente quanto migliori saranno a u i valori degli upper bound ed a loro volta tali valori approssimeranno tanto meglio il valore ottimo del sottoproblema quanto pi` ecace sar` stata la decomposizione del problema originario. Di conu a seguenza lecienza della tecnica del BB dipende essenzialmente dalla qualit` delle due strategie che ne a caratterizzano la struttura: (a) Strategia di Soluzione, ovvero la strategia per il calcolo di un valore che approssimi per eccesso (in un problema di massimo) il valore ottimo di un sottoproblema. (b) Strategia di Separazione, ovvero la strategia per la scelta della partizione dellinsieme delle soluzioni ammissibili di un sottoproblema. ` E anche evidente che a seconda della strategia di soluzione e di quella di separazione adottate, lo schema generale appena descritto si concretizzer` in un algoritmo dierente. a Nel seguito di questo paragrafo descriveremo un possibile schema (semplicato) di BB che corrisponde a uno degli schemi di BB pi` utilizzati nella pratica dando al contempo maggiore sistematicit` al metodo u a presentato. Ricordiamo che vogliamo risolvere un problema di PLI della seguente forma max cT x Ax b 0xU x intera
(P LI)
Questo problema, nel seguito sar` indicato anche come problema S0 . Nel corso del metodo considereremo a dei sottoproblemi che hanno una struttura simile. Pi` precisamente considereremo sottoproblemi Si con u la seguente struttura. max cT x Ax b (Si ) li x ui x intera,
102
dove i vettori n dimensionali li e ui sono calcolati dallalgoritmo. Nel seguito indicheremo, inoltre, con x e zi rispettivamente una soluzione ottima e il valore ottimo di Si . i La strategia che proponiamo per calcolare un upper bound Ui di zi ` la seguente: e dato il problema Si , risolvere il suo rilassamento lineare. Indichiamo con y i la soluzione ottima del rilassamento lineare di Si e con Ui il corrispondente valore ottimo. Per quanto visto precedentemente il valore ottimo Ui cos` ottenuto costituisce un upper bound di zi , inoltre il rilassamento lineare ` facilmente risolubile con il metodo del simplesso. e Dobbiamo ora descrivere un metodo per la separazione di un generico Si . Supponiamo di aver risolto il rilassamento lineare di Si e sia y i la sua soluzione ottima e, come gi` detto, con Ui il corrispondente a valore ottimo. Se y i ha tutte componenti intere allora y i = x e il problema non va separato. Se Ui i ` minore o uguale allottimo corrente, cio` al valore massimo della funzione obiettivo nora trovato, il e e problema non pu` dar origine ad una soluzione intera migliore di quella corrente e non ` necessario o e separarlo per trovare la sua soluzione ottima intera. Supponiamo quindi che nessuno di questi due casi i si sia vericato, e vediamo come seperare questo sottoproblema. Sia yj una componente non intera del i vettore y (almeno una ne deve esistere), j la sua parte intera inferiore (ossia il pi` grande intero minore u i o uguale a (x )j ) e j la sua parte intera superiore (ossia il pi` piccolo intero maggiore o uguale a yj ). u i Ovviamente valgono le seguenti relazioni: j < j j j = 1. Separiamo il problema Si nei seguenti due problemi max cT x Ax b 1 li x u1 i x intera, dove
1 (li )j = (li )j se i = j 1 ui = ui
1 (li )j = j se i = j
max
cT x Ax b li 2 x ui 2 x intera, e (u2 )j = j se i = j i
(Si )
dove
(u2 )j = (ui )j se i = j i 2 li = li
Notiamo che ` facile convincersi che lunione delle regioni ammissibili di questi due problemi d` la regione e a ammissibile del problema Si , di modo tale che questa ` in eetti una separazione del problema Si del e tipo prima considerato. Per concludere vogliamo osservare che dobbiamo considerare un altro caso che nora non abbiamo menzionato. Nel risolvere il rilassamento del problema Si pu` accadere che la regione ammissibile del o rilassamento risulti vuota. Siccome la regione ammissibile del problema Si ` contenuta in quella del suo e rilassamento, questo vuol dire che il problema Si ha regione ammissibile vuota, e quindi non c` bisogno e di separarlo. Abbiamo ora tutti gli elementi per descrivere il metodo di BB proposto. 1. Inizializzazione
103
Inizialmente il problema S0 = P LI ` lunico problema candidato. La procedura inizia con lapplicazione e della strategia di soluzione ad S0 ottenendo un primo upper bound U0 . Inoltre, viene calcolato un lower bound z per il problema S0 , cio` un valore sicuramente non e superiore a quello z della soluzione ottima. Tale valore viene usualmente ottenuto in corrispondenza ad una soluzione ammissibile x facile da individuare (ad es. mediante una semplice euristica). I valori x e z vengono successivamente aggiornati nel corso della procedura non appena vengono individuate soluzioni ammissibili per il problema originario con un valore pi` alto della funzione obiettivo. Se non ` possibile u e individuare facilmente una soluzione ammissibile si pu` porre z = , mentre x viene, per il momento o lasciato indenito. Se lottimo del problema rilassato y 0 appartiene allinsieme S0 il problema ` risolto. Altrimenti ` e e necessario applicare una strategia di separazione al problema S0 ottenendo due nuovi problemi candidati S1 ed S2 . 2. Passo generico dellalgoritmo. Ad un generico passo dellalgoritmo supponiamo di avere la lista L = {S1 , . . . , Sq } dei sottoproblemi che non sono ancora stati esaminati (problemi terminali). Illustriamo ora brevemente le possibili azioni dellalgoritmo in un passo generico. 2.1. Scelta del problema aperto da esaminare Si estrae un problema dalla lista L, diciamo Si , che diventa il problema corrente. Se la lista L ` vuota, e lalgoritmo termina e x, la soluzione ottima corrente, ` la soluzione ottima del problema. Se la lista L e non ` vuota possono essere adottate diverse strategie per la scelta del problema Si da esaminare. Diamo e qui due esempi: (1) Scelta con criterio di priorit` FIFO (First In First Out). In questo caso i sottoproblemi terminali a sono gestiti dalla procedura secondo lo schema a coda. In particolare, il problema scelto ` il primo e problema generato nella fase di separazione (tra quelli presenti nella lista). a (2) Scelta con criterio di priorit` LIFO (Last In First Out). In questo caso i sottoproblemi terminali sono gestiti dalla procedura secondo lo schema a stack. In particolare, il problema scelto ` lultimo e problema generato nella fase di separazione. Si risolve il rilassamento lineare di Si . Se Si ` vuoto si elimina e il passo dellalgoritmo ` terminato. Si e e pu` quindi passare ad esaminare un nuovo problema della lista L. o Se Si non ` vuoto si calcolano y i e Ui , rispettivamente la soluzione ottima e il valore ottimo del e problema rilassato (si noti che siccome stiamo supponendo che la regione ammissibile del problema rilassato ` limitata, e avendo appena vericato che non ` vuota, per il teorema fondamentale della e e Programmazione Lineare, il rilassamento del problema in esame deve avere una soluzione ottima y i ). 2.1. Confronto con lottimo corrente
Se Ui z , detto zi il valore ottimo della funzione obiettivo per il problema Si , abbiamo che: zi Ui z
e quindi che nessuna soluzione migliore di z pu` essere contenuta in Si . In tal caso il problema Si o pu` essere eliminato della lista dei problemi candidati e viene denito chiuso e il passo dellalgoritmo ` o e terminato. Si pu` quindi passare ad esaminare un nuovo problema della lista L. o 2.3. Aggiornamenti Arrivati a questo punto sono possibili due casi, che esaminiamo separatamente. Ricordiamo che y i ` e lottimo del problema rilassato, cio` il punto che soddisfa Ui = cT y i . e 2.3.1. y i ` intero e
104
Se lottimo del problema rilassato y i ha componenti intere abbiamo che esso ` ottimo anche per il sote toproblema Si . Inoltre poich Ui > z , y i ` una soluzione ammissibile del problema originario con valore e e della funzione obiettivo (cT y i = Ui ) migliore di z . Di conseguenza, possiamo porre x = y i e z = Ui . (aggiornamento dellottimo corrente). Il problema Si viene chiuso. 2.3.2. y i non ` intero e In tal caso si deve applicare la strategia di separazione precedentemente illustrata, produrre i due nuovi sottoproblemi ed aggiungerli alla lista L dei problemi terminali. In tutte due i casi il passo dellalgoritmo ` terminato e si pu` passare ad esaminare un nuovo problema e o della lista L. Si riporta di seguito lo schema a blocchi dellalgoritmo appena descritto. 2
y i intera
105
4.3
Esempi
Completiamo il capitolo con degli esempi di applicazione del Branch and Bound.
Il problema ` un problema di massimizzazione, quindi le soluzioni dei problemi rilassati forniranno dei e limiti superiori (upper bound) al valore della soluzione ottima intera. Inoltre, il valore della funzione obiettivo calcolato in corrispondenza ad una soluzione ammissibile fornir` un limite inferiore (lower a bound). Si noti che, bench non siano esplicitamente presenti degli upper bound sulle variabili (del tipo e x U ), il problema ha ovviamente una regione ammissibili limitata (infatti le variabili sono non negative ` e la loro somma deve essere minore o uguale a quattro, si veda il secondo vincolo). E facile convincersi quindi, che nulla cambia nellapplicazione dellalgoritmo e nella sua validit`. a Poniamo inizialmente z = , lottimo corrente ` per il momento non denito. Poniamo il problema e S0 nella lista L. Viene selezionato un problema in L = {S0 }. In particolare, viene estratto dalla lista il problema S0 , unico problema nella lista. La soluzione ottima y 0 del rilassamento lineare di S0 ` y 0 = (3/2, 5/2)T (si veda la gura Figura 4.5) e e fornisce un upper bound pari a U0 = cT y 0 = 7/2.
X2
Y0
X1
Ricordiamo che con Z si indica linsieme dei numeri interi 0 0 Ricordiamo che y1 indica il pi` grande numero intero minore o uguale a y1 u
106
che vengono messi in L: L = {S1 , S2 }. Estraiamo un problema da L, per esempio, S2 . Risolviamo il rilassamento di S2 (si veda la gura Figura 4.6), e otteniamo y 2 = (2, 2)T e un corrispondente U2 =
cT y 2 = 2. Siccome la soluzione del problema rilassato ` intera e il valore ottimo corrispondente ` migliore e e dellottimo corrento z , aggiorniamo e poniamo: z = 2 e x = (2, 2)T . Il problema S2 ` chiuso e ora e L = {S1 }. Estraiamo un problema da L, siccome c` solo S1 esaminiamo S1 . Risolviamo il rilassamento di S1 (si e veda la gura Figura 4.7) e otteniamo y 1 = (1, 13/6)T e un corrispondente U1 = cT y 1 = 10/3. Siccome U1 > z = 2 e y 1 non ` intera, generiamo due sottoproblemi e li mettiamo in L. Poich solo x2 ` frazionaria e e e , possiamo fare il branching solo su x2 . Otteniamo cos` i due problemi:
X2
(S2 )
(S1 )
Y2
(S3 )
max
max
max
107
x1 + 2x2 4x1 + 6x2 9 x1 + x2 4 x1 2 x0 x1 , x2 Z x1 + 2x2 4x1 + 6x2 9 x1 + x2 4 x1 1 x0 x1 + x2 4 x1 , x2 Z x1 + 2x2 4x1 + 6x2 9
X1
A questo punto L = {S3 , S4 }. Esaminiamo il problema S4 . Trovo che il suo rilassamento lineare ` vuoto. e Chido il problema. Estraggo dalla lista L lunico problema presente, S3 . Il suo rilassamento lineare ha per soluzione y 3 = (3/4, 2)T (si veda la gura Figura 4.8), con un corrispondente valore U3 = cT y 3 = 13/4.
Y1
2 X3
X2
Y3
(S4 )
108
X1
Siccome U3 > z e y 3 non ` intero, genero due sottoproblemi a partire da S3 facendo branching sullunica e variabile frazionaria, x1 : (S5 ) max x1 + 2x2 4x1 + 6x2 9 x1 + x2 4 x1 1 x1 0 x2 2 x0 x1 , x2 Z
(S6 )
max
Notiamo che in S5 i due vincoli x1 1 ` reso superuo dal nuovo vincolo x1 0. Abbiamo lasciato il e vincolo superuo per rendere chiaro che ogni volta che si compie un operazione di branching per generare due nuovi sottoproblemi che eridatano tutti i vincoli del problema che li genera e a cui vengono aggiunti i vincoli specici del branching. Analogamente, per S6 , i due vincoli x1 1 e x1 1 dicono che x1 = 1, ma abbiamo preferito lasciare i due vincoli distinti. A questo punto L = {S5 , S6 }. Esaminiamo il problema S6 . Il suo rilassamento lineare ha per soluzione y 6 = (1, 2)T (si veda la gura Figura 4.9), con un corrispondente valore U6 = cT y 6 = 3. Siccome
X2
Y6
X1
109
Estraggo il problema S5 dalla lista dei problemi aperti e ne risolvo il rilassamento. Ottengo y 5 = (0, 3/2) e U5 = cT y 5 = 3 (si veda la gura Figura 4.10). Siccome U5 z = 3, chiudo il problema.
X2
Y5
X1
S4: vuoto
110
Esempio 2. Passiamo ora ad esaminare, pi` sinteticamente, il secondo esempio. Sia dato il seguente u
problema di programmazione lineare a numeri interi. max x1 + x2 2x1 + 5x2 30 4x1 3x2 6 0 x1 0 x2 x1 , x2 Z Notiamo che in anche in questo problema non sono esplicitamente presenti gli upper bound sule variabili. Essendo comunque la regione ammissibile del problema rilassato limitato, non ` necessario inserirli e esplicitamente. Poniamo inizialmente z = e risolviamo il rilassamento lineare di S0 . Si ottiene U0 = 114 13
0 y1 =
(S0 )
60 13
0 y2 =
54 . 13
Si elimina S0 dalla lista L, e vi si aggiungono i due nuovi problemi S1 e S2 individuati dai seguenti vincoli aggiuntivi. S1 : x1 4 S2 : x1 5. Si avr` pertanto L = {S1 , S2 }. a Si sceglie S1 da L e lo si risolve il suo rilassamento. Si ottiene U1 = 42 5
1 y1 = 4 1 y2 =
22 5
Essendo U1 > z si elimina S1 da L e vi si aggiungono, invece altri due problemi, S3 e S4 , individuati dai seguenti vincoli aggiuntivi. S3 : x1 4 x2 4 S4 : x1 4 x2 5. Risulta pertanto L = {S2 , S3 , S4 }. Si sceglie S3 da L e si risolve il suo rilassamento. Si ottiene U3 = 8
3 y1 = 4 3 y2 = 4
e si elimina il problema S3 . Risulta a questo punto L = {S2 , S4 }. Si sceglie da L S4 e si risolve il suo rilassamento. Si ottiene U4 = 15 2
4 y1 =
5 2
4 y2 = 5
Essendo U4 < z si chiude S4 e la lista diventa L = {S2 }. Si sceglie S2 dalla lista e si risolve il suo rilassamento. Si vede che non esistono soluzioni ammisibili. Si chide S2 e la lista L ` vuota. La soluzione corrente ` la soluzione ottima. e e z = 8 x = 4 1 x = 4. 2
111
Capitolo 5
5.1
Denizioni fondamentali
Un grafo non orientato G = (V, E) ` denito da un insieme nito V (G) = {v1 , . . . , vn } di elementi detti e nodi o vertici e da un insieme E(G) = {e1 , . . . , em } V V di coppie non ordinate di nodi dette archi o spigoli. Dato larco e = (v, w) = (w, v), i nodi v e w sono detti estremi di e, e si dice che larco e incide su u e v. Una comoda rappresentazione del grafo viene mostrata in gura 5.1a. I nodi sono rappresentati da cerchi,
v2
e2
v3 e5
e1 v1 e3
e4 e6 v5
v4 v
a)
Figura 5.1: a) Grafo non-orientato
b) Loop
b)
metre gli archi sono tratti di curva congiungenti i due estremi. Per il grafo G = (V, E) rappresentato in gura si ha V = {v1 , v2 , v3 , v4 , v5 } E = {e1 , e2 , e3 , e4 , e5 , e6 } = {(v1 , v2 ), (v2 , v3 ), (v1 , v5 ), (v3 , v5 ), (v3 , v4 ), (v4 , v5 )}.
112
Due nodi u, v sono detti adiacenti (reciprocamente) se larco (u, v) appartiene ad E. Nella gura sono adiacenti, per esempio, i nodi v1 e v2 . Due archi sono detti adiacenti se hanno un estremo in comune, come gli archi e2 ed e4 in gura. Si denisce intorno di un nodo v in G, indicato con N (v), linsieme dei nodi adiacenti a v. Nella gura N (v5 ) = {v1 , v3 , v4 }. Un nodo v si dice isolato se N (v) = . Si denisce stella di v in G, indicata con (v), linsieme degli archi incidenti su v. Nella gura (v5 ) = {e3 , e4 , e6 }. Si denisce sottografo di G = (V, E) un grafo H = (W, F ) tale che W V e F E. Si denisce sottografo indotto da W V in G = (V, E) il grafo H = (W, F ), ove linsieme degli archi F ` tale che larco e (u, v) appartiene a F se e solo se: (a) u e v appartengono a W e (b) (u, v) E. Informalmente possiamo dire che il sottografo H eredita tutti gli archi di G i cui estremi sono entrambi contenuti nel sottoinsieme W . In gura 5.2 vengono mostrati due sottogra del grafo di gura 5.1. Il primo non ` un sottografo e indotto (manca larco e4 ), mentre il secondo ` indotto in G dallinsieme di nodi {v2 , v3 , v4 , v5 }. e
v2
e2
v3
v2
e2
v3 e5
e1 v1 e3 v5
e4 e6 v5
v4
a)
Figura 5.2: a) Sottografo
b)
b) Sottografo indotto
Un grafo orientato G = (V, E) ` denito da un insieme nito V (G) = {v1 , . . . , vn } di elementi detti e nodi e da un insieme E(G) = {e1 , . . . , em } V V di coppie ordinate di nodi dette archi. Dato larco e = (v, u), il primo nodo nella coppia (v) ` detto coda, e si dice che larco e ` uscente da v. Il secondo e e nodo (u) ` detto testa, e si dice che larco e ` entrante in u. Larco si dice orientato dal nodo v al nodo e e u. I nodi v e u sono detti estremi di e, e si dice che larco e incide su v e u. Notiamo che a dierenza del caso non orientato, larco (v, u) ` distinto dallarco (u, v). Una rappresentazione del grafo orientato e viene mostrata in gura 5.3. Lunica dierenza con la rappresentazione del grafo non orientato sta nella presenza sullarco di una freccia che indica lorientamento dellarco stesso. Analogamente al caso non-orientato, si denisce stella di v in G, indicata con (v), linsieme degli archi incidenti su v. In gura 5.3, (v1 ) = {e1 , e2 , e5 }. La stella (v) pu` essere partizionata in stella o entrante (v), cio` linsieme degli archi entranti in v, e in stella uscente + (v), linsieme degli archi e uscenti da v. Nellesempio, (v1 ) = {e2 }, mentre + (v1 ) = {e1 , e5 }. Sottogra e sottogra indotti sono deniti come per il caso non orientato.
Cammini, Cammini Orientati, Cicli. Dato un grafo G = (V, E) (indierentemente orientato o non orientato), ove V = {v1 , . . . , vn } e E = {e1 , . . . , em } diremo cammino in (di) G, un insieme ordinato P = {vj0 , eh1 , vj1 , eh2 , . . . , vjp1 , ehp , vjp } con: jk {1, . . . , n}, hi {1, . . . , m}, per k = 0, . . . , p e i = 1, . . . , p, e con larco ehi incidente sui nodi vji1 e vji .1 Notiamo che nel caso del grafo orientato, lorientamento degli archi del cammino ` indierente. Si richiede semplicemente che larco ehi incida sui e
Spesso, quando non c` possibilit` di ambiguit`, un cammino viene indicato indicando la sequenza dei soli e a a nodi o quella dei soli archi
1
113
v2
e3
v3 e6 v4 testa v coda
e1 v1
e2
e4 v5 u
e5
a)
Figura 5.3: a) Grafo orientato
b)
b) Arco orientato
nodi vji1 e vji , senza specicare quale dei due nodi sia la testa e quale la coda di ehi . I nodi vj0 e vjp sono detti estremi del cammino P . Un cammino ` detto semplice se gli archi e i nodi che lo deniscono e sono tutti distinti.
v2
e2
v3 e5
v2
e3
v3
e1 v1 e3 v5
v4 v1
e2 v5
e5
a)
Figura 5.4: Cammini semplici
b)
In gura 5.4a ` mostrato un cammino semplice del grafo non orientato di gura 5.1, P = {v5 , e3 , v1 , e1 , v2 , e e2 , v3 , e5 , v4 }, mentre in gura 5.4b ` mostrato il cammino semplice del grafo orientato di gura 5.3, e P = {v5 , e5 , v1 , e2 , v2 , e3 , v3 }. In gura 5.5a ` mostrato il cammino (non semplice) del grafo non oriene tato di gura 5.1, P = {v1 , e1 , v2 , e2 , v3 , e5 , v4 , e6 , v5 , e4 , v3 , e5 , v4 }. Notiamo che se in un grafo esiste un cammino fra i nodi u e v, esister` un cammino semplice fra u e v. a In un grafo orientato, chiameremo cammino orientato un cammino P = {vj0 , eh1 , vj1 , . . . , ehp , vjp } tale che ehi = (vji1 , vji ). Nel camino orientato ` dunque importante e anche lorientamento degli archi: il nodo che precede larco nel cammino deve esserne la coda, mentre il nodo che succede allarco deve esserne la testa. In gura 5.5b ` mostrato il cammino orientato del grafo e orientato di gura 5.3, P = {v1 , e1 , v2 , e3 , v3 , e4 , v5 }. Se u e v sono, rispettivamente, il primo e lultimo nodo di un cammino orientato P , si dir` che P va da u a v 2 . a
Spesso, quando si tratta di gra orientati e non ci sia possibilit` di ambiguit`, si indica col nome di cammino a a quello che pi` propriamente dovrebbe essere chiamato cammino orientato u
2
114
v2
e2 v3
v3 e5 e5 e4 v5 v4 e6 v4 e1 v1
v2
e3
v3
e1 v1
e4 v5
a)
Figura 5.5: a) Cammino (non semplice)
b)
b) Cammino orientato
Un cammino ` detto chiuso se i suoi estremi coincidono. Deniremo ciclo un cammino chiuso C = e {vj0 , eh1 , vj1 , . . . , vhp1 , vhp1 , ehp , vj0 }, tale che {vj0 , eh1 , vj1 , . . . , ehp1 , vhp1 } ` un cammino semplice. e Il cammino chiuso P = {v1 , e1 , v2 , e2 , v3 , e3 , v4 , e4 , v2 , e5 , v5 , e6 , v1 } di gura 5.6a non ` un ciclo perch` e e il cammino P = {v1 , e1 , v2 , e2 , v3 , e3 , v4 , e4 , v2 , e5 , v5 } non ` semplice (il nodo v2 ` contenuto due volte). e e In gura 5.6b ` mostrato un ciclo. Notiamo che ancora una volta lorientamento degli archi nei gra e orientati ` indierente. Per i gra orientati si denisce ciclo orientato un camino orientato chiuso C = e {vj0 , eh1 , vj1 , . . . , ehp1 , vhp1 , ehp , vj0 }, tale che {vj0 , eh1 , vj1 , . . . , ehp1 , vhp1 } ` un cammino orientato e semplice (Fig. 5.6c)
v1 e1 v2
e6 e5 e4 e2 v3
v5
v4 e3
a)
b)
c)
c) Ciclo orientato
115
Quindi la relazione essere connesso a ` una relazione di equivalenza, che denisce una partizione dellinsieme e dei nodi V in classi di equivalenza C1 , . . . , Cq . Si ha dunque V = C1 C2 . . . Cq , e Ci Cj = , per i = j. Il grafo indotto in G dai nodi apparteneti a una classe dequivalenza Ci ` detto componente e connessa di G. Un grafo ` detto connesso se possiede una sola componente connessa. In gura 5.7 ` e e mostrato un grafo non orientato formato da due componenti connesse (notare che |V | = 6)3 .
v2
v6 v4
v5 v1 v3
Figura 5.7: Componenti connesse
Dato un grafo orientato G = (V, E), un nodo v V ` fortemente connesso a un nodo u V se esistono e due cammini orientati in G, uno da v ad u e laltro da u ad v. Anche in questo caso ` facile vedere che la e relazione di forte connessione ` una relazione dequivalenza che denisce le classi C1 , . . . , Cq nellinsieme e dei nodi V . Il grafo indotto in G dai nodi appartenenti a una classe Ci ` detto componente fortemente e connessa di G. Un grafo si dice fortemente connesso se possiede una sola componente fortemente connessa. In gura 5.8a ` mostrato un grafo orientato e in gura 5.8b le sue tre componenti fortemente connesse. e
v1 v2 v1 v2
v4 v5 v3 v5 v3
v4
a)
Figura 5.8: a) Grafo orientato
b)
Alberi. Un grafo (orientato o non orientato) ` detto aciclico se non contiene cicli (non necessariamente e
orientati) come sottogra. Si dice albero un grafo aciclico e connesso. Ogni grafo aciclico ` lunione di e
Con il simbolo |I|, dove I ` un insieme nito di elementi, si indica la cardinalit` dellinsieme I, cio` il numero e a e di elementi che compongono l insieme stesso.
3
116
uno o pi` alberi e viene detto foresta. In gura 5.9a ` mostrato un albero, in gura 5.9b una foresta. u e
v1 v2
v1 v6 v3 v2 v3 v5
v4
v5
v6
v7
v4
a)
Figura 5.9: a) Albero
b)
b) Foresta
Dato un albero T = (V, E), con |V | 2, diremo foglia un nodo v V tale che |(v)| = 1 (|(v)| = 1). Ad esempio, in gura 5.9a sono foglie v4 , v5 , v6 , v7 . Valgono i due seguenti risultati, che diamo senza dimostrazione. Notiamo, in particolare, che il secondo lemma fornisce una serie di denizioni alternative di albero. Proposizione 5.1.1 Le seguenti asserzioni sono equivalenti: 1. G = (V, E) ` un albero. e 2. Ogni coppia di nodi ` connessa da un unico cammino. e Dato un grafo connesso G = (V, E) diremo albero ricoprente di G un albero T = (W, F ) con W = V e F E.
Gra bipartiti Un grafo G = (V, E) non orientato ` detto bipartito se ` possibile trovare una pare e
tizione V1 , V2 dei suoi nodi 4 tale che gli estremi di ogni arco appartengono uno a V1 e uno a V2 . Nella gura 5.10 ` riportato un esempio di grafo bipartito. e Si puo dimostrare che vale la seguente caratterizzazione dei gra bipartiti Proposizione 5.1.2 Un grafo ` bipartito se e solo se non contiene cicli di lunghezza dispari. e Spesso un grafo bipartito viene indicato, mettendo in evidenza la partizione dellinsieme dei nodi, come G = (V1 , V2 , E).
5.2
Rappresentazioni di un grafo
Un grafo G(V,E) pu essere rappresentato in molti modi diversi. Nelle pagine precedenti abbiamo gia incontrato due modi diversi: la rappresentazione estensiva e quella graca. Nella rappresentazione estensiva vengono elencati tutti gli elementi dellinsieme V e tutti quelli dellinsieme E, nella rappresentazione graca, invece, il grafo viene rappresentato medianto un disegno in cui ai nodi si fanno corrispondere piccoli cerchi e agli archi tratti di curva congiungenti i cerchi. Gi` da a
4
117
118
Nel caso di gra non orientati, il generico elemento (i, j) della matrice sar` pari a 1 se il j-esimo arco a del grafo incide sul nodo i, sar` pari a 0 se larco j-esimo non incide sul nodo i. a Nel caso di gra orientati, il generico elemento (i, j) della matrice sar` pari a 1 se larco j-esimo a esce dal nodo i, sar` pari a 1 se larco j-esimo entra nel nodo i, sar` pari a 0 se larco j-esimo non incide a a sul nodo i. Nella matrice di incidenza ogni colonna ha esattamente due elementi diversi da zero; essi sono in corrispondenza delle due righe della matrice relative ai due nodi estremi dellarco.
Lista di adiacenze. Questa modalit` di rappresentazione ` basata su una lista di adiacenze del a e grafo, in cui per ogni nodo del grafo vengono elencati i nodi adiacenti. Questa rappresentazione ` in genere la pi` eciente dal punto di vista computazionale, specialmente e u per gra con pochi archi.
Completiamo questa sezione con un esempio. Consideriamo il grafo G(V, E) denito nel seguente modo: V = {v1 , v2 , v3 , v4 , v5 , v6 } E = {e1 = (v1 , v2 ), e2 = (v1 , v3 ), e3 = (v3 , v2 ), e4 = (v2 , v4 ), e5 = (v3 , v5 ), e6 = (v4 , v5 ), e7 = (v4 , v6 )} Spesso, nel riportare la rappresentazione estensiva di un grafo, si identicano, per comodit`, i vertici con a i primi n numeri naturali. In questo caso la rappresentazione estensiva del grafo diventa V = {1, 2, 3, 4, 5, 6} E = {(1, 2), (1, 3), (3, 2), (2, 4), (3, 5), (4, 5), (4, 6)}, e spesso ci si limita a fornire il valore di n, cio` il numero di nodi e la lista degli archi. In gura 5.11 sono e riportate le rappresentazioni di questo grafo con le varie tecniche appena descritte.
5.3
Alcuni esempi
In questa ultima sezione verranno formulati alcuni problemi utilizzando il formalismo dei gra. Scopo di questi esempi non ` quello di dare una panoramica completa di quei problemi la cui formulazione (e e risoluzione) ` basata sui gra (non sarebbe suciente un intero corso dedicato a questo tema!). Piuttosto e vogliamo mostrare come problemi molto diversi tra loro possano essere formulati (e risolti) usando una rappresentazione basata sui gra, che spesso contribuisce a rendere chiari problemi apperentemente molto intricati, dando cos` inoltre, una prova dellimportanza della scelta di un buon modello nella risoluzione , di un problema e della necessit` di disporre di un ampio spettro di modelli per poter adeguatamente a modellare problemi pratici.
Scambio dei cavalli. Sia data una scacchiera 3 3 in cui le caselle siano numerate con i numeri
1,2,3,4,5,6,7,8,9 come in gura 5.12, due cavalli bianchi nelle caselle 1 e 3, due cavalli neri nelle caselle 7 e 9. Il problema ` quello di spostare i due cavalli bianchi al posto di quelli neri e viceversa, spostando e un cavallo per volta secondo le modalita delle mosse di scacchi (per esempio il cavallo nella casella 1 in una mossa potr` andare solo nelle caselle 6 e 8, i cavallo nella casella 7 potr` andare nelle caselle 2 e 6, a a ecc.) e facendo in modo che due cavalli non occupino mai contemporaneamente la stessa casella. Questo problema, apparentemente intricato, diventa semplice non appena viene formulato come problema su gra. Associamo ad ogni casella della scacchiera un nodo di un grafo. Due nodi sono collegati da un arco se (e solo se) ` possibile passare con un cavallo dalluna allaltra delle corrispondenti caselle. Il grafo e risultante ` quello disegnato in gura 5.12 ( da cui ovviamente si osserva come non sia mai possibile e passare attraverso la casella 5). Osservando il grafo si individua immediatamente la strategia da seguire per ottenere la soluzione desiderata: basta far circolare i cavalli sul grafo (in questo caso formato da un unico ciclo) in modo da non sovrapporli mai, no a quando ogni cavallo non ha raggiunto il posto desiderato. Si osservi che il minimo numero di mosse necessario per raggiungere lobiettivo ` pari a 24. e
119
4 2 1 1 3 2 3 5 5 4 7
Rappresentazione grafica
0 0 0 0 0 0
1 0 1 0 0 0
1 0 0 0 0 0
0 1 0 0 0 0
0 0 1 1 0 0
0 0 0 1 0 0
-1 1 0 0 0 0
-1 0 1 0 0 0
0 1 -1 0 0 0
0 -1 0 1 0 0
0 0 -1 0 1 0
0 0 0 -1 1 0
0 0 0 -1 0 1
Matrice di connessione
Matrice di incidenza
1: 2: 3: 4: 5: 6:
2, 3 4. 2, 5 5, 6
Lista di adiacenze
Figura 5.11: Rappresentazioni di un grafo
120
1 4 7
2 5 8
3 6 9
CB
CB
CN
CN
121
Assegnazione delle aule. In una facolt` universitaria vi sono nello stesso orario n corsi e m aule a
disponibili. Per ragioni di capienza delle aule e di attrezzature disponibili, ogni corso pu essere tenuto solo in alcune delle aule. Il problema ` quello di stabilire quale ` il numero massimo di corsi che ` possibile e e e tenere nellorario considerato. Il problema pu` essere scritto come problema su gra nel seguente modo: sia G(V1 , V2 , E) un grafo o bipartito in cui linsieme di nodi V1 corrisponde ai corsi, linsieme di nodi V2 corrisponde alle aule ed esiste un arco fra due nodi i e j (con i appartenente ad V1 e j appartenente a V2 ) se (e solo se) il corso i pu` essere tenuto nellaula j. Il problema di stabilire qual ` il numero massimo di corsi che ` possibile o e e tenere nellorario considerato pu` ora essere formulato come il problema di scegliere sul grafo il massimo o numero di archi (corrispondenti ad assegnazioni di corsi ad aule) tali che due archi scelti non siano mai adiacenti. Infatti se due archi fossero adiacenti in un nodo dellinsieme V1 , allora vorrebbe dire che uno stesso corso si tiene contemporaneamente in due aule diverse. Se due archi fossero adiacenti in un nodo dellinsieme V2 , allora vorrebbe dire che in una stessa aula si tengono contemporaneamente due corsi. In entrambi i casi le assegnazioni di aule non sono ovviamente ammissibili. Questo problema ` detto di e accoppiamento bipartito e verr` risolto nel capitolo 8. a
Rete di trasporto con ritardo Sia data una rete di trasporto con 4 nodi e 5 archi, pesata sugli archi 5 con pesi corrispondenti alla quantit` trasportabile sullarco in un singolo viaggio (per esempio 5 a tonnellate). Su ogni arco un viaggio richiede una unit` di tempo (per esempio unora) e in ogni unit` di a a tempo pu` essere eettuato al pi` un viaggio su ogni arco. In ogni nodo pu` essere inoltre immagazzinata o u o merce senza limiti di tempo e di quantit`. a La rete ` riportata come grafo G = (V, E) nella gura 5.13. Il problema ` quello di stabilire se ` e e e possibile trasferire una assegnata quantit` di merce dal nodo 1 della rete al nodo 4 entro 3 unit` di tempo. a a Per formulare il problema in modo da individuare pi` facilmente la soluzione ` opportuno introdurre un u e altro grafo (orientato) H = (V , E ) (vedi gura 5.13). Nel grafo H, ogni nodo corrisponde ad un nodo del grafo G ad un dato istante di tempo t. Il tempo ` in questo caso assunto discreto, per cui t pu` e o essere uguale a 0,1, 2 oppure 3. Ogni nodo di H pu` quindi essere indicato con due indici: uno relativo o al nodo di G considerato, laltro relativo al tempo. Nel grafo H, esiste un arco tra due nodi (per esempio (i, j) e (k, h) ) se ` possibile inviare in una unit` di tempo del materiale da un nodo allaltro. Quindi, e a nel nostro esempio, perche esista un arco, dovr` essereh = j + 1 e (i, k) dovr` appartenere allinsieme di a a archi A. La capacit` di ogni arco di H sar` pari alla capacit` del corrispondente arco di G. Per esempio a a a la capacit` dellarco da (i, j) a (k, h) di H sar` pari alla capacit` dellarco (i, k) di G. Inoltre, poiche si a a a suppone che la merce possa restare quanto si vuole in ogni nodo senza limiti di capienza, ` necessario e introdurre alcuni archi aggiuntivi, di capacit` innita, tra tutte le coppie di nodi (i, j) e (k, h) tali che a i = k eh = j + 1. Il problema, formulato sul nuovo grafo H, ` ora quello di decidere se ` possibile inviare e e un usso pari alla quantit` di merce da trasportare dal nodo (1, 0) al nodo (4, 3). Questo problema pu` a o essere facilmente risolto con lalgoritmo del massimo usso che verr` trattato nel capitolo 8. a Colorazione di una carta geograca. Il problema ` quello di stabilire il numero minimo di e colori necessario per colorare una carta geograca, assegnando colori alle varie nazioni rappresentate sulla carta, in modo che due nazioni adiacenti (che quindi abbiano un tratto di frontiera in comune) siano sempre colorate in modo diverso. Si suppone che ogni nazione sia formata da una unica regione connessa e che nazioni adiacenti abbiano una linea di conne in comune di lunghezza maggiore di zero (e non quindi solo un singolo punto in comune). Assegnando ad ogni nazione un nodo di un grafo e collegando due nodi se e solo se le due nazioni corrispondenti sono adiacenti, si ottiene un grafo (che viene detto planare). La famosa congettura dei quattro colori, ormai da chiamare teorema dei quattro colori, aerma che ogni carta geograca ` colorabile utilizzando al pi` quattro colori. Questa congettura era gi` nota nel e u a 1840. Nel corso di oltre un secolo sono state fornite dimostrazioni per molti casi particolari del problema
5
questo vuol dire che ad ogni arco ` associato un peso, cio` un numero e e
122
2 2 1 2 3 Grafo G 2 2 2 1 4
1,0
1,1
1,2
1,3
2,0
2,1
2,2
2,3
3,0
3,1
3,2
3,3
4,0
4,1
4,2
4,3
Grafo H
123
(oltre a molte dimostrazioni della congettura, poi rivelatesi sbagliate o valide per particolari classi di gra). Solo nel 1976 la congettura ` stata dimostrata in tutta la sua generalit` usando gli strumenti della e a teoria dei gra.
124
Capitolo 6
Cammini minimi
Come abbiamo accennato nel capitolo precedente, il linguaggio dei gra permette di rappresentare in modo semplice la struttura di molti problemi applicativi, consentendo, in molti casi di grande importanza, di costruire metodi razionali di soluzione dei problemi stessi. Fra i problemi pi` importanti, pi` semplici e pi` antichi, per la cui soluzione sono utilizzate rappreu u u sentazioni basate su gra, vi sono i problemi di ricerca di cammini minimi, di cui ci occupiamo in questo capitolo. I gra considerati in questo capitolo sono, salvo diversa specicazione, gra orientati. Nel caso della ricerca di cammini infatti ` sempre possibile ricondursi con poca fatica a questo caso. Per fare questo e ` suciente sostituire ogni arco non orientato (e quindi percorribile in entrambi i versi) con due archi e diretti in direzione opposta. Se esiste un cammino con le caratteristiche richieste nel grafo originario, allora esiste anche nel grafo trasformato e viceversa. Per brevit`, inne, trattando solo di gra orientati, indichiamo con grafo aciclico un grafo che non a contenga cicli orientati.
6.1
Dato un grafo orientato G = (V, E), associamo a ciascun arco e = (u, v) E un peso p(u, v) I Per R. ogni cammino orientato P = {v1 , e1 , . . . , ep1 , vp }, deniamo peso p(P ) del cammino P la somma dei pesi degli archi che appartengono a P , e cio`: p(P ) = (u,v)P p(u, v). Il problema del cammino minimo e pu` essere enunciato nel modo seguente: o dati due nodi s V e t V , trovare un cammino orientato P in G da s a t che abbia peso minimo. Notiamo che: - Se non esiste un cammino orientato che vada da s a t in G, il problema non ha soluzioni ammissibili. - Se esiste un ciclo orientato C in G, tale che p(C) < 0 (peso negativo), il problema ` illimitato inferiore mente. In genere, dato un nodo s gli algoritmi per il calcolo di cammini minimi determinano non il (o uno dei) cammini minimi da s a un ssato nodo t, ma il cosidetto albero dei cammini minimi, cio` un sottografo e di G che ` un albero i cui nodi includono s e tutti i nodi da esso raggiungibili con un cammino orientato e e tale che lunico (vedi teorema 5.1.1) cammino da s a ogni altro nodo t dellalbero sia un cammino minimo da s a t. A prima vista questa pu` sembrare una complicazione non necessaria, ma in eetti, per come o
125
sono organizzati gli algoritmi, vedremo che non ` cos` Quindi, in pratica, gli algoritmi che studieremo e . risolvono il seguente problema: dato un nodo s V , trovare un albero dei cammini minimi da s a ogni nodo in V raggiungibile da s. Nella letteratura esistono moltissimi algoritmi per il calcolo dei cammini minimi. Ognuno di essi ha le sue peculiarit` e le sue limitazioni. Per esempio alcuni algoritmi funzionano solo su determinate classi a di gra (gra aciclici, gra con pesi non negativi, etc.), inoltre ci possono essere notevoli dierenze nella ecienza degli algoritmi. In generale un algoritmo che funziona su una classe ampia di gra sar` pi` a u complesso di un algoritmo studiato per una classe ristretta di gra, tenendo conto delle peculiarit` di a quella classe. In questo capitolo consideremo due algoritmi: il primo calcola i cammini minimi su gra aciclici, il secondo calcola i cammini minimi su gra con pesi non negativi. Nella parte rimanente di questa sezione illustriamo alcuni semplici esempi di calcolo dei cammini minimi. Alla ne del capitolo considereremo due casi pi` complessi e interessanti. u
6.1.1
Dato un grafo pesato che rappresenta la rete stradale italiana in cui i pesi degli archi indicano il (valore atteso del) tempo di percorrenza dellarco, il problema ` quello di trovare il cammino che congiunge due e particolari nodi del grafo (nodo di partenza e nodo di arrivo) con tempo di percorrenza minimo. Si noti che possono esistere piu cammini con la caratteristica di essere minimi. Questo esempio, apparentemente semplice, solleva complessi problemi di modellistica. Un primo problema ` relativo al livello di dettaglio necessario nella rappresentazione. Se, per esempio, il percorso e da eettuare parte da Milano e arriva a Brindisi, il grafo dovr` contenere solo le autostrade e le principali a strade di collegamento fra citt` diverse e unintera citt` potr` essere rappresentata con un nodo del a a a grafo. Un eccesso di dettaglio appesantirebbe inutilmente la rappresentazione, rendendo ogni algoritmo di soluzione lento e inecace. Se, daltra parte, il percorso da eettuare parte da piazza San Pietro a Roma e arriva a un indirizzo di Frascati (a circa 20 km. da Roma), la rappresentazione davr` essere a completamente diversa, non solo perch il grafo sar` diverso, ma anche perch il peso degli archi, per e a e essere signicativo, dovr` prendere in considerazione i problemi del traco urbano e quindi essere funzione a dellora ed eventualmente del giorno. Infatti, eettuare tale percorso alle 10 di mattina di un giorno feriale non sar` ovviamente la stessa cosa che eettuarlo alle 4 del mattino (magari di un giorno festivo). a Un secondo problema ` relativo al tipo di obiettivi che ci si propone. Infatti, una rappresentazione e pu` essere o pu` non essere adeguata, a seconda del motivo per cui si vuole conoscere il cammino di o o tempo minimo. Per esempio, per alcune applicazioni critiche (autombulanze, vigili del fuoco, polizia), non basta linformazione sul valore atteso del tempo di transito, ma serve anche valutare la varianza di ` tale tempo, ossia le possibili variazioni rispetto alla media. E meglio infatti utilizzare un percorso un po pi` lungo ma con un tempo di percorrenza prevedibile con relativa certezza, piuttosto che un percorso u mediamente piu breve ma per cui vi sia il rischio di restare imbottigliati nel traco. Un terzo problema ` relativo alla quantit` di informazioni che ` necessario inserire nellelaboratore e a e per arontare il problema. Per calcolare il cammino da Milano a Brindisi ` necessario inserire lintera e carta stradale italiana, o basta una porzione? Da un lato, pi` informazioni vengono inserite maggiore ` il u e tempo necessario per inserirle e il costo delloperazione; daltro canto se vengono calcolati spesso percorsi di tempo minimo sulla rete stradale italiana forse conviene memorizzare tutto in modo organico una volta per tutte.
6.1.2
Il problema considerato ` quello di costruire al costo minimo una autostrada fra le citta A e B. Nel e grafo riportato in gura 6.1 i nodi rappresentano i punti per cui lautostrada puo passare e gli archi i
126
possibili collegamenti fra punti. Il peso degli archi rappresenta il costo di costruzione della relativa tratta di autostrada.
A 5 E 4 Y
8 7
Q 3
10 13 12
Z 4 T 18 4
9 8
R 3 U
10
6.2
Una classe di gra orientati di particolare interesse in campo applicativo (vedi gli esempi alla ne del capitolo) ` la classe di gra aciclici. La ricerca di cammini minimi o massimi su tali gra ` uno strumento di e e progetto di notevole importanza. Come si vedr` nel seguito, i due problemi di minimo e di massimo sono, a in questo caso particolare, risolti da due algoritmi identici eccetto che per la sostituzione di un massimo a un minimo nella formula ricorsiva alla base del procedimento. Nel seguito verr` prima considerato il caso a di un problema di cammino minimo. Per poter procedere con la descrizione dellalgoritmo, ` necessario e studiare prima una particolare tecnica di numerazione dei nodi di un grafo aciclico.
6.2.1
Una caratteristica peculiare dei gra aciclici (sia G = (V, E) il grafo, con|V | = n e |E| = m) consiste nella possibilit` di numerare i nodi del grafo con i numeri 1,2,3,....,n-1,n in modo tale che: a se esiste un arco dal nodo i al nodo j allora j > i Tale numerazione viene detta numerazione topologica dei nodi del grafo e non ` in generale unica. e Non tutti i gra possono essere numerati topologicamente. In eetti lesistenza di una numerazione topologica dei nodi di un grafo caratterizza esattamente la classe dei gra aciclici. Vale infatti il seguente teorema. Teorema 6.2.1 Un grafo ` aciclico se e solo se esiste una numerazione topologica dei suoi nodi. e
127
Dimostrazione. Sucienza. Supponiamo che esista una numerazione topologica dei nodi e facciamo vedere che l esistenza di un ciclo porterebbe ad una contraddizione. Possiamo assumere che i nodi siano numerati topologicamente, indicheremo li-esimo nodo di questa particolare numerazione, come vi . Se esiste un ciclo (orientato) vuol dire che esiste una successione di nodi (vi , vj , vk , . . . , vr , vs ) tali che - esistono gli archi (vi , vj ), (vj , vk ), . . ., (vr , vs ); - vi = vs . Ma allora, da una parte, siccome la numerazione ` topologica abbiamo i < j < k < . . . < r < s, cio` e e i < s, mentre dallaltra, poich vi = vs abbiamo i = s. Questa ` una contraddizione e cos` il grafo deve e e essere aciclico. Necessit`. Supponiamo che il grafo sia aciclico e mostriamo che deve esistere almeno una numerazione a topologica. La dimostrazione ` costruttiva, faremo cio` vedere che esiste una numerazione topologica e e costruendone una. Come primo passo osserviamo che se il grafo ` aciclico, deve esistere almeno un nodo che non abbia e archi entranti. Infatti, se ci` non fosse vero, potremmo ragionare nel modo seguente. Prendiamo un nodo o qualunque, chiamiamolo v1 . Siccome tutti i nodi hanno archi entranti esiste un nodo predecessore di v1 , indichiamolo con v2 ; notiamo che per come abbiamo scelto v2 esiste larco (v2 , v1 ) (attenzione, questa ` e una numerazione non topologica). Possiamo ripetere il ragionamento con v2 e trovare un nodo v3 tale che esista l arco (v3 , v2 ). Siccome stiamo supponendo, per assurdo, che tutti gli archi abbiano degli archi entranti, possiamo ripetere il ragionamento quante volte vogliamo. Notiamo che ogni nodo generato deve essere diverso dai precedenti, altrimenti avremmo trovato un ciclo, contraddicendo laciclicit` del a grafo. Daltra parte, arrivati a vn i nodi del grafo sono niti e quindi il predecessore di vn che stiamo supponendo esitente per assurdo, deve per forza essere uno dei nodi gi` esaminati. Cos` si viene a formare a un ciclo. Quindi dato un grafo aciclico deve per forza esistere almeno un nodo che non ha archi entranti. Prendiamo uno di questi nodi e numeriamolo con il numero 1. Eliminiamo dal grafo il nodo 1 e tutti gli archi uscenti da esso. Il nuovo grafo che otteniamo ` ovviamente ancora un grafo aciclico. Quindi per e lo stesso ragionamento fatto prima deve esistere almeno un nodo che non ha archi entranti. Prendiamo uno di questi nodi e numeriamolo con il numero 2. Notiamo che ovviamete se consideriamo il grafo originario il nodo 2 pu` avere archi entranti, ma solo provenienti dal nodo 1 e quindi la condizione i < j o ` rispettata. Possiamo ora ripetere il procedimento n volte (quanti sono i nodi) ed ottenere cos` una e numerazione topologica del grafo. 2 Il precedente teorema ` importante, anche perch nella dimostrazione della necessit` ` sostanzialmente e e ae dato un algoritmo per numerare topologicamente i nodi di un grafo. Riesponiamo qui lalgoritmo per chiarezza. - Siccome il grafo ` aciclico, deve esistere almeno un nodo con solo archi uscenti; e - individuiamo uno di questi nodi e attribuiamogli il numero 1; - cancelliamo il nodo numerato e tutti gli archi adiacenti, nel nuovo grafo ridotto individuiamo un nodo con soli archi uscenti e attribuiamogli il numero 2, e cos` via no ad aver numerato tutti i nodi La correttezza e validit` di questa procedura ` stata provata nella dimostrazione della necessit` del a e a Teorema 6.2.1. Notiamo che se ad un certo punto dellapplicazione della procedura non possiamo procedere, se succede cio` che ad un determinato passo non riusciamo a trovare un nodo senza archi entranti, questo e vuol dire che il grafo considerato contiene un ciclo. Quindi la procedura per la numerazione topologica di un grafo pu` anche essere utilizzata per detero minare se un grafo ` aciclico o meno. e Come esempio consideriamo il grafo di gura 6.2.
128
Il procedimento ` terminato con la numerazione di tutti i nodi. Il grafo ` dunque aciclico e la numerazione e e trovata ` topologica. e Supponiamo ora che nel precedente grafo larco (B, D) sia orientato da D a B. Ovviamente si verrebbe a creare un ciclo. Se proviamo ad applicare la procedura per la determinazione di una numerazione topologica possiamo iniziare numerando il nodo A come nodo 1. Ma dopo non possiamo pi` procedere u perch eliminato il nodo A e gli archi da esso uscenti ((A,B) e (A,C)) non ` pi` possibile individuare un e e u nodo che non abbia archi entranti.
6.2.2
La numerazione dei nodi di un grafo aciclico descritta nella sezione precedente consente di costruire un algoritmo di soluzione per il problema di cammino minimo particolarmente semplice. Infatti, nella ricerca di un cammino tra una qualsiasi coppia di nodi i e j del grafo, a causa della numerazione attribuita ai nodi, si pu` aermare che: o se j < i allora non esistono cammini da i a j; se j > i allora gli unici nodi che ` necessario considerare nella ricerca del cammino da i a j sono i nodi e con indice k tale che i < k < j. Infatti, se il cammino passasse per un nodo h > j, allora non potrebbe tornare su j, a causa della mancanza di archi che collegano nodi con indice maggiore a nodi con indice minore; se passasse per un nodo h < i, allora dovrebbe esistere un cammino da h a i, il che comporterebbe lesistenza di archi che collegano nodi con indice maggiore a nodi con indice minore.
129
Sulla base di queste considerazioni, ` possibile impostare un algoritmo per il calcolo dellalbero dei e cammini minimi tra un nodo del grafo (per esempio il nodo 1) e tutti i nodi con indice superiore (per quelli con indice inferiore non esiste sicuramente un cammino; ovviamente, se il nodo di partenza ` quello e contrassegnato con lindice 1, allora si tratta di calcolare lalbero dei cammini minimi tra il nodo 1 e tutti gli altri). Lalgoritmo per il calcolo dellalbero dei cammini minimi dal nodo 1 a tutti gli altri nodi si basa sul calcolo in sequenza dei cammini minimi dal nodo 1 al nodo 2, dal nodo 1 al nodo 3, dal nodo 1 al nodo 4, e cos via. Indichiamo con: - p(i, j) il peso dellarco (i, j) che parte dal nodo i e arriva al nodo j; - f (i) il valore del cammino minimo dal nodo 1 al nodo i; - J(i) il nodo che precede i su tale cammino (nel caso il cammino minimo non sia unico, allora se ne sceglie uno qualsiasi fra quelli minimi). Si noti che dai valori J(i) ` possibile ricostruire in modo immediato lalbero (o uno dei possibili alberi) e dei cammini minimi. Possiamo allora illustrare lalgoritmo per il calcolo dei percorsi minimi. - f (1) := 0; J(1) := 1; - per j = 2, 3, 4, . . . , n 1, n ripeti la seguente serie di operazioni f (j) := min(i,j) (j) {f (i) + p(i, j)}; J(j) := valore di i per cui si ` vericato il minimo; e Si noti che una volta assegnato un peso f(i) a un nodo (cio` un valore del cammino minimo dal nodo e 1 al nodo considerato), tale peso non viene pi` modicato nel corso dellalgoritmo, ma indica in modo u denitivo il valore del cammino. Questo ` dovuto al fatto, gi` citato, che tutti i nodi successivi non e a devono essere considerati per il calcolo del percorso dal nodo 1 al nodo i. Come esempio consideriamo il grafo di gura 6.3.
2 1 1 3 3 1 1 3 4
130
Passo 1 2 3 4
2 1 1 1 1 3 4
Esempio 6.2.2 Sia dato il grafo di Figura 6.5. Determinare lalbero dei cammini minimi, utilizzando
B 4 A 3 D 2 3 C
1 5 10 3 2 2
Figura 6.5: Grafo Esercizio 6.2.2
E 4 F 3 G
lalgoritmo per gra aciclici. Soluzione. Si deve prima numerare topologicamente il grafo. I passi sono riportati nella seguente tabella ed il grafo risultante in Figura 6.6
131
Passo 1 2 3 4 5 6 7
Osserviamo che la numerazione topologica in questo esempio non unica; infatti ai passi 2 e 5 potevamo e scegliere tra due nodi. Apllichiamo ora lalgortimo. I passi sono riportati nella seguente tabella
3 4 1 3 2 2 3 4
1 5 10 3 2 2
5 4 7 3 6
6.2.3
Se il problema di ottimo ` quello della determinazione del cammino di peso massimo sul grafo, allora ` e e facile convincersi che basta sostituire nella formula ricorsiva al min un max e tutte le considerazioni fatta continuano, in questo caso particolare di gra aciclici, a essere valide. Oltre che da considerazioni dirette questo risultato pu` essere dedotto coniderando che il problema di trovare un cammino di peso massimo o su un grafo aciclico ` equivalente a quello di trovare un cammino di peso minimo sullo stesso grafo dove e i pesi, per`, sono stati cambiati di segno. o Lalgoritmo per il calcolo dei cammini massimi su graci aciclici ` allora il seguente e
132
4 3
5 5
4 2 2 3 6 5
Figura 6.7: Albero dei cammini minimi
- f (1) := 0; J(1) := 1; - per j = 2, 3, 4, . . . , n 1, n ripeti la seguente serie di operazioni f (j) := max(i,j) (j) {f (i) + p(i, j)}; J(i) := valore di i per cui si ` vericato il massimo; e Come esempio consideriamo sempre il grafo di gura 6.3 Si tratta di determinare lalbero dei cammini massimi tra il nodo 1 e tutti gli altri nodi. I vari passi dellalgoritmo portano alla seguente successione di valori f (i) e J(i) Passo 1 2 3 4 Valore di f(i) f (1) = 0 f (2) = 1 f (3) = max{3, 1 + 1} = 3 f (4) = max{1 + 3, 3 + 1} = 4 Valore di J(i) J(1) = 1 J(2) = 1 J(3) = 1 J(4) = 2 (oppure J(4) = 3)
6.3
Lalgoritmo di Dijkstra permette di risolvere il problema del cammino minimo fra due nodi qualora tutti i pesi degli archi siano non negativi. Pi` precisamente, lalgoritmo calcola il peso del cammino minimo u da un nodo s a tutti gli altri nodi del grafo, costruendo conteporaneamente lalbero dei cammini minimi. Siccome in questo caso la numerazione non gioca nessun ruolo, in questo paragrafo supponiamo, senza perdita di generalit`, che s sia sempre uguale a 1. a Notiamo la dierenza con il caso esaminato nel paragrafo precedente: nel caso precedente non cera nessuna restrizione sui pesi, ma cera una restrizione sulla topologia del grafo, che non doveva contenere cicli orientati. Nel caso esaminato in questo paragrafo, non c` nessuna restrizione sulla topologia del e grafo (che pu` essere qualunque e contenere, dunque, cicli orientati), ma c` una restrizione sui pesi, che o e devono essere non negativi.
133
` E evidente che il caso analizzato in questo paragrafo ` di interesse in quanto, per esempio, in tutti i e casi in cui la ricerca di cammini minimi corrisponde alla ricerca di un reale percorso in, per esempio, una citt`, esisteranno cicli, ma i pesi, che corrispondono a distanze siche, sono ovviamente positivi. a Unaltra dierenza che vogliamo segnalare subito ` che in questo caso, non ` possibile dare una e e semplice variante dellalgoritmo che calcoli i cammini di peso massimo in quanto, se facciamo diventare il problema di minimo un problema di massimo cambiando i segni dei pesi, il grafo che otteniamo ha i pesi tutti non positivi, e quindi lalgoritmo non ` pi` utilizzabile. e u Lalgoritmo per il calcolo dei cammini minimi su gra aciclici si basa fortemente sul fatto che i nodi del grafo siano numerati topologicamente. Tenendo conto del fatto che il cammini minimo tra il nodo i e il nodo j (con j > i), se esiste, pu` passare solo per i nodi k, con k compreso tra i e j, abbiamo o sviluppato una semplice procedure iterativa. Nel caso di gra con pesi non negativi vogliamo, in qualche modo, ancora cercare di sviluppare un algoritmo che abbia le stesse caratteristiche. Ovviamente, non disponendo pi` di una numerazione topologica dobbiamo ragionare in maniera diversa. Vediamo su un u esempio come possiamo ragionare. Consideriamo il grafo in gura 6.8 e proponiamoci di trovare i cammini minimi dal nodo 1 a tutti i nodi da esso raggiungibili. Analogamente al caso dei gra aciclici, poniamo f (1) = 0 e J(1) = 1. Vogliamo anche in questo caso arrivare ad associare ad ogni nodo i del grafo due etichette, f (i) e J(i) che diano rispettivamente, la distanza dal nodo 1 e il predecessore di i su un cammino minimo che va da 1 a i.
4 4 2 7 5 1 1 3 6 7 1 2 5
5 2
134
etichettati). Sono 2, 5, 6. Le distanze minime da 1, con la restrizione di passare solo per 1 e 3, sono: - per il nodo 2: 6 (distanza data dal cammino che passa per i nodi 1, 3, 2); - per il nodo 5: 3 (distanza data dal cammino che passa per i nodi 1, 3, 5); - per il nodo 6: 8 (distanza data dal cammino che passa per i nodi 1,3,6). Notiamo che per andare al 2 due passando solo per i nodi 1 e 3 (gi` etichettati) esiste anche dato a dallarco (1,2), ma questi ha un peso 7 superiore a quello che si ottiene passando per 3. Osserviamo anche che il nodo scelto `, tra i nodi ancora non etichettati, quello che ha la distanza distanza minima da 1 se ci e limitiamo a considerare solo i cammini che passano per i nodi gi` etichettati. A questo punto possiamo a ragionare in modo simile a quello adottato prima, anche se la situazione ` leggermente pi` complessa. e u Consideriamo il nodo 5 (quello che ha la distanza pi` piccola, tra quelli raggiungibili dai nodi 1 e 3), e u poniamo f (5) = 3 e J(5) = 3. Queste sono etichette corrette. Supponiamo infatti che esista un altro cammino, C, da 1 a 5, diverso da quello trovato (e dato dai nodi 1,3 e 5) e con un peso minore di 3. Questo cammino C deve passare per almeno un nodo diverso da 1 e 3 e 5 per losservazione in corsivo fatta poche righe sopra. Ora, sia j il primo nodo diverso da 1, 3 e 5 nel cammino C. Il peso del cammino da 1 a j deve essere di almeno 3, sempre per losservazione in corsivo fatta prima. Siccome la parte del cammino che va da j a 5 ha un valore non negativo (per lipotesi che i pesi siano tutti non negativi) abbiamo di nuovo un assurdo. A questo punto la tecnica da adottare dovrebbe essere chiara. A un generico passo dellalgoritmo possiamo supporre di avere un insieme di nodi, diciamo S, che hanno gi` le loro etichette f e J corretaa mente assegnate. Si sceglie il nuovo nodo da mettere in S come il nodo (o uno dei nodi) che ha la distanza minima da 1 con il vincolo di passare solo per nodi di S. Ad ogni passo aggiungiamo un nodo in S e quindi in un numero di passi uguale al numero dei nodi, lalgoritmo termina con le etichette corretamente assegnate. Qui di seguito diamo una descrizione pi` dettagliata (e pi` vicina a una possibile implementazione u u sul calcolatore) dellalgoritmo delineato. In questa descrizione indichiamo con S i nodi a cui sono state assegnate le etichette corrette f e J, e con T tutti gli altri nodi. A dierenza di quanto visto nora, per`, o noi diamo delle etichette provvisorie, che denominiamo sempre, per brevit`, f e J, anche ai nodi in T . a Se i appartiene a T , f (i) rappresenta le distanze minima del nodo i dal nodo 1, con il vincolo di passare solo per nodi di S, e J(i) ` il corrispondente predecessore lungo il cammino minimo. Se non esiste nessun e cammino da 1 a i che passa solo per nodi in S, poniamo f (i) = + e J(i) ` lasciato indenito. Queste e etichette hanno lunico scopo di facilitare, ad ogni passo, la scelta del nodo in T da mettere in S. Infatti ` chiaro che baster` scegliere, di volta in volta, il nodo in T con il valore di f pi` piccolo. Ovviamente, e a u ad ogni iterazione, cambiando i nodi in S, le etichette provvisori dovranno essere aggiornate. Questo viene fatto nel punto (c) dellalgoritmo, la cui logica dovrebbe essere chiara, e che verr` ulteriormente a chiarito dallesempio che faremo subito dopo la descrizione dellalgoritmo. Lalgoritmo termina quando o tutti i nodi del grafo sono in S o quando tutti i nodi in T hanno il valore di f uguale a +, fatto che ovviamente indica che i nodi in T non sono raggiungibili da 1. Agoritmo di Dijkstra (a) Inizializzazione. Poni S {1}, T {2, . . . , n}. f (1) = 0, J(1) = 1. Poni f (i) = p(1, i), J(i) = 1, per (1, i) + (1). Poni f (i) = +, per (1, i) + (1). (b) Assegnazione etichetta permanente Trova j T tale che f (j) = miniT f (i). Poni T = T {j}, S = S {j}.
135
Se T = o f (i) = +, i T STOP (terminazione dellalgoritmo). (c) Assegnazione etichetta provvisoria Per ogni (j, i) T + (j) tale che f (i) > f (j) + p(j, i) Poni: c.1 f (i) = f (j) + p(j, i) c.2 J(i) = j Vai al passo (b). Vediamo, nel caso del grafo di gura 6.8, come lalgoritmo proceda (per semplicit`, levoluzione di T ` a e omessa essendo T = V S). Iterazione 0 Inizializzazione. (a) S = {1}. d(1) = 0. d(2) = 7. d(3) = 1. d(4) = +. d(5) = +. d(6) = +. J(2) = 1. J(3) = 1. J(4) = 1. J(5) = 1. J(6) = 1. Iterazione 1. (b) j = 3. S = {1, 3}. (c.1) ( + (j) T = {(3, 2), (3, 5), (3, 6)}. E facile vedere che per ognuno dei nodi {2, 5, 6} ` vericata la e condizione d(i) > d(j) + p(j, i), e quindi le etichette vanno tutte aggiornate. d(2) = d(3) + 1 = 6. d(5) = 2 + d(3) = 3. d(6) = 7 + d(3) = 8. (c.2) J(2) = 3. J(5) = 3. J(6) = 3. Iterazione 2. (b) j = 5. S = {1, 3, 5}. (c.1) + (j) T = {(5, 2), (5, 4)}. d(2) = d(5) + 2 = 5. d(4) = d(5) + 5 = 8. (c.2) J(2) = 5. J(4) = 5. Iterazione 3 (b) j = 2. S = {1, 2, 3, 5}. (c.1) + (j) T = {(2, 4), (2, 6)}. Letichetta del nodo 4 non soddisfa la condizione al passo (c), per cui va aggiornata solo letichetta (e il predecessore) del nodo 6. d(6) = d(2) + 1 = 6. (c.2) J(6) = 2. Iterazione 4. (b) j = 6. S = {1, 2, 3, 5, 6}. (c) + (j) T = . Iterazione 5. (b) j = 4. S = {1, 2, 3, 4, 5, 6}. STOP.
136
I pesi dei cammini minimi saranno quindi: d(1) = 0. d(2) = 5. d(3) = 1. d(4) = 8. d(5) = 3. d(6) = 6. Una comoda rappresentazione dellevolvere dellalgoritmo ` la seguente forma tabellare ove le righe e rappresentano iterazioni mentre le colonne rappresentano i nodi selezionati ad ogni iterazione. Per ciascun nodo j ci sono due colonne che riportano il valore della variabile d(j) e della J(j) alliterazione i-esima. Lelemento selezionato alliterazione i-esima ` rappresentato in grassetto e, nelle iterazioni successive, e il valore della variabile corrispondente non viene pi` riportato. La colonna corrispondente al nodo 1 ` u e omessa. nodo 2 It. It. It. It. It. It. 0 1 2 3 4 5 d 7 6 5 5 J 1 3 5 5 d 1 1 3 J 1 1 d + + 8 8 8 8 4 J 1(tt.) 1(tt.) 5 5 5 5 d + 3 3 5 J 1(tt.) 3 3 d + 8 8 6 6 6 J 1(tt.) 3 3 2 2
6.4
Due esempi
In questo paragrafo consideriamo pi` in dettaglio due esempi di applicazioni non banali di quanto visto u in questo capitolo.
6.4.1
I progetti di grandi dimensioni sono costituiti da pi` attivit`, che devono essere tutte completate anch u a e il progetto di cui fanno parte sia completato, ma che possono essere iniziate e svolte indipendentemente luna dallaltra, purch sia rispettata una data sequenza. Queste condizioni sono caratteristiche di molti e progetti di sviluppo e produzione, ad esempio nel settore aeronautico ed aereospaziale, o di costruzione, ad esempio nellingegneria civile, o di manutenzione di grossi sistemi; tutti progetti in cui il numero di attivit` a costituenti pu` essere dellordine delle migliaia. La gestione di un progetto consiste nel coordinamento o dellesecuzione delle varie attivit`, unitamente al controllo dei tempi e dei costi di esecuzione. Poich a e questo ` evidentemente un problema di rilevante importanza economica, e a volte strategica, per esso e sono state sviluppate, a partire dal 1958, alcune tecniche particolarmente ecaci, tra cui hanno assunto un ruolo importante il PERT (Program Evaluation and Review Technique) e il CPM (Critical Path Method). Il PERT ` stato sviluppato inizialmente per pianicare le operazioni di ricerca e sviluppo e connesse al progetto del missile Polaris, e lapplicazione di questa tecnica ha consentito di concludere il progetto con due anni di anticipo sui cinque anni inizialmente preventivati. Questo successo iniziale ha portato ad una sua rapida diusione. Lo scopo principale del PERT ` quello di pianicare e controllare e i tempi di completamento delle attivit` di un progetto, e del progetto nel suo insieme, tenendo conto del a fatto che i tempi di esecuzione delle varie attivit` non sono a priori noti con certezza, e possono variare a in dipendenza di molteplici fattori aleatori (PERT-Time); successivamente sono state fatte estensioni alla pianicazione e controllo dei costi di esecuzione, soggetti anchessi ad aleatoriet` (PERT-Cost). a PERT-Time e PERT-Cost costituiscono applicazioni software molto diuse. Il CPM si applica invece quando al tempo di esecuzione di ogni attivit` pu` essere attribuito un valore certo, pi` o meno lungo a a o u seconda di quanto si decide di spendere per lesecuzione dellattivit` stessa; ` esperienza comune che se a e si riduce il tempo di esecuzione di unattivit` il suo costo aumenta e viceversa. Il CPM ha come scopo a principale quello di pianicare e controllare i tempi di esecuzione di un progetto, rendendo minima la spesa complessiva, e trova larga applicazione in programmi riguardanti la manutenzione periodica di grossi impianti industriali, e lavori di produzione e costruzione per cui esiste una consolidata esperienza, cosicch e
137
si possono ritenere note con esattezza le relazioni costo-tempo di esecuzione. Base comune del PERT e del CPM ` la rappresentazione del progetto mediante un grafo orientato, secondo opportune norme. Poich e e in questo contesto, al grafo rappresentativo del progetto viene dato il nome di diagramma reticolare , queste tecniche vengono chiamate tecniche reticolari di programmazione delle attivit` . Dallanalisi a del diagramma reticolare si possono ricavare molte infomazioni signicative sul progetto. Vogliamo qui illustrare alcune considerazioni, che possono essere fatte nellanalizzare i progetti, in cui giocano un ruolo importanti i cammini minimi. Iniziamo la nostra analisi spiegando come sia possibile associare ad un progetto un diagramma reticolare (cio` un grafo orientato). e
Il progetto rappresentato in 6.11b verr` pi` volte riutilizzato a scopo esemplicativo; ad esso faremo a u pertanto riferimento con il nome di progetto P1. Nel disegnare il diagramma reticolare si utilizzano le seguenti regole fondamentali, alcune delle quali gi` a implicitamente enunciate:
138
a)
A< B
b)
A<B<C
A k B C l A,B < C
j c) A k
B i j C
A < B,C
139
4 D 0 A 1 B 2 E C F 3 H 5 G 6 I 7
B 0 A 1 C
Figura 6.12: Una coppia di nodi che non individua univocamente un attivit` a Esempio 2. Consideriamo le attivit` A, B, C, D, con le relazioni di precedenza A < B, C; B, C < a D. Il grafo costruito ignorando la regola 4 ` quello di 6.12, in cui alla coppia di nodi (1,2) non ` associata e e in maniera univoca unattivit`. a
Quando la regola 4 non ` esplicitamente soddisfatta dal progetto, come accade nell Esempio 2, occorre e ricorrere ad un articio che consiste nellintrodurre un attivit` ttizia, cui va associato un tempo di a esecuzione nullo: nel caso dellEsempio 2, introducendo lattivit` ttizia X si ottiene il grafo della 6.13, a
140
che rispetta la regola 4. Con l introduzione di attivit` ttizie ` quindi possibile individuare ogni attivit` a e a
1 C
X 2
Figura 6.14: Introduzione dell attivit` ttizia Y a Esempio 3. Un progetto prevede, tra la altre, le attivit` B, C, D, E, che devono essere svolte rispeta tando le precedenze: B,C < D ; C < E . Dal diagramma di gura 6.14 si rileva come solo lintroduzione dellattivit` ttizia Y rende possibile la rappresentazione di questa parte del progetto. a
141
Nel diagramma reticolare ogni nodo (ad eccezione del primo e dellultimo) rappresenta il termine di alcune attivit` e linizio di altre. Pertanto, in questo contesto, i nodi vengono anche chiamati eventi. a
1
A B 9 14 C 5
D 4
4
G 6 H 12 I 10 M
F 10
R 13 N 8 O 18 P 3 Q 6 S 5 T 7
J 3
6
K 4
L 5
10
11
12
13
Figura 6.15: Diagramma reticolare del progetto P3 Esempio 4 Un progetto consiste nellesecuzione di una serie di attivit` indicate con A, B, ..., T con le a
seguenti relazioni di precedenza: A, B, C possono iniziare immediatamente; D, E > A; F > B; G, H > D; I > F, G; J,K > C; M,L > J; N > K,L; O > M,N; P > H,I,O; R,Q> P; S > Q; T > R,S . Costruiamo il diagramma reticolare del progetto, numerando i nodi in modo che se il ramo (i, j) rappresenta unattivit`, a risulta i < j . Utilizzando le regole prima elencate, otteniamo il grafo di gura 6.15. Anche il progetto considerato nellEsempio 4 verr` riutilizzato nel seguito; ad esso faremo riferimento con a il nome di progetto P3. Domanda 1. Sai descrivere a cosa corrisponde il vericarsi dellevento 9 nel diagramma reticolare del progetto P3 rappresentato in gura 6.15? Domanda 2. Nel costruire il diagramma reticolare del progetto P3 ` stato necessario introdurre attivit` e a ttizie ? Esercizio 2. Supponiamo che alle relazioni di precedenza del progetto P3 debba essere aggiunta la C < F . Come si modica il grafo di gura 6.15? Esercizio 3. Supponi che il progetto P3 sia ampliato con lintroduzione dellattivit` U, per cui sussistono a le relazioni di precedenza U > M,N ; U < Q . Come si modica il grafo di gura 6.15?
Il percorso critico
Abbiamo nora visto come sia possibile costruire un grafo che rappresenti lesecuzione di un progetto, dopo che il progetto stesso ` stato decomposto in attivit`, o fasi, di cui si siano analizzate le relazioni di e a precedenza. Non abbiamo per` nora tenuto conto del tempo richiesto per lesecuzione delle varie attivit` o a che compongono il progetto, e che ovviamente condizionano il tempo di esecuzione complessivo. Poich e i metodi reticolari di programmazione hanno, tra gli altri, lo scopo di controllare i tempi di esecuzione delle attivit` al ne di ottenere il rispetto del tempo di completamento del progetto, occorre aggiungere a alla analisi qualitativa delle precedenze gi` eettuata anche unanalisi quantitativa che determini i valori a
142
143
di di di di di di di di di
di di di di di di di di di
Nella gura 6.4.1 i tempi di esecuzione delle attivit` sono stati associati ai rami del diagramma reticolare a del progetto. Posto t0 = 0, possiamo calcolare per i successivi nodi i tempi minimi di raggiungimento, espressi in giorni, utilizzando l algoritmo dei cammini massimi. per il nodo 1, t1 = t0 + t01 = 0 + 5 = 5 per il nodo 2, t2 = t1 + t12 = 5 + 7 = 12 per il nodo 3, t3 = t1 + t13 = 5 + 3 = 8 per il nodo 4, t4 = t2 + t24 = 12 + 4 = 16 per il nodo 5, t5 = max(t2 + t25 , t3 + t35 ) = max(12 + 5, 8 + 6) = 17 per il nodo 6, t6 = max(t4 + t46 , t5 + t56 ) = max(16 + 2, 17 + 8) = 25 per il nodo 7, t7 = t6 + t67 = 25 + 2 + 27; avremo inoltre per il tempo minimo di completamento del progetto, T = t7 = 27 giorni.
Esercizio 4. Consideriamo nuovamente il progetto P2 e associamo alle attivit` i seguenti tempi di a esecuzione, espressi in settimane: A, 3 settimane; B, 2; C, 1; D, 4 ; E, 1; F, 2; G, . Determinare il tempo minimo di completamento del progetto. Domanda 3 Con riferimento al progetto P1, supponiamo che il tempo di esecuzione dellattivit` H a
passi da 8 a 10 giorni. Come varia il tempo minimo di completamento del progetto?
Domanda 4 Sempre con riferimento al progetto P1, supponiamo ora che il tempo di esecuzione dellattivit` G passi da 2 a 6 giorni. Come varia il tempo minimo di completamento del progetto? a
Oltre al tempo minimo di completamento dellintero progetto, ` utile introdurre anche la nozione di tempo e minimo di completamento per ogni attivit`. Ovviamente unattivit` (i, j) pu` avere inizio, al pi` presto, a a o u dopo un tempo ti dallinizio dellesecuzione del progetto, in quanto perch lattivit` possa avere inizio e a deve essere stato raggiunto il nodo i; di conseguenza se lattivit` richiede un tempo di esecuzione pari a a tij , non potr` essere completata prima di un tempo pari a ti + tij . Possiamo quindi dare la denizione a seguente: Denizione 6.4.3 Si denisce tempo minimo di completamento dellattivit` (i, j), e si indica con Cij , a il valore Cij = ti + tij .
Esempio 6 Consideriamo ancora il progetto P1. Per le attivit` del progetto, tenendo conto dei tempi a
di raggiungimento dei nodi calcolati nellEsempio 5, abbiamo i seguenti tempi minimi di completamento espressi in giorni: per per per per per per lattivit` a lattivit` a lattivit` a lattivit` a lattivit` a lattivit` a A: C01 = t0 + t01 = 5 B: C12 = t1 + t12 = 5 + 7 = 12 C: C13 = t1 + t13 = 5 + 3 = 8 D: C24 = t2 + t24 = 12 + 4 = 16 E: C25 = t2 + t25 = 12 + 5 = 17 F: C35 = t3 + t35 = 8 + 6 = 14
144
per lattivit` G: C46 = t4 + t46 = 16 + 2 = 18 a per lattivit` H: C56 = t5 + t56 = 17 + 8 = 25 a per lattivit` I: C67 = t6 + t67 = 25 + 2 = 27. a Nelle tecniche reticolari di programmazione sono di fondamentale importanza le cosidette attivit` critica a di cui diamo la denizione. Denizione 6.4.4 Sia T il tempo minimo di completamento di un progetto, corrispondente a un insieme {tij } di valori pressati dei tempi di esecuzione delle singole attivit`. Unattivit` (h, k) viene detta attivit` a a a critica se un variazione positiva comunque piccola ma non nulla del suo tempo di esecuzione comporta una variazione della stessa entit` nel tempo minimo di completamento del progetto; e cio`, unattivit` a e a (h, k) ` critica se, sostituito thk con thk + t , con t = 0 il tempo minimo di completamento del progetto e diventa T + t, per qualunque valore positivo di t .
Esempio 7 Nel progetto P1 lattivit` E ` critica: infatti se si pone t25 = 5 + t, si ottiene per i tempi a e
di raggiungi mento dei nodi 5, 6, 7 : per il nodo 5, t5 = max(t2 + t25 , t3 + t35 ) = max(12 + 5 + t, 8 + 6) = 17 + t per il nodo 6, t6 = max(t4 + t46 , t5 + t56 ) = max(16 + 2, 17 + t + 8) = 25 + t per il nodo 7, t7 = t6 + t67 = 25 + t + 2 = 27 + t; invece lattivit` F non critica; infatti posto t35 = 6 + t , si ottiene per il tempo di raggiungimento del a nodo 5 : t5 = max(t2 + t25 , t3 + t35 ) = max(12 + 5, 8 + 6 + t) = 17 e cio` lo stesso valore di prima, almeno ntanto chet non supera i 3 giorni; e ovviamente se t5 non varia, e non variano neanche i tempi minimi di raggiungimento dei nodi successivi. La determinazione dei percorsi critici ` evidentemente di fondamentale importanza nelle tecniche e reticolari di programmazione. Infatti le attivit` critiche sono quelle su cui pi` stretto deve essere il a u controllo di chi gestisce lesecuzione del progetto, nei casi in cui un ritardo dellesecuzione complessiva comporta una penalit`, che pu` essere sia economica, sia di immagine. Da quanto abbiamo visto nora, a o lindividuazione delle attivit` critiche ` molto semplice: ` evidente che le attivit` critiche sono tutte e a e e a sole le attivit` che appartengono ad almeno un cammino massimo dal nodo iniziale al nodo nale. a Per quanto riguarda le attivit` non critiche ` anche possibile stimare di quanto esse possano essere a e ritardate senza aumentare il tempo di completamento del progetto. Unattivit` non critica, per esempio a lattivit` F nel progetto P1, non appartiene a un cammino massimo dal nodo iniziale al nodo nale, ma a appartiene comunque a cammini che vanno dal nodo iniziale al nodo nale (nel caso specico considerato uno solo, in generale pi` di uno). Sia allora Lmax la lunghezza massima di un percorso dal nodo iniziale u ` al nodo nale che passa per F. E chiaro che lattivit` F ` lunica a subire un ritardo, il ritardo massimo a e che ` possibile tollerare senza che aumenti la durata del progetto ` T Lmax . Questo tempo ` chiamato e e e tempo di slittamento dellattivit`. In generale: a Denizione 6.4.5 Si denisce tempo di slittamento, o margine di tempo dellattivit` (i, j) il valore che a indica di quanto tempo pu` essere ritardato il completamento dellattivit` (i, j) senza che si determini un o a aumento del tempo minimo di completamento dellintero progetto. Ovviamente le attivit` critiche hanno tempo di slittamento nullo, le attivit` non critiche hanno a a un tempo di slittamento positivo. Segnaliamo che ` possibile determinare in maniera molto semplice e e eciente i tempi di slittamento di tutte le attivit` di un progetto, noi non approfondiamo qui ulteriormente a la questione per mancanza di tempo.
6.4.2
Il problema di cui ci occuperemo in questo capitolo ` il cosiddetto problema di Gestione delle Scorte. Si e tratta di un problema di programmazione della produzione industriale che consiste nel decidere, dato un
145
particolare prodotto, le quantit` da produrre o da immagazzinare in modo da soddisfare una domanda a presente o futura. Tipicamente per la pianicazione si considera un numero ristretto di periodi di tempo, ad esempio i prossimi dodici mesi o le prossime 20 settimane. In generale indicheremo con {1, . . . , T } lorizzonte temporale, che ` composto di T periodi detti periodi di controllo. Per ogni periodo ` nota una e e domanda del bene dt . Ad esempio, se il bene consiste in tondini metallici, per ogni giorno (o settimana o mese) del nostro orizzonte di pianicazione sono note le tonnellate richieste dal mercato. Ora, la domanda giornaliera di tondini deve essere integralmente soddisfatta. Io posso scegliere se produrre quotidianamente la quantit richiesta, oppure produrre solo in alcuni giorni (ad esempio una volta a settimana) a una quantit` suciente a soddisfare la domanda di pi` giorni successivi, mettendo in magazzino ci` che a u o invier` al mercato nei giorni futuri. Ovviamente, sia produrre che immagazzinare costa, e il costo pu` o o variare da periodo a periodo. Di seguito indicheremo con ct il costo unitario di produzione nel periodo t, mentre indicheremo con ht il costo unitario di immagazzinamento, per t = 1 . . . T . Inne, iniziare un lotto di produzione presenta i cosiddetti costi di setup, ovvero costi amministrativi e di avviamento. Questi costi sono ssi, non dipendono cio` dalle quantit` prodotte, e vengono eettivamente sostenuti solo se si e a produce qualcosa. Chiameremo con ft i costi ssi di set-up relativi al periodo t, per t = 1 . . . , T . Il problema ` quello di scegliere quando (in che giorni) e quanto produrre in modo da minimizzare i e costi di produzione (ssi e variabili) e i costi di immagazzinamento.
Per i periodi successivi al primo, la quantit` prodotta pt nel periodo t si va ad aggiungere alle scorte a accumulate nel periodo precedente st1 . Quindi, nel periodo t avremo a disposizione una quantit` di a bene pari a pt + st1 . Una parte di questa quantit` servir` a soddisfare la domanda dt nel periodo t, a a mentre il resto rimarr` in magazzino e cio` sar` il livello di scorte st nel periodo t (utilizzabili nel periodo a e a successivo). Quindi possiamo scrivere pt + st1 = dt + st t = 1, . . . , T (6.2)
Per tenere conto del costo sso di produzione ft che va pagato solo nei periodi per cui si abbia pt > 0, dobbiamo aggiungere una variabile booleana xt per t = 1, . . . , T con il seguente signicato 1 se si produce nel periodo t (pt > 0) 0 altrimenti. Per esprimere con un vincolo che xt = 1 quando pt > 0, o, equivalentemente, che possiamo produrre nel periodo t solo se xt = 1 introduciamo il seguente vincolo: xt = pt M xt t = 1, . . . , T (6.3)
dove M ` una costante sucientemente grande. Il ruolo del vincolo 6.3 ` il seguente: se xt = 0, allora e e non ` possibile produrre (pt 0 pt = 0). Se xt = 1 allora pt M e noi possiamo produrre una e quantit` compresa fra 0 e M . Come si ` detto M deve essere scelto opportunamente in modo da rendere a e il vincolo sempre soddisfatto quando xt = 1. Ad esempio, poich` in ogni periodo non ha senso produrre e pi` di quanto viene richiesto durante tutto lorizzonte temporale, un valore ammissibile per M pu` essere u o T M = t=1 dt . Siamo ora in grado di scrivere la funzione obiettivo, che si compone di tre termini:
146
T t=1 ct pt .
ft xt .
T t=1
ht st .
min
t=1
ct pt + ft xt + ht st
(6.4)
147
Rappresentazione del problema di gestione delle scorte come problema di cammino minimo su grafo
Vediamo ora come il problema di trovare un insieme di istanti produttivi ottimale pu` essere agevolmente o ricondotto a un problema di cammino minimo su gra aciclici. A tal scopo denisco un grafo orientato G = (V, E). Linsieme dei nodi ` linsieme dei periodi di controllo pi` un nodo ttizio che denominiamo e u T + 1, e cio` V = {1, . . . , T, T + 1}. Linsieme degli archi ` linsieme di tutti gli archi in avanti, e cio` e e e E = {(i, j) : i V, j V, i < j}. E facile che con questa denizione degli archi, linsieme dei nodi risulta ordinato topologicamente, e cio` gli archi vanno sempre da nodi con indice pi` piccolo a nodi con indice e u pi` grande. Quindi, il grafo G ` privo di cicli orientati (vedi il teorema 6.2.1). Associamo inoltre a ogni u e arco (i, j) il peso p(i, j) = C(i, j). Ora, a ogni cammino P = {1, i, j, k, . . . , r, q, T + 1} dal nodo 1 al nodo T + 1 associamo linsieme di periodi produttivi I(P ) = {1, i, j, k . . . , r, q}. Per quanto visto sopra, il costo C(I) = C(1, i) + C(i, j) + C(j, k) + C(k, .) + . . . + C(., r) + C(r, q); ma, per come sono stati deniti i pesi sugli archi di G, ` facile e vedere che C(I) = p(P ). Quindi, il peso del cammino minimo da 1 a T + 1 in G corrisponde al costo di un insieme di istanti produttivi di costo minimo.
Esempio
Si consideri lesempio riportato in tabella.
Periodo 1 2 3 4
Domanda 20 30 40 30
f 30 40 30 50
c 3 3 4 4
h 2 2 1 1
Per prima cosa calcoliamo costruiamo il grafo associato allistanza del problema. Si tratta di un nodo con 5 nodi, uno in pi` dei periodi di controllo: quindi V = {1, 2, 3, 4, 5} e tutti gli archi in avanti. u
Per prima cosa calcoliamo i pesi degli archi. Larco (1, 2) ha peso pari a C(1, 2), cio` il costo di e produrre nel periodo 1 per soddisfare la domanda no al periodo 2 1 = 1. Poich` la domanda ` e e
148
pari a d1 = 20, il costo variabile di produzione sar` c1 d1 = 3 20 = 60; a questo va aggiunto il a costo sso di produzione nel periodo 1, f1 = 30. Non ci sono scorte residue e quindi il costo complessivo C(1, 2) = 60+30 = 90. Calcoliamo ora il costo C(1, 3), cio` il costo di produrre nel periodo 1 per soddisfare e la domanda no al periodo 31 = 2. La domanda complessiva sar` d1 +d2 = 50. Quindi il costo variabile a di produzione sar` pari a c1 (d1 + d2 ) = 3 50 = 150; a questo va aggiunto il costo sso di produzione nel a periodo 1, f1 = 30. Inoltre, una parte della produzione (d2 ) dovr` essere immagazzinata per un periodo a (da 1 no a 2), e quindi pagheremo un costo dimmagazzinamento pari a s1 d2 = 2 30 = 60. Quindi, il costo complessivo C(1, 3) = 150 + 30 + 60 = 230. Calcoliamo ora il costo C(1, 4), cio` il costo di e produrre nel periodo 1 per soddisfare la domanda no al periodo 4 1 = 3. La domanda complessiva sar` a d1 + d2 + d3 = 90. Quindi il costo variabile di produzione sar` pari a c1 (d1 + d2 + d3 ) = 3 90 = 270; a a questo va aggiunto il costo sso di produzione nel periodo 1, f1 = 30. Inoltre, una parte della produzione (d2 + d3 ) dovr` essere immagazzinata nel periodo 1 no al periodo 2, e unaltra parte d3 dovr` essere a a immagazzinata nel periodo 2 no al periodo 3 e quindi pagheremo un costo dimmagazzinamento pari a s1 (d2 + d3 ) + s2 d3 = 2 70 + 2 40 = 220. Quindi, il costo complessivo C(1, 4) = 270 + 30 + 220 = 520. A titolo esemplicativo, calcoliamo un ultimo peso, il peso dellarco (3, 5) corrispondente a C(3, 5).
90
130 330
190
170
5
340
510
A questo punto, applichiamo lalgoritmo per il calcolo di un cammino minimo su gra aciclici per calcolare un cammino di peso minimo dal nodo 1 al nodo 5. f (1) = 0; J(1) = 1; f (2) = f (1) + p(1, 2) = 90; J[2] = 1. f (3) = min{f (1) + p(1, 3), f (2) + p(2, 3)} = min{240, 220} = 220; J(3) = 2. f (4) = min{f (1) + p(1, 4), f (2) + p(2, 4), f (3) + p(3, 4)} = min{520, 420, 410} = 410; J(4) = 4. f (5) = min{f (1) + p(1, 5), f (2) + p(2, 5), f (3) + p(3, 5), f (4) + p(4, 5)} = min{760, 600, 560, 580} = 560; J(5) = 3. A questo punto ` possibile ricostruire il cammino minimo da 1 a 5 utilizzando il vettore dei predee cessori. Infatti, il predecessore di 5 ` il nodo 3, il predecessore di 3 ` il nodo 2 e il predecessore di 3 ` il e e e nodo 1.
149
90
130 330
190
170
5
340
510
150
Capitolo 7
Massimo usso
In questo capitolo esaminiamo un importante problema di PL su gra, il problema del usso massimo in un grafo; dopo aver presentato il problema e alcune delle sue caratteristiche fondamentali, studieremo un algoritmo per la sua soluzione e considereremo inoltre alcune sue generalizzazioni ed estensioni. In maniera molto discorsiva, possiamo immaginare che il grafo sia una rete idrica con il quale si tenta di portare dellacqua da un nodo sorgente s ad un utilizzatore rappresentato da un nodo t. Per far questo si usa una rete di tubature rappresentata dagli archi. Le tubature hanno una certa capacita cuv (cio` e possono trasportare al pi` cuv litri di acqua al secondo). Le tubature si intersecano nei nodi, dove pu` u o essere deciso, come l acqua che arriva nel nodo deva essere distribuita ai tubi in uscita. Si tratta di determinare come incanalare lacqua in modo da massimizzare il usso da s a t; da qui il nome del problema di massimo usso. Ovviamente, linterpretazione idrica ` solo una delle molte possibili. In fatti e si potrebbe trattare di una rete di trasporto di energia elettrica (e allora i rami rappresenterebbero cavi elettrici), di persone (e allora i rami rappresenterebbero tratte servite da aerei, treni, macchine etc.), di informazioni etc.
7.1
Sia dato un grafo orientato G = (V, E) con V = {s, t, 3, . . . , n} ed |E| = m e sia data una capacit` a cuv I + associata a ciascun arco (u, v) E. Supponiamo che esistano R - un nodo s detto sorgente con solo archi uscenti ( (s) = {}); - un nodo t detto pozzo con solo archi entranti ( + (t) = {}). I nodi distinti da s e da t sono detti nodi intermedi. Un vettore x I m (notare che x ha un numero di componenti pari alla cardinalit` dellinsieme di R a archi di G) viene detto usso s-t ammissibile o, per brevit` usso ammissibile, se soddisfa i seguenti a vincoli: 0 xuv cuv xuv
(u,v) (v) (v,k) + (v)
(7.1) (7.2)
I vincoli (7.1) indicano che il usso su ogni arco ` sempre non-negativo e non eccede la capacit` e a dellarco stesso. I vincoli (7.2) indicano che per ogni nodo intermedio il usso totale entrante nel nodo eguagli il usso totale uscente dal nodo stesso. Per questo motivo, le n 2 equazioni (7.2) sono dette equazioni di conservazione (del usso).
151
2 (1, 2) s (0, 5)
(1, 7)
3 (0, 3) (1, 2) t
(0, 2) 1 (0, 5) 4
(1, 1)
xsu
(7.3)
e Nel grafo di gura 7.1, il valore del usso f ` uguale a 1. Il problema del massimo usso si pu` ora enunciare come segue: o Trovare un usso ammissibile nel grafo G in modo che il valore del usso f sia massimo. Questo problema pu` essere formulato come un problema di PL. Associamo una variabile xuv ad o ogni arco (u, v) E. Tale variabile rappresenta il usso inviato sullarco (u, v). Inoltre associamo una variabile f alla quantit` totale di usso inviata da s a t. Da quanto sopra detto, il problema (M F ) verr` a a formulato nel seguente modo: max f
(s,k) + (s)
xsk + f = 0 xvk = 0,
(v,k) + (v)
xuv
(u,v) (v)
v V {s, t}
Il primo vincolo (7.5) indica che la somma dei ussi sugli archi uscenti da s ` uguale al usso totale e
152
Si ha quindi un vincolo per ogni nodo intermedio (7.6), che rappresenta il fatto che il usso entrante nel nodo ` uguale al usso uscente (conservazione del usso). Si pu` vericare facilmente che i vincoli e o (7.5) e (7.6) implicano che la somma dei ussi sugli archi entranti in t ` uguale al usso totale f . e Quindi abbiamo i vincoli (7.7) che rappresentano il fatto che il usso su ogni arco non pu` eccedere o la capacit` dellarco stesso. a Inne ci sono i vincoli di non negativit` delle variabili (7.8). a Notiamo che la regione ammissibile di questo problema di PL ` non vuota (il vettore di usso x = 0 ` e e ovviamente ammissibile) e limitata (per la presenza dei vincoli (7.7) e (7.8)). Quindi, per il teorema fondamentale della programmazione lineare ammette una soluzione ottima e un valore ottimo della funzione obiettivo, che verr` indicato nel seguito con con f . a Molte altre considerazioni, sia teoriche sia algoritmiche, potrebbero essere fatte sul problema del massimo usso a partire dalla sua formulazione come problema di PL. Intanto, per fare un esempio, ` e evidente che il problema del massimo usso potrebbe essere risolto con il metodo del Simplesso studiato nella prima parte del corso. Questo non ` tuttavia lalgoritmo migliore applicabile in questo caso (notiamo e che il problema ha una struttura particolare che pu` e deve essere sfruttata). o In questo capitolo, per semplicit` e brevit`, noi studieremo le propriet` del problema di massimo a a a usso e un algoritmo per la sua soluzione a partire dalla sua formulazione come problema su gra. Questo approccio, se da una parte non mette pienamente in luce i rapporti con la teoria della programmazione lineare, ha il vantaggio di essere pi` semplice e di permettere una pi` immediata interpretazione intuitiva u u dei risultati che via via esporremo.
7.2
Nel problema del massimo usso un ruolo centrale ` svolto dal concetto di taglio s-t. e Denizione 7.2.1 Dato un grafo orientato G = (V, E), con s, t V , e s = t, si denisce taglio s-t una partizione dei nodi (W, W ) tale che s W e t W .
2 (1, 2) s (0, 5)
(1, 7)
W
(0, 3)
W
t
(1, 2)
(0, 2) 1 (0, 5) 4
(1, 1)
153
un taglio s-t. Ad ogni taglio s-t (W, W ) associamo una capacit` del taglio C(W, W ) che ` pari alla somma a e delle capacit` degli archi che hanno il primo estremo in W e il secondo estremo in W , e cio` a e C(W, W ) =
uW,vW
cuv
(7.9)
Notiamo che gli archi che attraversano il taglio in senso opposto, ovvero che abbiano il primo estremo in W e il secondo estremo in W , non contribuiscono alla capacit` del taglio. Ad esempio, dato il a taglio di gura 7.2, gli archi che hanno il primo estremo in W e il secondo estremo in W sono gli archi ) = 2 + 2 + 2 + 3 = 9. Notiamo inoltre (s, 1), (s, 2), (3, 4), (3, t), e dunque la capacit` del taglio C(W, W a che larco (2, 3) attraversa il taglio in direzione opposta, e cio` va da W a W , e dunque la sua capacit` e a non contribuisce alla capacit` complessiva del taglio. a Dato un usso s-t x, ` possibile associare ad ogni taglio s-t (W, W ) un usso netto di (W, W ), che ` pari e e alla somma dei ussi sugli archi uscenti da W ed entranti in W , meno la somma dei ussi sugli archi uscenti da W ed entranti in W : F (W, W ) =
uW,vW
xuv
uW,vW
xvu .
(7.10)
Per il taglio di gura 7.2 ` facile vericare che F (W, W ) = 1. e Esiste una semplice relazione tra il usso netto di un taglio e il valore del usso, tale relazione ` data e nel seguente teorema. e Teorema 7.2.2 Dato un usso ammissibile x, il usso netto F (W, W ) in ogni taglio (W, W ) ` pari al , cio` valore del usso f e F (W, W ) = f . Dimostrazione. Sommando le equazioni (7.2) di conservazione del usso relative ai soli nodi dellinsieme W {s} e lequazione (7.3) f = (s,u)+ (s) xsu , otteniamo: (
vW {s} (u,v) (v)
xuv
(v,k) + (v)
xvk )
(s,u) + (s)
xsu = f
xuv
(v,k) + (v)
xvk ) = f .
Notiamo il usso relativo ad un arco (u, v) con entrambi gli estremi in W compare nella sommatoria per + (u) con segno negativo e in (v) con segno positivo. Pertanto il suo contributo complessivo alla sommatoria ` nullo. Dunque gli archi (u, v) che contribuiscono alla sommatoria avranno necessariamente e un estremo in W e laltro estremo in W , ovvero saranno tali che u W e v W , oppure v W e u W . Pertanto xuv
uW ,vW uW,vW
xvu = f ,
oppure, equivalentemente:
F (W, W ) = f
xuv =
(u,t) (t)
xut = f .
154
Quindi il usso uscente dalla sorgente s ` uguale al usso netto entrante nel pozzo t. e ` Passiamo ora ed esaminare le relazioni tra il valore del usso e le capacit` di un taglio. E estremamente a semplice provare i seguenti due risultati. Teorema 7.2.3 Sia dato un usso ammissibile x in G. Il usso netto di un taglio qualunque ` minore e e o uguale alla capacit` dello stesso taglio. Cio`, se (W, W ) ` un taglio, risulta a e F (W, W ) C(W, W ). Dimostrazione. Siccome il usso ` ammissibile soddisfa, in particolare, le (7.1). Ma allora il teoe rema segue immediatamente dal confronto delle denizioni di capacit` usso netto di un taglio, cio` dal a e confronto delle (7.9) e (7.10). 2 Notiamo, per inciso, che il usso netto di un taglio dipende dal usso x che stiamo considerando, mentre la capacit` dello stesso taglio ` indipendente dal usso x e dipende invece solamente dalle capacit` degli a e a archi. Il usso massimo f ` ottenuto in corrispondenza ad un particolare usso ammissibile, che indichiamo e con x ; quindi, come caso particolare del precedente teorema otteniamo il seguente risultato. Teorema 7.2.4 Il valore del massimo usso f ` minore o uguale alla capacit` di un qualunque taglio s-t, e a cio` e f C(W, W ) per ogni taglio (W, W ). Dimostrazione. Per il Teorema 7.2.2 abbiamo, per qualunque taglio (W, W ) f = F (W, W ). Ma abbiamo anche, per il teorema precedente F (W, W ) C(W, W ) Dalle (7.11) e (7.12) segue immediatamente f C(W, W ), che ` quanto volevamo dimostrare. e 2 (7.12) (7.11)
7.3
Cammini aumentanti
Un secondo elemento che gioca un ruolo fondamentale nello studio di problemi di massimo usso ` il e concetto di cammino aumentante, che ` loggetto di questa sezione. e Per introdurre la denizione di cammino aumentante abbiamo bisogno di una denizione preliminare Denizione 7.3.1 Dato un cammino semplice P = {u0 , e1 , u1 . . . , ep , up }, chiamiamo arco diretto un arco di tipo ei = (ui1 , ui ), mentre chiamiamo arco inverso un arco di tipo ei = (ui , ui1 )1 . Denizione 7.3.2 Data una soluzione ammissibile x del problema di massimo usso, deniamo cammino aumentante da u0 a up un cammino semplice P = {u0 , e1 , . . . , ep , up } tale che: - per ogni arco diretto ei = (ui1 , ui ), si ha cui1 ,ui > xui1 ,ui - per ogni arco inverso ei = (ui , ui1 ), si ha xui ,ui1 > 0.
155
2 (1, 2) s (0, 5)
(1, 7)
3 (0, 3) (1, 2) t
(0, 2) 1 (0, 5) 4
(1, 1)
(0, 2)
(0, 5)
(1, 2) 3 (0, 3)
156
Notiamo che, rispetto a x vengono modicati solo i ussi degli archi appartenenti al cammino aumentante P . Vogliamo mostrare che, come preannunciato, x ` ammissibile e ha un valore di usso f maggiore di e . f Mostriamo dapprima che x ` una soluzione ammissibile. Le variabili corrispondenti ad archi non e appartenenti a P non vengono modicate rispetto alla soluzione ammissibile x e dunque non violano i vincoli di capacit` (7.7) e di non negativit` (7.8). Le variabili corrispondenti agli archi di P + vengono a a aumentate di , quindi i vincoli di non negativit` (7.8) non vengono violati. Inoltre, poich` + a e min(cuv xuv ), i vincoli di capacit` (7.7) non sono violati. Le variabili corrispondenti agli archi di P a vengono diminuite di , quindi i vincoli di capacit` (7.7) non sono violati. Inoltre, poich` a e min(uv ), i vincoli non negativit` (7.8) non vengono violati. Dobbiamo ora mostrare che i vincoli di x a conservazione ai nodi (7.6) non sono violati. Poich` solo le variabili che corrispondono ad archi di P e vengono modicate, i vincoli che potrebbero essere violati sono quelli che corrispondono a nodi di P . Per ogni nodo ui P , con ui = s, t ci sono esattamente due archi incidenti in ui appartenenti a P , larco ei1 e larco ei . Sono possibili i seguenti quattro casi: 1. ei1 ` diretto ed ei ` inverso su P . In questo caso xei1 = xei1 + , mentre xei = xei . Poich` e e e
e i-1 +
ui
ei -
e i-1 +
ui
ei +
e i-1 -
ui
ei -
157
Poich` ei1 ` uscente da ui , mentre ei ` entrante, il usso entrante diminuisce di e il usso uscente e e e diminuisce di : luguaglianza fra usso entrante e usso uscente ` preservata. e 4. ei1 ` inverso ed ei ` diretto su P . In questo caso xei1 = xei1 + , mentre xei = xei . Poich` e e e
e i-1 -
ui
ei +
7.4
Condizioni di ottimalit` a
In questa sezione ci proponiamo di trovare delle condizioni che, dato un usso ammissibile x, ci permettano di capire se x sia una soluzione ottima del problema di massimo usso o meno. La prima condizione che consideriamo ` legata allesistenza di cammini aumentanti ed ha implicazioni algoritmiche immediate. La e seconda, equivalente, coinvolge la capacit` dei tagli ed ` interessante perch mostra come risolvendo un a e e problema di massimo usso possiamo contemporaneamente risolvere un altro problema apparentemente molto diverso: il problema del minimo taglio. Passiamo ora a considerare la prima delle due condizioni preannunciate. e Teorema 7.4.1 Un usso s-t x di valore f ` massimo se e solo se non esiste nessun cammino aumen tante P = {s = u0 , e1 , . . . , up = t} da s a t in G rispetto a x. Dimostrazione. Necessit`. Se x ` ottimo non possono esistere cammini aumentanti da s a t in G rispetto a x. Infatti, a e se ne esistesse uno sappiamo (vedi sezione precedente) che ` possibile trovare un nuovo usso x con un e valore maggiore di f . Ci` ` assurdo perch x ` ottimo. oe ee Sucienza. Consideriamo il seguente taglio: W = {u : esiste un cammino aumentante da s a u rispetto ad x} {s} =V W W Notiamo che deve risultare t W . Infatti, se risultasse t W esisterebbe, per denizione di W , un cammino aumentante da s a t. Ma questo implicherebbe, per quanto visto nella sezione precedente, che sarebbe possibile trovare un nuovo usso x con un valore di usso f maggiore di f . Siccome questo ` e assurdo perchtiamo supponendo che f sia massimo, deve essere, come aermato t W . s e Quindi (W, W ) ` un taglio s-t. Consideriamo adesso il usso sugli archi che attraversano il taglio da W a W e sugli archi che attraversano il taglio da W a W .
158
- Per ogni (u, v) E tale che u W , e v W si ha che il usso xuv = cuv . Infatti, supponiamo per assurdo che xuv < cuv . Essendo u W esiste un cammino aumentante P da s ad u. Se xuv < cuv , allora il cammino P = P (u, v) ` un cammino aumentante da s a v. Infatti lungo larco diretto e (u, v) si verica la condizione xuv < cuv . Ma allora v dovrebbe appartenere a W contraddicendo lipotesi che v W . - Per ogni (v, u) E tale che u W , e v W si ha che il usso xvu = 0. Infatti, supponiamo per assurdo che xvu > 0. Essendo u W esiste un cammino aumentante P da s ad u. Se xvu > 0, allora il cammino P = P (u, v) ` un cammino aumentante da s a v. Infatti lungo larco inverso e (v, u) si verica la condizione xvu > 0. Ma allora v dovrebbe appartenere a W contraddicendo lipotesi che v W . Per il Teorema (7.2.2), il usso totale f da s a t ` pari al usso attraverso il taglio (W, W ) che vale, e per quanto appena visto, f=
uW,vW
xuv =
uW,vW
cuv = C(W, W ).
f = C(W, W ).
Ma per il Teorema 7.2.4 sappiamo che una qualunque distribuzione di usso ammissibile non pu` generare o e un usso totale maggiore di C(W, W ) e quindi il usso f ` massimo. 2 Nel paragrafo successivo vedremo come questo teorema sia alla base di un metodo per il calcolo del massimo usso. Prima di occuparci di questo, per`, vediamo come il teorema appena visto possa essere o riformulato in un modo che metta in luce le connessioni tra il problema di trovare il massimo usso e il problema di trovare il tagli a capacit` minima. a Per introdurre questo risultato facciamo delle considerazioni preliminari. Nella seconda sezione di questo capitolo abbiamo associato ad ogni taglio (W, W ) un ben denito numero: la sua capacit` a ). Siccome il numero di tagli possibile ` nito (anche se, eventualmente, molto grande) posC(W, W e siamo considerare tra tutti i tagli quello che ha capacit` minore di tutti gli altri (ovviamente possono a esistere pi` tagli diversi che forniscono la stessa capacit` minima). Indichiamo con Cmin il valore di u a questa capacit` minima. Il Teorema 7.2.4 ` valido per qualunque taglio, in particolare per il taglio di a e capacit` minima. Quindi possiamo aermare che a f Cmin La capacit` del taglio minimo costituisce quindi un limite superiore per il valore del usso massimo, e se a troviamo un usso x per cui f = Cmin , x ` ovviamente un usso ottimo2 . e In generale per`, il valore del usso massimo f potrebbe risultare inferiore o uguale a Cmin . Il o teorema del Massimo usso - Minimo taglio (pi` noto, con terminologia inglese, come Max ow - Min u cut theorem) stabilisce invece che un usso x ` ottimo se e solo se il valore del usso ` esattamente Cmin e e Teorema 7.4.2 (Massimo usso - Minimo taglio) Una distribuzione di usso ` ottima se e solo se e risulta f = Cmin e dove f ` il valore di usso di x.
Cambiando punto di vista possiamo anche dire che il usso massimo ` un limite inferiore per la capacit` di un e a e taglio. Quindi, se per qualche taglio (W, W ) risulta C(W, W ) = f , (W, W ) ` un taglio minimo e C(W, W ) = Cmin . Questo fatto verr` usato spesso nel seguito. a
2
159
Dimostrazione. Sucienza. Mostriamo che se f = Cmin allora x ` ottimo. Procediamo per assurdo. Supponiamo che e = Cmin , ma x non sia ottimo. Allora esiste un altro usso, x il cui valore di usso ` maggiore risulti f e di f . Possiamo quindi scrivere f > f = Cmin che ` ovviamente assurdo perch` contraddice il Teorema 7.2.4. e e Necessit`. Supponiamo che x sia ottimo e mostriamo che deve risultare f = Cmin Procediamo per a = Cmin . Pi` in particolare, siccome sappiamo che non pu` essere assurdo e supponiamo che sia f u o f > Cmin per il Teorema 7.2.4, deve risultare f < Cmin . (7.13)
Deniamo ora lo stesso taglio considerato nel teorema precedente. Poniamo cio` W = {u : esiste un e cammino aumentante da s a u rispetto ad x} {s} e W = V W . e Ragionando come nella prova del teorema precedente, abbiamo che (W, W ) ` un taglio s-te che f = C(W, W ). Per le (7.13) e (7.14) possiamo allora scrivere C(W, W ) Cmin > f = C(W, W ) che ` ovviamente assurda e cos` la prova del teorema ` completa. e e 2 Nella dimostrazione della necessit` del teorema appena dimostrato, abbiamo anche implicitamente a trovato un modo per determinare un taglio di capacit` minima. Infatti, se x ` un usso ottimo, il taglio a e denito da W = {u : esiste un cammino aumentante da s a u rispetto ad x} {s} =V W W ` tale che f = C(W, W ) (equazione (7.14)) ed ` quindi minimo per il Teorema (7.2.2). Quindi, se e e sappiamo risolvere un problema di massimo usso, sappiamo anche risolvere il problema di trovare un taglio di capacit` minima! a Il fatto che il massimo usso sia minore o uguale alla capacit` di ogni taglio e quindi anche alla a capacit` del taglio minimo ` abbastanza ovvio. Meno ovvio ` che all ottimo valga sempre luguaglianza. a e e Questa propriet` permette, concettualmente, di vericare se un dato usso (ammissibile) ` ottimo. Infatti a e per fornire la prova di ottimalit` basta esibire un taglio con capacit` pari al usso inviato da s a t. Nel a a caso tale taglio non esista, sappiamo che deve esistere un usso che permette di inviare un usso maggiore da s a t. Il teorema del Massimo usso - Minimo taglio mette quindi in relazione un problema sostanzialmente continuo (trovare il massimo usso inviabile da s a t) con un problema intrinsecamente combinatorio (trovare il taglio di minima capacit che separa s a t). I due problemi sono di natura diversa. In particolare, il primo cerca una soluzione in un insieme innito di possibili soluzioni. Il secondo cerca una soluzione in un insieme nito di possibili soluzioni. Questo fatto potrebbe portare allimpressione (errata) che il primo problema sia pi` dicile del secondo, in quanto nel secondo ` sempre possibile enumerare tutte u e le possibili soluzioni e scegliere la migliore. Questa impressione `, per`, come ormai ben sappiamo, e o errata, in quanto linsieme di tutte le soluzioni ` s` nito, ma talmente grande, anche per gra di piccole e dimensioni, che non ` pensabile esaminarlo tutto. Per esempio, un grafo con 300 nodi (piccolo per le e applicazioni normalmente arontate con questa metodologia) porta a 2288 possibili tagli separatori di due nodi assegnati. Alcuni ricercatori stimano che il numero di atomi delluniverso osservabile sia inferiore a 2263 . Prima di chiudere questa sezione, vogliamo dare una formulazione equivalente del teorema del Massimo usso - Minimo taglio che pu` aiutare a chiarire ulteriormente le relazioni tra i vari concetti introdotti. o (7.14)
160
7.5
I precedenti risultati ci permettono di denire un algoritmo per il calcolo del usso massimo da s a t in un grafo orientato. Sia dato un usso x ammissibile. Per il Teorema 7.4.1, se non esiste in G un cammino aumentante da s a t rispetto a x, allora x ` ottimo. Supponiamo invece che esista un cammino e aumentante P = {s = u0 , e1 , . . . , up = t}. Il usso x non ` ottimo, e quindi pu` essere aumentato, nel e o senso che ` possibile modicare x in modo da aumentare il usso totale inviato da s a t come visto nella e sezione Cammini aumentanti. Viene allora spontaneo denire un algoritmo per il calcolo del massimo usso nel seguente modo. Algoritmo di Ford e Fulkerson Inizializzazione Poni x0 := 0; i := 0. Passo i-esimo Cerca un cammino aumentante da s a t rispetto al usso xi . Se non esiste: STOP. xi ` la soluzione ottima. e Altrimenti poni: xi+1 Poni i := i + 1; vai al passo i. Notiamo subito che in questo algoritmo c` una parte non completamente specicata. Infatti allinizio e del Passo i viene detto Cerca un cammino aumentante..., ma non viene detto n come trovare un tale e cammino aumentante n quale scegliere nel caso ne esista pi` di uno. Queste questioni verranno arontate e u nella prossima sezione. Per quel che ci interessa qui, supponiamo di essere in grado di trovare i cammini aumentanti e, nel caso ne esista pi` di uno, di sceglierne uno a caso. u Per chiarire meglio il procedimento illustriamolo subito con un esempio. Consideriamo di nuovo il grafo di gura 7.2. Al passo 0 avremo x0 = 0, x0 = 0, x0 = 0, x0 = 0, x0 = 0, x0 = 0, x0 = 3t 34 23 21 14 s2 s1 a 0, x0 = 0. Un possibile cammino aumentante sar`: P = {s, (s, 2), 2, (2, 3), 3, (3, 4), 4, (4, t), t}. P+ = 4t {(s, 2), (2, 3), (3, 4), (4, t)}, mentre P = . Quindi il primo cammino aumentante possiede solo archi diretti. = + = min(2 0, 7 0, 2 0, 1 0) = 1. Quindi tutte le variabili relative agli archi del cammino aumentante vengono aumentate di una unit`. Le altre resteranno invariate. Si avr`: a a e x1 = 0, x1 = 1, x1 = 0, x1 = 0, x1 = 1, x1 = 1, x1 = 0, x1 = 1. Il usso ` aumentato da 0 a 1. 3t 4t 34 14 21 23 s2 s1 Un nuovo cammino aumentante sar` P = {s, (s, 1), 1, (1, 4), 4, (3, 4), 3, (3, t), t}. Risulta quindi P+ = a {(s, 1), (1, 4), (3, 4), (3, t)} e P = {(3, 4)}. Quindi + = min(2 0, 5 0, 3 0) = 2, mentre = min(1) = 1 e = min(+ , ) = 1. Le variabili corrispondenti ad archi diretti vengono quindi aumentate di una unit`, mentre le variabili a corrispondenti ad archi inversi (in questo caso la variabile x34 ) vengono diminuite di ununit`. x2 = a s1 1, x2 = 1, x2 = 1, x2 = 0, x2 = 1, x2 = 0, x2 = 1, x2 = 1. Il usso ` aumentato da 1 a 2. e s2 14 21 23 34 3t 4t Inne troviamo il cammino aumentante: P = {s, (s, 2), 2, (2, 3), 3, (3, t), t}. Sono tutti archi diretti e per essi vale = 1. Quindi si avr`: a x3 = 1, x3 = 2, x3 = 1, x3 = 0, x3 = 2, x3 = 0, x3 = 2, x3 = 1. Il usso nale vale 3, cio` la e s1 s2 14 21 23 34 3t 4t somma dei ussi uscenti da s. Per il teorema 7.4.2, per dimostrare lottimalit` del usso basta mostrare a un taglio s-tla cui capacit` ` pari al valore del usso. Bisogna cio` trovare il taglio a capacit` minima. ae e a Nellesempio il taglio a capacit` minima sar` W = {s, 1, 4} e W = {2, 3, t}, ed ` illustrato in gura 7.8. a a e Gli archi che hanno la coda in W e la testa in W sono gli archi (s, 2) e (4, t), e la somma delle loro capacit` a vale 3. Per trovare questo taglio basta usare la costruzione suggerita nella dimostrazione della sucienza del teorema 7.4.1, ovvero basta mettere in W il nodo s e tutti i nodi raggiungibilli da s con un cammino aumentante rispetto alla soluzione ottima x. Nellesempio appena visto lalgoritmo di Ford e Fulkerson i+1 xuv = xi uv xi+1 = xi + = uv uv i+1 xuv = xi uv se (u, v) P / se (u, v) P + se (u, v) P
161
2 2
3 3
W
2 t 1
2 1 5 4
W
Figura 7.8: Taglio a capacit` minima a
ha trovato la soluzione ottima in un numero nito di iterazioni. Ma quale garanzia abbiamo che ci` o accada sempre? Pi` in particolare, se non possiamo trovare un cammino aumentante sappiamo di essere u allottimo, mentre in caso contrario sappiamo che lalgoritmo aumenta il valore del usso. Ma, per esempio, possiamo pensare di poter trovare cammini aumentanti con i quali ` possibile aumentare il e valore del usso di quantit` sempre pi` piccole cosicch se, poniamo, il usso ottimo vale 10, i nostri a u e ussi abbiano valori di 9, 9.9, 9.99, 9.999 . . . e non si arrivi mai al usso ottimo. In proposito vale il seguente risultato. a Teorema 7.5.1 Supponiamo che tutte le capacit` siano numeri interi. Allora l algoritmo di Ford e Fulkerson trova lottimo in un numero nito di passi. Dimostrazione. Sappiamo che il usso ottimo esiste sempre e ha quindi una valore (nito) f . Il usso da cui parte l algoritmo ` quello nullo, che ha un valore di 0. Siccome le capacit` sono tutte intere ` e a e facile convincersi che ad ogni passo il usso viene aumentato di un numero intero ( ` un numero intero). e Quindi ad ogni iterazione il usso viene aumentato di almeno ununit` ( ` maggiore o uguale a 1, il pi` a e u piccolo intero positivo). Questo vuol dire che in un numero nito di passi ( pari, nel caso peggiore, al pi` u piccolo intero superiore a f ) lalgoritmo trova (= raggiunge) lottimo. 2 Con ragionamenti molto simili si pu` dimostrare che anche se le capacit` sono numeri razionali3 lalgoritmo o a termina in un numero nito di passi. Invece se alcune delle capacit` sono numeri irrazionali ` possibile a e fornire degli esempi (piuttosto articiosi in verit`) in cui lalgoritmo non riesce a trrovare la soluzione a ottima in un numero nito di passi. ` E importante sapere che esistono delle semplici varianti dell algoritmo di Ford e Fulkerson che garantiscono la convergenza in un numero nito di passi qualunque siano i valori delle capacit` a
7.6
In questa sezione arontiamo la questione che era stata lasciata in sospeso nella descrizione dellalgoritmo di Ford e Fulkerson: come possiamo, in maniera sistematica, trovare un cammino aumentante o, nel caso
Ricordiamo che i numeri razionali sono quelli esprimibili come rapporto di due numeri interi. Esempi di numeri irrazionali sono invece e 2.
3
162
non ne esista uno, trovare un taglio minimo? A questo ne introduciamo un semplice algoritmo noto come algoritmo di etichettatura. Lalgoritmo assegna ad ogni nodo unetichetta a partire da s no a raggiungere, se possibile, t. Se riesce eettivamente a raggiungere t ` poi possibile ricostruire un cammino aumentante e a partire dalle etichette; se invece non riesce a raggiungere t allora non esistono cammini aumentanti e linsieme dei nodi etichettati e quello dei nodi non etichettati costituiscono un taglio di capacit` minima. a Ogni etichetta ` costituita da due numeri; la generica etichetta del nodo i verr` indicata con (E1 (i), E2 (i)), e a dove E1 (i) ` il primo numero delletichette e E2 (i) il secondo. e Sia allora x un usso s-t ammissibile. L algoritmo procede nel seguente modo. Assegna alla sorgente letichetta (0, ). Poi seguita ad etichettare i nodi, nch possibile, secondo le e seguenti regole. (a) Se - i ` un nodo etichettato, e - j ` un nodo non etichettato, e - esiste larco (i, j), - risulta xij < cij , assegna a j letichetta (i, min{cij xij , E2 (i)}). (b) Se e - i ` un nodo etichettato, - j ` un nodo non etichettato, e - esiste larco (j, i), - risulta xji > 0, assegna a j letichetta (i, min{xji , E2 (i)}).
Commenti. A un certo stadio dellalgoritmo ci possono essere pi` modi in cui un nodo non etichettato u
pu` essere etichettato seguendo le regole (a) e (b). In questo caso basta scegliere uno qualsiasi dei modi o possibili e proseguire. Per esempio consideriamo la parte di un grafo parzialmente etichettato, mostrata in gura 7.9a). Il nodo 9 pu` essere etichettato indierentemente a partire dal nodo 5, 7.9b), o dal nodo o 11, 7.9c). ` E importante tener presente che una volta attribuita un etichetta a un nodo questa non va pi` u cambiata. La procedura termina quando o viene etichettato il pozzo t o non ` pi` possibile etichettare nessun e u nodo.
Signicato delle etichette Le etichette indicano un possibile cammino aumentante dalla sorgente s al nodo etichettato. Per ricostruire il cammino basta usare le E1 (i) e leggerle allindietro no ad arrivare ` alla sorgente s. E infatti facile convincersi, tenendo presente le regole (a) e (b) adottate nel processo di etichettatura, che il cammino dal nodo s al nodo i costruito in questo modo ` in eetti un cammino e aumentante e che il usso aggiuntivo che ` possibile inviare da s a i ` esattamente pari a E2 (i). e e Quindi se etichettiamo il nodo t abbiamo trovato un cammino aumentante e possiamo procedere con lalgoritmo di Ford e Fulkerson. Consideriamo invece il caso in cui lalgoritmo di etichettatura si fermi, senza aver etichettato il pozzo t, perch non ` pi` possibile etichettare nessun nodo. Deniamo W come linsieme dei nodi che sono stati e e u etichettati e indichiamo con W i rimanenti nodo del grafo. Risulta ovviamente s W , per costruzione, e t W perch abbiamo supposto che il pozzo non sia stato etichettato. (W, W ) costituisce quindi un e taglio s-t. 163
3, 1
3, 1
3, 1
1
(4, 6)
2
(4, 6) 5, 1
(4, 6) 11, 3
3
(3, 3) (3, 3)
0
(3, 3)
4
2, 4
5
2, 4
7
2, 4
a)
b)
c)
1 1000 1 1000
1000 2
1000
164
((s, 1), (1, 2), (2, t)), ((s, 2), (2, 1), (1, t)), . . . . . ., si vede che sono necessarie 2000 iterazioni, perch` ate traverso ogni cammino aumentato indicato si pu` aumentare il valore del usso di una sola unit` alla o a volta. Esistono dei modi intelligenti di scegliere i cammini aumentanti che assicurano che situazione disastrose come quella evidenziata nellesempio appena visto non possono accadere. Non abbiamo qui lo spazio per approfondire l argomento. Diciamo solo che due buone scelte sono quelle di scegliere ad ogni passo, tra tutti i cammini aumentanti possibili, un cammino composto dal minore numero possibili di archi o un cammino che assicuri di poter aumentare il valore del usso della pi` grande quantit` possibile. u a Notiamo che usando uno qualunque di questi due criteri nell esempio della gura 7.10 porta alla scelta dei cammini ((s, 1), (1, t)) e ((s, 2), (1, t)) e fa quindi terminare lalgoritmo di Ford e Fulkerson in 2 sole iterazioni. Esistono dei modi ecienti e esistematici, diversi dalla procedura di etichettatura illustrata in questa sezione, per calcolare cammini aumentanti che soddisno uno dei due criteri appena indicati. Qui, per ragioni di spazio, diciamo solo che sono basati sulle tecniche di calcolo dei cammini minimi del tipo illustrato nel capitolo precedente.
7.7
Esempi
Dato il grafo di gura 7.11, trovare il valore del massimo usso inviabile da s a t (la capacit` associata a a ciascun arco ` mostrata in gura in prossimit` dellarco stesso). e a
2 2 s 5
3 2 1 1 2 t
2 4
Figura 7.11:
Soluzione. Per calcolare il usso utilizzeremo lalgoritmo di Ford e Fulkerson, con usso iniziale nullo. Ricordiamo infatti che lalgoritmo di Ford e Fulkerson richiede in ingresso un usso ammissibile, e che il usso nullo ` un usso ammissibile per il nostro problema. e
165
Iterazione 0. Al passo 0 avremo x0 = 0, x0 = 0, x0 = 0, x0 = 0, x0 = 0, x0 = 0, x0 = 0, x0 = s1 s2 14 21 23 34 3t 4t 0. Un possibile cammino aumentante da s a t sar`: P = {s, (s, 2), 2, (2, 3), 3, (3, 4), 4, (4, t), t}. a P+ = {(s, 2), (2, 3), (3, 4), (4, t)}, mentre P = . Ci sono solo archi diretti e dunque = + = min(20, 70, 20, 10) = 1. Quindi tutte le variabili relative agli archi del cammino aumentante vengono aumentate di ununit`. Le altre resteranno invariate. Si avr`: x1 = 0, x1 = 1, x1 = 0, a a s1 s2 14 x1 = 0, x1 = 1, x1 = 1, x1 = 0, x1 = 1. Il usso ` aumentato da 0 a 1. e 21 23 34 3t 4t Iterazione 1. Un nuovo cammino aumentante sar`: P = {s, (s, 1), 1, (1, 4), 4, (3, 4), 3, (3, t), t}. a Risulta P+ = {(s, 1), (1, 4), (3, t)}, mentre P = {(3, 4)}. Inoltre + = min(2 0, 2 0, 3 0) = 2, mentre = min(1) = 1. Quindi = min(+ , ) = 1. Le variabili corrispondenti ad archi diretti vengono quindi aumentate di ununit`, mentre le variabili a corrispondenti ad archi inversi (in questo caso la variabile x34 ) vengono diminuite di ununit`. Sar` a a dunque: x2 = 1, x2 = 1, x2 = 1, x2 = 0, x2 = 1, x2 = 0, x2 = 1, x2 = 1. Il usso ` aumentato e s1 s2 14 21 23 34 3t 4t da 1 a 2. Iterazione 2. Inne troviamo il cammino aumentante: P = {s, (s, 2), 2, (2, 3), 3, (3, t), t}. Sono tutti archi diretti e per essi vale = 1. Quindi si avr`: a 3 3 3 3 xs1 = 1, xs2 = 2, x14 = 1, x21 = 0, x3 = 2, x3 = 0, x3 = 2, x3 = 1. 4t 3t 34 23 Il usso nale vale 3. Iterazione 3. Non ` possibile trovare un cammino aumentante rispetto al usso x3 , che ` dunque ottimo. e e 2
Ovviamente, se ` noto un usso iniziale ammissibile, diverso da 0, possiamo tranquillamente applicare e lalgoritmo a partire dal usso dato. Consideriamo anche unaltro esempio. Dato il grafo e il usso ammissibile rappresentati in Fig. 7.12, trovare il usso massimo iniviabile da s a t, certicando lottimalit` della soluzione ottenuta con lesibizione di un taglio di capacit` uguale al a a usso massimo trovato. Soluzione. Per trovare il usso massimo utilizzeremo lalgoritmo di Ford e Fulkerson, con usso iniziale uguale a quello in gura. Il usso iniziale vale 10.
166
(0, 1) s
(1, 1) (1, 2)
(2, 2) (2, 6) 4
(2, 5)
Figura 7.12:
Iterazione 0. Al passo 0 avremo x0 = 2, x0 = 2, x0 = 2, x0 = 4, x0 = 4, x0 = 0, x0 = 1, x0 = 1, x0 = 2 46 36 35 32 27 s7 s4 s3 s2 x0 = 2 x0 = 1 x0 = 3 x0 = 4 x0 = 5 x0 = 3. Un possibile cammino aumentante da s a t 7t 75 6t 5t 56 52 sar`: P = {s, (s, 4), 4, (4, 6), 6, (5, 6), 5, (7, 5), 7, (7, t), t}. P+ = {(s, 4), (4, 6), (7, t)}, mentre P = a {(5, 6), (7, 5)}. + = min(4, 3, 3) = 3, mentre = min(1, 3) = 1. Quindi = min(+ , ) = 1. Si avr` quindi (scriviamo solo le variabili da aggiornare: x1 = 3, x1 = 3, x1 = 0, x1 = 4, x1 = 4. a 7t 75 56 46 s4 Il usso ` aumentato da 10 a 11. e Iterazione 1. Un nuovo cammino aumentante sar`: P = {s, (s, 4), 4, (4, 6), 6, (3, 6), 3, (3, 2), 2, (5, 2), 5, (7, 5), a 7, (7, t), t}. P+ = {(s, 4), (4, 6), (3, 2), (7, t)}, mentre P = {(3, 6), (5, 2), (7, 5)}. + = min(3, 2, 1, 2) = 1, mentre = min(1, 2, 2) = 1. Quindi = min(+ , ) = 1. Si avr`: x2 = 4, x2 = 4, x2 = 0, a s4 46 36 x2 = 1, x2 = 1, x1 = 5, x1 = 5. Il usso ` aumentato da 11 a 12. e 32 52 75 7t
167
Iterazione 2. Non ` possibile trovare un cammino aumentante rispetto a x2 , che ` dunque ottimo. e e Un modo per rappresentare gracamente le iterazioni dellalgoritmo ` illustrato in Figura 7.13. Ogni e volta che il valore del usso su un arco viene aggiornato, si sbarra il precedente valore del usso sovrapponendogli il nuovo valore.
7
5 4
3 4
(3, 6)
(0, 1) W s
4 3
(1, 1)
0
(1, 3) (4, 4) 6
(1, 2) (2, 2) 4 3
4 3
(2, 6)
(2, 5)
Figura 7.13:
Nellesempio un taglio a capacit` minima sar` W = {s, 4, 6} e W = {2, 3, 5, 7, t}, ed ` mostrato in a a e gura 7.13 con una linea che separa i due insiemi. Per calcolare la capacit` del taglio bisogna sommare a le capacit` degli archi che hanno la coda in W e la testa in W , e cio` gli archi (s, 2), (s, 3), (s, 7), e a e (6, t), e la somma delle loro capacit` vale 12. Per trovare questo taglio si pu` usare la costruzione suga o gerita dallenunciato del Teorema ??, ovvero basta mettere in W il nodo s e tutti i nodi raggiungibili da s con un cammino aumentante rispetto alla soluzione ottima x2 . In questo esempio, i nodi raggiungibili sono appunto il nodo 4 (cammino aumentante {s, (s, 4), 4} e il nodo 6 (cammino aumentante {s, (s, 4), 4, (4, 6), 6}).
7.8
Accoppiamento bipartito
Sia dato un grafo bipartito G(S, D, E) (con |S| = l,|D| = r,l +r = n, |E| = m) non orientato. Il problema che si vuole arontare ` quello di determinare un sottoinsieme A di archi di G di cardinalit` massima, e a tale che due archi di A non abbiano mai un nodo in comune. In altre parole, si tratta di assegnare il massimo numero di nodi dellinsieme S a nodi dellinsieme D (o viceversa), in modo che ogni nodo sia di S sia di D sia assegnato al pi` ad un solo altro nodo, con il vincolo che una assegnazione di un nodo i a u un nodo j possa avvenire solo se nel grafo G esiste larco (i, j). Questo problema, noto come problema di accoppiamento di cardinalit` massima, ha moltissime apa plicazione, e si presenta tutte le volte in cui bisogna assegnare in maniera esclusiva i membri di un insieme
168
(nodi S) a quelli di un altro insieme (nodi D). Per esempio, supponiamo che i nodi S rappresentino i dipendenti di unazienda e i nodi D i lavori che devono essere svolti. Supponiamo inoltre che un arco colleghi un nodo di S a un nodo di D se e solo se la persona rappresentata dal nodo di S ` in grado e di svolgere il lavoro rappresentato dal nodo di D. in questo caso allora, risolvere il problema di accoppiamento di cardinalit` massima vuol dire assegnare ai dipendenti i lavori in modo da massimizzare il a numero di lavori svolti. In questa sezione presentiamo un algoritmo per la risoluzione del problema di accoppiamento di cardinalit` massima basato sulla riduzione del problema a un problema di massimo usso, che pu` a o quindi essere risolto con lalgoritmo di Ford e Fulkerson. Pi` precisamente mostreremo come sia possibile u formulare il problema come problema di massimo usso; ossia mostreremo come sia possibile formulare un problema di massimo usso la cui soluzione ottima fornisca immediatamente la soluzione ottima del problema di accoppiamento bipartito. Per raggiungere questo scopo, costruiamo il seguente grafo straticato H con (n + 2) nodi, (m + n) archi e 4 strati (vedi la gura 7.14).
169
Si noti che s ha solo archi uscenti, i nodi del secondo strato hanno tutti un solo arco entrante, i nodo del terzo strato hanno tutti un solo arco uscente, p ha solo archi entranti. Risolvendo il problema del massimo usso dal nodo s al nodo p sul grafo H, viene anche risolto il problema di accoppiamento massimo sul grafo G. In eetti, per la particolare struttura del grafo, ` facile convincesi che una distribuzione di usso e che massimizza il usso inviato da s a p inviando complessivamente un usso pari a f , (e ottenuta con l algoritmo di Ford e Fulkerson) ` formata da un insieme di f cammini in cui scorre un usso unitario, e tutti con origine nel nodo s, arrivo nel nodo p, formati da tre archi (uno tra gli strati 1 e 2, uno tra gli strati 2 e 3, uno tra gli strati 3 e 4) e senza altri nodi comuni oltre a s e p. Accoppiando i nodi associati agli archi con usso pari a 1, si ottiene un accoppiamento ammissibile di cardinalit pari a f . a Daltra parte, se, per assurdo, esistesse un accoppiamento di cardinalit maggiore di f , allora sarebbe a anche possibile, per la struttura del problema, costruire una distribuzione di ussi maggiore di f (e pari alla cardinalit` dellaccoppiamento). Infatti basterebbe inviare un usso pari a 1: da s a tutti i nodi del a secondo strato accoppiati, fra i nodi accoppiati, e dai nodi del terzo strato accoppiati al nodo p; questo ` ovviamente assurdo. Quindi laccoppiamento di cardinalit` f , trovato in base alla risoluzione del e a problema di massimo usso, ` massimo e risolve il problema di accoppiamento bipartito posto allinizio. e
7.9
In questo ultimo pragrafo vogliamo mostrare come tutti i problemi su gra considerati n qui (cammini minimi, usso massimo, accoppiamento bipartito), siano in verit` casi particolari di un unico problema: a Il problema della distribuzione di usso a costo minimo. Descriviamo dapprima questo problema. Problemi di distribuzione di usso a costo minimo nascono naturalmente quando si voglia determinare il modo pi` economico di trasportare merci da alcune origini u a delle destinazioni attraverso una rete sica, e in eetti modelli di questo tipo sono stati gia incontrati quando abbiamo presentato modelli di PL. Consideriamo una grafo orientato G = (V, E) con associato ad ogni arco (i, j) E un costo cij (negativo, positivo o nullo), una capacit` uij 0 ed un limite inferiore a lij , con 0 lij uij . Supponiamo inoltre che a ciascun nodo i di V sia associato un numero intero b(i), con la convenzione che: - b(i) > 0 indica la presenza di oerta (il nodo i viene detto origine); - b(i) < 0 indica la presenza di domanda (il nodo i viene detto destinazione); - b(i) = 0 indica lassenza di oerta e di domanda (il nodo i viene detto di trasferimento). Nel seguito supporremo valida la seguente ipotesi: Ipotesi di ammissibilit`. Loerta totale uguaglia la domanda totale; ovvero, formalmente: a b(i) = 0.
iV
(7.15)
e Denizione 7.9.1 Un usso ammissibile in una rete G ` un vettore non negativo x IR|E| che soddisfa i seguenti vincoli: vincoli di capacit`: per ogni arco (ij) E: a lij xij uij . vincoli di bilanciamento della massa: per ogni nodo k V xjk
(jk) (k) (ki) + (k)
xki = b(k).
170
Il problema del usso a costo minimo, si pu` enunciare come segue: o trovare una distribuzione ammissibile di usso sulla rete G tale in modo da minimizzare il costo totale. Se si indica con AG la matrice dincidenza della rete, con b = (b(1), . . . , b(n))T il vettore della domanda/oerta, con c IRm il vettore dei costi e con l IRm ed u IRm i vettori le cui componenti + + rappresentano il limite inferiore e la capacit` dellarco corrispondente, il problema di usso a costo minimo a pu` essere scritto nel seguente modo: o min cT x AG x = b lxu (PC )
Nel caso di rete non capacitata, cio` quando si abbia lij = 0 e uij = , allora il problema di usso a e costo minimo si scrive: min cT x AG x = b x0 (Q).
In questo caso il problema ` anche noto in letteratura come problema di trasferimento (transhipment e problem). Lipotesi di ammissibilit` consente di assicurare lesistenza di una soluzione ammissibile per il proba lema di trasferimento (P ). Si ha infatti, il seguente teorema: Teorema 7.9.2 (Ipotesi di ammissibilit`) Condizione necessaria e suciente per lesistenza di una a soluzione ammissibile per problema di trasferimento (Q) ` cha valga (7.15). e Una delle propriet` pi` interessanti della classe di problemi che stiamo analizzando ` espressa dal a u e seguente teorema. Teorema 7.9.3 (Propriet` di interezza) Dato un problema di usso a costo minimo che soddisfa a lipotesi di ammissibilit`, se i vettori l, u e b sono interi non negativi, se il problema ha una soluzione a ottima, allora ha una soluzione intera dello stesso valore. In particolare se si utilizasse il metodo del simplesso (cosa che in genere, bisogna dire, non viene fatta, poich` si possono sviluppare sue specializzazioni che risultano pi` ecienti), si pu` mostrare che e u o la soluzione ottima trovata, se sono soddisfatte le condizioni del teorema precedente, sono intere. Riconsideriamo ora i problemi su gra gi` studiati e mostriamo che si tratta di casi particolari del a problema di usso a costo minimo.
171
per ogni nodo i V , si ponga b(i) = 0 (vincoli di conservazione del usso). ` E facile vedere che minimizzare il costo di un usso su una rete cos` denita, corrisponde a massimiz zare la quantit` di usso sullarco ttizio ts, e quindi a massimizzare la quantit` di usso entrante in a a t.
Vincoli. I vincoli devono imporre che la soluzione corrisponda al vettore dincidenza di un cammino semplice da s a t, cio`: e in ciascun nodo k che non sia s o t incidono esattamente due archi del cammino, uno entrante e laltro uscente. Questo si esprime con il vincolo: xik = 1
(ik) (k)
k V {s, t} k V {s, t}
xkj = 1
(kj) + (k)
e dalla sorgente s esce esattamente un arco e nel pozzo t entra esattamente un arco; cio`: xit = 1
(it) (t)
xsj = 1
(sj) + (s)
172
Se poniamo b = (1 1 0 . . . 0)T , e consideramo la matrice di incidenza A della rete G, allora questi vincoli si possono esprimere in forma matriciale come: Ax = b. Se si eccettua la richiesta che le variabili siano binarie, si tratta ovviamente di un problema di usso a costa minimo in cui la rete ` non-capacitata; e per ogni nodo i V {s, t}, si pone b(i) = 0; si pone b(s) = 1 e b(t) = 1. ` E facile vedere che ogni usso ammissibile corrisponde a inviare un usso unitario dal nodo s al nodo t; se si suppone che il usso ottimo sia intero, un usso unitario corrisponde a un cammino diretto da s a t (formato dagli archi il cui usso corrispondente ` uguale a uno). Dunque, il usso di costo e minimo corrisponder` al cammino di costo minimo da s a t. Per il Teorema 7.9.3 sappiamo che in eetti, a almeno una soluzione di questo problema problema ` intera. Quindi se utilizziamo un algoritmo che e ci garantisce di trovare una soluzione intera (per esempio il simplesso), nella formulazione precedente possiamo trascurare il vincolo (dicile da trattare) che impone che le variabili siano 0-1 e ridurci a un puro problema di usso a costo minimo. I problemi di usso a costo minimo costituiscono una delle pi` importanti classi di problemi su gra, e u anche se non possiamo approfondire i metodi di soluzione per questa classe di problemi, abbiamo voluto almeno introdurre il problema e alcune sue importanti propriet`, quali lesistenza di soluzioni intere. a Laver fatto vedere che il problema dei cammini minimi e quello del massimo usso sono casi particolari del problema di usso a costo minimo non vuole assolutamente suggerire che i metodi di risoluzione per questultima classe di problemi dovrebbero essere usati per la risoluzione di problemi di cammino minimo ` o di massimo usso. E piuttosto vero il contrario: gli algoritmi che abbiamo studiato per risolvere i problemi di massimo usso e di cammino minimo contengono in nuce le idee di base e, in alcuni casi, possono essere direttamente utilizzati come mattoncini per sviluppare algoritmi ecienti per la risoluzione dei problemi di usso a costo minimo.
173
Capitolo 8
174
8.1
Lottimizzazione combinatoria
Una particolare classe di problemi di ottimizzazione ` rappresentata dai cosiddetti problemi di ottimize zazione combinatoria. A questa classe appartengono, fra laltro, i problemi di PL01, il problema dellaccoppiamento e il problema del cammino minimo su gra visti nei capitoli precedenti.
1 5 s 10 2 4
10 t 10
. Si osservi la dierenza fra la denizione di problema di ottimizzazione combinatoria e la pi generale u denizione di problema di ottimizzazione introdotta nel Capitolo 1. Nella denizione generale, linsieme di soluzioni ammissibili S pu assumere qualunque forma, mentre nei problemi di ottimizzazione S una o e famiglia (nita) di sottoinsiemi di un insieme nito di elementi. Ad esempio, il problema del cammino minimo da s a t in un grafo orientato G = (V, E), con un peso pe associato a ogni arco e E, visto nel capitolo precedente, ` un problema di ottimizzazione combinatoria. e Per questo problema, linsieme di base ` linsieme degli archi. Per listanza mostrata in gura 8.1, e linsieme di base sar` B = {(s, 1), (s, 2), (1, 2), (1, t), (2, t)}. La famiglia di soluzioni ` linsieme di tutti i a e sottoinsiemi di archi che corrispondono a cammini orientati da s a t. In particolare, avremo 3 possibili cammini distinti da s a t e quindi S = {S1 = {(s, 1), (1, t)}, S2 = {(s, 1), (1, 2), (2, t)}, S3 = {(s, 2), (2, t)}}. La funzione obiettivo ` semplicemente la somma dei pesi associati agli archi: w(S) = eS pe . Quindi e w(S1 ) = 15, w(S2 ) = 19 e w(S3 ) = 20. Nella maggioranza dei casi trattati, a ogni elemento dellinsieme di base associato un peso e la e funzione obiettivo semplicemente la somma dei pesi degli elementi contenuti nella soluzione. Tuttavia e la funzione obiettivo pu assumere in generale qualunque forma. Un esempio di diversa funzione obiettivo o verr mostrato in seguito. a Nei prossimi paragra illustreremo alcuni esempi importanti di problemi di ottimizzazione combinatoria.
175
8.1.1
Sia dato un grafo G = (V, E) non orientato e bipartito, ovvero i) V = U W e W U = e ogni arco appartenente ad E ha per estremi un nodo u U e un nodo v W (cio` non esistono archi con ambo e gli estremi in U o ambo gli estremi in W ). Inoltre, con ogni arco (u, v) E ` associato un peso wuv , e che rappresenta il vantaggio di assegnare il nodo u al nodo v. Un esempio di grafo bipartito (pesato) ` e mostrato in gura 8.2.a. Ora, a ogni nodo dellinsieme W vogliamo assegnare al pi` un nodo dellinsieme u U e viceversa, in modo da massimizzare la somma dei vantaggi. Si osservi che assegnare un nodo u U a un nodo v W ` equivalente a selezionare larco (u, v) (di peso wuv ). Inoltre, se ` stato selezionato e e larco (u, v), e quindi se ` stato assegnato il nodo u a v (e viceversa), nessun altro arco incidente in u e pu` essere selezionato (perch` ci` equivarrebbe ad assegnare u a pi` di un nodo); analogamente, nessun o e o u altro arco incidente in v pu` essere selezionato. Un sottoinsieme M E degli archi di G che gode della o propriet` che, comunque presi due archi appartenenti a M , essi non hanno estremi in comune, ` detto a e accoppiamento (in inglese matching). Un esempio di matching (di valore 19) ` mostrato in gura 8.2.b. e
6 9
A 4
6 9
A 4
2 8 3 10
2 8 B 3
10
a.
Figura 8.2: Esempio di accoppiamento bipartito
b.
Dunque, il problema dellaccoppiamento massimo pu` essere cos` ridenito: selezionare un sottoino sieme M degli archi di G tale che i) M sia un matching, e ii) la somma dei pesi degli archi in M sia massima. Cos` formulato il problema dellaccoppiamento massimo su grafo bipartito ` chiaramente un problema e di ottimizzazione combintatoria, ove: linsieme di base coincide con linsieme degli archi E. la famiglia di sottoinsiemi di archi coincide con la famiglia di tutti i possibili matching di G la funzione obiettivo associa a ogni matching M la somma dei pesi degli archi in M .
8.1.2
Un commesso viaggiatore deve visitare un certo numero di citt`, partendo dalla sua citt` di residenza a a e ritornandoci alla ne del giro. Questo problema pu` essere utilmente rappresentato su un grafo G = o (V, E), ove ogni nodo u V rappresenta una citt` da visitare, mentre gli archi rappresentano strade a (o voli) che collegano coppie di citt`. Per semplicare la trattazione supporremo che il grafo G sia non a orientato: lestensione al caso orientato di quanto verr` detto ` immediata. A ogni arco (u, v) E si a e associa una distanza duv I + che rappresenta la lunghezza del percorso fra la citt` u e la citt` v. Si R a a osservi che duv potrebbe anche rappresentare il tempo di percorrenza, o il costo del trasferimento.
176
Dunque, il commesso viaggiatore, partendo dalla citt` in cui abita (sia per esempio la citt` 1), vuole a a eettuare tutte le visite e ritornare alla ne alla citt` di partenza, percorrendo una strada di lunghezza a complessiva minima. Si osservi intanto che il giro del commesso viaggiatore corrisponde a un ciclo del grafo G che attraversi ogni nodo una e una sola volta. Un ciclo siatto ` detto ciclo hamiltoniano. e Quindi, il Problema del Commesso Viaggiatore (indicato anche con lacronimo TSP, dallinglese Travelling Salesman Problem) si denisce come il problema di selezionare un particolare ciclo hamiltoniano, quello (o uno di quelli) di costo (lunghezza, peso) minimo.
1
7 5 3 15
5 2 5
1
7 5 3 15
5 2
1
7 5 3 15
5 2
5
3
2 5
3
2 5
5 3
2
5
a.
b.
Figura 8.3: Esempi di cicli hamiltoniani
c.
Si consideri ad esempio il grafo in Fig. 8.3. Un possibile ciclo hamiltoniano `, ad esempio, linsieme e di archi H1 = {(1, 2), (2, 3), (3, 4), (4, 5), (5, 1)} (Fig. 8.3.b), e il suo costo (somma dei costi degli archi) ` e pari a 24. Un altro ciclo hamiltoniano ` H2 = {(1, 3), (3, 2), (2, 4), (4, 5), (5, 1)} (Fig. 8.3.c) di costo pari e a 32. Un ciclo hamiltoniano pu` dunque essere rappresentato come insieme di archi. Quindi, linsieme o di base del nostro problema di ottimizzazione combinatoria ` linsieme E degli archi di G. Linsieme e delle soluzioni ` una famiglia H = {H1 , . . . , Hm } di sottoinsiemi di E, ove Hi ` linsieme di archi di un e e ciclo hamiltoniano per i = 1, . . . , m. La funzione obiettivo ` semplicemente, per ogni H H, w(H) = e (u,v)H duv .
8.1.3
Problemi di questo tipo appaiono ogni qual volta si debbia scegliere una partizione di un insieme di elementi in un certo numero di classi in modo da minimizzare (o massimizzare) una funzione di distanza fra gli elementi appartenenti a una stessa classe. Sia quindi dato un grafo non orientato G = (V, E), e sia associato un peso wuv con ogni arco uv E. Si vuole trovare la partizione di V in k classi (o cluster), con k pressato, che minimizzi la somma dei pesi degli archi incidenti in nodi appartenenti a una stessa classe. Si ricordi che se = {C1 , C2 , . . . , Ck } ` una k partizione di V si ha n Ci = V e Ci Cj = per e i=1 i, j {1, . . . , k}, i = j. Il costo w(Ci ) di una classe di nodi C ` denito come uC,vC wuv . Il costo di e una partizione w() = w({C1 , C2 , . . . , Ck }) ` denito come i=1 w(Ci ). Il problema di Partizionamento e di un Grafo consiste nel scegliere la k-partizione che minimizza w( ). Anche il problema di partizionamento di un grafo pu` essere inserito nel framework dei problemi di o ottimizzazione, anche se lassociazione non ` cos` immediata. Esistono in realt` (almeno) due diverse e a rappresentazioni del problema come problema di ottimizzazione combinatoria. La prima consiste nel denire linsieme di base come linsieme degli archi E e le soluzioni ammissibili come quei sottoinsiemi di archi che sono archi completamente contenuti in qualche classe di una k-partizione di G. Cio`, S E e ` una soluzione ammissibile se e solo se esiste una k-partizione = {C1 , . . . , Ck } tale che, per ogni arco e uv S, il nodo u e il nodo v sono entrambi contenuti in una stessa classe della partizione . In questo
k
177
caso, la funzione di costo w(S) ` semplicemente la somma degli archi contenuti in S. e Una seconda rappresentazione ` in qualche senso pi` naturale, perch` discende direttamente dalla e u e denizione di k-partizione. Infatti, una k-partizione pu` essere denita come una funzione che associa a o ogni nodo v un intero appartenente allintervallo [1, . . . , k], e cio` (lindice del) la classe di appertenza. e Quindi, una soluzione ` completamente denita da un insieme di n coppie (v1 , i1 ), (v2 , i2 ), . . . , (vn , in ), e ove con ij si ` indicato la classe di appartenenza del nodo vj . Quindi, linsieme di base ` linsieme e e B = {(v, i) : v V, i = 1 . . . , k}, mentre una soluzione S B ` un insieme di coppie nodo/classe (v, i) e con la propriet` che ogni nodo di V ` contenuto in esattamente una coppia di S. La funzione obiettivo, a e in questo caso, non ` una funzione lineare degli elementi di S: in eetti, a ciascun elemento dellinsieme e di base non ` associato alcun peso. Tuttavia, il costo della soluzione S dipende dalle coppie apaprtenenti e ad S nel senso che queste ultime determinano gli archi che appartengono a una medesima classe della k partizione e quindi il costo di S. La funzione di costo sar` quindi w(S) = i=1 (u,i)S,(v,i)S wuv . a Questo un esempio di funzione obiettivo atipica anticipato nella parte iniziale di questo capitolo. e Una importante famiglia di problemi di partizionamento pone una restrizione sulla dimensione delle classi. In particolare, con ogni classe viene associata una cardinalit` massima, e il problema diventa: a trovare la k-partizione di costo minimo, col vincolo che la cardinalit` della j-esima classe non ecceda la a cardinalit` massima rj , per j = 1, . . . , k. a
8.1.4
PL01
Le soluzioni ammissibili di un problema di programmazione lineare (0,1) sono vettori booleani x {0, 1}n . In genere, ogni componente di un vettore booleano rappresenta il fatto che un certo elemento di un insieme di base B = {b1 , . . . , bn } ` scelto oppure no. Tipicamente, se la componente i-esima xi = 1 allora e lelemento bi ` scelto, se xi = 0 allora bi non ` scelto. Ad esempio, nel problema di scelta dei progetti e e pi` remunerativi, linsieme di base ` linsieme dei possibili progetti attivabili e xi = 1 signica che il u e progetto i-esimo ` attivato, xi = 0 signica che il progetto i-esimo non ` attivato. In altri termini, un e e vettore booleano identica tutti gli elementi dellinsieme di base che sono stati scelti, e cio` un particolare e sottoinsieme S B. Al contrario, dato un qualunque sottoinsieme S B, possiamo associare a S un vettore booleano xS detto vettore dincidenza di S, tale che la componente i-esima xS = 1 se e solo se i bi S. In denitiva, un problema di programmazione lineare (0,1) min{wT x : Ax b, x {0, 1}n } pu` o sempre essere interpretato nel seguente modo: Le variabili x1 , . . . , xn sono in corrispondenza agli elementi di un insieme di base B = {b1 , b2 , . . . , bn }. I vincoli del problema deniscono la regione ammissibile e quindi ci dicono quali vettori booleani sono ammissibili e quali no. Poich` ogni vettore booleano ` in corrispondenza con un sottoinsieme e e dellinsieme di base, i vincoli deniscono quali sottoinsiemi dellinsieme di base sono soluzioni ammissibili del nostro problema e quali no. La funzione obiettivo (lineare) associa un costo wi a ogni variabile xi per i = 1, . . . , n e quindi a ciascun elemento bi dellinsieme di base B. E facile vedere che il costo di una soluzione xS , e cio` e di un sottoinsieme S di B, ` semplicemente la somma dei costi degli elementi appartenenti a S. e
8.2
Descriveremo di seguito unapplicazione reale e recente che ha richiesto lutilizzazione di diverse tecniche dellottimizzazione combinatoria (algortimi greedy e ricerca locale) e dellottimizzazione su reti (cammini minimi e assegnamento). In eetti, gli algoritmi di soluzione descritti nei prossimi paragra sono stati scelti come esempi di algoritmi proprio perch necessari alla soluzione dellapplicazione descritta. Altre e applicazioni avrebbero ovviamente richiesto algoritmi diversi. Si osservi inoltre che la maggior parte dei
178
problemi di ottimizzazione presenti in natura non sono puri e la scelta dei modelli da utilizzare non ` e univoca dipendendo dalla dimensione delle istanze dinteresse, dalla disponibilit` di algoritmi ecienti, a etc. Nel 1999 lEnte Nazionale per le Energie Alternative (ENEA) ` stato incaricato dal ministero dellambiente e di sviluppare sistemi alternativi per il trasporto urbano. Investigando una serie di strategie per la politica dei trasporti, lENEA si ` resa conto dellesistenza di alcuni problemi di ottimizzazione connessi alle e proposte allo studio. Si tratta di un buon esempio di sinergia fra diverse competenze, e soprattutto si tratta di un buon esempio di utilizzazione delle metodologie dellottimizzazione intese non come solutori universali, ma come mattoncini (in inglese building block) per sviluppare sistemi complessi. Fra le varie strategie individuate dallENEA, una consisteva nello sviluppo di un sistema integrato di taxi collettivo (detto anche multitaxi) per il trasporto di persone dallareoporto di Fiumicino alle loro destinazioni cittadine e viceversa. Il taxi collettivo ` uninteressante alternativa ai tradizionali sistemi di trasporto pubblico. La princie pale caratteristica di questo tipo di servizio risiede nel fatto che i percorsi dei veicoli non sono pressati (come nel caso delle linee degli autobus), ma sono calcolati di volta in volta in base alla domanda; questa essibilit` ` propria del servizio taxi classico, ma a dierenza di questultimo, il servizio multitaxi non ae ` individuale. Un sistema di trasporto multitaxi ` composto da: e e Una otta di vetture, non necessariamente uguali tra loro, il cui compito ` prelevare dei clienti dai e loro punti di partenza e trasportarli ciascuno nelle rispettive destinazioni. Uno o pi` depositi in cui gli automezzi ritornano alla ne del turno di servizio. u Una centrale di gestione che raccoglie le richieste di servizio degli utenti e comunica alle vetture i percorsi da seguire e i clienti da servire. Il servizio pu` essere di tipo immediato o a prenotazione. Nel primo caso le richieste dei clienti sono o soddisfatte appena possibile, a partire dal momento della loro formulazione, oppure sono subito riutate se non ` possibile (o conveniente) soddisfarle. Nel secondo caso le domande devono pervenire alla centrale e di gestione con un certo anticipo per essere servite in un secondo momento. Le richieste degli utenti sono espresse in termini di localit` di prelievo, localit` di destinazione e, nel a a caso di servizio a prenotazione, orario desiderato (di partenza o di arrivo). Il servizio, inoltre, pu` essere dei seguenti tipi: o Molti a molti. In questo modo si indica lesistenza di molteplici (e distinti) punti di raccolta e di consegna.Questo implica che le vetture, durante i loro viaggi, eettuano sia prelievi che consegne di clienti. Uno a molti. In questo caso, invece, si indica lesistenza di un unico punto di raccolta e di molteplici (e distinti) punti di consegna; di conseguenza le vetture eettuano un solo prelievo di clienti, allinizio del viaggio, dopodich` si limitano a portare a destinazione tutti i passeggeri a bordo. e Molti a uno. Le vetture eettuano una serie di prelievi e concludono il loro viaggio nellunico punto di discesa per i clienti. Un sistema di trasporto multitaxi ` particolarmente adatto in situazioni di utenza debole (anziani e e disabili) e nel caso di domanda scarsa (trasporto urbano notturno, servizio in aree poco abitate). Nel caso specico del servizio multitaxi dallareoporto di Fiumicino a Roma centro, si tratta di un servizio immediato di tipo uno a molti. Coloro che intendono avvalersi di questo servizio si presentano ad uno sportello di accettazione dove vengono registrati i loro dati (nominativo, ora di arrivo allo sportello, indirizzo di destinazione,...). Terminata la fase di registrazione, i clienti restano in attesa no al momento in cui viene loro comunicato di salire su una vettura per partire. Per semplicit` supporremo che tutte le autovetture abbiano la stessa capacit` (ad esempio, possono a a trasportare al massimo 5 passeggeri). Il sistema automatico, ad intervalli regolari (ad esempio ogni
179
minuto), suddivide i clienti in attesa in gruppi composti al massimo da cinque persone, assegna ciascun gruppo a un taxi specico, decide quali gruppi debbano partire e, inne, calcola per ogni taxi litinerario da seguire, ovvero la sequenza delle consegne. I clienti che compongono i gruppi selezionati per la partenza vengono fatti salire sulle vetture e queste ultime iniziano il loro viaggio, seguendo le indicazioni di percorso fornite dalla centrale di gestione. I dati dei clienti partiti vengono quindi rimossi dal sistema. Inne, le vetture devono tornare alllareoporto per accogliere nuovi passeggeri. Bisogna quindi decidere a) come si compongono i gruppi (cio` gli equipaggi dei singoli taxi) e b) quale sia, per ogni vettura, il e percorso migliore da seguire. Bench` gli obiettivi possono essere molteplici, in prima analisi potremmo e assumere che il gestore debba soddisfare le richieste dei clienti cercando di minimizzare il tempo medio (o le distanze) percorse dai suoi taxi. Si tratta evidentemente di un problema di ottimizzazione. Esiste una naturale decomposizione del problema in due fasi: 1. fase di clustering, o di partizionamento, in cui i clienti attualmente in attesa vengono suddivisi in un numero di gruppi di dimensione al pi` pari alla u capacit` dei veicoli. Tipicamente si preferisce aggegare clienti con destinizioni il pi` possibile vicine fra a u loro. 2. fase di istradamento (in inglese routing). In questa fase si decidono i percorsi che i taxi devono seguire per scaricare i passeggeri. I percorsi devono essere tali da minimizzare, ad esempio, le distanze percorse o i tempi di viaggio. Per poter modellare quanto sopra descritto in termini di problema di ottimizzazione ` conveniente e denire una struttura matematica adeguata per rappresentare strade, incroci e destinazioni.
5
9,8 3,3 5,6 11 10 8,5 14
4,2
10
27,5
29
9 3 38 46
6,7
Figura 8.4: Dettaglio del grafo di Roma Il grafo di Roma Tutte le possibili destinazioni di clienti sono rappresentate dal grafo di Roma. Si
tratta di un grafo orientanto R = (W, A) dove linsieme dei nodi W rappresenta gli incroci (o piazze) della citt` mentre gli archi sono i tratti di strada compresi fra coppie di incroci (vedi Fig. 8.4). La lunghezza a cuv di ogni arco (u, v) A rappresenta la lunghezza eettiva del tratto di strada corrispondente. Per semplicare la trattazione successiva, supporremo sempre che la destinazione dei clienti coincida con una piazza o un incrocio, cio` con un nodo del grafo di Roma. Qualora questa ipotesi sia troppo e restrittiva, in corrispondenza cio` a tratti di strada molto lunghi fra due incroci adiacenti, si pu` sempre e o aggiungere un incrocio ttizio suddividendo il tratto in due tratti consecutivi separati (vedi gura 8.5).
180
10000
5000
5000
181
2. per ogni coppia (orientata) di nodi distinti u e v si aggiunge larco (u, v) allinsieme di archi A: la lunghezza associata sar` posta uguale a c . a uv
8.3
Una prima classe di euristiche per la soluzione di problemi di ottimizzazione combinatoria va sotto il nome di euristiche di tipo greedy. Il termine inglese greedy pu` essere tradotto come avido ed ` stato scelto o e per rappresentare una caratteristica fondamentale dellalgoritmo greedy, appunto la cosiddetta scelta greedy. Per costruire la soluzione nale, che ricordiamo essere un sottoinsieme S dellinsieme di base B, lalgoritmo parte in genere da una soluzione parziale che estende aggiungendo un elemento per volta no a costruire la soluzione nale. Lelemento scelto di volta in volta ` quello che minimizza il costo della e funzione obiettivo (da cui avido). Inoltre, una volta scelto un elemento, questo non viene mai rimosso dalla soluzione (altra caratteristica dellavidit`). Di seguito, denoteremo con B = {b1 , . . . , bn } linsieme a di base e con S = {S1 , . . . , Sm } linsieme delle soluzioni ammissibili del problema di ottimizzazione combinatoria. Inoltre, supponiamo che un costo sia a ssociato a qualsiasi sottoinsieme di B (non solo alle soluzioni ammissibili). E cio`, indicando con T la famiglia di tutti i sottoinsiemi di B, supporremo che e sia denita una funzione w : T I per ogni sottoinsieme T B. Lobiettivo ` sempre quello di trovare R e una soluzione ammissibile S S T tale che w(S) sia minimo. Per introdurre formalmente lalgoritmo greedy, abbiamo bisogno della seguente denizione: Denizione 8.3.1 Un sottoinsieme T dellinsieme di base B ` detto soluzione parziale (o anche sote tosoluzione), se esiste una soluzione S S tale che T S. Si osservi che: a. Se S una soluzione, allora S anche una soluzione parziale. Infatti S S. e e b. Se T una soluzione parziale, allora sempre possibile costruire una soluzione S tale che T S e e semplicemente inserendo elementi a T . Lalgoritmo greedy costruisce una sequenza di soluzioni parziali T0 , T1 , . . . , Tq con la propriet` che T0 a ` linsieme vuoto, Tq ` una soluzione ammissibile del problema e Ti = Ti1 {e}, ove e B Ti1 ` e e e lelemento tale che Ti1 {e} sia ancora una soluzione parziale e abbia costo minimo (fra tutte le soluzioni parziali ottenibili aggiungendo un elemento a Ti1 . Il seguente schema fornisce una versione semplicata dellalgoritmo greedy: Algoritmo Greedy a. Inizializzazione. Poni T0 = . Poni i = 1. b. Iterazione i-esima. Scegli e B Ti1 tale che Ti1 {e} sia una soluzione parziale e w(Ti1 {e}) sia minimo. c. Poni Ti = Ti1 {e}. d. Terminazione Se Ti ` una soluzione ammissibile: STOP. e e. Altrimenti Poni i = i + 1. Va al passo b. Si osservi che il passo [b.] possiede un certo grado di indeterminatezza. In particolare, potrebbero esistere pi` elemtenti che minimizzano il costo della nuova soluzione parziale. In questo caso, ` necessaria u e una regola per dirimire i pareggi (in inglese tie breaking rule). A volte ` suciente scegliere a caso e (random choice); altre volte ` pi` opportuno denire una nuova funzione di costo. Vedremo di seguito e u esempi delle due alternative. Per concludere questa sezione, si osservi che ogni qual volta si voglia applicare lalgoritmo greedy a un qualunque problema di ottimizzazione combinatoria, bisgoner` innanzitutto denire: a
182
linsieme di base la famiglia delle soluzioni la famiglia delle soluzioni parziali la funzione obiettivo Poich` il nostro esempio prevede la soluzione in cascata di un problema di partizionamento di gra e e di un problema di commesso viaggiatore, considereremo appunto le applicazioni dellalgoritmo greedy a tali problemi. Consideriamo innanzitutto lapplicazione dellalgoritmo greedy al problema del TSP.
8.3.1
Consideriamo il problema del Commesso Viaggiatore (TSP). Come visto nel paragrafo 8.1.2, una soluzione ammissibile per il TSP ` un insieme di archi che denisce un ciclo hamiltoniano. Si consideri ad esempio il e grafo in Fig. 8.6. Linsieme delle soluzioni ` rappresentato da tutti i possibili cicli hamiltoniani del grafo. e Un possibile ciclo hamiltoniano `, ad esempio S1 = {(1, 2), (2, 3), (3, 4), (4, 5), (5, 1)}, e il suo costo (somma e dei costi degli archi) ` pari a 24. Un altro ciclo hamiltoniano ` S2 = {(1, 3), (3, 2), (2, 4), (4, 5), (5, 1)} e e di costo pari a 32. E facile vedere che i cicli hamiltoniani in un grafo completo sono in corrispondenza ai possibili ordinamenti circolari dei nodi del grafo. Ad esempio, la soluzione S1 ` in corrispondenza e dellordinamento o1 = (1, 2, 3, 4, 5), mentre S2 ` in corrispondenza a o2 = (1, 3, 2, 4, 5) Quindi, se i nodi e sono 5, abbiamo 4! = 24 cicli hamiltoniani distinti.
1
7 5 3 15
5 2 5
1
7 5 3 15
5 2
1
7 5 3 15
5 2
5
3
2 5
3
2 5
5 3
2
5
a.
b.
Figura 8.6: Esempi di cicli hamiltoniani
c.
Osservazione 8.3.2 Il numero di cicli hamiltoniani in un grafo completo con n nodi ` pari a (n 1)!. e La precedente osservazione permette di rilevare che il numero di cicli hamiltoniani di un grafo completo cresce esponenzialmente col numero di nodi. In altri termini, quando il numero di nodi ` elevato, e lesplorazione completa dellinsieme delle soluzioni diventa impraticabile ed ` cruciale sviluppare delle e buone euristiche per la soluzione del problema. Vediamo come lalgoritmo greedy si applica al TSP. Innanzitutto dobbiamo rispondere alla domanda: chi sono le soluzioni parziali del problema del Commesso Viaggiatore? Per vedere ci` consideriamo o innanzitutto le propriet` di cui deve godere un insieme di archi s perch` esso sia un ciclo hamiltoniano. a e
183
Osservazione 8.3.3 Dato un grafo G = (V, A) e un insieme S A, S ` linsieme di archi di un ciclo e hamiltoniano se e solo se: 1. in ogni nodo di G incidono esattamente due archi di S 2. S non contiene cicli di cardinalit` inferiore a |V |. a Per capire la natura della condizione 2., si osservi la gura 8.7. In grassetto ` evidenziato un insieme S e di archi che soddisfa la condizione 1. ma non la condizione 2. (linsieme contiene infatti cicli di cardinalit` a inferiore a 6). In eetti, linsieme S non rappresenta in questo caso un ciclo hamiltoniano.
4 6
184
e. Poni i = 2. Iterazione 2. b. Anche in questo caso ogni arco (in A{(3, 5)}) pu` essere aggiunto a T1 soddisfacendo le condizioni o di soluzione parziale; scegliamo larco che costa di meno, cio` larco (2, 4) di costo w2,4 = 2. e c. Poni T2 = T1 {(2, 4)} = {(3, 5), (2, 4)} (w(T2 ) = 3). d. T2 non ` un ciclo hamiltoniano. e e. Poni i = 3. Iterazione 3. b. Tutti gli archi residui possono essere aggiunti e quindi scegliamo larco meno costoso in A T2 : larco (2, 5) di costo w2,5 = 3. Si osservi che anche larco (4, 5) ha costo w4,5 = 3. La scelta fra due archi equivalenti pu` essere fatta casualmente. Tuttavia, in altri casi si pu` decidere un criterio di o o risoluzione dei pareggi (tie breaking rule), legato ovviamente al tipo di problema. c. Poni T3 = T2 {(2, 5)} = {(3, 5), (2, 4), (2, 5)} (w(T3 ) = 6). d. T3 non ` un ciclo hamiltoniano. e e. Poni i = 4. Iterazione 4. b. Non tutti gli archi in A T3 possono essere aggiunti a T3 soddisfacendo le condizioni di soluzione parziale; infatti, se aggiungiamo larco (3, 4) si crea il ciclo su quattro nodi (2, 3), (3, 4), (4, 5), (5, 2), violando cos` la condizione (2) di soluzione parziale. Se aggiungiamo larco (1, 2), invece, avremo tre archi incidenti nel nodo 2. Ragionamenti analoghi valgono per gli archi (1, 5), (2, 3), (4, 5). Quindi, gli unici archi che aggiunti non violano le condizioni per le soluzioni parziali, sono larco (1, 4) e larco (1, 3). Fra i due, scegliamo (1, 4) che ha costo minimo. c. Poni T4 = T3 {(1, 4)} = {(3, 5), (2, 4), (2, 5), (1, 4)} (w(T4 ) = 11). d. T4 non ` un ciclo hamiltoniano. e e. Poni i = 5. Iterazione 5. e b. Lunico arco selezionabile ` larco (1, 3). c. Poni T5 = T4 {(1, 3)} = {(3, 5), (2, 4), (2, 5), (1, 4), (1, 3)} (w(T5 ) = 26) d. T5 ` un ciclo hamiltoniano: STOP. e
8.3.2
Si ` visto come il problema di clustering consiste nel partizionare i nodi di un grafo G = (V, A) in k e classi C = {C1 , C2 , . . . , Ck } in modo da minimizzare la somma dei costi degli archi appartenenti alla stessa classe. Una soluzione S (detta k-partizione) pu` essere rappresentata come un insieme di coppie o (v, c), ove v V ` un nodo del grafo e c {C1 , . . . , Ck } ` un possibile cluster. Quindi, linsieme di e e base B ` linsieme di tutte le coppie (nodo, cluster) e cio` B = {(v, c) : v V, c C}. Una soluzione e e S B ` quindi un sottoinsieme di B con la propriet` che, per ogni nodo v V esiste una e una sola e a
185
1
7 5 15 3 2 5
5
1 3
2
5
coppia (u, c) S tale che u = v. Una conseguenza di ci` ` che S conterr` esattamente |V | coppie (cio` oe a e |S| = |V |). Inoltre, per la nostra applicazione (ogni classe corrisponde a una vettura), le classi hanno una cardinalit` massima pressata. Le soluzioni parziali sono tutti i sottoinsiemi T di B tali che, per ogni a nodo v V , esister` al pi` una coppia (u, c) T tale che u = v. In altri termini, le soluzioni parziali a u sono k-partizioni parziali, cio` k-partizioni di un sottoinsieme dei nodi di G. Il costo di una soluzione e parziale (pi` in generale, di un sottoinsieme di B) ` calcolato ancora una una volta come la somma dei u e costi degli archi appartenenti a una stessa classe. Supponiamo adesso di avere 5 persone in attesa e due taxi disponibili. Inoltre, supponiamo che ogni taxi possa ospitare al massimo 3 persone. Supponiamo inne che il grafo dei clienti sia quello di Figura 8.6. Vediamo adesso come sia possibile calcolare una 2-partizione (partizione in due classi, bi-partizione) del grafo in Figura 8.6. Poich` V = {1, . . . , 5} e C = {C1 , C2 }, linsieme di base sar` B = {(1, C1 ), (1, C2 ), (2, C1 ), (2, C2 ), e a (3, C1 ), (3, C2 ), (4, C1 ), (4, C2 ), (5, C1 ), (5, C2 )}. E importante osservare che in questo caso i pareggi vengono risolti individuando una funzione di costo ad hoc per motivi che verranno discussi di seguito. Inne, poich` scegliere una coppia di B corrisponde ad assegnare un nodo a un cluster, di seguito adotteremo e una terminologia (semplicata) e a anco della locuzione scegliere la coppia (v, Cj ), diremo anche assegnare il nodo v al cluster Cj , e via di seguito. Inizializzazione. a. T0 = (w(T0 ) = 0). i = 1. (Equivalentemente: crea 2 classi vuote C1 , C2 ). Iterazione 1. b. Poich` ogni coppia pu` essere aggiunta a T0 senza incrementare il costo di T0 (ovvero, ogni nodo e o pu` essere assegnato a una qualunque classe a costo nullo), ho bisogno di una regola per decidere o quale nodo assegnare a quale classe. Nellesempio del TSP si era optato per una scelta di tipo random. In questo esempio si preferisce una regola che tenga in conto della particolare struttura del problema. Una considerazione euristica ` la seguente: conviene innanzitutto sistemare in e qualche classe della partizione quei nodi su cui incidono gli archi pi` costosi in modo da poter u scegliere per essi classi abbastanza (se non del tutto) vuote. Quindi la regola di tie breaking sar`: a scegli il nodo per cui la somma degli archi incidenti ` massima. Di seguito, indicheremo con g(v) e la somma dei costi degli archi incidenti nel nodo v. E facile vericare che g(1) = 32, g(2) = 17, g(3) = 25, g(4) = 14, g(5) = 14. Scegliamo quindi il nodo 1. Poich` le coppie (1, 1) e (1, 2) e sono equivalenti dal punto di vista del costo delle partizioni corrispondenti (e cio` ` indierente e e
186
assegnare il nodo 1 alla classe C1 o alla classe C2 , possiamo scegliere in modo casuale. Scegliamo quindi la coppia (1, C1 ) (assegnamo cio` il nodo 1 alla classe C1 ). e c. Poni T1 = T0 {(1, C1 )} (w(T1 ) = 0). Equivalentemente C1 = {1}, C2 = . d. Poich` T1 non ` una partizione (completa) dei nodi di G, si continua. e e e. Poni i = 2. Iterazione 2. o b. Ogni coppia in B che non contiene il nodo 1 pu` essere aggiunta a T1 soddisfacendo le condizioni di soluzione parziale. Tuttavia, ogni coppia del tipo (v, C1 ), che corrisponde ad assegnare il nodo v alla classe C1 , produce un incremento di costo pari al costo dellarco (1, v) (infatti il nodo 1 appartiene alla classe 1); al contrario, ogni nodo pu` essere assegnato alla classe 2 senza incrementi o di costo (infatti la classe C2 ` ancora vuota). Inne, poich` ogni coppia di tipo (v, C2 ) produce e e un incremento di costo nullo, dobbiamo usare ancora una volta la regola di tie breaking e scegliere quindi il nodo di costo massimo, ovvero il nodo 3 (g(3) = 25). Scegliamo quindi la coppia (3, 2), assegnando in questo modo il nodo 3 alla classe 2. c. Poni T2 = T1 {(3, C2 )} = {(1, C1 ), (3, C2 )} (w(T2 ) = 0). C1 = {1}, C2 = {3}. d. T2 non ` una partizione di V . e e. Poni i = 3.
C1
7
1
5 5 3 15 1
C2
2
C1 1
7 5 5 3 15 2
5
3
2
5
5
3
2
5
4 3 Iterazione 1
4
Figura 8.9: Evoluzione delle classi I
Iterazione 2
C2
Iterazione 3. b. In questo caso, ogni coppia aggiungibile a T2 , e cio` tutte quelle coppie che non contengono il nodo e 1 e il nodo 3, producono un incremento di costo positivo. Ad esempio, se il nodo 2 viene assegnato alla classe 1, lincremento di costo ` pari al costo dellarco (1,2), ovvero 5. E faicle vedere che il e minimo incremento di costo si ottiene scegliendo la coppia (5, C2 ), ovvero assegnando il nodo 5 alla classe C2 . Non ci sono pareggi.
187
c. Poni T3 = T2 {(5, C2 )} = {(1, C1 ), (3, C2 ), (5, C2 )} (w(T3 ) = 5). C1 = {1}, C2 = {3, 5}. e d. T3 non ` una partizione. e. Poni i = 4. Iterazione 4. b. Tutte le coppie contenenti i nodi 1, 3 e 5 non possono essere aggiunte. Lincremento di costo associato alla coppia (2, C1 ) ` pari a 5, per la coppia (2, C2 ) ` pari a 3 + 5 = 8, per la coppia (4, C1 ) e e ` pari a 5, per la coppia (4, C2 ) ` pari a 3 + 4 = 7. Fra la coppia (2, C1 ) e la coppia (4, C1 ) si sceglie e e (2, C1 ) perch` g(2) = 17 > g(4) = 14. e c. Poni T4 = T3 {(2, C1 )} = {(1, C1 ), (3, C2 ), (5, C2 ), (2, C1 )} (w(T3 ) = 10). C1 = {1, 2}, C2 = {3, 5}. d. T4 non ` una partizione. e e. Poni i = 5.
C1 1
7
5
3
5 5 15 3 2 4
C1 1
7
2
5
5
3
5 5 15 3 2 4
2
5
Iterazione 3
C2
4
Figura 8.10: Evoluzione delle classi II
Iterazione 4
C2
Iterazione 5. b. Le uniche coppie selezionabili sono (4, C1 ) e (4, C2 ). Lincremento di costo corrispondente a (4, C1 ) ` pari a 7 ed ` uguale allincremento prodotto dalla coppia (4, C2 ). Possiamo scegliere indierentee e mente. c. Poni T4 = T3 {(2, C1 )} = {(1, C1 ), (3, C2 ), (5, C2 ), (2, C1 ), (4, C2 )} (w(T5 ) = 17) C1 = {1, 2}, C2 = {3, 4, 5}. d. T5 ` una partizione: STOP. e Unultima osservazione riguarda la forma con cui vengono generalmente rappresentati gli algoritmi greedy. Infatti, raramente si fa esplicito riferimento allinsieme di base (o alle soluzioni ammissibili come sottoinsiemi dellinsieme di base). Normalmente gli algoritmi vengono presentati in una forma molto
188
1
5
5
1 3
5 15 2 3 2 5 4
C1
3 C2
Iterazione 5
8.3.3
Gli esempi di applicazione dellalgoritmo greedy sopra elencati hanno una specica struttura delle soluzioni e delle soluzioni parziali. In particolare, tutte le soluzioni parziali generate dal greedy - tranne lultima non sono soluzioni ammissibili per il problema. Inoltre la funzione obiettivo peggiora a ogni iterazione, ma noi siamo comunque obbligati a continuare i passi nch` la sottosoluzione diventa una soluzione del e problema. Per altri problemi di ottimizzazione, come il problema dellaccoppiamento, le soluzioni parziali sono anche soluzioni del problema originario. Infatti, se M = {e1 , . . . , eq } ` un matching, allora ogni sottoine sieme di M ` ancora un matching (e cio` una soluzione ammissibile). In questo caso si tende in generale e e
189
a estendere le soluzioni parziali perch` tipicamente la funzione obiettivo migliora allaumentare del nue mero di elementi contenuti nella soluzione. Per problemi di questo tipo, il generico algoritmo greedy (per problemi di minimizzazione) viene riscritto nel modo seguente: Algoritmo Greedy II a. Inizializzazione. Poni T0 = . Poni i = 1. b. Iterazione i-esima. Scegli e B Ti1 tale che Ti1 {e} sia una soluzione parziale e w(Ti1 {e}) sia minimo. c. Se per ogni e B Ti1 , Ti1 {e} non una soluzione ammissibile: STOP. Ti1 ` la soluzione e e greedy. d. Altrimenti se w(Ti1 ) < w(Ti1 {e}): STOP. Ti1 ` la soluzione greedy. e e. Altrimenti Poni Ti = Ti1 {e}. Poni i = i + 1. Vai al passo b. Il passo [c.] serve ad assicurare che lalgoritmo termini qualora ogni elemento residuo non pu` essere o aggiunto alla soluzione parziale corrente senza violare il vincolo di essere soluzione parziale. Il passo [d.] assicura invece che se la prossima soluzione parziale ` peggiore di quella attuale essa non venga generata e e lalgoritmo termini. Si osservi inne che in questa forma lalgoritmo greedy pu essere applicato anche a o problemi in cui le sottosoluzioni via via generate non sono soluzioni ammissibili. Si consideri ad esempio il problema del Commesso Viaggiatore. A ogni iterazione generiamo sottosoluzioni che non sono cicli hamiltoniani nch, alliterazione n-esima, genereremo il nostro ciclo hamiltoniano. Secondo lo schema e qui sopra riportato, alliterazione n + 1 lalgoritmo terminer in quanto laggiunta di un qualunque arco a a un ciclo hamiltoniano non produce una sottosoluzione: quindi sar vericato il test di terminazione al a passo [c.]. E facile vedere che per adattare il precedente algoritmo a problemi di massimizzazione ` suciente e cambiare il passo [b.] scegliendo lelemento e tale che w(Ti1 {e}) sia massimo e invertendo il senso della disequazione nel test al passo [d.] che va riscritto come: [d.] Altrimenti se w(Ti1 ) > w(Ti1 {e}): STOP. Ti1 ` la soluzione greedy. e Si consideri lesempio di Fig. 8.12, ove si voglia calcolare laccoppiamento di peso massimo.
1 4 9 2 3 8 9
B C
10
Inizializzazione. a. T0 = (w(T0 ) = 0). i = 1. Iterazione 1. b. Poich` ogni arco pu` essere aggiunto a T0 mantenendo la propriet` di essere una soluzione parziale, e o a scegliamo larco di peso massimo (3, C). e c. Larco esiste, il test di terminazione non ` soddisfatto. d. 10 = w(T0 {(3, C)}) > w(T0 ) e il secondo test di terminazione non ` soddisfatto (si ricordi che si e tratta di un problema di massimizzazione). e. Poni T1 = T0 {(3, C)} (w(T1 ) = 10). Poni i = 2. Iterazione 2. b. Gli archi (1, C) e (2, C) non possono essere aggiunti a T1 in quanto incidenti in C (esiste gi` un a arco in T1 incidente in C). Analogamente, larco (3, B) non pu` essere aggiunto perch` incidente o e in 3. Fra gli archi residui, quello di peso massimo ` larco (2, A), di peso 9. e e c. Larco esiste, il test di terminazione non ` soddisfatto. d. 18 = w(T1 {(2, A)}) > w(T1 ) e il secondo test di terminazione non ` soddisfatto. e e. Poni T2 = T1 {(2, A)} (w(T2 ) = 19). Poni i = 3. Iterazione 3. b. Lunico arco che pu` essere aggiunto a T2 ` larco (1, B), di peso 4. o e c. Larco esiste, il test di terminazione non ` soddisfatto. e e d. 23 = w(T2 {(1, B)}) > w(T2 ) e il secondo test di terminazione non ` soddisfatto. e. Poni T3 = T2 {(1, B)} (w(T3 ) = 23). Poni i = 4. Iterazione 4. b. Nessun arco pu` essere aggiunto a T3 . o c. Larco non esiste, il test di terminazione ` soddisfatto. T3 ` la soluzione greedy. e e La soluzione trovata dallalgoritmo greedy per il grafo di Fig. 8.12 ` mostrata in Fig. 8.13. e
8.4
Ricerca Locale
Si ` osservato come uno degli elementi caratterizzanti dellalgoritmo greedy sia la natura irrevocabile della e scelta greedy. Tuttavia, assai spesso apportando piccole modiche alla soluzione greedy si possono avere miglioramenti nel valore della funzione obiettivo. Si consideri lesempio del ciclo hamiltoniano di Fig. 8.14.a, che ` quello prodotto dallalgoritmo greedy (si confronti con la Fig. 8.6). Il costo del ciclo ` e e pari a 26. Per comodit` gli archi non appartenenti al ciclo non sono stati rappresentati nella gura. Se a rimuoviamo gli archi (1, 3) e (4, 5) otteniamo la soluzione parziale di Fig. 8.14.b. Esistono due soli modi di completare questo insieme di archi per renderlo un ciclo hamiltoniano. Il primo ` re-inserire gli archi e (1, 3) e (4, 5), riottenendo cos` il ciclo di partenza. Il secondo ` invece scegliere gli archi (3, 4) e (1, 5), e ottenendo cos` il ciclo hamiltoniano di Fig. 8.14.c. Si osservi che questo ciclo ha costo 19, cio` un costo inferiore al ciclo di partenza. Quindi, con e una piccola modica della soluzione greedy (cambiando solo due archi) si ` ottenuto un sostanziale e
191
1 4 9 2 3 8 9
B C
10
1 5
3 15 1
1 2
2
1
5
5 4
2
2
5
1 2 4
2 4 3
4 a.
3 b.
c.
1 5
3 15 1
5 2
1 2 5
15 1 2
1 2 5
1 5 15 3
2
2
4 a.
3 b.
3 c.
miglioramento della funzione obiettivo. Proviamo ora, sempre partendo dal grafo di Fig.8.14 a sostituire la coppia (1, 2) e (4, 5). In questo caso, lunico modo per ricostruire un ciclo hamiltoniano diverso da quello di partenza ` aggiungere gli archi (1, 4), (2, 5) (si veda la Fig. 8.15). e Questo nuovo ciclo tuttavia ha lo stesso costo di quello di partenza. Cerchiamo di generalizzare ci` che ` stato fatto. Innanzitutto osserviamo che, se rimuoviamo dal ciclo di partenza due archi adio e acenti (ovvero incidenti in uno stesso nodo), esiste un solo modo per completare la soluzione parziale cos` ottenuta consistente nel re-inserire gli archi appena eliminati. Al contrario, se rimuoviamo due archi non adiacenti (cio` due archi che non hanno nodi in comune), la soluzione parziale pu` essere e o completata in due modi distinti, uno dei quali produce un nuovo ciclo. In generale, se indichiamo con H0 = {(u1 , u2 ), (u2 , u3 ), . . . , (uq1 , uq ), (uq , u1 )} un generico ciclo hamiltoniano, allora il meccanismo di generazione di un nuovo ciclo hamiltoniano pu` essere descritto come segue (si veda la Fig. ??): o 1. Scegli una coppia di archi non adiacenti (ui , ui+1 ) e (uj , uj+1 ). 2. Rimuovi la coppia di archi dal ciclo 3. Aggiungi i due nuovi archi (ui , uj ) e (ui+1 , uj+1 ). Poich` loperazione coinvolge lo scambio di due archi con altri due archi, verr` chiamata 2-scambio e a (in inglese 2-exchange).
u1 u2 uj+1 uj ui ui+1 uk
u1 u2
ui ui+1
193
a. w(H1 ) < w(H0 ), cio` il ciclo trovato ` migliore di quello di partenza. e e b. w(H1 ) w(H0 ), cio` il ciclo trovato non ` migliore di quello di partenza. e e Supponiamo adesso di trovarci nel caso a., e cio` H1 ` migliore di H0 . Nulla ci impedisce di rie e cominciare da capo, nella speranza di migliorare ulteriormente il ciclo hamiltoniano. Quindi possiamo riapplicare ad H1 la procedura di ricerca del miglior 2-scambio, eventualmente identicando un nuovo ciclo H2 migliore di H1 (e quindi di H0 ); inne, la procedura pu` essere re-iterata nch` si riesce a o e identicare un ciclo migliore del precedente. Siamo in grado di descrivere adesso una delle euristiche pi` ecienti per la ricerca di un ciclo hamilu toniano di costo (lunghezza) minimo, la cosiddetta euristica 2 Opt. Di seguito, denotiamo con T la famiglia dei cicli hamiltoniani di G. Algoritmo 2-opt per il TSP Inizializzazione a. Scegli un ciclo hamiltoniano iniziale H0 T (ad esempio mediante leuristica greedy). Poni i = 1. Iterazione i-esima b. Sia Hi il pi` corto ciclo hamiltoniano ottenibile da Hi1 per 2-scambio. u c. Se w(Hi ) w(Hi1 ) allora STOP. Hi1 ` il miglior ciclo trovato no a questo punto. e d. Altrimenti poni i = i + 1 a va al passo b. Fine iterazione i-esima
S H0
194
possiamo rappresentare tutti i cicli hamiltoniani come dei punti in uno spazio di soluzioni S (vedi Fig. 8.17). Il ciclo H0 sar` un punto appartenente a questo sottoinsieme. Linsieme di tutti i cicli vicini ad H0 ` a e evidenziato in gura 8.18 da un ovale centrato in H0 e contenuto in S. Questo insieme ` detto in generale e lintorno di H0 , ed ` indicato come N (H0 ). In questo caso stiamo parlando di un particolare intorno, e quello denito dal 2-scambio. Nulla ci impedisce di denire intorni pi` grandi (ad esempio, linsieme di u tutti i cicli hamiltoniani ottenibili sostituendo 3 archi) o pi` piccoli. In genere, ` bene che la dimensione u e dellintorno non cresca troppo per poter eettuare ecientemente la visita (e cio` la generazione) dei cicli e hamiltoniani in esso contenuti, il calcolo della funzione obiettivo e quindi la scelta della migliore soluzione appartenente allintorno.
N(H0) S H0
N(H0)
N(H1)
N(H2) S
H0
H1 H2
H3
195
soluzioni) avviene localmente, negli intorni delle soluzioni sulla traiettoria seguita. Lultima soluzione ` e detta minimo locale, a sottolineare il fatto che questa soluzione non ` lottimo globale (su tutto linsieme e delle soluzioni) ma solo lottimo locale, relativo alla famiglia di intorni denita.
8.4.1
.
Leuristica 2-Opt per il TSP ` un esempio di euristica di Ricerca Locale. Il primo passo per costruire e uneuristica consiste nel denire un opportuno intorno delle soluzioni. Chiamando con S S una soluzione ammissibile per il problema di ottimizzazione, si tratta di stabilire come costruire a partire da S un insieme di soluzioni N (S). La denizione dellintorno avviene tipicamente mediante la specicazione di una particolare operazione, detta mossa, da applicare alla soluzione corrente per ottenere le nuove soluzioni. Per esempio, nelleuristica 2-Opt per il Commesso Viaggiatore, la mossa era il cosiddetto 2scambio (sostituzione di due archi non adiacenti con due nuovi archi). Consideriamo come nuovo esempio il problema di k-partizionamento. Per semplicare la trattazione, considereremo il caso senza vincoli di cardinalit` sulle partizioni. Le soluzioni del problema di k-clustering sono dunque tutte le k-partizioni a dellinsieme di nodi V del grafo. Quindi, una soluzione ` una specica k-partizione, che possiamo indicare e come S = {C1 , . . . , Ck }. Un modo per denire lintorno di una partizione ` il seguente: lintorno N (S) e di una partizione S ` linsieme di tutte le partizioni ottenibili da S spostando uno e un solo nodo dalla e sua classe di appartenenza a una nuova classe. La mossa in questo caso consiste in: scegli un nodo vj V . Sia Cl la classe di appartenenza di vj . genera una nuova partizione S = {C1 , C2 , . . . , Cl , . . . , Cq } nel seguente modo: Scegli un indice r con r {1, . . . , q} e r = l. Poni Ci = Ci per i = 1, . . . , q e i = r, i = l. Poni Cl = Cl {vj }, Cr = Cr {vj }. Se consideriamo ancora lesempio di Fig. 8.11, la soluzione prodotta dallalgoritmo greedy `: S0 = e {C1 = {1, 2}, C2 = {3, 4, 5}}. Lintorno di S0 ` formato da cinque soluzione N (S0 ) = {S1 , S2 , S3 , S4 , S5 }, e ove S1 = {C1 = {1, 2, 3}, C2 = {4, 5}}, S2 = {C1 = {1, 2, 4}, C2 = {3, 5}}, S3 = {C1 = {1, 2, 5}, C2 = {3, 4}}, S4 = {C1 = {2}, C2 = {1, 3, 4, 5}}, S5 = {C1 = {1}, C2 = {2, 3, 4, 5}}. E facile anche vericare che w(S0 ) = 13, w(S1 ) = 18, w(S2 ) = 13, w(S3 ) = 21, w(S4 ) = 35. w(S5 ) = 16. Introdotta la denizione di intorno di una soluzione, siamo nalmente in grado di descrivere formalmente il generico algoritmo di ricerca locale. Algoritmo di Ricerca Locale Inizializzazione a. Scegli una soluzione iniziale S0 S (ad esempio mediante leuristica greedy). Poni i = 1. Iterazione i-esima b. Sia Si N (Si1 ) la migliore soluzione nellintorno di Si1 . c. Se w(Si ) w(Si1 ) allora STOP. Si1 ` il minimo locale. e d. Altrimenti poni i = i + 1 a va al passo b. Fine iterazione i-esima Ovviamente sempre possibile interrompere la ricerca locale prima di aver raggiunto un ottimo locale, e ad esempio dopo aver eseguito un pressato massimo numero di iterazioni.
196
8.5
Finora abbiamo trattato il caso del servizio da Fiunmicino Areoporto al centro citt`. In questo contesto a le vetture, una volta lasciati i passeggeri alle loro destinazioni, tornano allareoporto per prelevare nuovi clienti. Tuttavia nulla impedisce loro di trasportare passeggeri da Roma centro allareoporto di Fiumicino eettuando il servizio anche nel viaggio di ritorno. In eetti, un servizio del genere ` allo studio. Il modo e pi` semplice per arontare il problema consiste nel considerare le due tratte (Fiumicino-Roma Centro e u Roma Centro - Fiumicino) come due problemi distinti. Il caso Roma Centro - Fiumicino presenta qualche elemento di complessit` addizionale. Infatti, in a questo caso il servizio viene eettuato su prenotazione e i clienti vanno raccolti rispettando il pi` possibile u gli orari stabiliti. In ogni caso, ancora una volta di stratta di un problema di clustering (assegnazione dei clienti alle vetture) e di un problema di Comesso Viaggiatore (scelta del percorso ottimo) risolti in sequenza. Quindi, alla ne del processo di ottimizzazione avremo un certo numero di cicli hamiltoniani H = {H1 , H2 , . . . , Hq } ciascuno rappresentante i clienti da prelevare e la sequenza da seguire per ciascun taxi. A ogni ciclo avremo inoltre associato un tempo dinizio raccolta ti per i = 1, . . . , q, ovvero il primo cliente di ogni ciclo Hi deve essere prelevato al tempo ti . Si tratta ora di assegnare ciascun ciclo a un taxi proveniente dallareoporto e che abbia gi` concluso il suo giro di consegne. Quale vettura conviene a assegnare al ciclo Hj (per j = 1, . . . , q)? Sicuramente un taxi che abbia nito le consegne in tempo per prelevare il primo cliente al tempo tj (ma non troppo prima, altrimenti il taxi dovr` aspettare a lungo). a Inoltre, ci converr` assegnare un taxi che consegni il suo ulimo passeggero in un nodo del grafo di Roma a abbastanza vicino al nodo corrispondente al primo cliente del ciclo di ritorno. Allora, se chiamiamo con A = {A1 , A2 , . . . , Ar } linsieme dei cicli hamiltoniani che corrispondono a taxi provenienti dallareoporto di umicino che possono essere assegnati ai cicli di ritorno {H1 , H2 , . . . , Hq }, si tratter` innanzitutto di a denire un insieme di pesi pij che rappresentino il vantaggio di assegnare il taxi che serve Ai al percorso di ritorno Hj . Ad esempio, se dij ` la distanza fra lultimo passeggero di Ai e il primo passeggero di Hj , e potremmo porre pij = dij . Potremmo aggiungere nel peso anche un fattore relativo al tempo di attesa - minori tempi di attesa per il conducente sono da preferire). A questo punto vogliamo scegliere come assegnare ogni vettura che arriva dallareoporto a un ciclo verso lareoporto. Costruiamo quindi un grafo bipartito G = (V, E) ove linsieme dei nodi sar` V = H A, ed esiste un arco fra in nodo Hj H e il a nodo Ai A se e solo se lultimo cliente di Ai viene lasciato in tempo utile per prelevare il primo cliente di Hj . Inoltre, associamo a ogni arco (i, j) E il peso pij che rappresenta il vantaggio di assegnare il taxi del ciclo Aj al ciclo di ritorno Hi . E facile convincersi che cercare lassegnamento migliore corrisponde a risolvere un problema di accoppiamento massimo nel grafo G.
197