Problemi di scheduling multi agente
Download
1 / 77

Problemi di scheduling multi-agente - PowerPoint PPT Presentation


  • 98 Views
  • Uploaded on

Problemi di scheduling multi-agente. Alessandro Agnetis , Università di Siena Gianluca De Pascale , Università di Siena Pitu B. Mirchandani , University of Arizona Dario Pacciarelli , Università di Roma Tre Andrea Pacifici , Università di Roma Tor Vergata Marco Pranzo , Università di Siena.

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about ' Problemi di scheduling multi-agente' - umeko


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript
Problemi di scheduling multi agente

Problemi di scheduling multi-agente

Alessandro Agnetis, Università di Siena

Gianluca De Pascale, Università di Siena

Pitu B. Mirchandani, University of Arizona

Dario Pacciarelli, Università di Roma Tre

Andrea Pacifici, Università di Roma Tor Vergata

Marco Pranzo, Università di Siena

Alessandria, 16 marzo 2007


Problemi multi agente
Problemi multi-agente

  • Diversi agenti competono per l’utilizzo di un insieme limitato di risorse produttive o logistiche

  • Per raggiungere un accordo, gli agenti possono negoziare l’utilizzo della risorsa

  • Un eventuale soggetto centrale può avere parte attiva nel problema o essere solo un coordinatore



  • Job di diversi ordini che competono per l’uso di slot temporali su una macchina --- agenti autonomi

    [Kutanoglu e Wu 1999, Wellman et al. 2001]

  • Tipi diversi di segnali (dati, voce) che competono per le stesse risorse radio

    [Arbib et al. 2002]


Problemi di scheduling con due agenti
Problemi di scheduling con due agenti

  • Due agenti, A e B, possiedono ciascuno un set di job che richiedono determinate risorse di processamento

  • Gli agenti possiedono ciascuno una funzione di costo f A(s) and f B(s)rispettivamente

  • Ogni funzione di costo dipende soltanto dai job del rispettivo agente


Problemi multi agente aspetti
Problemi multi-agente: aspetti

  • Situazione iniziale

  • Possibilità e modalità di scambio delle informazioni tra agenti

  • Possibilità di compensazioni/scambi di utilità tra agenti


Situazione iniziale scenari
Situazione iniziale: scenari

  • Esiste una allocazione inizialerispetto alla quale solo un insieme limitato di riallocazioni è possibile (es. orario ferroviario)

  • Non esiste alcuna situazione iniziale, tutti gli agenti si presentano contemporaneamente e hanno uguale priorità


Scambi di informazione scenari
Scambi di informazione: scenari

  • Tutti gli agenti possono comunicare direttamente tra loro informazioni complete riguardanti i propri job e le proprie utilità

  • Esiste un protocollo di comunicazione e offerta (e.g. aste)

  • Ciascun agente comunica solo con un sottoinsieme di agenti o con un coordinatore


Trasferimenti di utilit scenari
Trasferimenti di utilità: scenari

  • L’utilità degli agenti e i rapporti relativi sono tali da consentire una redistribuzione dell’utilità (e.g. in termini monetari)

  • L’utilità degli agenti è espressa in termini che non ne consentono una redistribuzione immediata (e.g. diverse funzioni obiettivo)


Modelli multi agente
Modelli multi-agente

  • Giochi cooperativi: sequencing games

  • Aste:

    • Wellman et al. (asta ascendente parallela)

    • Kutanoglu-Wu (asta combinatoria)

  • Bargaining problems: estensione dei concetti di soluzioni di Nash e Kalai Smorodinski


Sequencing games
Sequencing games

  • Sono particolari giochi cooperativi ad utilità trasferibile

  • Si studiano situazioni di sequenziamento in cui, a partire da uno schedule iniziale s0, i giocatori possono formare coalizioni per rischedulare i loro job in modo proficuo senza danneggiare gli altri giocatori

  • In molti casi, il nucleo è non vuoto [Curiel, Pederzoli and Tijs 1989, Slikker 2003]


2 market oriented programming

2. MARKET ORIENTED PROGRAMMING


Aste market oriented programming
Aste - Market Oriented Programming

  • La situazione è rappresentata da un modello di tipo economico [Wellman, Walsh, Wurman, Mc-Kie Mason 2002]

  • Gli agenti si muovono in un mercato i cui beni sono i periodi di utilizzo delle risorse

  • La comunicazione è limitata alle offerte che ciascun agente formula per le risorse


Market oriented programming ii
Market Oriented Programming - II

  • Gli agenti formulano le proprie offerte sulla base di valutazioni individuali

  • Le uniche informazioni scambiate sono nel formato di prezzi e avvengono tra agenti e un coordinatore (automatico)

  • L’analisi studia le relazioni tra equilibrio e ottimalità


Modello di scheduling
Modello di scheduling

  • Un insieme G di ntime slot

  • Un insieme A di agenti compreso l’agente “venditore” F0

  • Un vettore [p1, p2,…, pn] di prezzi per i vari time slot

  • Per ogni XG, un valore vj(X) che l’agente j attribuisce a X

  • I job sono interrompibili


Modello di scheduling1
Modello di scheduling

  • Ciascuna risorsa i ha un reserve priceqi, che rappresenta il valore della risorsa per il sistema se non viene allocata

  • Il valore globale di un’allocazione è


Allocazione ottima
Allocazione ottima

  • Una allocazione f è ottima se il suo valore globale è massimo

  • L’ottimalità di una soluzione dipende soltanto dall’allocazione f e dai valori wj, non dai prezzi a cui le risorse possono essere acquisite


Prezzi e agenti
Prezzi e agenti

  • Dato un vettore p di prezzi, la quantità Hj(p) misura il massimo guadagno che l’agente j può conseguire


Equilibrio
Equilibrio

  • Un’allocazione f è in equilibrio per un vettore p di prezzi se:

    1)

    (ossia, ogni agente consegue il massimo guadagno)


Equilibrio1
Equilibrio

2) pi qi per ogni slot i allocato

pi= qi per ogni slot i non allocato

(ossia, anche l’agente “venditore” ha un vantaggio)


0

1

2

3

4

5

6

7

8

Esempio

pi

€6,25

€6,25

€6,25

€3,25

€3,25

€3,25

€3,25

€3,25

w1=16

d1 =3

L1=2

w2=10

d2 =4

L2=2

w3=6

d3 =2

L3=1

w4=14,5

d4 =8

L4=4

qi = € 3


0

1

2

3

4

5

6

7

8

Esempio

pi

€6,25

€6,25

€6,25

€3,25

€3,25

€3,25

€3,25

€3,25

w1=16

d1 =3

L1=2

w1=16

d1 =3

L1=2

w2=10

d2 =4

L2=2

w2=10

d2 =4

L2=2

w3=6

d3 =2

L3=1

w4=14,5

d4 =8

L4=4

w4=14,5

d4 =8

L4=4

qi = € 3


Equilibrio e ottimalit
Equilibrio e ottimalità

Teorema [Bikhchandani e Mamer 1997, Gul e Stacchetti 1999, Wellman et al. 2001]:

Se esiste un sistema di prezzi p per cui f è in equilibrio, allora f è ottima

Il viceversa in generale non è vero


Esempio

0

1

2

w1=3

d1 =2

L1=2

w2=2

d2 =2

L2=1

qi = € 0


Allocazione ottima

p2

p1

0

1

2

w1=3

d1 =2

L1=2

w1=3

d1 =2

L1=2

w2=2

d2 =2

L2=1

qi = € 0


Equilibrio e ottimalit1
Equilibrio e ottimalità

  • Perché f sia in equilibrio, per l’agente 2 deve essere conveniente non comprare nulla

  • Questo si ha solo se p12 e p22

  • Ma allora non può essere in equilibrio per l’agente 1 !


Equilibrio e ottimalit2
Equilibrio e ottimalità

  • Le due condizioni sono equivalenti nel caso più particolare di job unitari

  • Anche nel caso multiple-deadline


Analisi dei protocolli di asta
Analisi dei protocolli di asta

  • Come si può raggiungere una soluzione di equilibrio da parte di agenti distribuiti?

  • Meccanismi di asta

  • Esempio: l’asta ascendente


Asta ascendente
Asta ascendente

  • Gli agenti formulano in modo asincrono offerte per ciascuno slot i

  • Se l’offerta corrente èbi , l’offerta successiva deve essere pari ad almeno

    ai =bi + e (ask price)

  • Quando non ci sono più offerte, la risorsa è allocata al miglior offerente


Comportamento degli agenti
Comportamento degli agenti

  • Ciascun agente offre il valore ai per alcune risorse, in modo da massimizzare il proprio surplus

  • L’asta ascendente raggiunge un equilibrio?


Esempio

Prezzo corr.0 0 0

0

1

2

3

w1= € 20

d1 =2

L1=2

w2= € 8

d2 =3

L2=2

w3= € 2,5

d3 =3

L3=1

qi = € 0, e = € 1


Offerta agente 2

Prezzo corr.0 0 0

Prezzo corr.01 1

0

1

2

3

w1= € 20

d1 =2

L1=2

w2= € 8

d2 =3

L2=2

w2= € 8

d2 =3

L2=2

w2= € 2,5

d2 =3

L2=1

qi = € 0, e = € 1


Offerta agente 1

Prezzo corr.01 1

Prezzo corr.121

0

1

2

3

w1= € 20

d1 =2

L1=2

w2= € 8

d2 =3

L2=2

w2= € 8

d2 =3

L2=2

w2= € 2,5

d2 =3

L2=1

qi = € 0, e = € 1


Offerta agente 3

Prezzo corr.122

Prezzo corr.121

0

1

2

3

w1= € 20

d1 =2

L1=2

w2= € 8

d2 =3

L2=2

w2= € 8

d2 =3

L2=2

w2= € 2,5

d2 =3

L2=1

qi = € 0, e = € 1


Offerta agente 2

Prezzo corr.122

Prezzo corr.121

Prezzo corr.223

0

1

2

3

w1= € 20

d1 =2

L1=2

w2= € 8

d2 =3

L2=2

w2= € 8

d2 =3

L2=2

w2= € 2,5

d2 =3

L2=1

qi = € 0, e = € 1



Equilibrio

Prezzo 881

0

1

2

3

w1= € 20

d1 =2

L1=2

w2= € 8

d2 =3

L2=2

w2= € 8

d2 =3

L2=2

w2= € 2,5

d2 =3

L2=1

qi = € 0, e = € 1


Convergenza di un asta
Convergenza di un’asta

  • L’asta ascendente può non raggiungere un equilibrio, anche se esiste

  • Può raggiungere un’allocazione arbitrariamente lontana dall’ottimo

  • Nel caso di job unitari, la distanza tra il valore di un’allocazione ottima e quella generata dall’asta è limitata (ke+1)


3 kutanoglu wu

3. KUTANOGLU - WU


Aste modello di kutanoglu wu
Aste – modello di Kutanoglu-Wu

  • Il sistema è un job shop

  • Un insieme di agenti, ognuno dei quali possiede un job, che richiede l’utilizzo di alcune macchine per alcuni time slot

  • I job sono non interrompibili

  • Un coordinatore centrale gestisce l’asta combinatoria


Kutanoglu wu ii
Kutanoglu-Wu (II)

  • A ogni iterazione, ogni slot su ogni macchina ha un prezzo

  • In base ai prezzi di ogni slot/macchina (k,t), e in base alla propria funzione di utilità, ogni agente, risolvendo un problema di ottimizzazione, formula la propria migliore offerta


Kutanoglu wu iii
Kutanoglu-Wu (III)

  • Il banditore raccoglie dunque tutte le offerte, le elabora e annuncia i nuovi prezzi delle risorse

  • Lo scopo del banditore è di convergere verso uno schedule ammissibile, per cui i prezzi delle risorse più contese vengono aumentati in misura del livello di conflitto:


Kutanoglu wu iii1
Kutanoglu-Wu (III)

  • Ad esempio, l’aggiornamento dei prezzi può realizzarsi attraverso un semplice meccanismo di proporzionalità, ossia

    lktr+1 = lktr+ s Dkt


Kutanoglu wu iv
Kutanoglu-Wu (IV)

  • Il procedimento va avanti fino a raggiungere un criterio di arresto

  • Lo schedule risultante può non essere ammissibile

  • Obiettivo globale non monotono

  • Il comportamento può variare molto a seconda del pricing scheme e del protocollo usato (regola usata per aggiornare i prezzi)


4 bargaining

4. BARGAINING


Bargaining problems
Bargaining problems

  • Due giocatori, A e B, devono scegliere uno di un insieme X di possibili agreements

  • I giocatori possono comunicare, ma non possono trasferirsi utilità

  • Questi giochi modellano le situazioni di negoziazione


Bargaining problems ii
Bargaining problems (II)

  • La soluzione di un bargaining problem è un agreement che soddisfa certe proprietà (assiomatiche) che ne fanno un particolare candidato a essere il risultato del processo di negoziazione


Bargaining problems iii
Bargaining problems (III)

  • A e B sono “razionali”, i.e., hanno funzioni di utilità (o anche value functions) uA(x), uB(x) definite su X che soddisfano gli assiomi di

    von Neumann-Morgenstern

  • D è il disagreement point (dominato da tutti gli altri punti di X)


Bargaining problems iv
Bargaining problems (IV)

  • La teoria della negoziazione studia in che modo il risultato finale della negoziazione dipende dai parametri del problema e/o dal comportamento dei giocatori

  • In particolare, la soluzione di Nash tiene conto dell’utilità dei giocatori e dunque del loro atteggiamento rispetto al rischio


Soluzione di nash
Soluzione di Nash

  • La soluzione di Nash può caratterizzarsi in termini delle preferenze dei giocatori sull’insieme delle lotterie aventi come premi gli elementi di X

  • La soluzione di Nash x* è un’alternativa rispetto alla quale nessuno dei due giocatori ha abbastanza incentivi a deviare


Soluzione di nash1
Soluzione di Nash

  • È un agreement x* tale che, se esiste un agreement x e una probabilità p tale che il giocatore A preferisce

    L =< p, x; 1-p, d>

    a x*,

    allora il giocatore B preferisce

    L =< p, x*; 1-p, d>

    a x


Soluzione di nash2
Soluzione di Nash

  • Date le funzioni di utilità dei due giocatori, la soluzione di Nash x* è tale che

    uA(x*) uB(x*) ≥uA(x) uB(x)

    per ogni xX

  • La soluzione di Nash è unica se X è compatto e convesso


Soluzione di nash3
Soluzione di Nash

  • Se X non è compatto e convesso (e.g. un insieme discreto), il concetto di soluzione di Nash può ancora definirsi come soluzione che massimizza il prodotto delle utilità, ma può non essere unica


Soluzione di Nash - dominio discreto

(dA,dB)

*

S

*

*

*

*

*

*

*

*

*

d

*

*

*

*

*

*

*

*

*

*

*

*

*

*

*

*

*

*

*

*

*

*

*

Non appartiene necessariamente alla frontiera efficiente


Altri concetti di soluzione
Altri concetti di soluzione

  • La soluzione di Nash fa riferimento a una caratterizzazione dei decisori basata sul loro atteggiamento rispetto al rischio (value function)

  • Consideriamo il caso di decisori indifferenti al rischio (relativamente al valore dell’indice di costo)


Equit e vantaggio globale
Equità e vantaggio globale

  • Un punto di vista diverso confronta la situazione migliore e quella peggiore in assoluto per i due decisori (tipicamente la migliore per A è la peggiore per B e viceversa)

  • Siano zA* ,zB* ,zA0, zB0 , i valori ottimi e quelli peggiori per i due giocatori


Equit e vantaggio globale1
Equità e vantaggio globale

  • Data una qualsiasi soluzione s di valore zAezBper i due agenti, si può osservare come si situa rispetto agli estremi:


Equit e vantaggio globale2
Equità e vantaggio globale

  • I due valori rA e rB indicano a quanto ciascun giocatore sta rinunciando rispetto alla situazione in cui è da solo

  • Dunque, si vuole che rA e rB siano piccoli (qualità globale) ma anche che siano il più possibile vicini (equità)


Equit e vantaggio globale3
Equità e vantaggio globale

  • Siamo interessati a trovare i due schedule sA e sB tali che:


Equit e vantaggio globale4
Equità e vantaggio globale

  • La soluzione di Kalai Smorodinski (nel discreto) è definita come quello schedule sKS tale che

    r(sKS) = min {rA(s), rB(s)}


Soluzione di Kalai-Smorodinsky - dominio discreto

(dA,dB)

*

(dA,dB)

*

*

*

1

*

*

*

*

*

*

*

*

*

*

*

*

*

*

*

*

*

*

*

*

*

*

*

*

*

*

*

*

*

1

Non appartiene necessariamente alla frontiera efficiente


Scheduling bargaining problems
Scheduling bargaining problems

  • Problemi:

    • Quanto è grande l’insieme di tutti gli schedule Pareto-ottimi?

    • Quanto è complesso trovarne ognuno?

    • Quanto è complesso determinare la soluzione di Nash e quella di KS?


Modello di ottimizzazione vincolato
Modello di ottimizzazione vincolato

1 | f B≤Q | f A

è il problema di trovare lo schedule s* che minimizza f A(s)tra quelli tali che

f B(s) ≤Q


Modello bicriterio
Modello bicriterio

  • Un altro approccio minimizza una combinazione convessa delle funzioni obiettivo dei due agenti

    lf A+ (1- l)f B


I due approcci
I due approcci

  • Il modello vincolato può essere iterativamente utilizzato per trovare tutte le soluzioni Pareto-ottime

  • Il modello bicriterio può essere più semplice da risolvere ma consente di trovare solo le soluzioni estreme o efficienti


f A

f B

Soluzioni Pareto-ottime che sono

anche soluzioni del modello

bicriterio


Agente B

fB=SiCiB

Q = 43

Ji pi

1 3

2 4

3 4

1|SCiB Q| TmaxA- Esempio

Agente A

fA= TmaxA

Ji pi di

1 5 4

2 3 13

3 4 21


J1

J1

J2

J2

J3

J3

0

5

8

12

15

19

23

TmaxA= 2

Schedule s

SiCiB =

8 + 12 + 23 = 43


J1

J1

J2

J2

J3

J3

0

5

8

12

15

19

23

TmaxA= 2

Schedule s’

SiCiB =

8 + 12 + 19 = 39


Agent B

fB= CmaxB

JiBpiB

1 10

Q = 20

Agent A

fA= SiwiACiA

JiApiAwiA

1 6 9

2 5 7

3 3 4

4 4 5

1| CmaxB Q|SwiACiA - Esempio


J1A

J4A

J2A

J3A

J1B

25

28

0

20

6

10

Soluzione ottima s*

SiwiACiA(s)= 9*6+5*10+7*25+4*28

JiApiAwiA

1 6 9

2 5 7

3 3 4

4 4 5

CmaxB(s*)= 20


Constr.model Size of PBicriteria

fmaxA fmaxB O(n2) O(nAnB) O(n4)

SwjACjA CmaxBNP-hard pseudopol.O(n log n)

SwjACjA TmaxBNP-hard pseudopol.NP-hard

SCjA fmaxBO(n log n) O(nAnB) O(n3log n)

SUjA fmaxBO(n log n) O(nA) O(n2log n)

SUjA SUjBO(n3)O(nA) O(n4)

SCjA SUjBO(nB)

SwjACjA SUjBNP-hardO(nB) NP-hard

SCjA SCjBNP-hard pseudopol.O(n log n)


Constr.model Nash/KSBicriteria

fmaxA fmaxB O(n2) O(nAnB)O(n4)

SwjACjA CmaxBNP-hard O(n log n)

SwjACjA TmaxBNP-hard NP-hard

SCjA fmaxBO(n log n)O(n3log n)O(n3log n)

SUjA fmaxBO(n log n)O(n2log n)O(n2log n)

SUjA SUjBO(n3)O(n4) O(n4)

SCjA SUjB

SwjACjA SUjBNP-hardNP-hard

SCjA SCjBNP-hardNP-hard O(n log n)


Ricerca dei triangoli critici (per WC/WC)

  • Per velocizzare l’intero processo:

  • 1. Generiamo i “triangoli”, ognuno corrispondente ad una coppia di soluzioni estreme.

  • 2. Identifichiamo un “triangolo critico” nel quale cercare la soluzione desiderata.


Triangolo critico di Nash

La soluzione di Nash

è qui (da qualche parte)

Questa è

la soluzione di Nash

(a), (b) e (c) sono mutuamente esclusive


Triangolo critico di Kalai-Smorodinsky

E’ sufficiente identificare i due schedule(successivi)

s’, s’’ tali che:

s’

s’’


Ricerca in corso
Ricerca in corso

  • Algoritmi esatti (branch and bound) per trovare soluzioni Pareto-ottime nei casi difficili

  • Studio di protocolli di negoziazione per giungere ad allocazioni “buone” senza bisogno di rivelare tutta l’informazione

  • Connessione con altri modelli di negoziazione, come aste etc


ad