160 likes | 683 Views
01 feb 2007. Programaci?n Din?mica Probabil?stica. P?gina 2. Contenido. Introducci?nUn juego de azarReferencias. 01 feb 2007. Programaci?n Din?mica Probabil?stica. P?gina 3. Introducci?n. La programaci?n din?mica probabil?stica (PDP) difiere de la programaci?n din?mica determin?stica (PDD) en que
E N D
1. Sesión 2 – Programación Dinámica Probabilística Ing. en Sistemas Computacionales
Modelos Probabilísticos
Paul Ramírez De la Cruz
01 feb 2007
2. 01 feb 2007 Programación Dinámica Probabilística Página 2 Contenido Introducción
Un juego de azar
Referencias
3. 01 feb 2007 Programación Dinámica Probabilística Página 3 Introducción La programación dinámica probabilística (PDP) difiere de la programación dinámica determinística (PDD) en que
Las condiciones y resultados en cada etapa no son fijos, sino que tienen un componente de aleatoriedad
Se hace uso de conceptos de probabilidad en la obtención de su solución
Presentaremos la PDP mediante algunos problemas prototipo
4. 01 feb 2007 Programación Dinámica Probabilística Página 4 Un juego de azar Una variante del juego de ruleta requiere que se gire una rueda marcada con los números de 1 a n
La probabilidad de que la rueda se detenga en un número i después de hacerla girar es pi
Un jugador paga $x para tener derecho a girar la rueda hasta m veces
El jugador obtiene como ganancia el doble del número que obtiene cuando gira por última vez
Suponiendo que el juego se repite un número grande de veces, queremos diseñar una estrategia óptima para el jugador
5. 01 feb 2007 Programación Dinámica Probabilística Página 5 Planteamiento general Para poner el problema en términos de PD, consideremos lo siguiente:
La etapa i corresponde a la i-ésima vuelta de la rueda, i = 1, 2, …, m
En cada etapa hay dos alternativas: se gira la rueda una vez más o se termina el juego
El estado j del sistema en la etapa i es el número que se obtuvo la última vez que se giró la rueda, el cual está entre 1 y n
6. 01 feb 2007 Programación Dinámica Probabilística Página 6 Planteamiento general Sea fi(j) = Ganancia máxima esperada dado que el juego está en la etapa i y que el resultado de la última vuelta fue j, entonces
7. 01 feb 2007 Programación Dinámica Probabilística Página 7 Planteamiento general La ecuación recursiva es entonces
8. 01 feb 2007 Programación Dinámica Probabilística Página 8 Planteamiento general Los cálculos comienzan con fm+1 y terminan con f1, de modo que hay m+1 etapas
f1(0) representa el rendimiento esperado de las m vueltas, así que el rendimiento esperado neto, Rn, es
9. 01 feb 2007 Programación Dinámica Probabilística Página 9 Ejemplo Supongamos que la ruleta está marcada con los números 1 a 5 y que las probabilidades de que se detenga en cada número son p1 = 0.30, p2 = 0.25, p3 = 0.20, p4 = 0.15, p5 = 0.10
El jugador paga $5 por un máximo de cuatro vueltas
Determine la estrategia óptima para cada una de las cuatro vueltas y encuentre el rendimiento esperado neto asociado
10. 01 feb 2007 Programación Dinámica Probabilística Página 10 Ejemplo
11. 01 feb 2007 Programación Dinámica Probabilística Página 11 Ejemplo
12. 01 feb 2007 Programación Dinámica Probabilística Página 12 Ejemplo
13. 01 feb 2007 Programación Dinámica Probabilística Página 13 Ejemplo En la etapa 1 debe girar. Su ganancia esperada es de 7.31
14. 01 feb 2007 Programación Dinámica Probabilística Página 14 Ejemplo
15. 01 feb 2007 Programación Dinámica Probabilística Página 15 Referencias Taha, Hamdy A. Investigación de operaciones. Una introducción. Pearson Educación. 6ª edición. México, 1997