C pitulo 6
This presentation is the property of its rightful owner.
Sponsored Links
1 / 21

Cápitulo 6 PowerPoint PPT Presentation


  • 83 Views
  • Uploaded on
  • Presentation posted in: General

Cápitulo 6. BUSQUEDA EN JUEGOS DE ADVERSARIO Sección 1-4. Bosquejo. Las decisiones óptimas Poda α-β Las decisiones imperfectas de tiempo real. Juegos vs. Búsqueda. A dversario “ imprevisible ”  especifica r un movimiento para cada respuesta posible del adversario

Download Presentation

Cápitulo 6

An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -

Presentation Transcript


C pitulo 6

Cápitulo 6

BUSQUEDA EN JUEGOS DE ADVERSARIO

Sección 1-4


Bosquejo

Bosquejo

  • Las decisiones óptimas

  • Poda α-β

  • Las decisiones imperfectas de tiempo real


Juegos vs b squeda

Juegos vs. Búsqueda

  • Adversario “imprevisible” especificar un movimiento para cada respuesta posible del adversario

  • Límite de tiempo  improbable encontrar meta, deben aproximarse


Arbol de juego 2 jugadores deterministas turnos

Arbol de juego (2 jugadores, deterministas, turnos)


Minimax

Minimax

  • Jugada perfecta para juegos determinísticos

  • Idea: mover a la posición con mayor valorminimax= Mejor ganancia vs. mejor jugada

  • E. g. Explorando a profundidad 2


Algoritmo minimax

Algoritmo Minimax


Propiedades de minimax

Propiedades de minimax

  • ¿Completa? Sí (si el árbol es finito)

  • ¿Óptimo? Sí (en contra de un adversario óptimo)

  • ¿Complejidad en Tiempo?O(bm)

  • ¿Complejidad en espacio?O(bm)DFS

  • Para el ajedrez,b ≈ 35, m ≈100, para juegos "razonables“. Solución exacta no factible.


Ejemplo de

Ejemplo de α-β


Ejemplo de1

Ejemplo de α-β


Ejemplo de2

Ejemplo de α-β


Ejemplo de3

Ejemplo de α-β


Ejemplo de4

Ejemplo de α-β


Propiedades de

Propiedades de α-β

  • La podano afecta el resultado final

  • Un buen orden de movimientos mejora la efectividad de poda

    Orden perfecto. Complejidad en tiempo = O(bm/2)

    à duplica laprofundidad de búsqueda

  • Un ejemplo simple del valor de razonamiento donde las computaciones tienen importancia (una forma de metarazonamiento)


Por que

¿Por que α-β?

  • α es el valor de la mejor elección (el valor más alto) encontrada hasta ahora en cualquier punto a lo largo del camino hacia max

  • Si v es peor que α,max lo evitará àpoda esa rama

  • β semejante para min


Algoritmo

Algoritmo α-β


Algoritmo1

Algoritmo α-β


Recursos limitados

Recursos Limitados

Tenemos 100 s, explorar 104nodos/s 106 nodos por movimiento

método estándar:

  • Prueba de truncamiento:

    v.g., Límite de profundidad

  • La función de evaluación

    = estimar la conveniencia de la posición


Funciones de evaluaci n

Funciones de evaluación

  • Para el ajedrez, típicamente la suma ponderada lineal de características

    Eval(s) = w1 f1(s) + w2 f2(s) + … + wn fn(s)

    w1 = 9 con

    f1(s) = (el número de reinas blancas) – (el número de reinas negras)

    etc.


Recortando la b squeda

Recortando la búsqueda

MinimaxCutoff es idéntico a MinimaxValue excepto

  • Terminal? es remplazada por Cutoff?

  • Utility es remplazada por Eval

    Funciona en la práctica?

    bm = 106, b=35  m=4

    Adelantarse 4 jugadas  jugador pésimo!

  • 4-ply ≈ Principiante humano

  • 8-ply ≈ PC típica, maestro humano

  • 12-ply ≈ Deep Blue, Kasparov


Juegos determin sticos

Juegos Determinísticos

  • Damas: Chinook acabó reinado de 40 años de campeón mundial Marion Tinsley en 1994. Usaba una base de datos precomputada de finalesperfectos para 8 o menos piezas. Un total de 444 billones de posiciones.

  • Ajedrez: Deep Blue derrotó al campeón mundial Garry Kasparov en seis juegos en 1997. Deep Blue registra 200 millones de posiciones por segundo. Evaluación muy sofisticada, y métodos sin revelar para explorar hasta 40 jugadas adelante.

  • Othello: Los campeones humanos se reúsan a jugar en contra de computadoras. Son demasiado buenas.

  • Go: Los campeones humanos se reúsan a jugar contra computadoras. Son demasiados malas. En Go, b > 300, la mayoría de programas usan bases de conocimiento de patrones para sugerir movimientos aparentemente buenos.


Resumen

Resumen

  • ¡Los juegos son divertidos !

  • Ilustran varias puntos importantes acerca de IA

  • La perfección es inalcanzable  debe aproximarse


  • Login