1 / 22

What the aibos could learn from the midsize league

What the aibos could learn from the midsize league. Overview of past research activities at the University of Amsterdam. Speaker Jürgen Sturm. Overview. Midsize soccer league Onderzoek UvA 2000-2004 Team gebaseerde gedragsselectie Particle filters voor lokalisatie. Midsize league.

erin-larson
Download Presentation

What the aibos could learn from the midsize league

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. What the aibos could learn from the midsize league Overview of past research activities at the University of Amsterdam Speaker Jürgen Sturm

  2. Overview • Midsize soccer league • Onderzoek UvA 2000-2004 • Team gebaseerde gedragsselectie • Particle filters voor lokalisatie

  3. Midsize league

  4. Midsize league

  5. Midsize league – 4 legged league

  6. Team based Action planning Master project of Matthijs Spaan

  7. Clockwork Orange Architecture Sense-Think-Act

  8. Team based Action planning World model Robot, Teamgenoten Tegenstanders Bal Player skills: • Turn • Move • Dribble • Shoot • Seek • Chase

  9. Team based Action planning • Het balbezit bepaald de team strategie • Wij balbezit → Attack • Zij balbezit → Defend • Niemand balbezit → Intercept • De team strategie is algemeen, oftewel hetzelfde voor alle teamgenoten

  10. Team based Action planning Dynamische rolallocatie Om in te schatten wat de optimale rolverdeling is, zijn er verschillende evaluatie functies gemaakt, met als variabelen: • Tijd benodigd om bij de bal te komen • Huidige positie • Balbezit

  11. Team based Action planning Resultaten • Team Strategie 2001 • Seattle 0-8 5-0 3-0 1-4 0-4 • Rolverdeling kwart-finale CS Freiburg

  12. Team based Action planning Resultaten • Actieverdeling kwart-finale

  13. Particle filters for localisation

  14. Markov State • World States • Sensor Readings • Actions • Action Model • Sensor Model

  15. Particle distribution Markov State Estimation • Markov State Estimation • Problem: how to represent efficiently a probability distribution? • Monte-Carlo solution

  16. prior distribution Particle filtering • Particle filters is een Monte Carlo methode • Houdt een aantal hypothesen bij mbv particles • De waarschijnlijkheid distributie kan hierbij een willekeurige vorm hebben. apply action and sensor model select most likely hypothesis by random sampling on weight (posterior distribution)

  17. Particle filtering • Particle Filter moet robuust zijn tegen verstoringen • Alle particles fout, sensor model correct (kidnap) • sensor model fout, particles correct (noise, outlier) • Allebei fout • Kidnapper-noise dilemma • Noise vaak tijdelijk gecorreleerd

  18. Particle filtering • Solutions to the kidnapper-noise dilemma • Re-sample strategy • Re-sample all particles from scratch after a given period without overlap (“reset” by a watchdog) • Sample-from-likelihood • Sample part of the new particles directly from the sensor data

  19. t: t+1: t+2: t+3: t+4: Particle filteringSolution: Coherence • initiëren rechtstreeks uit de metingen een kleine subset • nieuwe particle eigenschap: coherence • De nieuwe set van particles wordt samengesteld mbv de eigenschappen: • weight, likelihood en coherence • MaxCoherence kan gebruikt worden om het conservatisme in te stellen • Korte periode van twijfel bij consistente verstoringen

  20. Particle filtering • Experimenten met een 1-D gesimuleerde omgeving • 3 scenarios • kidnap • Korte periode (4 tijdstappen) van consistent foute metingen • Langere periode (20 tijdstappen) van willekeurige foute metingen • 5 particle filter configuraties • normal • reinitialize • sample from likelihood • coherence with maxCoherence=5 • coherence with maxCoherence=15

  21. Particle filteringResults • Coherence PF is nooit de slechtste oplossing • Het conservatisme is goed in te stellen met Cmax • Coherence PF test de consistentie van alternatieve hypothesen, en veranderd gelijkmatig zijn aannames

  22. Conclusion • Robot toepassingen hebben vaak vergelijkbare problemen • Er is bij de UvA (en TUD) veel ervaring met problemen zoals: • Gedrag selectie en coördinatie • Lokalisatie

More Related