1 / 11

Sous-projet IV Communications Placement/Ordonnancement

Sous-projet IV Communications Placement/Ordonnancement. SP 4 : participants. George Bosilca (doctorant) Franck Cappello (CR CRNS) Adberhamanne Djilali (doctorant) Gilles Fedak (doctorant) Cecile Germain (MC Univ. PXI) Oleg Lodygensky (Ing. Doctorant) Vincent Néri (IE)

brendy
Download Presentation

Sous-projet IV Communications Placement/Ordonnancement

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Sous-projet IV Communications Placement/Ordonnancement

  2. SP 4 : participants • George Bosilca (doctorant) • Franck Cappello (CR CRNS) • Adberhamanne Djilali (doctorant) • Gilles Fedak (doctorant) • Cecile Germain (MC Univ. PXI) • Oleg Lodygensky (Ing. Doctorant) • Vincent Néri (IE) • Anton Selikov (PostDoc) + • Henri Casanova (UCSD – USA) ACI GRID CGP2P 30/01/02

  3. SP 4 : objectifs généraux • Exécution d'applications parallèles • Placement/ordonnancement • d'applications non-communicantes • d'applications parallèles • Sur CGP2P : CG/P2P-interactions/P2P-système ACI GRID CGP2P 30/01/02

  4. Execution parallèle Lancement Disparition Re-lancement • Vrai parallélisme massif : K machines • Modèles d'exécution • Graphe de tâches -> SP1 • Passage de messages • L'exécution doit progresser en présence de défaillances massives :tolérance aux pannes complètement décentralisée ACI GRID CGP2P 30/01/02

  5. Parallélisme et tolérance aux fautes Choix : Virtualisation des tâches logiques permanentes sur des tâches volatiles • Flots d'exécution, ex processus MPI • Communications, ex send/recv MPI • Infrastructure logicielle • Communication • Sauvegarde (checkpoint) • Lancement • Protocoles • Quoi/Quand • Sauvegarder/Reprendre • Correction SP 5 • Optimisation Mouvement de données Ordonnancement ACI GRID CGP2P 30/01/02

  6. Une implémentation de MPICH Fondée sur des communications découplées Canal mémoire Service distribué Extensibilité d'un service chargé Construire un modèle de performances Protocoles Expérimentation Communications : MPICH-V W W Send/Recv Espace de tuples put get ACI GRID CGP2P 30/01/02

  7. Sauvegardes (checkpoint) • Infrastructure logicielle de sauvegarde locale : libckpt ? + contexte • Ordonnancement local • Fiabilité du support et importance de la tâche • Placement global tâches/sauvegardes • Consommation de ressources réseau • Service de stockage -> SP2 ACI GRID CGP2P 30/01/02

  8. Placement/Ordonnancement • Que reste-t-il du Processeur/Date dans un système CG/P2P • Echelle massive • Volatilité des ressources • Faible contrôle • Information très incomplète • Faible bande passante ACI GRID CGP2P 30/01/02

  9. Les différentes approches • Algorithmique centralisée adaptative • Algorithmique décentralisée : vol/donation de travail, diffusion… • Applicatif : ne dépend que du graphe Objectif : degré de réplication commecompromis débit global du système et temps de complétion (makespan) d ’une application ACI GRID CGP2P 30/01/02

  10. Les ressources La définition des ressources ne peut être basée que sur une inférence statistique • Les environnements • Collection de traces : Ganglia, NWS, XWTrace • Prédiction de disponibilité /performance : NWS • Les questions scientifiques • Qualité de la prédiction • Sensibilité des algorithmes de scheduling à la QoI ACI GRID CGP2P 30/01/02

  11. Plan de travail Etude comms Proto Comms Evaluation Micro-bench Etude protocoles de reprise Proto MPICH-V Evaluation Benchmarks NAS, Linpack Outils de traces et d'analyse stat. Testbed Etude ordonnancement Proto Evaluation t0+6 t0+12 t0+18 t0+24 t0+30 t0+36 t0 ACI GRID CGP2P 30/01/02

More Related