1 / 21

proPar Presentación Curso 14/15

Departamento : Informática Aplicada => Sistemas Informáticos (Bloque IV - Planta 4ª) Profesores : Pablo Carazo D4417 email : pcarazo@eui.upm.es TABLÓN DE ANUNCIOS : <==> www.dia.eui.upm.es Normas del Curso Tutorías Notas Exámenes PRÁCTICAS : Laboratorio 4405.

Download Presentation

proPar Presentación Curso 14/15

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Departamento: Informática Aplicada => Sistemas Informáticos • (Bloque IV - Planta 4ª) • Profesores: • Pablo Carazo D4417 email: pcarazo@eui.upm.es • TABLÓN DE ANUNCIOS: <==> www.dia.eui.upm.es • Normas del Curso • Tutorías • Notas • Exámenes • PRÁCTICAS:Laboratorio 4405 proPar Presentación Curso 14/15 L y X 9-10 13-14 16-17

  2. proPar Presentación2 Mi despacho Tablón ? Secretaria L y J (15’00 a 18’00)

  3. proPar Presentación3 “Aumento de prestaciones” Un año • Alta productividad • Alto rendimiento 6 meses Misma tarea en menos tiempo 3 en un año • + gente • + ahínco • mejor • + CPU’s • + GHz • algoritmo Más tareas en el mismo tiempo

  4. proPar Objetivo4 • Poner a trabajar juntos a varios procesadores (2 ... 10.000 ...) ¿Buses? Intel AMD Oracle 8 núcleos 8 núcleos 16 núcleos Decenas de núcleos Miles de núcleos 16 12 61 RED

  5. proPar Presentación5 OBJETIVOS: “Ejecutar un programa más rápido” • Poner a trabajar juntos a varios procesadores (2 … 10.000 …) Libro electrónico: How to Survive the Multicore Software Revolution Paralelismo en el PC  Gran desafío Prensa 19/06/12: IBM recupera el liderazgo mundial supercomputadores 1.572.864 núcleos  16,32 PetaFlops 1993 CM-5/1024 3 días  1 segundo Intel AMD Oracle • Entornos de desarrollo (Hw + Lenguaje + Depurador + Monitor) 8 núcleos 8 núcleos 16 núcleos • Técnicas básicas para el desarrollo de programas paralelos • Implementaciones concretas(Prácticas)

  6. proPar Presentación6 OBJETIVOS: “Ejecutar un programa más rápido” Prensa 19/06/12: IBM recupera el liderazgo mundial supercomputadores 1.572.864 núcleos  17,17 PetaFlops 1993 CM-5/1024 3 días  1 segundo TOP500 Jun/2013: China duplica la capacidad del Titan 2 años antes 3.120.000 núcleos  33,86 PetaFlops 3 1 ¿ Jun2014 ? 2 Titan (USA) con 560.640 núcleos

  7. proPar Presentación7 • Programa de Teoría • Computadores Paralelos • Programación basada en paso de mensajes (MPI) • Técnicas básicas de programación paralela • Compulsiva, Divide y vencerás, Pipeline, • Síncrona, Equilibrado de carga y Terminación • Programación basada en memoria común (OpenMP, CUDA) • Algoritmos y aplicaciones Ordenación, Numéricos, Imagen, Búsqueda • Bibliografía • TransparenciasFotocopias?? / WWW • “Parallel Programming. .....”. B. Wilkinson & M. Allen - P.H. 1999-2005 • “Parallel Programming in C with MPI and OpenMP”. Quinn,M.J. – MGH 2003

  8. proPar Presentación8 Arquitecturas Paralelas Programación … Concurrente ySistemas Operativos Algorítmica y complejidad Relación con otras asignaturas: • Computadores Paralelos • Programación con paso de mensajes (MPI) • Técnicas básicas de programación paralela • Programación con memoria común (OpenMP) • Algoritmos y aplicaciones • Ordenación, Numéricos, Imagen, Búsqueda

  9. proPar Presentación9 • Las prácticas Programa de Prácticas • Entorno • Cluster de 10 PC’s –cada uno 4 núcleos- (Lab4405) + PC9 • Lenguaje de programación “C” • MPI “Message Passing Interface” • Toma de contacto (mediciones de tiempos) • Montecarlo (PI), Divide y vencerás (# veces) • Cálculo de números primos • Cálculo de fractales • Entorno OpenMP: PI y ordenación ¿Breviario de C? CUDA • Planificación • .. 22 de Sep => Agruparse en grupos de dos • .. 10 de Dic => 5/6 turnos de 2+2 horas

  10. proPar Presentación10 Dibujaremos este fractal en secuencial en 43 segundos y, utilizando 16 núcleos, lo conseguiremos dibujar en tan sólo 3 segundos

  11. proPar Presentación 11

  12. proPar Presentación12 Pentium Core 2 Quad Q6600 2,4GHz• 8ML2 •4GB • 500GB pc4 pc3 pc2 pc1 pc5 Core i7 Switch GigaEthernet pc6 Red E.U.I. pc7 pc8

  13. proPar Presentación13 Pentium Core 2 Quad Q8200 2,4GHz• 4ML2 •2GB • 300GB PC10 PC11

  14. proPar Presentación14 PC9 2 Xeon E5520 Quad 2,26GHz• 8ML3 •12GB • 500GB

  15. proPar Presentación 15 3 * NVIDIA GEFORCE GTX 660 2GB GDDR5 960 núcleos 1,03 GHz

  16. proPar Presentación 16 34,245 seg MPI 4 núcleos 8,840 seg 1,329 seg MPI 32 núcleos 1,809 seg

  17. proPar Presentación17 Zynq dual core ARM-A9 1GB SDRAM Parallella Epiphani-16 Desktop Computer 16 núcleos 600MHz => 19,2 GFlops

  18. proPar Presentación18

  19. proPar Presentación Planificación19 Septiembre Teoría Prácticas Noviembre Teoría Prácticas L 8 Presentación L 3 3. Primos X 10 comParale X 5 T2 mComún L 15 comParale L 10 X 17 pasoMsj X 12 memComún L 22 pasoMsj L 17 4. Fractales X 24 compulsiva X 19 memComún L 29 1. Contacto L 24 4. Fractales Octubre X 26 ordenación Diciembre X 1 divideVence L 6 1. Contacto L 1 5. openMP X 8 T1 y … X 3 ordenación L 13 2. MonteCar L 8 X 15 pipeline X 10 T3 Artículos L 20 2. MonteCar L 15 5. openMP X 22 síncrona X 17 Artículos L 27 3. Primos X 29 equiliTermi

  20. proPar Presentación20 • “A Common Parallel Computing Framework for Modeling Hydrological Processes of • River Basins”, 2011 • “AA-Sort: A New Parallel Sorting Algorithm for Multi-core Parallel Systems”, 2007 • “Un banco de pruebas de ordenación paralela”, 2007 • “Parallel Suffix Sorting”, 2001 • “Invasive MPI on Intel’s Single-Chip Cloud Computing”, 2012 • Evaluación contínua [Adherirse* ..6Oct] • Asistencia 4 puntos (Control + tests) • Trabajo 2 puntos (Exposición o Escrito) • Práctica 4 puntos (Funcionando en 1,2,4,8,16 núcleos) FIN Guía de aprendizaje Competencia “Análisis y síntesis”

  21. proPar Presentación21 Actividad Horas presenciales Horas no presenciales Horas totales Clases 28 28 56 Prácticas 20 40 60 Presentación artículos 4 14 18 Tests 3 12 15 Tutorías 1 0 1 Totales 56 94 150

More Related