1 / 83

Проблемы создания элементной базы экзамасштабных систем

Семинар кафедры “ Нано и микроэлектроники ” МИФИ, 24 сентября 2013. Проблемы создания элементной базы экзамасштабных систем. Л.К.Эйсымонт (к.ф-м.н, научный консультант ФГУП «НИИ «Квант»). Требования по памяти экзамасштабных систем.

soyala
Download Presentation

Проблемы создания элементной базы экзамасштабных систем

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Семинар кафедры “Нано и микроэлектроники” МИФИ, 24 сентября 2013 Проблемы создания элементной базы экзамасштабных систем Л.К.Эйсымонт (к.ф-м.н, научный консультант ФГУП «НИИ «Квант»)

  2. Требования по памяти экзамасштабных систем

  3. Общая картина в области СКТ- Внедрение результатов программы DARPA HPCS (2002-2010), коммерческие образцы и военные суперЭВМ (2013-2017)- Выполнение программы DARPA UHPC (2010-2020) и программ DoE по экзамасштабным технологиям и суперЭВМ экза-уровня - Выполнение программы DARPA STARNet (с 2013 года) по оптимизации использования КМОП-технологий и разработки технологий пост-Муровской эры, зетта- и йотта-уровень

  4. Проекты DARPA UHPCэкзамасштабной тематики и эксперименты с перспективными run-timе системами. • Проект Echelon (NVIDIA, Cray, 8 университетов. Модель программ – обобщение CUDA.Есть эмуляция на кластерных суперкомпьютерах. • Проект Runnemede (Intel, Университет Делавера….). Модель программы – Соdelet-модель. Есть эмуляция на кластерных компьютерах . 3. Проект Angstrom (MIT, Tilera ), Модель программы – SEEС, есть эмуляция на кластерных суперкомпьютерах. 4. Проект X-calibr (Лаборатория Sandia, ….). Модель программы – ParalleX, есть эмуляция на кластерных суперкомпьютерах – HPX (университет Луизианы).

  5. Базовые материалы экзафлопсной тематики (экстремальные технологии)

  6. Ожидаемые результаты по суперЭВМ экза- и более уровня • 2015-2017 – военные суперкомпьютеры (ВКСН) экза-уровня, CF- и DIS-задачи • 2018-2020 – эволюционная суперЭВМ экзафлопсного уровня NNSA DoE - после 2022 – инновационная суперЭВМ экзафлопсного уровня OS/ASCR DoE - после 2020 - военные суперкомпьютеры (ВКСН) зетта-уровня (~ 2020)и йотта- уровня (~ 2024), технологии RSFQ, QCA и квантовые аналогово-спиновые (~D-Wave)

  7. Проблемы, которые надо решить…( стена памяти, хранение и передача данных, энергоэффективность, отказоустойчивость, продуктивность)

  8. Базовые целевые характеристики суперЭВМ экза-уровня

  9. Базовые характеристики рекордных суперЭВМ, лето 2013 (Top500)

  10. Увеличение разрыва такта процессора и времени доступа к DRAM-памяти

  11. Динамика роста пиковой и реальной производительности (видение 2003 года) В настоящее время разрыв 100-1000 раз

  12. Saule E. et al. Performance Evaluation of Sparse Matrix Multiplication Kernels on Intel Xeon Phi. 5 Feb 2013, 19 pp HPCG (SpMV) против HPL(Top500)

  13. Пакет тестов Euroben, группы операций тест Euroben(модуль mod1a) 31 тест простых операций с векторами Цели:Оценка производительности вычислительных элементов в зависимости от схемы доступа к данным и соотношения числа вычислительных операций и операций доступа к памяти Сравнение компиляторов и опций

  14. Пакет тестовEuroben, Intel E5-2660 Sandy Bridge(core Rpeak 17,6Гфлоп/с) Группа 1 Группа 2

  15. Тест APEX-map, APEX-поверхность, профиль работы с памятью теста APEX-map

  16. Разные режимы пространственно-временной локализации и эффективность работы памяти Пространственная локализация Временная локализация

  17. Профилитестов, получены на имитационной модели СКСН Ангара‏ (Россия, ОАО”НИЦЭВТ”) Тест SpMV BFS

  18. Профили реальных программ, получены на реальном оборудовании (США, ORNLDoE)

  19. Пространственно-временная локализация обращений к памяти - измерение Пространственная локализация (spatial locality) -тенденция приложения выдавать обращения к памяти, в которых адреса находятся вблизи от адресов недавно выданных обращений SL  [0,1] Временная локализация (temporal locality) – тенденция приложения выдавать обращения к памяти к тем же адресам, которые были в недавно выданных обращениях TL  [0,1] Weinberg J. et al. Quantifying Locality In The Memory Access Patterns of HPC Applications. SC’05, November 12-18, 2005, 12 pp. (San Diego-LBNL)

  20. Технология оптимизации на основе результатов профилирования работы с памятью - 1

  21. Технология оптимизации на основе результатов профилирования работы с памятью - 2

  22. Архитектурные-программные приемы преодоления проблемы “стены памяти”

  23. Перспективы и особенности развития технологий микропроцессорных кристаллов

  24. Развитие микроэлектронных технологий Процессорные кристаллы Кристаллы памяти

  25. Анатомия энергетических характеристик экзамасштабных систем 2018 года

  26. Анатомия характеристик подсистемы памяти экзамасштабных систем 2018 года

  27. Текущий уровень интерфейсов Threadstorm

  28. Имитационное моделирование многоядерного Cray XMT (Threadstorm)

  29. Результаты тестовых прогонов без агрегирования сообщений (32 узла)

  30. Блок агрегирования сообщений

  31. Результаты тестовых прогонов с агрегированием сообщений, MC=8

  32. Вычислительный узел

  33. Энергоэффективность процессора узла

  34. 3D сборка – IBM TSV

  35. Коммуникационный опточип IBM Holley и вариант перспективной компоновки вычислительного модуля 90 нм, 48 линков по 12.5 Gb/s (24(in)+24(out)), ~5x5мм, 8 pJ/bit. Перспектива (45 нм) – 40 Gb/s, 1 pJ/bit (0.8 – E, 0.2 – O) Узел - 5х6 см, 82 (OE), 1968 VCSL + 1968 PD, 6 узлов в группе, 4 группы в модуле

  36. HMC (фирмы Micron, HP)

  37. HMC (фирмы Micron, HP) – интеллектуальная память

  38. Многоуровневая коммуникационная сеть

  39. Стойка суперкомпьютераPower 775

  40. Серверная плата суперкомпьютера Power 775

  41. Многопортовый HUB-маршрутизаторсети PERCS

  42. Многоуровневая сеть PERCS суперкомпьютера Power 775

  43. Одно вычислительное лезвие суперкомпьютера Сray XC30

  44. Многоуровневая сеть суперкомпьютера Сray XC30 Фрейм Двухстоечный фрагмент

  45. Уровни иерархии 1, 2 и 3 новых суперкомпьютеров и возможности коммуникационных средств этих уровней

  46. Специализация и блоки аналогового типа

  47. Переход от подхода 90/10 к подходу 10х10 – специализация ядер в виде функциональных кластеров

  48. Переход от подхода 90/10 к подходу 10х10 – специализация ядер в виде функциональных кластеров

  49. Специализация на символьную обработку – “символьный кластер” Регистры Pe Операции Pe Правила переходовPe Правила проектирования – 206 Правила замены - 88

More Related