1 / 29

Архитектура современных ЭВМ

Архитектура современных ЭВМ. Кафедра Параллельных вычислений (ИВМиМГ) Кафедра Параллельных вычислительных технологий Маркова Валентина Петровна, markova@ssd.sscc.ru Куликов Игорь Михайлович, kulikov@ssd.sscc.ru. Определение архитектуры компьютера.

lynn-vang
Download Presentation

Архитектура современных ЭВМ

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Архитектура современных ЭВМ Кафедра Параллельных вычислений (ИВМиМГ) Кафедра Параллельных вычислительных технологий • Маркова Валентина Петровна, markova@ssd.sscc.ru • Куликов Игорь Михайлович, kulikov@ssd.sscc.ru

  2. Определение архитектуры компьютера • Архитектура компьютера – логическая организация компьютера с точки зрения программиста, (программно-видимые средства) • IA-32,Intel Core, AMD x86-64, STI Cell, IBM POWER • Микроархитектура компьютера – совокупностьаппаратных решений для серии процессоров, реализующих ее программную модель • IA-32 (IntelArchitecture 32 bit)представлена двумя микроархитектурами: • P6 (Pentium Pro, Pentium II и Pentium III) • NetBurst (Celeron, Pentium 4, Xeon ,….)

  3. Архитектурные принципы компьютера фон Неймана • Принцип программного управления • Принцип хранимой программы • Синхронное функционирование • Принцип условного перехода • Принцип использования двоичной системысчисления • Принцип иерархичности ЗУ

  4. Схема компьютерафон Неймана

  5. Выполнение команды

  6. Выполнение команды

  7. Машины потока команд Характерной чертой компьютеров фон Неймана является наличие глобально адресуемой памяти и счетчика команд, которые позволяют УУ многократно повторять один и тот же цикл действий: 1)Извлечение очередной команды машинного кода, 2)Декодирование и выполнение команды в автоматическом режиме. В результате глобально адресуемая память и счетчик команд создают поток команд, которые УУ декодирует, а АЛУ исполняют.

  8. Управляющие стратегии вычислений • Команда выполняется, если предыду-щая команда, определенная в машин-ном коде, выполнена (control flow). • Команда выполняется, когда требуе-мые операнды готовы (data flow). • Команда выполняется, когда ее резу-льтат требуется другой команде (demand driven). • Команда выполняется, когда появля-ются частичные образы данных (pattern driven).

  9. Узкие места архитектуры фон Неймана • Последовательное выпол-нение команд. • Хранение данных и прог-раммы в одном ОЗУ. • Один канал связи.

  10. Усовершенствования архитектуры фон Неймана • Усовершенствования в области CБИС-технологий. • Программного обеспечения. • Архитектурные усовершенствования.

  11. Прогресс в СБИС-технологиях. Закон Мура

  12. Усовершенствование ПО • Языки программирования ВУ. • Компиляторы. • Библиотеки подпрограмм. • Параллельные языки програм-мирования. • Коммуникационные библиотеки.

  13. Оптимизация подсистемы памяти Контроллер памяти Высокоскоростная шина Кэш и иерархия памяти Виртуальная память Аппаратная предвыборка данных и команд Оптимизация выполнения команд Конвейеризация Упрощение набора команд Истинный параллелизм Данные Инструкции Потоки Программы Архитектурные усовершенствования

  14. Очень сложное ядро

  15. Характеристикисуперкомпьютера Roadrunner(№1 http://www.top500.org) • Процессоры • PowerXCell 8i 3.2 ГГц (12 240 шт.) • Opteron DC 1.8 ГГц (6 562 шт.) • Всего ядер 122 400 • Общая память 98 Тбайт • Производительность • 1026 TFlops (макс) • 1375.78 TFlops (пиковая) • 437 MFlops/watt • Энергопотребление 2.35 мегаватт

  16. Иерархия памяти

  17. 3я команда 2я команда 1я команда Конвейер команд Ступени Запись результата 1 2 Вычисление операции 1 2 3 Выборка операндов 1 2 Декодирование команды 3 1 2 3 Выборка команды 1 2 Время

  18. 3я команда 2я команда 1я команда Конвейер команд Все ступени конвейера активны Латентность конвейера Ступени Запись результата 1 2 3 4 5 6 9 7 8 Вычисление операции 1 2 3 4 5 6 9 7 8 Выборка операндов 1 2 3 4 5 6 9 7 8 Декодирование команды 1 2 3 4 5 6 9 7 8 Выборка команды 1 2 3 4 5 6 9 7 8 Время

  19. Параллелизм на уровне инструкций (ILP) CPU INT Окно команд FP MEM BR

  20. Параллелизм на уровне инструкций (ILP) Время

  21. Параллелизм на уровне нитей (TLP) CPU Окно команд Нить №1 INT FP Окно команд MEM Нить №2 BR

  22. Параллелизм на уровне нитей (TLP) Нить №1 Нить №2 Время

  23. Многоядерность(Multi-Core) Окно команд Процесс №1 Окно команд Процесс №2

  24. Основные проблемы • Power Wall – стена мощности • Процессоры греются • Memory Wall – стена памяти • Память медленнее процессоров • Frequency Wall – стена частоты • Транзисторы маленькие, процессоры большие • Complexity Wall – стена сложности • Процессоры больше управляют вычислениями, чем вычисляют

  25. Итоги • Современные архитектуры произрастают из корняфон-Неймана • Оптимизации идут экстенсивно вплоть до стен (walls)

  26. Разработка IBM: 500 GHz

  27. Intel Polaris80 ядер, 1 ТФлопс

  28. University of Texas at Austin

  29. Алмазные кристаллы • 1000 vs 150 °C • 200 vs 20 Вольт

More Related