1 / 41

GPU

GPU. ELTE IK Számítógépes Grafika II. Jeni László Attila jedi@inf.elte.hu Magdics Milán gumi@inf.elte.hu. Tartalom. A grafikus hardver fejlődése GPU generációk Hardveres grafikus szerelőszalag felépítése Csúcspont és képpont árnyaló egységek működése. 2. CPU vs GPU.

decima
Download Presentation

GPU

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. GPU ELTE IK Számítógépes Grafika II. Jeni László Attila jedi@inf.elte.hu Magdics Milán gumi@inf.elte.hu

  2. Tartalom A grafikus hardver fejlődése GPU generációk Hardveres grafikus szerelőszalag felépítése Csúcspont és képpont árnyaló egységek működése 2

  3. CPU vs GPU • CPU (central processing unit) • Általános célú • Alkalmazások futtatása • GPU (graphics processing unit) • Speciális célú (grafikus feladatok) • Sokkal gyorsabbak mint a CPU-k • Sokmagos processzor (32, 64, 128, …, 512, …) • ~ 10’000’000 csúcspont / sec • ~ 10’000’000’000 fragment / sec • >1 TFlop/s (ATI Radeon™ HD 5870: 2.72 TFlop/s) • SZTAKI desktopgrid csúcsteljesítmény: 3 TFlop/s 3

  4. CPU vs GPU – TFlops 4

  5. CPU vs GPU – sávszélesség 5

  6. Miért fejlődik ilyen gyorsan? 6

  7. CPU vs GPU 7

  8. CPU vs GPU – tranzisztorszám Nagyobb tranzisztorszám jut az adatok feldolgozására, régebben csak SIMD 8

  9. PCI buszrendszer • Nagy ugrás az ISA után, de • Idővel a PCI buszrendszer lett a „szűk keresztmetszet” • Sok eszköz használta • Sok dolgot kellett mozgatni a memória és a grafikus kártya között (geometria, textúrák, …) • Példa:2M háromszög, mindegyik 90 byte =180 MByte > 133 MByte (PCI sávszélessége) 9

  10. AGP buszrendszer Accelerated Graphics Port Megoldás: a memória közvetlen elérése! Nincs többé torlódás az adatbuszon Több geometriát lehet feldolgozni Az „AGP 1x” kétszer gyorsabb, mint a PCI (most „AGP 8x”-nél tartunk, ami 2 GB/s) 10

  11. PCI Express Soros kommunikációra (kétirányú) épülő technika, de skálázható! A két sáv mindkét irányba tud közvetíteni. A PCI-E X16 akkor 8 GB/s ha mindkét sáv azonos irányba közvetít. 11

  12. PCI Express 2010-es években

  13. A GPU fejlődése: generációk 13

  14. A GPU fejlődése: generációk 14

  15. A GPU fejlődése: generációk 15

  16. A GPU fejlődése: generációk A 90-es évek közepén a grafikus hardverek több különböző chipet tartalmaztak, amelyek együttesen végezték a képszintézist. A félvezetőgyártás fejlődésével ezeket végül egyetlen chipbe vonták össze. A GPU elnevezés a 90-es évek végén jelent meg, amikor a „VGA vezérlő” kifejezés már nem jellemezte pontosan a grafikus hardvert. VGA (Video Graphics Array) – 1987 Hat különböző generáció különböztethető meg a GPU-k terén. 16

  17. Kezdeti próbálkozások A GPU-k megjelenése előtt néhány vállalat (Silicon Graphics, Evans&Sutherland) tervez néhány drága és speciális hardvert Ezekben már sok alapkoncepció megjelenik (csúcspont transzformációk, textúrázás) Ezek a gépek fontosak történelmi szempontból, de a magas áruk miatt nem érték el az egy-chipes GPU-k sikerét. 17

  18. Vertex Transforms Primitive Assembly Frame Buffer Rasterization and Interpolation Raster Operations CPU GPU PCI 1. Generáció (1998-ig) NVIDIA TNT2, ATI Rage, 3dfx Voodoo3 A standard 2d-s videokártyák kiegészítése Csúcspont transzformációkat még a CPU csinálja! A kártya csak a textúrázást, Z-buffer kezelést végezte 18

  19. Vertex Transforms Primitive Assembly Frame Buffer Rasterization and Interpolation Raster Operations GPU AGP 2. Generáció (1999-2000) NVIDIA GeForce 256, GeForce 2, ATI Radeon 7500 Átveszik a transzformációk és az árnyalás kezelését a CPU-tól. Az OpenGL és DirectX 7 is támogatja a hardveres csúcspont transzformációkat. Multi-textúrázás megjelenése: bump map, light map Konfigurálható (driver szinten), de még nem programozható 19

  20. Vertex Transforms Primitive Assembly Frame Buffer Rasterization and Interpolation Raster Operations GPU AGP Small vertex shaders 3. Generáció (2001) NVIDIA GeForce 3, GeForce 4 Ti, Xbox, ATI Radeon 8500 A csúcspont pipeline korlátozott programozhatósága Fejlettebb pixel szintű konfigurálás, de még nem programozás 3d-s textúrák, többszörös mintavételezés (antialias-hoz) 20

  21. Vertex Transforms Primitive Assembly Frame Buffer Rasterization and Interpolation Raster Operations AGP Programmable Vertex shader Programmable Fragment Processor 4. Generáció (2002) NVIDIA GeForce FX, ATI Radeon 9700 A csúcspont és pixel pipeline teljesen programozható (erőforrás-korlátok azért még vannak) Magas szintű árnyaló nyelvek (shading languages) megjelenése (NVIDIA Cg, Microsoft HLSL, OpenGL GLSL) Shader Model 2.0 (simple branching) 21

  22. 5. Generáció (2004) NVIDIA GeForce 6, ATI Radeon X, GeForce 7 Több puffer szimultán renderelése 64bites pipeline PCIe busz Több memória, hosszabb csúcspont árnyaló programok Shader Model 3.0 (branching and looping in the pixel shader (physics)) HDRI, SLI, TSAA, TMAA 22

  23. 6. Generáció • DirectX 10 • Shader Model 4.0 (Unified Shader Model, geometry shader) • Unified Shading Architecture • Shading performance 2x pixel, 12x vertex above G71 • 700 Mtransistors • 130W to 300W 23

  24. A hardveres grafikus szerelőszalag A 3d alkalmazás csúcspontok szekvenciáját küldi a GPU-nak geometriai primitívekbe kötegelve (poligonok, vonalak, pontok) Minden csúcspontban van egy pozíciója és más attribútumai (szín, spekuláris szín, textúra koordináták, normálvektor) A csúcspont transzformációk a szerelőszalag első lépésében hajtódnak végre. 24

  25. Primitívek és raszterizálás A transzformált csúcspontok sorozatát a következő lépésben geometriai primitívekké alakítja a hardver (háromszög, vonal, pont) Ebben a feldolgozási lépésben végzi el a hardver a látógúlával történő metszést és a hátlapeldobást. Amely poligonok „túlélték” a metszést és a hátlapeldobást, azokra végrehajtja a raszterkonverziót. Raszterizálás:az a folyamat, amely meghatározza, hogy az egyes geometriai primitívekhez melyik pixelek tartoznak A raszterizálás eredménye pixel pozíciók halmaza valamint „fragment”-ek halmaza. 25

  26. Pixel  Fragment Pixel = Picture element A pixel a Frame Buffer (kép puffer) egy elemének a tartalmát reprezentálja egy adott pozícióban (pl szín, mélység, és más tulajdonságok, amik az adott pozícióhoz vannak rendelve) A fragment a geometriai primitívnek egy pixel méretű darabja. Egy fragment rendelkezik a neki megfelelő pixel pozíciójával, mélység értékével, és interpolált paraméterek halmazával (szín, spekuláris szín, textúra koordináták) Úgy is gondolhatunk a fragment-re mint egy potenciális pixelre. Ha a fragment végigmegy a különböző raszterizálási teszteken, akkor a fragment frissíti a hozzá tartozó pixelt a Frame Buffer-ben. 26

  27. Fragment textúrázás, színezés • Miután a hardver egy geometriai primitívet raszterizált nulla vagy több fragment-re, • Interpolálja a paramétereit • Végrehatja rá a textúrázást és a matematikai műveleteket • És minden fragment-nek meghatározza a végső színét • Ebben a lépésben módosulhat a fragment mélység értéke • De törölhet is egy fragment-et, hogy elkerülje a Frame Buffer-ben a neki megfelelő pixel frissítését 27

  28. Raszter műveletek Ez a lépés közvetlenül a Frame Buffer frissítése előtt hajtódik végre Ezek a műveletek szabványos részei az OpenGL-nek és a Direct3D-nek Pixel ownership test: a fragment-nek megfelelő pixel a Frame Buffer-ben hozzánk tartozik-e Scissor test: a fragment egy megadott téglalapon belül van-e Alpha test: a fragment alpha értékét hasonlítja egy egy konstans értékhez Stencil test: a stencil buffer értékét hasonlítja egy referenciaértékhez Depth test: a fragment mélység értékét a mélységi puffer értékével veti össze Blending: a fragment RGBA értékét kombinálja a Frame Buffer adott pixelének RGBA értékével Dithering: elmossa a különböző színű felületek közötti eredetileg éles átmenetet Logic Op: egy logikai műveletet hajt végre a fragment és a Frame Buffer színe között 28

  29. A grafikus szerelőszalag A csúcspontok transzformálása és színezése Geometriai primitívek kialakítása Ezek „feltöltése” fragment-ekkel Az értékek interpolálása és felhasználása a textúrázáshoz és színezéshez 29

  30. A programozható grafikus szerelőszalag Jelenleg a domináns irányvonal a grafikus hardver tervezésekor a GPU minél nagyobb szintű programozhatóságának biztosítása 30

  31. Fragment árnyaló egység Az átmeneti regiszterek írhatók-olvashatók. Ezek használhatók a közbenső számítások elvégzésére. Ezután folyamatosan beolvassa és végrehajtja következő utasítást, amíg a program nem terminál. A fragmens attribútumainak betöltése a fragmens árnyaló egységbe (pl pozíció, textúra koordináták) Az utasítások több regiszterhez is hozzáférnek, amik vektorértékeket tartalmaznak (pozíció, normál, szín). A fragmens attribútum regiszterek csak olvashatóak. A fragmens árnyaló egységben korlátozott utasításkészlet áll rendelkezésünkre. Lehetőségünk van pl a vektorok komponensenkénti manipulálására, vektorműveletek végrehajtására (összeadás, szorzás, minimum, maximum kiválasztás). A kimeneti regiszterek csak írhatók. A program terminálásakor ezek fogják tartalmazni pl. a fragmens színét. 31

  32. Shader Model 4.0 • Geometry Shader • Stream Output • A GS kimenete a következő pass bemenete lehet • Egységesített shader utasításkészlet 32

  33. Geometry Shader • Geometriai primitíveken dolgozik (pont, vonal, vagy háromszög). • Tetszőleges (de korlátos) számú primitívet állít elő, melyeket egy stream bufferbe ír. • Az eredmény továbbhaladhat a pipeline-on (raszterizálás, fragment shader), vagy a streamet felhasználhatjuk pl. Vertex Bufferként egy újabb renderelési ciklusban (a streamet nem olvassuk vissza a GPU-ból). 33

  34. Fejlődés A játékok hatással vannak a grafikus hardverre, a hardver pedig a játékra… 34

  35. Vizuális hatások Visszaverődés Level of detail Füst Árnyalás Árnyékok 35

  36. Vizuális hatások Per-pixel lighting Multi textúrázás Light mapping Bump mapping 36

  37. Többmenetes képszintézis Egy képszintézis lépés több funkcionális programot (vizuális hatást) is tartalmazhat. 37

  38. Többmenetes képszintézis Minden egyes program (hatás) külön van kezelve, és ezeket összegezve áll elő a végső hatás. 38

  39. Mit tudnak a mai kártyák? 39

  40. Mit tudnak a mai kártyák? • Luna demohttp://www.nzone.com/object/nzone_luna_videos.html • Human Head • http://www.nzone.com/object/ nzone_humanhead_home. html • track one / fairlight (Assembly 2k6, demo)http://www.scene.org/file.php?file=/parties/2006/assembly06/demo/track_one_by_fairlight.mpg&fileinfo 40

  41. Vége 41

More Related