210 likes | 311 Views
MetaCentrum – gridy pod mrakem. Jiří Sitera , Miroslav Ruda, Luděk Matyska http://www.metacentrum.cz/. MetaCentrum. Česká akademická infrastruktura pro náročné výpočty Od roku 1996, původně MU, UK, ZČU Dnes součást e-Infrastruktury CESNET Národní gridová infrastruktura (NGI)
E N D
MetaCentrum – gridy pod mrakem Jiří Sitera, Miroslav Ruda, Luděk Matyska http://www.metacentrum.cz/ MetaCentrum - gridy pod mrakem
MetaCentrum • Česká akademická infrastruktura pro náročné výpočty • Od roku 1996, původně MU, UK, ZČU • Dnes součást e-Infrastruktury CESNET • Národní gridová infrastruktura (NGI) • Propojení kapacit různých projektů/univerzit/organizací napříč ČR • Propojení ČR do mezinárodních aktivit (EGI – European Grid Infrastructure) www.egi.eu • Cíl: zvýšení konkurenceschopnosti VaV týmů MetaCentrum - gridy pod mrakem
MetaCentrum – dostupné zdroje • 8500 CPU jader, HD uzly (2x4-8 jader) i SMP stroje (32-80 jader) • 550 TB datové prostory (plus řádově PB datová úložiště CESNET) • Infiniband • GPGPU Tesla • Až 1,5 TB v uzlu • Rychlý scratch disk MetaCentrum - gridy pod mrakem
Grid – co to vlastně je? MetaCentrum - gridy pod mrakem
Grid - první pohled • Dávkové zpracování úloh • Zadání úlohy (odkaz na data, řídící skript, případný paralelismus) • Čekání ve frontě, hledání odpovídajících zdrojů (plánovač) • Přidělení zdrojů, spuštění v definovaném prostředí (OS, knihovny, aplikace, autentizace, přístup k datům, atd.) • Ukončení výpočtu, uvolnění zdrojů, oznámení uživateli Fronta Plánovač Soubor zdrojů Job Job Job Job Job MetaCentrum - gridy pod mrakem
Grid jako koncepce MetaCentra • Propojování zdrojů (analogie power grid) • Výpočetní uzly, diskové systémy, experimentální přístroje • Zdroje různých vlastníků, pořízené za různých podmínek • Přelévání/slévání kapacit dle daných pravidel, organizace výpočetních prostředí do vyššího celku • HPC (high performance computing) prostředí • Orientace na výkon, náročné a nadstandardní úlohy • Software (180 instalovaných SW balíků) MetaCentrum - gridy pod mrakem
Grid a jeho flexibilita • MetaCentrum propojuje • Propojený systém zdrojů různých vlastníků • Zdroje dostupné různými způsoby, vlastně různé gridy • Virtuální organizace (VO) • Nástroj pro zvládnutí různorodosti, princip „rozděl a panuj“ • Delegace pravomocí, uvnitř VO mají správci vysokou autonomii • Podpora různých potřeb komunit a týmů, např. možnost instalovat vlastní aplikační SW, dedikovat HW, atd. • Integrovaná infastruktura • Společná národní AAI (uživatelé, jejich identity) • Úzká integrace s datovými úložišti MetaCentrum - gridy pod mrakem
A kde je ten cloud? MetaCentrum - gridy pod mrakem
Cloudové rozhraní MetaCentra • Technická podstata – uživatelská virtualizace • Namísto jobů (programů) uživatel zadá celý virtuální stroj (včetně operačního systému) • Koncepčně stejný přístup jako k jobům Fronta Plánovač Soubor zdrojů Job VM Job VM VM MetaCentrum - gridy pod mrakem
HPC cloud • Zobecnění a větší flexibilita proti gridu • Výpočet lze zadat včetně kompletního prostředí pro běh • Uživatel dostane práva superuživatele (systémový SW, knihovny, OS, vše v jeho kompetenci) • Snížení vstupního prahu pro týmy (existující vlastní prostředí, vlastní správce, speciální požadavky) • HPC cloud • Stejný přístup jako u výpočetních úloh – plánování, přidělení, výpočet, ukončení • Pro náročné výpočty, nikoli pro provoz permanentních služeb MetaCentrum - gridy pod mrakem
Virtuální cluster • Uživatel požádá o celý cluster • Obdoba paralelního výpočtu • Vlastní plně dedikovaný cluster ve své správě • Síť jako nový zdroj (resource) • Virtuální síť (L2 segment, VLAN) jako nový zdroj dostupný uživatelům (přiděluje plánovač podobně jako třeba CPU) • Díky schopnostem sítě CESNET může být rozprostřena přes ČR • Důsledky: stroje mohou být uživatelské včetně uživatelské IP adresy, privátní VLAN, celá síť uzlů různých rolí, atd. Dedikovaná VLAN VM VM VM VM MetaCentrum - gridy pod mrakem
Use case: nové možnosti • Potřebuji pro aplikaci jiný OS (typicky MS Windows) • Vlastní vývoj, komerční aplikace, složitá nebo nemožná portace • Žádné podmínky ze strany MetaCentra (autentizace, autorizace, dávkový systém, bezpečné protokoly a SW, atd.) • Vlastní nástroj pro řízení zpracování (workload manager) • Vlastní vývoj, BOINC, jednoduché skripty na míru • Příklady: průběžné testování vyvíjeného SW, genetické programování • Buduji celé prostředí • Příklady: testovací polygon pro bezpečnostní výzkum sítě, simulace distribuovaného systému (SmartGrids – sběr dat a řízení v energetice) MetaCentrum - gridy pod mrakem
Use case: rozšíření lokálního clusteru • Postavíme virtuální cluster, který • Má VLAN napojenu na místní síť uživatele (L2 segment, kde je fyzický cluster) • Jeho uzly jsou kopie uzlů fyzického clusteru (obrazy) • Uživatel vidí známé prostředí rozšířené o nové uzly • S MetaCentrem interaguje jen správce lokálního clusteru • Prostředí je stejné do všech detailů, nové uzly jsou nerozlišitelné od fyzických (dávkový systém, autentizace, SW, konfigurace) Domácí síť uživatele 7 8 1 2 3 4 6 5 Fyzická část Virtuální část MetaCentrum - gridy pod mrakem
Use case: nafukovací služby • Příklad: nafukovací databáze • Poskytuje interface: ulož data, vyhledej • Distribuovaná na několik uzlů (data, indexy, paralelizace dotazů) • Umí automaticky měnit velikost (počet uzlů) • Interní servisní proces řídí replikaci dat, tvorbu indexů, optimalizaci dotazů • Přidáváním/ubíráním uzlů se mění „jen“ kapacita, výkon • Možný scénář: databáze běžící „v malém“ u uživatele se v případě potřeby experimentu „nafoukne“ do MetaCentra • Příklady: ElasticSearch, MongoDB – viz následující přednáška MetaCentrum - gridy pod mrakem
Naše mezinárodní spolupráce v cloudech • Federated clouds • V rámci EGI (Evropské gridové infrastruktury) • Mezinárodní kooperující skupina cloudů • Propojení autentizace, bezpečnosti, accountingu, monitoringu, informačních služeb • Společná knihovna připravených obrazů virtuálních strojů • Standardy pro cloudové rozhraní • OCCI Open Cloud Computing Interface • CDMI Cloud Data Management Interface • Účast MetaCentra na vývoji a evropském testbedu MetaCentrum - gridy pod mrakem
Reklamnívložka MetaCentrum - gridy pod mrakem
MetaCentrum je tu pro vás • Pro výzkumné a výukové účely akademických institucí ČR, od jednotlivých studentů až po velké týmy • „Platí“ se kvalitou a úspěšností vlastní práce • Koncept: cílem infrastruktury je, aby její uživatelé měli kvalitní výsledky • Publikace s poděkováním, případně jiné reference na VaV výsledky vzniklé díky MetaCentru • Lepší výsledky = lepší priorita při přidělování zdrojů (motivační systém, průběžný systém zadávání výsledků a nastavování priorit) • Počítat můžete začít ihned, na výsledky se ptáme až za rok MetaCentrum - gridy pod mrakem
MetaCentrum je partner • Naším cílem je e-Infrastrukturou řešit potřeby VaV týmů • Překonání dosavadních limitů – aplikací špičkové ICT infrastruktury • Nové možnosti – tam, kde dosud nebylo ICT třeba, nové přístroje, nové objemy dat, nové zpracování existujících dat • „Ambicí je nejen poskytovat služby, ale i posunout schopnost vědeckých týmů využívat nové technologie a možnosti infrastruktury.“ • Konkrétní možnosti • Semináře, cílené akce pro konkrétní skupiny • Návrh a optimalizace algoritmů, modelů, nástrojů a prostředí • Společné projekty – spolupráce informatiků a různých vědeckých oborů MetaCentrum - gridy pod mrakem
Národní akademická licence Matlab • Možnost získat skutečně národní plovoucí licenci • Záměr je v souladu s EUNIS, Klubem ředitelů, CESNETem • Máme podle našeho názoru přijatelnou nabídku Mathworks • Jsou k dispozici finanční zdroje (VaVpI projekt eIGeR CESNET) • Podle zkušeností z minulosti se jedná o výjimečnou příležitost • Záměr rozvoje MetaCentra • Poskytovat nákladný SW jako nový zdroj/službu dostupnou samostatně • Matlab je dobrý kandidát, nejužívanější placený SW v MetaCentru (350 licencí, 150 simulink, 700 toolboxy) • Provoz nové služby nejméně do roku 2020, k úspoře dojde na úrovni institucí/projektů, nebudou potřebovat vlastní licence MetaCentrum - gridy pod mrakem
Matlab – co je třeba k úspěchu • Podpora institucí/týmů/projektů • Deklarace zájmu, indikace dostatečného objemu uživatelů • Do 15.6.2013 reakce institucí (deklarace zájmu, kontaktní osoba) na dopis ředitele CESNETu rektorům • Sestavení vhodné struktury licence • Podklady do 30.6. https://www.surveymonkey.com/s/96THXBM • Licence je strukturována (počet plovoucích licencí mezi toolboxy) • Omezení ze strany Mathworks – min. 500 licencí na toolbox • Během provozu nelze národní licenci jednoduše měnit (minimální nákup opět 500 licencí); současné licence ale zůstanou platné a půjde dokupovat individuálně MetaCentrum - gridy pod mrakem
Shrnutí • Cloudové rozhraní MetaCentra • Flexibilita, kontrola prostředí uživatelem, speciální potřeby • HPC Cloud – místo výpočtu celý obraz stroje, jinak jako grid • Virtuální výpočetní cluster • Komplexní abstrakce nad zdroji „v cloudu“ • Nový zdroj dostupný uživatelům - síť • Cíl: zlepšení pro uživatele • Nové možnosti • Odbourání některých bariér plného využití MetaCentra Děkuji za pozornost MetaCentrum - gridy pod mrakem