210 likes | 325 Views
Netezza – to pravé řešení pro Vaše náročné analytické potřeby Martin Pavlík (martin_pavlik@cz.ibm.com) 14 . Června 2011. Napříč odvětvími Retail Telekomunikace Digitální media Zdravotnictví Věda a výzkum Finanční instituce Veřejný sektor Energetika. Co Netezza dodává
E N D
Netezza – to pravé řešení pro Vaše náročné analytické potřeby Martin Pavlík (martin_pavlik@cz.ibm.com) 14. Června 2011
Napříč odvětvími Retail Telekomunikace Digitální media Zdravotnictví Věda a výzkum Finanční instituce Veřejný sektor Energetika Co Netezza dodává Vysoce výkonné appliance Řešení pro ukládání a dotazování nad PB dat Datové sklady a pokročilé analýzy Co je Netezza? Firma Špičková technologie pro oblast datových skladů Kde působí? Po celém světě Zejména však v severní Americe Filozofie Jednoduchost po všech stránkách Akvizice IBM 11.11.2010 Netezza se stává součástí portfolia produktů brandu Information Management Zaměstnanci500+ Zákazníci500+ Reference400+
Co Netezza dodává Vysoce výkonné appliance Řešení pro ukládání a dotazování se nad PB dat Datové sklady a pokročilé analýzy • Jednoduchost • Chytrost Co Netezza dodává Vysoce výkonné appliance Řešení pro ukládání a dotazování se nad PB dat Datové sklady a pokročilé analýzy • Rychlost • Škálovatelnost
Proč appliance? • Aby to bylo komplikované • Aby to bylo hooooodně drahé A co vlastně má efektivně fungovat? • Vyhodnocování analytických / ad-hoc dotazů • Aby to EFEKTIVNĚ FUNGOVALO
Co Netezza není? • Není OLTP databázovým serverem • Není vhodná jako db pod ERP, CRM, ... Kdy Netezza obvykle není rychlejší? • Když jsou konvenční technologie maximálně vyladěné • pro konkrétní dotazovací potřebu • Má co do činění s velmi malým objemem dat Kde Netezza fakticky nemá konkurenci? • Náročné • Analytické dotazy • Ad-hoc dotazy
OK. Musíme udělat řadu statistik,nastavitsprávně indexy a partitioning. 5 dní práce to spraví Potřeboval bych vyhodnotit závislost mezi vzděláním a velikosti bytu. IT Analytik
Hotovo. Můžete spustit Váš analytický dotaz. Paráda. Mockrát děkuji. Hned to zkusím. IT Analytik Po 5 dnech ...
Neeee !!! Tady se nedá pracovat ! Ale ale, to jsou k nám hosti. No, tak to máme dalších 5 dní práce Výborně. Vidím tady pěkné závislosti. Teď bych se na to potřeboval podívat ještě jinak IT Analytik Po 10 minutách ...
Potřeboval bych vyhodnotit závislost mezi vzděláním a velikosti bytu. IT Analytik
Výborně. Vidím tady pěkné závislosti. Teď bych se na to potřeboval podívat ještě jinak. S Netezzou můžu dotaz zadat hned. Odpověď bude za stejnou dobu IT Analytik IT se může věnovat něčemu jinému Po 12 minutách ...
Masivní paralelní architektura“Rozděl a panuj” • MPP architektura • Koncept “Shared Nothing” • Rozdělení práce na několik menších úloh • Velká úloha je rozdělena vertikálně do série menších úloh • Menší úlohy běží paralelně / naprosto nezávisle • Pro každou menší úlohu je přiděleno stejné množství fyzických zdrojů • Komunikace mezi jednotlivými úlohami je jen na začátku a konci • Přínosy • Obrovské úlohy jsou vykonány ve významně kratším čase • Maximální využitelnost zdrojů
ODBC 3.X JDBC Type 4 OLE-DB SQL/92 Client ETL Server DBA CLI Source Systems SOLARIS AIX 3rd PartyApps HP-UX TRU64 LINUX WINDOWS High Performance Loader Netezza TwinFin Appliance S-Blade 1 Processor & streaming DB logic SQL Compiler Query Plan Optimize Admin 2 S-Blade Execution Engine Processor & streaming DB logic S-Blade 3 Processor & streaming DB logic Ÿ Ÿ Ÿ High-PerformanceDatabase Engine Streaming joins, aggregations, sorts High-Speed Loader/Unloader 920 S-Blade Front End Processor & streaming DB logic Massively Parallel Intelligent Storage Network Fabric SMP Host
Client ETL Server DBA CLI Source Systems SOLARIS AIX 3rd PartyApps HP-UX TRU64 LINUX WINDOWS High Performance Loader Netezza TwinFin Appliance S-Blade 1 Snippets Processor & streaming DB logic SQL Compiler Query Plan Optimize Admin 3 2 1 1 1 1 1 2 2 2 2 3 3 3 3 1 2 3 SQL SQL 2 S-Blade Execution Engine Processor & streaming DB logic S-Blade 3 Processor & streaming DB logic Ÿ Ÿ Ÿ High-PerformanceDatabase Engine Streaming joins, aggregations, sorts High-Speed Loader/Unloader 920 S-Blade Front End Processor & streaming DB logic Massively Parallel Intelligent Storage Network Fabric SMP Host
Zpracování toku dat jednotkou S-Blade DatováCache Jádro (Core) FPGA Jádro CPU Selekce, Autorizace Komplexní ∑ Joiny, Aggr, atd. Dekomprese dat Projekce Select sex, age, count(*) From MultiBillionRowTable Where BirthDate < ’01/01/1967’ And PostCode like ’SW%’ Group by sex, age; • Každý S-Blade obsahuje 8 n-tic s vlastním: • Diskem • Datovou cache • Jádrem FPGA jednotky • Jádrem CPU
Client ETL Server DBA CLI Source Systems SOLARIS AIX 3rd PartyApps HP-UX TRU64 LINUX WINDOWS High Performance Loader Asymmetric Massively Parallel Processing™ Netezza TwinFin Appliance Consolidate S-Blade 1 1 2 3 1 1 1 2 2 2 3 3 3 Processor & streaming DB logic SQL Compiler Query Plan Optimize Admin ODBC 3.X JDBC Type 4 OLE-DB SQL/92 2 S-Blade Execution Engine Processor & streaming DB logic S-Blade 3 Processor & streaming DB logic Ÿ Ÿ Ÿ High-PerformanceDatabase Engine Streaming joins, aggregations, sorts, etc. High-Speed Loader/Unloader 920 S-Blade Front End Processor & streaming DB logic Massively Parallel Intelligent Storage Network Fabric SMP Host
The NetezzaTwinFin™ Appliance Každý disk je rozdělen na 3 oblasti: Uživatelská data „Swap“ „Mirror“ Disky SQL Compiler Query Plan Optimalizátor Administrace SMP Servery Jednotky S-Blade™ (s databázovým akcelerátorem FPGA)
Základní přínosy řešení NETEZZA Data mart to enterprise warehouses Price/PerformanceLeader Low TCO,fast time to value Deliver analyticsto the masses
Konkurenční technologie mají obrovské množství parametrů a databázových objektů, které pomáhají výrazně zlepšovat výkonnost systémů. Musejí být tedy lepší. Netezza má celou řadu z nich taky, ale jejich hodnoty si spravuje sama a nezatěžuje tím uživatele. Používá tedy vlastně jakési implicitní hodnoty parametrů Tak takhle nějak jsem se na to tvářil poprvé, podruhé, ... a ještě mockrát, ... Jenže v případě Netezzy platí: Výkonnost systému s implicitními parametry je dostatečná • Těším se na Vaše dotazy • Martin Pavlík • +420 731 435 691 • martin_pavlik@cz.ibm.com