290 likes | 450 Views
Využitie dolovania dát v riadení výrobných procesov. Školiteľ: Doc. Ing. Peter Schreiber, CSc. Doktorand: Ing. Michal Kebísek. Obsah prezentácie. p roces KDD , dolovanie dát, metódy dolovania dát, techniky dolovania dát, problémy implementácie dolovania dát,
E N D
Využitie dolovania dát v riadení výrobných procesov Školiteľ: Doc. Ing. Peter Schreiber, CSc. Doktorand: Ing. Michal Kebísek
Obsah prezentácie • proces KDD, • dolovanie dát, • metódy dolovania dát, • techniky dolovania dát, • problémy implementácie dolovania dát, • využitie dolovania dát v praxi, • tézy dizertačnej práce
Definícia KDD Netriviálny proces identifikácie platných, nových, doteraz neznámych, potenciálne použiteľných a dobre pochopiteľných znalostí v dátach. Fayyad, Piatetski-Shapiro, Smyth 1996
zber a výber dát čistenie a skúmanie dát transformácia dát definícia problému interpretácia a vyhodnotenie dolovanie dát Proces KDD
Dolovanie dát Jedna z fáz procesu KDD, v rámci ktorej sa pomocou rôznych techníka pri daných obmedzeniach hľadajú skrytévzory alebo modely v dátach.
Proces dolovania dát • preskúmanie dát, • nájdenie vzorov alebo súvislostí, • overenie zostaveného modelu.
Ciele procesu dolovania dát • verifikácia, • explorácia • deskripcia, • predikcia.
Metódy dolovania dát Podľa vyhľadávanej znalosti rozdeľujeme metódy na: • sumarizáciu a generalizáciu, • hľadanie závislostí, • klasifikáciu a zhlukovanie, • štatistickú analýzu (predovšetkým regresiu), • detekcia zmien a odchýlok, • vyhľadávanie podobností v časových, resp. časopriestorových databázach …
Metódy dolovania dát • klasifikácia, • regresia, • zhlukovanie (segmentácia), • sumarizácia (a generalizácia), • modelovanie závislostí (asociácie), • detekcia zmien a odchýlok, • metódy založené na príkladoch, • predpovedanie podľa časových radov, • symbolické metódy, • objavovanie postupností, • vyhľadávanie podobností…
Metódy dolovania dát Vzorový príklad
Metódy dolovania dát Jednoduchá lineárna klasifikácia
Metódy dolovania dát Jednoduchá lineárna regresia
Metódy dolovania dát Zhlukovanie (Clustering, Segmentácia)
Metódy dolovania dát Symbolické metódy (prahové rozdelenie)
Metódy dolovania dát Subsymbolické metódy (nelineárny klasifikátor)
Metódy dolovania dát Metódy založené na príkladoch
Metódy dolovania dát Vyhľadávanie podobností
Techniky dolovania dát • rozhodovacie stromy, • asociačné pravidlá, • neurónové siete, • genetické algoritmy, • zhluková analýza, • regresná analýza ...
Porovnanie techník dolovania dát Dovrtěl, 1999
Požiadavky kladené na DM • možnosť práce s rôznymi typmi dát, • efektívnosť a škálovateľnosť dolovacích algoritmov, • zrozumiteľná prezentácia výsledkov, • interaktívnosť dolovania na rôznych úrovniach abstrakcie, • dolovanie z rôznych zdrojov dát, • ochrana súkromia a utajenia dát.
Problémy implementácie v praxi (1) • zväčšovanie databáz, • veľkorozmernosť, • overfitting, • stanovenie štatistickej významnosti, • zrozumiteľnosť a jednoduchá pochopiteľnosť získaných znalostí,
Problémy implementácie v praxi (2) • chýbajúce alebo zašumené dáta, • komplexné vzťahy medzi položkami, • premenlivosť dát a znalostí, • interakcia užívateľa a predchádzajúcich znalostí, • interakcia s ostatnými systémami.
Využitie DM v praxi (1) • segmentácia zákazníkov pre cielené marketingové kampane, • zisťovanie podvodov v bankovníctve a poistovníctve, • analýzy nákupných košíkov, • zisťovanie náchylnosti zákazníkov na odchod ku konkurencii (telekomunikácie),
Využitie DM v praxi (2) • predpovedanie chovania zákazníkov, • diagnostický nástroj v medicíne, • overovanie pravosti podpisov, • vyhodnocovanie zachytených radarových kontaktov (armáda), • klasifikácia hviezd v astronómii ...
Tézy dizertačnej práce (1) • výber reálnej databázy priemyselného podniku v Trnavskom resp. Bratislavskom regióne, • oboznámenie sa s výrobným procesom vybraného priemyselného podniku, s jeho databázou a so spôsobom ukladania dát do databázy, • vytipovanie problému vhodného na riešenie pomocou dolovania dát, • v prípade potreby úprava dát uložených v databáze pre efektívnejšie využívanie v procese dolovania dát,
Tézy dizertačnej práce (2) • výber konkrétnych metód dolovania dát pre potreby riadenia na úrovni výrobného procesu, • aplikácia vybraných metód, • s ohľadom na získané výsledky upravovanie použitých metód s dôrazom na špecifické vlastnosti vybranej aplikačnej oblasti, • zo získaných znalostí vytvorenie bázy poznatkov využiteľných ako systém odporúčaní pre riadenie konkrétneho výrobného procesu.
Ďakujem za pozornosť! Otázky a odpovede