1 / 25

SAILKAPEN ZUHAITZAK GARATZEKO TRESNA

SAILKAPEN ZUHAITZAK GARATZEKO TRESNA. Egilea: Aritz Rabadan Amas Zuzendaria: Basilio Sierra Araujo Karrera Bukaerako Proiektua, Ekainak 2001. E DUKIAK. SARRERA GAINBEGIRATUTAKO SAILKAPENA SAILKAPEN ZUHAITZAK EGINDAKO APLIKAZIOA ONDORIOAK. SARRERA. KZAA Sailak proposatutako proiektua

noreen
Download Presentation

SAILKAPEN ZUHAITZAK GARATZEKO TRESNA

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. SAILKAPEN ZUHAITZAK GARATZEKO TRESNA Egilea: Aritz Rabadan Amas Zuzendaria: Basilio Sierra Araujo Karrera Bukaerako Proiektua, Ekainak 2001

  2. EDUKIAK • SARRERA • GAINBEGIRATUTAKO SAILKAPENA • SAILKAPEN ZUHAITZAK • EGINDAKO APLIKAZIOA • ONDORIOAK

  3. SARRERA • KZAA Sailak proposatutako proiektua • HELBURUAK • Tresna bisual bat garatzea • Sailkapen zuhaitzak eraiki, bisualizatu, inprimatu eta testeatzeko • Erabilterraza izatea • Dozentzian erabilgarria izatea • Euskaraz egindako tresna izatea

  4. GAINBEGIRATUTAKO SAILKAPENA • Patroien ezagutzari lotutako familia da • Helburua: datu multzo batetik “eredu” bat eraikitzea, kasu berriak sailkatzeko gai izango dena.

  5. DATU MULTZOAK • ENTRENAMENDUKO DATU-BASEA: Eredua eraikitzeko erabiltzen den datu multzoa • TESTEOKO DATU-BASEA:Eraikitako eredua probatzeko balio duen datu multzoa

  6. SAILKATZAILE MOTAK • SAILKAPEN ZUHAITZAK • K-NN (k auzokide hurbilenak) • NAIVE-BAYES

  7. SAILKATZAILEEN EGOKITASUNA • ASMATZE-TASA:Ereduak kasuak esleitzean egiten dituen asmatzeak • AZKARTASUNA:Kasu berri bat sailkatzeko behar den denbora • SINPLETASUNA:Ereduaren egituraren konplexutasuna neurtzeko

  8. BALIDAZIOA • Hold-Out • Leave One Out • Boostrapping • X-Fold Crossvalidation

  9. SAILKAPEN ZUHAITZAK • Aukeratzeko arrazoiak: • Edozein domeinutan erabilgarria • Errepresentazio sinplea • Eredua ez da aldatzen ikasketaren ordenaren arabera • Batez ere komenigarriak: • Aldagai binarioekin • Soinua duten datu multzoekin

  10. DATUEN EGITURA • Atributu motak: • Tarte atributuak • Atributu ordinalak • Atributu nominalak • Arazoak • Balio ezezagunak • Soinua

  11. ZUHAITZEN EGITURA • Osagaiak: • Nodoak • Adarrak • Hostoak • Motak: • Dikotomikoak/Politomikoak • Monotetiko/Politetikoak X <1 >=1 Bai Ez

  12. ZUHAITZEN ERAIKUNTZA • Top Down Induction of Decision Trees (T.D.I.D.T) • Algoritmoak: ID3, C4.5 • Datuak zatitzen joaten da • Nodo bakoitzean zein atributu aukeratuko den hautatu behar da • Hostoa edo nodoa noiz eraiki behar den erabaki

  13. ATRIBUTUAREN AUKERAKETA • Quinlan-en neurria (Gain) • Chi-square • G estatistikoa • Probabilitateak • Gini • Gain Ratio

  14. OVERFITTING • Arazoa: Eraikitako zuhaitza entrenamenduko multzoari gehiegi egokitzen zaio. • Irtenbidea: Inausketa erabili • Inausketa • Aurreinausketa

  15. TESTEAKETA • Potentzia • Sinpletasuna • Ulergarritasuna

  16. APLIKAZIOA • Visual C++ 6.0 erabiliz garatu da • Arrazoiak: • Ingurune bisuala • C programazio lengoaia • Objektuetara zuzendua • Liburutegi asko

  17. ENTRENAMENDUKO DATU-BASEA • Diskretuak: Aldagai guztiek balio diskretuez osatuta daudenean • Jarraiak: Aldagai batek balio jarraiez osatuta dagoenean

  18. DISKRETIZAZIOA • Datu jarraiak -> Datu diskretuak • Diskretizatzeko metodoa • Tarte kopurua definitu • Datu kopuruaren arabera mugak finkatu • Tarte bakoitzari balio diskretu bat esleitu • Datuen balio jarraiak dagokien balio diskretuez ordezkatu

  19. AUKERAK • Sailkapen zuhaitza eraiki eta ikusi • Zuhaitza testeatu • Kasu konkretu baten ibilbidea ikusi • Datu jarraiak zein diskretuak maneiatzeko gai izatea • Emaitzak inprimatu eta gordetzeko aukera izatea

  20. ZUHAITZA MARRAZTU • 2 dimentsioetan • Zuhaitzean zehar mugitzeko Scroll-a • 3 Zoom ezberdin • Marrazteko metodo berezia • Nodoak eta hostoak ez dira gainjartzen • Edozein nodo kopuruarentzat baliogarria

  21. ZUHAITZAREN TESTEAKETA • Testeatzeko Datu-Basea kargatu • Ereduaren testeaketa egin • Emaitzak pantailaratu • Aldagaien informazioa • Asmatze-tasa • Missclassification Matrix • Kasu bakoitzari esleitutakoa

  22. PANTAILAK INPRIMATU • Edozein pantaila inprimatzeko aukera: • Zuhaitza • Testeaketaren emaitzak • Kasu konkretuaren ibilbidea • Diskretizazio tarteak • Aukerak

  23. PROGRAMAREN ITXURA • Windows programen itxura • Instalatu/Desinstalatzeko aukera • Guztiz bisuala • Dozentzian erabiltzeko egokia

  24. ONDORIOAK • Sailkapen zuhaitzak maneiatzeko tresna egokia lortu da • Erabilterraza eta atsegina • Emaitzak gordetzeko eta inprimatzeko aukera • Programa hedatzeko erraza • Euskaraz egina

  25. AURRERA BEGIRA • On line laguntza • Aukera gehiago • Algoritmo ezberdinak • Atributuak aukeratzeko metodo ezberdinak • Zuhaitzen marrazkiak gordetzeko formatu bat bilatzea

More Related