1 / 24

Self Organizing Tree Algorithm

Self Organizing Tree Algorithm. Bastian Jarzembinski Enrico Bade Tobias Aagard. Gliederung. Theorie Hintergrund Lernverfahren Experimente Attributskalierung Wachstumssteuerung Bewertung Vergleich mit anderen Verfahren Einsatz. Theorie. Hintergrund Lernverfahren.

maxine
Download Presentation

Self Organizing Tree Algorithm

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. SelfOrganizingTreeAlgorithm Bastian JarzembinskiEnrico BadeTobias Aagard

  2. Gliederung • Theorie • Hintergrund • Lernverfahren • Experimente • Attributskalierung • Wachstumssteuerung • Bewertung • Vergleich mit anderen Verfahren • Einsatz

  3. Theorie Hintergrund Lernverfahren

  4. Theorie Hintergrund • Bioinformatik • Microarrays • Ähnliches Aussehen = Ähnliche Funktion?

  5. Theorie Lernverfahren n-dimensionale Vektoren mit metrischen Attributen Knoten bilden Clusterzentren Knoten mit größter Varianz wird geteilt

  6. Theorie Lernverfahren Inputvektor Repräsentant Distanz Lernrate Fehler

  7. Theorie Lernverfahren Wurzel Blatt Zuordnung

  8. Theorie Lernverfahren Variability /Spannweite Ressource /mittlere Abweichung

  9. Theorie Lernverfahren

  10. Theorie Lernverfahren ?

  11. Theorie Lernverfahren Ancestor / Vorfahre Sister / Schwester

  12. Experimente Attributskalierung Fallbeispiel

  13. Experimente Attributskalierung • Parameter in KNIME können das zyklisches Wachsen des Treesbeeinflussen: • Lerningrates • min. variablity und min. ressourcenur bei „Usevariablity“ berücksichtigt • min. Error • Distance: Euclid. Oder Cosinus • Clustern ohne Zielattribut

  14. Experimente Fallbeispiel • IRIS-Datenset • 4 Attribute, metrisch skaliert • Zielattribut mit 3 Klassen • LIVE DEMO • Quantitativer Vergleich zu Klassifikationsalgorithmen • i.d.F. k-Means • Keine signifikanten Unterschiede • Anwendung des SOTA auf Daten mit und ohne Zielattribut • Keine signifikanten Unterschiede

  15. Bewertung Vergleich mit anderen Verfahren Einsatz

  16. Bewertung Vergleich mit anderen Verfahren • Eigenschaften k-Means • Wenige Iterationen • Einfaches Verfahren • Anfällig für Rauschen / Ausreißer • Ergebnis von initialen Zerlegung abhängig

  17. Bewertung Vergleich mit anderen Verfahren Eigenschaften SOTA Annähernd lineares Laufzeitverhalten Punkt für k-Means Resistent Unabhängig • Eigenschaften k-Means • Wenige Iterationen • Einfaches Verfahren • Anfällig für Rauschen / Ausreißer • Ergebnis von initialen Zerlegung abhängig

  18. Bewertung Vergleich mit anderen Verfahren • Hierarchisches Clustern • Divisiv oder agglomerativ • Knoten sind einfache Darstellung der Teilmengen • Zwischenschritte sind irreversibel

  19. Bewertung Vergleich mit anderen Verfahren Eigenschaften SOTA Divisives Verfahren Knoten sind Mittelwerte sämtlicher folgenden Knoten Zuordnung wird ständig angepasst • Hierarchisches Clustern • Divisiv oder agglomerativ • Knoten sind einfache Darstellung der Teilmengen • Zwischenschritte sind irreversibel

  20. Bewertung Vergleich mit anderen Verfahren • SelfOrganizingMap (KohonenMap) • Ähnliches Verfahren, aber andere Topologie • SOM: vorgegebenes Netz, wird bestmöglich an den Eingaberaum angepasst • SOTA: wächst dynamisch, um den Eingaberaum bestmöglich darzustellen; Hierarchie vorhanden

  21. Bewertung Einsatz • Methodisch vielversprechend • Erfolge nicht reproduzierbar • Mögliche Ursachen • Ungeeignete Daten • Ungeeignete Parameterjustierung • Mangelndes (Aufgaben-)Verständnis • Weitere Untersuchung • Hintergrundwissen Bioinformatik • Microarray-Datensätze wählen

  22. Fin

  23. Theorie Hintergrund

  24. Theorie Hintergrund

More Related