1 / 15

System analizy skupień w danych liczbowych

System analizy skupień w danych liczbowych. Promotor. Promotor: dr hab. inż. Jerzy M. Stefanowski Opiekun laboratorium: mgr inż. Marek Kubiak. Menadżerowie. Studenci TWO nadzorujący projekt: inż. Grzegorz Gębura inż. Szymon Kupiński inż. Robert Nowak inż. Jacek Serafiński.

Download Presentation

System analizy skupień w danych liczbowych

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. System analizy skupień w danych liczbowych

  2. Promotor • Promotor: dr hab. inż. Jerzy M. Stefanowski • Opiekun laboratorium: mgr inż. Marek Kubiak

  3. Menadżerowie • Studenci TWO nadzorujący projekt: inż. Grzegorz Gębura inż. Szymon Kupiński inż. Robert Nowak inż. Jacek Serafiński

  4. Programiści • Studenci piszący pracę inżynierską: Michał Rej Błażej Sołtowski Jacek Winiecki Robert Ziembicki

  5. Cel projektu • Celem projektu jest stworzenie systemu informatycznego zawierającego implementacje wybranych algorytmów grupowania danych (odpowiednik terminu analiza skupień, cluster analysis). • System ma być przeznaczony jako narzędzie dostępne dla studentów Politechniki Poznańskiej i innych uczelni oraz potencjalnie zainteresowanych pracowników naukowych. Ma umożliwiać przeprowadzanie analizy danych z różnych dziedzin, np. medycyna, biologia, ekonomia i zarządzanie.

  6. Główne założenia • Implementacja podstawowych algorytmów analizy skupień oraz ich wizualizacja: • przedziałowych, takich jak k-średnich • hierarchicznych (wersja aglomeracyjna AHC) • Różne rodzaje raportowania wyników. • Różne typy wczytywanych plików: • XML, CSV, ARFF

  7. Podział zadań Michał Rej -implementacja i wizualizacja algorytmu AHC, kreator aplikacji Błażej Sołtowski - implementacja algorytmu AHC, format ARFF Jacek Winiecki - implementacja algorytmu K-means, operacje na plikach Robert Ziembicki - implementacja i wizualizacja algorytmu K-means, raportowanie wyników

  8. Wykorzystane technologie • Język • Java (JRE 5.0) • Ważniejsze wykorzystane biblioteki: • Pakiet narzędziowy SWING • JAXB (Java Architecture for XML Binding ) • TMX (Translation Memory eXchange) - i18n • JFreeReport • JUnit (biblioteka + narzędzie)

  9. Wykorzystane technologie • Środowisko programistyczne • Eclipse • Narzędzia • Subversion (SVN) • Maven 2, Dotproject • Log4j • Zarządzanie jakością kodu • FindBugs • PMD • Checkstyle

  10. Architektura

  11. Osiągnięcia • Szczegółowy diagram UML klas obejmujących obliczenia algorytmów • Wczytywanie danych z plików - XML, CSV, ARFF • Selekcja atrybutów (standaryzacja, normalizacja) • Grupowanie danych za pomocą algorytmów AHC i K-means – przydział do skupień

  12. Osiągnięcia • Wizualizacja algorytmu AHC w postaci drzewa • Wizualizacja algorytmu K-means w postaci wykresu 2D • Raportowanie wyników w postaci tabelarycznej • Zapis wyników do pliku • Liczne testy JUnitowe

  13. Do zrobienia • Dopracowanie jakości kodu • Dopracowanie raportowania • Dokumentacja użytkownika • Obronienie pracy inżynierskiej

  14. Porażki • „O porażkach się nie mówi.” • Nie udało się zaimplementować sesji

  15. Zapraszamy na prezentację programu

More Related