Inteligencja obliczeniowa regu y logiczne i ich stosowanie
This presentation is the property of its rightful owner.
Sponsored Links
1 / 17

Inteligencja Obliczeniowa Reguły logiczne i ich stosowanie. PowerPoint PPT Presentation


  • 79 Views
  • Uploaded on
  • Presentation posted in: General

Inteligencja Obliczeniowa Reguły logiczne i ich stosowanie. . Wykład 22 Włodzisław Duch Uniwersytet Mikołaja Kopernika. Neuro-fuzzy Feature Space Mapping - motywacje Funkcje transferu. Co było. Stosowanie reguł: niepewność pomiaru. Dokładność - prostota reguł.

Download Presentation

Inteligencja Obliczeniowa Reguły logiczne i ich stosowanie.

An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -

Presentation Transcript


Inteligencja obliczeniowa regu y logiczne i ich stosowanie

Inteligencja ObliczeniowaReguły logiczne i ich stosowanie.

Wykład 22

Włodzisław Duch

Uniwersytet Mikołaja Kopernika


Co by o

Neuro-fuzzy

Feature Space Mapping - motywacje

Funkcje transferu

Co było


Co b dzie

Stosowanie reguł: niepewność pomiaru.

Dokładność - prostota reguł.

Odrzucanie i stopień zaufania do reguł.

Od danych do systemu ekspertowego.

Co będzie


Stosowanie regu

Stosowanie reguł

Dane: obarczone nieznanym błędem; zakładamy Gaussowski rozkład:

x - liczba rozmyta, z Gaussowską funkcją przynależności.

Zestaw reguł logicznych R zastosowany do liczb rozmytych: jeśli wykonać symulacje Monte Carlo da p(Ci|X).

Analityczna ocena p(C|X) oparta jest na f. kumulującej:

dokładność przybliżenia f. błędu logistyczną < 0.02


Rozmywanie regu

Rozmywanie reguł

Reguła Ra(x) = {x>a} spełniona jest przez Gx z prawd.

F. błędu jest przybliżoną f. logistyczną; odpowiada to założeniu rozkładu błędu typu s(x)(1- s(x)), dla s2=1.7 przybliża f. Gaussa z dokładnością <3.5%

Różnica dwóch sigmoid, f. przynależności typu miękkiego trapezoidu.

Wniosek: logika rozmyta z f. przynależności s(x) -s(x-b) jest równoważna klasycznej przy założeniu Gaussowskich niepewności rozkładu.


Optymalizacja regu

Optymalizacja reguł

Fuzzy: duże pola recepcyjne, ocena „z grubsza”.

Gx - niepewność pomiaru, małe pola recepcyjne.

Minimalizacja liczby błędów dla klasyfikatora regułowego: trudna, metody niegradientowe, wolno zbieżne.

Minimalizacja z uwzględnieniem niepewności:

Optymalizacja gradientowa, działa nawet dla >1000 parametrów (opisujących kształt i położenie przedziałów dla przesłanek).

Najprościej: wspólny parametr sx dla grupy cech.

Możliwe inne funkcje błędu.


Zalety

Zalety

1) Zbiór ciągłych prawd. zamiast 0,1 ocen;

2) Niesklasyfikowane wektory mają niezerowe prawd.

3) Dyspersje sx mogą być parametrami adaptacyjnymi.

Obliczanie prawdopodobieństw dla wielu przesłanek.

Dla koniunkcji przesłanek R=r1(x1) r2 (x2)  .. rk (xk) jeśli ri są niezależne (ortogonalne) wystarczy iloczyn p(ri).Jeśli reguły się nakrywają nie można dodawać p bo policzymy wielokrotnie to samo. Odtworzenie symulacji Monte Carlo wymaga: (RC - reguły dla klasy C)


Odrzucanie

Odrzucanie

Prostota reguł vs. dokładność.

Zaufanie do reguł vs. wektory odrzucone.

Zdefiniujmy macierz rozrzutu F(Ci,Cj|M) = Nij/N

częstość przypisania klasy Cj do klasy Ci przez reguły M. Dla 2 klas:

Wrażliwość reguł: Se=F++/(F+++F+-)[0,1]

Specyficzność: Sp=F--/(F--+F-+) [0,1]

Se=1 klasa - nigdy nie jest przypisywana do +

Sp=1 klasa + nigdy nie jest przypisywana do -

Minimalizacja l. pomyłek: możliwe wektory odrzucone, węższe przedziały. Max. liczby poprawnych wektorów.


Zastosowania

Zastosowania

Szczegółowy przykład dla danych Iris.

Przykłady rzeczywistych zastosowań:

Grzyby: dane czysto symboliczne.

3 Mnichów: sztuczne dane symboliczne.

Dane Medyczne: Rak piersi - nawroty (Ljubliana)Rak piersi - złośliwość (Wisconsin)Badania przesiewowe tarczycy.

Badania psychometryczne

Dane techniczne:

NASA Shuttle


Grzyby

Grzyby

Dane z książki, w której wyraźnie napisano: „nie ma łatwego sposobu odróżnienia jadalnych od niejadalnych i trujących.

8124 przypadki, 22 cechy symboliczne, razem 118 wartości logicznych, czyli 2118=3.1035 możliwych wektorów binarnych.

2480 brakujących wartości cechy „stalk-root” 51.8% jadalnych, 48.2% niejadalnych.

Grzyb jest jadalny jeśli:

odor = (almond Ú anise Ú none) Ù spore-print-color = Ø green

48 błędów, 99.41% dokładności

Węch - najważniejszy zmysł; Jakie receptory pozwalają odróżnić zapach anyżu i migdałów?

Reguła z MLP2LN.

Prosta sieć, automatyczna analiza funkcji logicznych i sprawdzania ich poprawności (program w Prologu).


Grzyby regu y

Grzyby - reguły

Reguły dla grzybów trujących

R1) odor = Ø (almond Ú anise Ú none); 120 błędów, 98.52%

R2) spore-print-color = green48 błędów, 99.41%

R3) odor = none Ù stalk-surface-below-ring = scaly Ù      stalk-color-above-ring = Ø brown 8 błędów, 99.90%

R4) habitat = leaves Ùcap-color = white0 błędów!

R1 + R2 stabilne, wychodzą nawet na 10% danych; R3 i R4 można zamienić na:

R'3): gill-size = narrow Ù stalk-surface-above-ring = (silky Ú scaly) R'4): gill-size = narrow Ù population = clustered

Wystarczy 5 cech! 100% dokładności w testach CV.

Dane całkowicie zrozumiałe.


Rak piersi nawroty ljubliana

Rak piersi - nawroty (Ljubliana)

Po wycięciu guza zdarzają się nawroty: czy można je przewidzieć?

286 przypadków, 201 bez nawrotów (70.3%), 85 z nawrotami (29.7%) 9 cech symbolicznych, 2 do 13 wartości: wiek (9 przedziałów), wielkość guza (12 przedziałów), liczba guzów (13 przedziałów), złośliwość (1,2,3), kwadrant lub centrum; napromieniowanie itd.

Reguła:

Jeśli (l. guzów > [0,2] Ù złośliwość = 3 To nawrót ELSE brak nawrotu

ma dokładność 77% na całym zbiorze; najlepsze systemy nie dają więcej niż 78% przy bardziej złożonym opisie.

Cała wiedza zawarta w tej bazie to:

Złośliwe raki z przerzutami dają nawroty.

Problem: jak znaleźć jedną, stabilną regułę w kroswalidacji?


Budowa system w regu owych

Budowa systemów regułowych

Analiza psychometrycznych kwestionariuszy: jak zbudować system wspomagający diagnozy w oparciu o interpretację danych tekstowych?

System analizy danych i indukcji reguł pozwalający na wspomaganie decyzji - IDSS (Intelligent Decision Support System)


Psychometria

Psychometria

Test: kwestionariusz, odpowiedzi na pytania.

MMPI (Minnesota Multiphasic Personality Inventory) - typowy test.

Skanowanie formularzy.

  • Odpowiedzi na 550 pytań - czyste dane.

  • Rezultaty kombinuje się liniowo z współczynnikami ustalonymi przez psychometrów, tworząc 14 „skal”.

  • Każda skala mierzy tendencje do oszukiwania, unikania odpowiedzi, hipochondrii, depresji, paranoi, schizofrenii itp.

  • Interpretacji podlega „psychogram”, czyli histogram skal. Interpretacja zależy od intuicji i doświadczenia psychometry.

  • Czy można zrobić sztucznego psychometrę?

  • Dokładność interpretacji: < 70% zgodności pomiędzy dwoma ekspertami?


Dane do analizy

Dane do analizy.

Około 1600 przypadków dla kobiet i tyle samo dla mężczyzn.

27 klas: norma, psychopatia, zespół urojeniowy, schizofrenia, paranoja, nerwica, stan maniakalny, symulacja, dyssymulacja, alkoholizm, narkomania, skłonności przestępcze, zmiany organiczne w mózgu ...

Etap tworzenia reguł: przesłanki to wartości ciągłe, 14 skal.

FSM, MLP2LN, drzewo decyzji - około 2-3 reguł/klasę.

10-CV daje 82-85% z FSM i 79-84% z C4.5.

Rozmycie poprawia wyniki dla FSM do 90-92%


Wyniki

Wyniki

Prawdopodobieństwa przynależności do klas.

Analiza dopasowania reguł i szczegółowa analiza przyczyn.

Werbalne interpretacje przypadków.

Prezentacja danego przypadku w relacji do pozostałych.


Koniec wyk adu 22

Koniec wykładu 22

Dobranoc !


  • Login