metody wyszukiwania informacji l.
Download
Skip this Video
Loading SlideShow in 5 Seconds..
Metody wyszukiwania informacji PowerPoint Presentation
Download Presentation
Metody wyszukiwania informacji

Loading in 2 Seconds...

play fullscreen
1 / 36

Metody wyszukiwania informacji - PowerPoint PPT Presentation


  • 233 Views
  • Uploaded on

Metody wyszukiwania informacji. Wykonali: Leszek Kłosowicz Przemysław Juszczuk. Przegląd najpopularniejszych metod wyszukiwania. Wyszukiwanie według słów kluczowych : polega na znajdowaniu dokumentów zawierających jedno lub kilka z podanych przez użytkownika słów.

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about 'Metody wyszukiwania informacji' - eugene


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript
metody wyszukiwania informacji

Metody wyszukiwania informacji

Wykonali:

Leszek Kłosowicz

Przemysław Juszczuk

przegl d najpopularniejszych metod wyszukiwania
Przegląd najpopularniejszych metod wyszukiwania
  • Wyszukiwanie według słów kluczowych : polega na znajdowaniu dokumentów zawierających jedno lub kilka z podanych przez użytkownika słów.
  • wyszukiwanie koncepcyjne : celem takiego wyszukiwania jest znalezienie stron niekoniecznie zawierających podane słowo lecz raczej związanych z nią znaczeniowo.
przegl d najpopularniejszych metod wyszukiwania3
Przegląd najpopularniejszych metod wyszukiwania
  • Szukanie frazy : polega na szukaniu dokumentów zawierających podany ciąg słów lub pełne zdanie podane wcześniej przez użytkownika.
  • Tezaurus : jest zbiorem synonimów, których może używać wyszukiwarka dla podanych w zapytaniu słów ( w przypadku, gdy nie pojawią się one w dokumencie ).
przegl d najpopularniejszych metod wyszukiwania4
Przegląd najpopularniejszych metod wyszukiwania

Wyszukiwanie rozmyte : to sposób wyszukiwania, który wykrywa także zbieżność części słów (maskowanie końcówek) lub wręcz słów napisanych niepoprawnie. Uzyskuje się go, stosując maski. Znak "*" zastępuje kilkuliterową końcówkę wyrazu, a symbol "?" może zastąpić tylko jeden znak.

przegl d najpopularniejszych metod wyszukiwania5
Przegląd najpopularniejszych metod wyszukiwania

Szukanie podobnych dokumentów:jest to wyszukiwanie, w którym poleca się znaleźć inne dokumenty podobne do znalezionego wcześniej.

wst p do wyszukiwania strukturalnego r nica pomi dzy wyszukiwaniem katalogowym a strukturalnym
Wstęp do wyszukiwania strukturalnegoRóżnica pomiędzy wyszukiwaniem katalogowym a strukturalnym

Wyszukiwarki katalogowe działają na podstawie hierarchicznej, redagowanej ręcznie i ciągle uzupełnianej struktury wpisów.

Proces wyszukiwania jest bardzo szybki i daje dość precyzyjne wyniki, jednak dużo ważnych dla użytkownika informacji pozostaje „w ukryciu”.

wyszukiwanie strukturalne
Wyszukiwanie strukturalne
  • Zwane inaczej wyszukiwaniem indeksowym. Stało się bardzo popularne, dzięki wykorzystaniu w procesie wyszukiwania słów kluczowych.
  • Hiperłącza tworzone przez autorów stron www przedstawiają relację pomiędzy stronami źródłowymi a docelowymi.
definicja wyszukiwania strukturalnego
Definicja wyszukiwania strukturalnego

Wyszukiwanie strukturalne – jest procesem przeszukiwania sieci pozwalającym nie tylko na tekstową analizę treści strony, lecz także na wskazanie specyficznej struktury hiperłączy.

slide9

Strona trzecia

Strona druga

Strona pierwsza

Odnośnik

Odnośnik

Odnośnik

Strona czwarta

Graficzne przedstawienie struktury hiperłączy

slide10
Dzięki takiemu mechanizmowi otrzymujemy bardzo dużą ilość potencjalnie relewantnych stron, których wyszukanie za pomocą samego mechanizmu analizy tekstu nie byłoby możliwe.
poj cie klasteryzacji
Pojęcie klasteryzacji

Samo wyszukiwanie zwraca tysiące linków, których przejrzenie nie jest możliwe w realnym czasie. Potrzebny jest pewien mechanizm grupowania stron na podstawie podobieństw. Właśnie clustering pozwala na pewny logiczny podział znalezionych dokumentów.

o co chodzi czyli algorytm src
O co chodzi, czyli algorytm SRC
  • SRC – Search Results Clustering
  • Dane wejściowe – N linków do dokumentów czyli zwykłe wyniki wyszukiwania ( adres,tytuł, fragment strony).
  • Założenia – istnieje logiczna struktura tematyczna w zestawie wyników.
  • Dane wyjściowe – zbiór grup tematycznych ułożonych hierarchicznie, częściowo na siebie zachodzących.
problemy wyszukiwania strukturalnego
Problemy wyszukiwania strukturalnego

Projekt Carrot zajmuje się wyszukiwaniem strukturalnym w języku polskim. Jednak ze względu na budowę języka pojawia się problem ze zdefiniowaniem wartości progowych.

wyszukiwanie boolowskie
Wyszukiwanie boolowskie
  • Wyszukiwanie boolowskie polega na szukaniu dokumentów spełniających zadane kryteria.
  • Zadawane pytania mogą zawierać spójniki boolowskie: AND, OR lub NOT.
wyszukiwanie boolowskie18
Wyszukiwanie boolowskie
  • Spójnik AND:

słowo1 AND słowo2

wyszukane zostaną dokumenty, w których występują jednocześnie oba słowa.

wyszukiwanie boolowskie19
Wyszukiwanie boolowskie
  • Spójnik OR:

słowo1 OR słowo2

wyszukane zostaną dokumenty, które zawierają przynajmniej jedno ze słów.

wyszukiwanie boolowskie20
Wyszukiwanie boolowskie
  • Spójnik NOT:

NOT słowo

wyszukane zostaną dokumenty, które nie zawierają podanego słowa.

wyszukiwanie boolowskie21
Wyszukiwanie boolowskie
  • Zapytanie kierowane do wyszukiwarki, traktowane jest jako zdanie logiczne.
  • Jako wynik wyszukiwarka zwraca strony, dla których podane zdanie logiczne jest prawdziwe.
wyszukiwanie boolowskie22
Wyszukiwanie boolowskie
  • Przykładowe zapytanie formalnie można zapisać następująco:

Z=(S1 OR S2) AND NOT S3

gdzie Z to zapytanie, a S1, S2 i S3 to pewne słowa.

wyszukiwanie boolowskie23
Wyszukiwanie boolowskie
  • Wyszukiwarka przechowuje n-elementową listę ponumerowanych słów (słownik).
  • Dokumenty reprezentowane są przez wektory binarne o długości n.
wyszukiwanie boolowskie24
Wyszukiwanie boolowskie
  • Słowa z zapytania konwertowane są do wektorów binarnych poprzez wyszukanie odpowiednich pozycji słów w słowniku .
  • Wyszukanie relewantnych dokumentów polega na wykonaniu prostych operacji logicznych na wektorach.
wyszukiwanie boolowskie25
Wyszukiwanie boolowskie
  • Wada wyszukiwania boolowskiego to słaba możliwość posortowania otrzymanych wyników (pod kątem relewantności dokumentów). Możliwy jest jedynie dyskretny pomiar zbieżności dokumentu z zapytaniem.
wyszukiwanie boolowskie26
Wyszukiwanie boolowskie
  • Wyszukiwanie boolowskie oferuje użytkownikowi łatwy sposób tworzenia dokładnych i skomplikowanych zapytań, dlatego też jest zaimplementowane w prawie każdej wyszukiwarce.
webring metoda pokrewna
Webring – metoda pokrewna
  • w dosłownym tłumaczeniu: sieciowy pierścień.
  • Jest to swoista odmiana katalogu internetowego, grupująca strony WWW poświęcone jednej określonej tematyce, zagadnieniu, branży itd.
  • Różnica pomiędzy zwykłym katalogiem internetowym polega na tym, iż tron określonego webringu zawiera w swoim kodzie źródłowym HTML specjalną sekwencję, która na końcu strony tworzy stopkę zawierającą kilka odnośników odwołujących się do specjalnego skryptu CGI Skrypt ten przeszukuje bazę danych stron należących do danego webringu, umożliwiając odwiedzającym swobodną nawigację po nich"
zalety webringu
Zalety Webringu
  • Łatwe przemieszczanie się do kolejnych stron w pierścieniu ( lub cofanie się, a także wybieranie stron losowo ).
  • Możliwość wybrania aktualnie interesującej strony z listy – wykazu wszystkich stron danego webringu.
  • Przystąpienie do webringu zwiększa oglądalność danej witryny
  • Popularyzacja danego tematu/zagadnienia.
przegl d innych wyszukiwarek
Przegląd innych wyszukiwarek

Hakia jest wyszukiwarką, która opiera się na języku naturalnym. W założeniu, ma rozumieć semantykę wpisywanych zapytań. Pełna wersja Hakii, ma ruszyć na początku przyszłego roku, nie wiadomo czy wierzyć tym zapowiedziom, gdyż Hakia miała już działać w I kwartale 2006. www.hakia.com

przegl d innych wyszukiwarek31
Przegląd innych wyszukiwarek

Na podobnej zasadzie działają min. Wyszukiwarki Ask.com oraz AnswerBus.com ( www.AnswerBus.com ) jednak mają one jedną zasadniczą wadę. Często w ramach odpowiedzi na postawione pytanie otrzymujemy zbiór luźno powiązanych z tematem stron.

przegl d innych wyszukiwarek33
Przegląd innych wyszukiwarek

Mechanizm NetSprinta podobnie jak Google korzysta m.in. z Wikipedii oraz serwisów informacyjnych, dając użytkownikowi możliwość zapoznania się z najnowszymi wiadomościami na dany temat. Wyszukiwarka nie zawsze radzi sobie dobrze też m.in. z podpowiedziami po błędnym wpisaniu zapytania.

przegl d innych wyszukiwarek35
Przegląd innych wyszukiwarek
  • Innym trendem w wyszukiwaniu są rozwiązania dedykowane przeszukujące specyficzne bazy danych. Przykładem takiej wyszukiwarki jest http://www.gopubmed.org/
  • mechanizm pomagający precyzyjnie wyszukiwać dokumenty związane z dziedziną biomedycyny.