60 likes | 198 Views
Fazetov é vyhľadávanie. Vyhľadávanie informácií. Riešenie. Poskytnutie fazetového vyhľadávania nad existujúcou množinou dát. Dáta sú extrahované zo stránky ponúkajúcej byty. Cieľom je ponúknuť rýchlejšie, prehľadnejšie a pokročilejšie vyhľadávanie ako je na stránke. Postup riešenia.
E N D
Fazetové vyhľadávanie Vyhľadávanie informácií
Riešenie • Poskytnutie fazetového vyhľadávania nad existujúcou množinou dát. • Dáta sú extrahované zo stránky ponúkajúcej byty. • Cieľom je ponúknuť rýchlejšie, prehľadnejšie a pokročilejšie vyhľadávanie ako je na stránke.
Postup riešenia. • Konfigurácia Apache Solr– štruktúra dát a nastavenie webového prostredia. • Implementácia aplikácie v prostredí .NET umožňujúcej: • Extrakciu dát z webu pomocou v pravidelných intervaloch. • Napĺňanie a aktualizáciu Solr indexu. Fazetové vyhľadávanie nad Solr indexom. • Vedenie záznamov o poslednej aktualizácií bytov v indexe do XML súboru. • Overenie korektnosti faziet a fazetovéhovyhľadávania.
Využité knižnice • HtmlAgilityPack – knižnica pre .NET na parsovanie webu. • Solr.Net – API pre prácu so Solr indexom s prostredia .NET – generuje http dopyty. • Velocity – webové rozhranie, ktoré je súčasťou Apache Solr.
Overenie • Extrahované dáta zodpovedali dátam na stránke – dobrá štruktúrovanosť. • Overenie prostredníctvom porovnania veľkosti množiny po výbere viacerých faziet a manuálneho dohľadania na stránke.