slide1
Download
Skip this Video
Download Presentation
On the integration of Large Data Banks by a Powerful Cataloguing Method

Loading in 2 Seconds...

play fullscreen
1 / 14

On the integration of Large Data Banks by a Powerful Cataloguing Method - PowerPoint PPT Presentation


  • 111 Views
  • Uploaded on

Adatb ázisok oktatási labor. Knowledge and Database Management. On the integration of Large Data Banks by a Powerful Cataloguing Method. Kardkovács Zsolt – Surányi Gábor – dr. Gajdos Sándor. Nagy adattárak integrációjának nyomában egy hatékony katalogizáló eljárással.

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about 'On the integration of Large Data Banks by a Powerful Cataloguing Method' - edward


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript
slide1
Adatbázisok oktatási labor

Knowledge and Database Management

On the integration of Large Data Banks

by a Powerful Cataloguing Method

Kardkovács Zsolt – Surányi Gábor – dr. Gajdos Sándor

Nagy adattárak integrációjának nyomában

egy hatékony katalogizáló eljárással

Budapesti Műszaki és Gazdaságtudományi Egyetem

Távközlési és Médiainformatikai Tanszék

slide2
Miről lesz szó?
  • A probléma környezete – megoldandó feladatok
  • A megoldás ötlete – elméleti alapok
  • A megoldás finomítása
  • Katalogizáló eljárás megvalósítása
  • Katalogizáló eljárás alapműveleteiről
  • Tapasztalatok

Neumann János emlékkonfencia

slide3
Hová forduljak?
  • Hová fordulhatok, ha…
    • egy izgalmas tudományos–fantasztikus könyvet keresek?
    • utazni szeretnénk egy nyugalmas, festői vidékre?
    • a betegségemre a leghatékonyabb gyógykezelést akarom?
    • szeretném megállapítani, mire képesek az egyes gének?
    • a legmegfelelőbb személyt akarom kiválasztani a munkára?
  • … és …
    • az információt rejtő adatbázisok rendelkezésre állnak
    • nincs sok időm, hogy megtaláljam a választ
    • nem akarok drága szakembereket fizetni ilyen információért
    • én akarok dönteni

Neumann János emlékkonfencia

slide4
Hogyan szolgálhatnám ki a felhasználót?
  • Hogyan találom meg a helyes választ, ha bár…
    • rendelkezem ugyan a megfelelő adatokkal
    • rendelkezésre áll az ismeretanyag, amiből megválaszolható kérdés
    • tudom, hogy kell a különböző attribútumokat megfeleltetni
    • az adatbázisok adatai „tiszták”
  • …de nem tudom, hogy…
    • lekérdezhető–e (hogyan?) a jól ismert lekérdezőnyelveken
    • hogyan integrálhatóak a különböző adatbázisok
    • hogyan igazolható a relációkon belüli fogalmak azonossága
    • két tulajdonság (kijelentés) közül melyik az erősebb
    • milyen módszerekkel gyorsíthatom a keresést

Neumann János emlékkonfencia

slide5
Rendezzük az adatokat!

Elég, ha0NF (NFNF) sémákban gondolkodunk! Pl.

R = ( könyvszerző, könyvcím )

r ( {Neumann János, Oskar Morgenstern} ,

{Theory of Games and Economic Behaviour} )

NULL értékeknek az üres halmaz felel meg! (NULL = NULL?)

Helyettesíthetőség:

Definiáljuk az mattribútum elemein értelmezett  előrendezési relációt! Pl.

legyen a jól ismert  reláció és m= könyvszerző

{Neumann János}   / könyvszerző {Neumann János, Oskar Morgenstern}

Neumann János emlékkonfencia

slide6
Rendezzük az összetett adatokat!

Fedés:

Terjesszük ki a helyettesíthetőséget attribútumok egy Mhalmazára! Pl.

1legyen a jól ismert  reláció és m1= könyvszerző

2legyen az alfabetikus rendezés és m2= könyvcím

M= {m1, m2}  = { 1, 2 }

r1: ( { Neumann János, Oskar Morgenstern },

{ Theory of Game and Economic Behavior } )

r2: ( { Neumann János },

{ The Computer and the Brain } )

Ekkor…

r1   / Mr2

Neumann János emlékkonfencia

slide7
Vizsgáljuk meg a rendezést!

Helyettesíthetőség:

Kiterjeszthetjük–e származtatott attribútumokra is?

f : X1, X2, …, Xn YP( X1, X2, …, Xn, Y )

Bernays – Schönfinkel – Ramsey osztály (adott struktúrán):

X1 X2 …Xn Y1 Y2

P1( X1, X2, …, Y1)  P2( X1, X2, …, Y2)  ( Y1, Y2 )

Fedés:

Viselkedése hasonlít az objektumorientált specializációra

Neumann János emlékkonfencia

slide8
Építsünk katalógust!

Építsünk gráfot az mattribútum helyettesíthetősége alapján!

V = { reláció elemei }

E = { egy csúcsból mutat él egy v csúcsba,

ha m attribútumban a csúcs helyettesíthető v-vel }

Építsünk gráfot az Mattribútum halmaz fedése alapján!

E = { egy csúcsból mutat él egy v csúcsba,

ha M attribútum halmazon v fedi a csúcsot }

Észrevétel: Az erősen összefüggő komponensek klikkeket alkotnak.

V = { reláció klikkjei }

E = { egy csúcsból mutat él egy v csúcsba,

ha a klikk egy csúcsából mutat él a v klikk egy csúcsába

és nincs olyan u klikk, amelyen át v a csúcsból elérhető }

Neumann János emlékkonfencia

slide9
Keressünk értéket a gráfban!

Algoritmus:

1. Induljunk a gyökér elemből (legyen ez a NULL elem)

2. Keresési kulcs egy elemével vizsgáljuk meg a csúcsot!

3. Az elem mentén haladjunk az irányítás mentés a gráfban addig,

míg a fedés teljesül vagy véget nem ér a gráf!

4. Létezik–e másik eleme a kulcsnak?

5.a. Ha igen, akkor vedd a kulcs újabb elemét

5.b. Menj a 2-es pontra

6.a. Ha véget ért a gráf, akkor nincs ilyen elem

6.b. Egyéb esetben a keresett elemhez jutottunk

Neumann János emlékkonfencia

slide10
Keressünk minimum értéket a gráfban!
  • Keressünk egy dolgozót, aki…
      • beszél angolul és németül
      • ért a számítógép–tervezéshez
  • Legyen tehát:
  • M = { nyelvtudás, gyakorlat } és
  • k = { {német, angol}, {számítógép–tervezés} }
  • Megoldás:
  • 1. Tegyük fel a csúcs (virtuálisan)létezik a gráfban
  • 2. A csúcsból induló (esetleg virtuális) utakon elérhető csúcsok
  • elemei kielégítik a kritériumot

Neumann János emlékkonfencia

slide11
Keressünk korlátos értéket a gráfban!
  • Keressük azokat a honvédeket, akik…
      • csak magyarul beszélnek
      • és legfeljebb tiszthelyettesi rangban szolgálnak
  • Legyen tehát:
  • M = { nyelvtudás, rangfokozat } és
  • k = { {magyar}, {főtörzsőrmester} }
  • Megoldás:
  • 1. Tegyük fel, hogy a csúcs (virtuálisan) létezik a gráfban
  • 2. A gyökér elem(ek)ből induló (esetleg virtuális) a csúcsba vezető
  • utakon elérhető csúcsok elemei kielégítik a kritériumot

Neumann János emlékkonfencia

slide12
Keressünk hasonló értéket a gráfban!
  • Szeretnék egy olyan helyen nyaralni, ahol…
      • nyugalom van, tengerpart és múzeum
      • repülővel vagy hajóval megközelíthető
      • és 250.000Ft érték körül eljuthatok
  • Legyen tehát:
  • M = { tulajdonságok, megközelítés, ár } és
  • k = { {nyugalom, tengerpart, múzeum}, {repülő, hajó}, {250.000} }
  • Megoldás:
  • 1. Ha a csúcs létezik a gráfban, akkor ez a tökéletes ajánlat
  • 2. Ha nem létezik, akkor a virtuális csúcsba belépő és kilépő
  • éleken közvetlen elérhető ajánlatok a megfelelőek

Neumann János emlékkonfencia

slide13
Mire jutottunk?
  • Definiáltunk egy eljárást és módszert, amely…
    • általában működik az adatbázistípusokra
    • alkalmas adatbázisok integrált katalogizálására
    • kiterjeszthető származtatott attribútumokra
    • számítható
    • támogatja
      • a felső– és alsókorlátos keresést
      • a hasonlósági mértékek létrehozását
      • a hasonlósági keresést
  • lehetővé teszi a webszolgáltatások működtetését

Neumann János emlékkonfencia

slide14
Van kérdésük?

Köszönöm a megtisztelő figyelmüket!

Kérem, tegyék fel a

katalogizáló eljárással kapcsolatos kérdéseiket!

Neumann János emlékkonfencia

ad