On the integration of Large Data Banks by a Powerful Cataloguing Method - PowerPoint PPT Presentation

Adatb
Download
1 / 14

  • 99 Views
  • Uploaded on
  • Presentation posted in: General

Adatb ázisok oktatási labor. Knowledge and Database Management. On the integration of Large Data Banks by a Powerful Cataloguing Method. Kardkovács Zsolt – Surányi Gábor – dr. Gajdos Sándor. Nagy adattárak integrációjának nyomában egy hatékony katalogizáló eljárással.

I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.

Download Presentation

On the integration of Large Data Banks by a Powerful Cataloguing Method

An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -

Presentation Transcript


On the integration of large data banks by a powerful cataloguing method

Adatbázisok oktatási labor

Knowledge and Database Management

On the integration of Large Data Banks

by a Powerful Cataloguing Method

Kardkovács Zsolt – Surányi Gábor – dr. Gajdos Sándor

Nagy adattárak integrációjának nyomában

egy hatékony katalogizáló eljárással

Budapesti Műszaki és Gazdaságtudományi Egyetem

Távközlési és Médiainformatikai Tanszék


On the integration of large data banks by a powerful cataloguing method

Miről lesz szó?

  • A probléma környezete – megoldandó feladatok

  • A megoldás ötlete – elméleti alapok

  • A megoldás finomítása

  • Katalogizáló eljárás megvalósítása

  • Katalogizáló eljárás alapműveleteiről

  • Tapasztalatok

Neumann János emlékkonfencia


On the integration of large data banks by a powerful cataloguing method

Hová forduljak?

  • Hová fordulhatok, ha…

    • egy izgalmas tudományos–fantasztikus könyvet keresek?

    • utazni szeretnénk egy nyugalmas, festői vidékre?

    • a betegségemre a leghatékonyabb gyógykezelést akarom?

    • szeretném megállapítani, mire képesek az egyes gének?

    • a legmegfelelőbb személyt akarom kiválasztani a munkára?

  • … és …

    • az információt rejtő adatbázisok rendelkezésre állnak

    • nincs sok időm, hogy megtaláljam a választ

    • nem akarok drága szakembereket fizetni ilyen információért

    • én akarok dönteni

Neumann János emlékkonfencia


On the integration of large data banks by a powerful cataloguing method

Hogyan szolgálhatnám ki a felhasználót?

  • Hogyan találom meg a helyes választ, ha bár…

    • rendelkezem ugyan a megfelelő adatokkal

    • rendelkezésre áll az ismeretanyag, amiből megválaszolható kérdés

    • tudom, hogy kell a különböző attribútumokat megfeleltetni

    • az adatbázisok adatai „tiszták”

  • …de nem tudom, hogy…

    • lekérdezhető–e (hogyan?) a jól ismert lekérdezőnyelveken

    • hogyan integrálhatóak a különböző adatbázisok

    • hogyan igazolható a relációkon belüli fogalmak azonossága

    • két tulajdonság (kijelentés) közül melyik az erősebb

    • milyen módszerekkel gyorsíthatom a keresést

Neumann János emlékkonfencia


On the integration of large data banks by a powerful cataloguing method

Rendezzük az adatokat!

Elég, ha0NF (NFNF) sémákban gondolkodunk! Pl.

R = ( könyvszerző, könyvcím )

r ( {Neumann János, Oskar Morgenstern} ,

{Theory of Games and Economic Behaviour} )

NULL értékeknek az üres halmaz felel meg! (NULL = NULL?)

Helyettesíthetőség:

Definiáljuk az mattribútum elemein értelmezett  előrendezési relációt! Pl.

legyen a jól ismert  reláció és m= könyvszerző

{Neumann János}   / könyvszerző {Neumann János, Oskar Morgenstern}

Neumann János emlékkonfencia


On the integration of large data banks by a powerful cataloguing method

Rendezzük az összetett adatokat!

Fedés:

Terjesszük ki a helyettesíthetőséget attribútumok egy Mhalmazára! Pl.

1legyen a jól ismert  reláció és m1= könyvszerző

2legyen az alfabetikus rendezés és m2= könyvcím

M= {m1, m2} = { 1, 2 }

r1: ( { Neumann János, Oskar Morgenstern },

{ Theory of Game and Economic Behavior } )

r2: ( { Neumann János },

{ The Computer and the Brain } )

Ekkor…

r1   / Mr2

Neumann János emlékkonfencia


On the integration of large data banks by a powerful cataloguing method

Vizsgáljuk meg a rendezést!

Helyettesíthetőség:

Kiterjeszthetjük–e származtatott attribútumokra is?

f : X1, X2, …, Xn YP( X1, X2, …, Xn, Y )

Bernays – Schönfinkel – Ramsey osztály (adott struktúrán):

X1 X2 …Xn Y1 Y2

P1( X1, X2, …, Y1)  P2( X1, X2, …, Y2)  ( Y1, Y2 )

Fedés:

Viselkedése hasonlít az objektumorientált specializációra

Neumann János emlékkonfencia


On the integration of large data banks by a powerful cataloguing method

Építsünk katalógust!

Építsünk gráfot az mattribútum helyettesíthetősége alapján!

V = { reláció elemei }

E = { egy csúcsból mutat él egy v csúcsba,

ha m attribútumban a csúcs helyettesíthető v-vel }

Építsünk gráfot az Mattribútum halmaz fedése alapján!

E = { egy csúcsból mutat él egy v csúcsba,

ha M attribútum halmazon v fedi a csúcsot }

Észrevétel: Az erősen összefüggő komponensek klikkeket alkotnak.

V = { reláció klikkjei }

E = { egy csúcsból mutat él egy v csúcsba,

ha a klikk egy csúcsából mutat él a v klikk egy csúcsába

és nincs olyan u klikk, amelyen át v a csúcsból elérhető }

Neumann János emlékkonfencia


On the integration of large data banks by a powerful cataloguing method

Keressünk értéket a gráfban!

Algoritmus:

1. Induljunk a gyökér elemből (legyen ez a NULL elem)

2. Keresési kulcs egy elemével vizsgáljuk meg a csúcsot!

3. Az elem mentén haladjunk az irányítás mentés a gráfban addig,

míg a fedés teljesül vagy véget nem ér a gráf!

4. Létezik–e másik eleme a kulcsnak?

5.a. Ha igen, akkor vedd a kulcs újabb elemét

5.b. Menj a 2-es pontra

6.a. Ha véget ért a gráf, akkor nincs ilyen elem

6.b. Egyéb esetben a keresett elemhez jutottunk

Neumann János emlékkonfencia


On the integration of large data banks by a powerful cataloguing method

Keressünk minimum értéket a gráfban!

  • Keressünk egy dolgozót, aki…

    • beszél angolul és németül

    • ért a számítógép–tervezéshez

  • Legyen tehát:

  • M = { nyelvtudás, gyakorlat } és

  • k = { {német, angol}, {számítógép–tervezés} }

  • Megoldás:

  • 1. Tegyük fel a csúcs (virtuálisan)létezik a gráfban

  • 2. A csúcsból induló (esetleg virtuális) utakon elérhető csúcsok

  • elemei kielégítik a kritériumot

  • Neumann János emlékkonfencia


    On the integration of large data banks by a powerful cataloguing method

    Keressünk korlátos értéket a gráfban!

    • Keressük azokat a honvédeket, akik…

      • csak magyarul beszélnek

      • és legfeljebb tiszthelyettesi rangban szolgálnak

  • Legyen tehát:

  • M = { nyelvtudás, rangfokozat } és

  • k = { {magyar}, {főtörzsőrmester} }

  • Megoldás:

  • 1. Tegyük fel, hogy a csúcs (virtuálisan) létezik a gráfban

  • 2. A gyökér elem(ek)ből induló (esetleg virtuális) a csúcsba vezető

  • utakon elérhető csúcsok elemei kielégítik a kritériumot

  • Neumann János emlékkonfencia


    On the integration of large data banks by a powerful cataloguing method

    Keressünk hasonló értéket a gráfban!

    • Szeretnék egy olyan helyen nyaralni, ahol…

      • nyugalom van, tengerpart és múzeum

      • repülővel vagy hajóval megközelíthető

      • és 250.000Ft érték körül eljuthatok

  • Legyen tehát:

  • M = { tulajdonságok, megközelítés, ár } és

  • k = { {nyugalom, tengerpart, múzeum}, {repülő, hajó}, {250.000} }

  • Megoldás:

  • 1. Ha a csúcs létezik a gráfban, akkor ez a tökéletes ajánlat

  • 2. Ha nem létezik, akkor a virtuális csúcsba belépő és kilépő

  • éleken közvetlen elérhető ajánlatok a megfelelőek

  • Neumann János emlékkonfencia


    On the integration of large data banks by a powerful cataloguing method

    Mire jutottunk?

    • Definiáltunk egy eljárást és módszert, amely…

      • általában működik az adatbázistípusokra

      • alkalmas adatbázisok integrált katalogizálására

      • kiterjeszthető származtatott attribútumokra

      • számítható

      • támogatja

        • a felső– és alsókorlátos keresést

        • a hasonlósági mértékek létrehozását

        • a hasonlósági keresést

    • lehetővé teszi a webszolgáltatások működtetését

    Neumann János emlékkonfencia


    On the integration of large data banks by a powerful cataloguing method

    Van kérdésük?

    Köszönöm a megtisztelő figyelmüket!

    Kérem, tegyék fel a

    katalogizáló eljárással kapcsolatos kérdéseiket!

    Neumann János emlékkonfencia


  • Login