integraci n de datos n.
Download
Skip this Video
Loading SlideShow in 5 Seconds..
Integración de Datos PowerPoint Presentation
Download Presentation
Integración de Datos

Loading in 2 Seconds...

play fullscreen
1 / 23

Integración de Datos - PowerPoint PPT Presentation


  • 106 Views
  • Uploaded on

Integración de Datos. Integración : read-only. Carácterísticas: necesidad de fusión de datos Abordajes : virtual (basado en modelo de descomposici ón de consultas, enviando las subconsultas a las BD fuentes y mezclando las respuestas.)

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about 'Integración de Datos' - sheri


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript
integraci n read only
Integración: read-only
  • Carácterísticas: necesidad de fusiónde datos
  • Abordajes:
    • virtual

(basado en modelo de descomposición de consultas, enviando las subconsultas a las BD fuentes y mezclando las respuestas.)

      • Close Word Assumption (CWA)La vista integrada posee exactamente la union de los datos en las BD fuentes.

Vista construida “bottom-up”

      • Open Word Assumption (OWA) La respuesta provista a través de una vista integrada tendrá un subconjunto de las respuestas completas que implican cada una de las bases de datos fuentes.

Vista construida “top-down”

integraci n read only ii
Integración: read-only (II)
  • Abordajes:
    • materializado
      • Vista construida “bottom-up” en un abordaje CWA. ((DW))
      • Aspecto crítico: mantenimiento actualizado de la vista.
        • “Refresh” periódico
        • Mantenimiento incremental [GL95], [LMSS95]
        • “Self- maintainability” [GJM96] [ZHK96]

(deltas: representación, álgebra, aplicación inmediata o diferida)

      • Ventaja sobre el virtual: tiempo de respuesta.
    • híbridos
metodolog as
Metodologías
  • Correspondencias al nivel de los esquemas.

Parten de la resolución de heterogeneidades entre los esquemas.

(Sistemas fuertemente acoplados)

[SpaccapietraParent 94], [Kosky 95], [Fankhauser 97]

  • Correspondencias al nivel de las instancias .

(Sistemas débilmente acoplados)

[Fang et al. 93], [Scholl et al. 94] , [VermeeerApers 96]

slide5

S1

S2

integer

integer

Id-

Id-

exc

exc

scales

string

tours

Excursion

string

tours

National

Internat.

BusExc

BusExc

National

National

National

Internat.

BusExc

string

tours

scales

integer

string

string

Id-exc

posses

Excursion

Itinerary

performs

posses

Excursion

Itinerary

performs

scales

string

ExcursionItineraryscales  Excursionscales

ExcursionItinerarytours  Excursiontours

ExcursionNational  ExcursionBusExcNational

instance mapping
Instance Mapping

Schema 1

Schema 2

Augmentation 1

Augmentation 2

Homogenized

Schema 2

Homogenized

Schema 1

a) Identifying objects from

multiple sources

b) Resolving instance- conflicts

between corresponding objects

c) Maintaining integrity constraints

Merge

Integrated

Schema

generating an integrated schema
Generating an Integrated Schema
  • Identifying Instances: keys values approach
  • Data Representation Conflicts: conversion mappings or routines
  • Data Precision Conflicts: conversion function (when possible)
  • Data Scaling Conflicts: conversion functions
  • Default Value Conflicts: preference criterion
  • Attribute Integrity Constraint Conflicts:
  • generalization of constraint (when possible)
slide8

string

string

string

string

c

a

b

a

A

B

string

string

c

b

AB

a

string

string

string

string

string

a

c

a

c

b

b

A

string

A

B

string

string

string

a

c

b

A

B

string

slide9

A

A

C

B

C

A

A

B

A

A

B

B

B

A

C

B

B

A

slide10

A

B

A

C

B

A

C

B

mapping specification syntax
Mapping Specification Syntax

interface <class name >: {<superclass name>}{

extent <extent name>

keys [<attribute name>]*;

attribute <attribute type> <attribute name>

relationship <class name> <relationship name>

inverse <class name>: <relationship name>}

mapping <class name >{

origins <attribute name> [,<attribute name>]*;

def_ext <oql expression>

def_att <attribute name> as <oql expression>

def_rel <traversal path name> as <oql expression>; }

slide12

mapping h_Excursion1{

origins eorig; // eorig from Excursion1

def_ext select h_Excursion1(eorig: e_inst)

from e_inst in e_excursions;

def_att h_exc_id as this.eorig.exc_id;

def_rel posses as select e from e in posses

where (this.eorig = e.eorig.tours) and

(this.eorig = e.eorig.scales); }

mapping h_Itinerary2{

origins torig, eorig1, eorig2; // torig from Excursion2 ,

// eorig1 from Itinary.tours,

// eorig2 from Itinary.scales

def_ext select h_Itinerary2(torig: inst, eorig1: itinerary.tours, eorig2: itinerary.scales)

from inst in e_excursions,

inst.tours in itinerary.tours,

inst.scales in itinerary.scales;

def_rel posses as select p from p in excursion

where (this.torig.excursion.tours = p.eorig1) and

(this.torig.excursion.scales= p.eorig2) ;}

integraci n basada en relaciones sem nticas al nivel de las instancias
Integración basada en relaciones semánticas al nivel de las instancias

OBJETOS:

Cadaobjetorepresenta cierto objeto del mundo real.

Los objetos de la BD están agrupados en clases.

Cada clase posee un conjunto de propiedades por las cuales los objetos de esa clase son descriptos.

El conjunto de propiedades determina la estructura de un objeto.

Cada propiedad tiene un dominio del cual toma valores.

Para propiedades referenciales el dominio es una clase.

Cada objeto de la BD tiene valores para sus propiedades.

Este conjunto de valores determina el estado del objeto de la BD.

ejemplo vermeerapers96

Publ

authors

publisher

Scientific

forum

descr

org

type

Referred

NonRef

Springer

Readings

ICS

“IC”

“VC”

O3

O4

{JonesSmith}

{Jones}

chapter

Springer

Proc

Ejemplo [VermeerApers96]

title

Prof

“VC”

IRIS

O1

t

{Jones}

“CB”

t

O2

{Star}

IRIS

title

Journal

“CC”

MasterTh

student

O5

{Star}

supervisor

IEEE Press

“CA”

IEEE

Lewis

O6

Star

ejemplo vermeerapers961
Ejemplo [VermeerApers96]

title

Publications

authors

ref?

pp

Paper

Book

publisher

TechReport

nr

superv

“VC”

Springer

true

O’2

O’1

false

PhDTh

proc

{Quinn}

Proc.

t5

Proc

O’8

{Jones}

XYZPress

Journal

Conf

Springer

{Ram}

journal

true

false

“CD”

O’3

O’4

{Scan}

Readings

“VC”

Quinn

Journal

{Jones}

XYZPress

O’6

“AC”

{JonesSmith}

O’5

{Smith}

24-48

O’2

“NC”

O’7

30-88

JournalAA

10-20

{QuinnShort}

O’8

relacionamientos entre objetos vermeerapers96

title

title

Ej.: Eq(O4,O’6)

Publications

authors

Publ

authors

publisher

pp

Paper

Scientific

forum

org

proc

Conf

Referred

ICS

“VC”

“VC”

O4

{JonesSmith}

O’6

{JonesSmith}

Springer

Proc

24-48

O’2

Relacionamientos entre objetos [VermeerApers96]
  • Equal:corresponden al mismo objeto del mundo real

Eq(A,B) vale siiel objeto A es el mismo que el objeto modelado por la abstracción B.

a)B puede ser un objeto.

relacionamientos entre objetos vermeerapers96 ii
Relacionamientos entre objetos [VermeerApers96] (II)

b)B puede ser un conjunto de valores de propiedades.

Ejemplo:

Publicaciones cientificas de un forum son vistas como objetos en DB2 mientras que son vistas como valores describiendo publicaciones en libros en DB1.

Eq(O4.forum, O’2)

title

title

authors

Publications

Publ

authors

publisher

ref?

Scientific

forum

Book

publisher

org

Referred

Springer

true

O’2

{Quinn}

Proc.

ICS

“VC”

O4

{JonesSmith}

Springer

Proc

relacionamientos entre objetos vermeerapers96 iii
Relacionamientos entre objetos [VermeerApers96] (III)
  • Similar

Un objeto puede ser similar a un conjunto de objetos de una clase C

    • Strict Similarity

Sim(A,B) es valido sii objeto A es similar a los objetos representados por la abstracción B.

Ejemplo: Una PhDTh es con referato entonces: SIM(O’4,Referred)

    • Approximate Similarity

Sim(A,B, NewC) Ocurre cuando O’ y los objetos de C son suficientemente similares como para a gruparlos en una nueva clase NewC.

Ejemplo: Sim(O’4, MasterTh, GradTh)

relacionamientos entre objetos vermeerapers96 iv
Relacionamientos entre objetos [VermeerApers96] (IV)
  • Aggregate

Es usada para la composición de objetos dentro de un objeto mayor.

Aggr(A, B [, Role]) Vale sii el objeto modelado por la abstraccion A es una agregación del objeto representado por la abstracción B.

Opcionalmente se puede especificar un papel (role) especifico por B en A.

Ejemplo: El chapter de Jones esta contenido en su libro:

Aggr(O3, O’3)

reglas de comparaci n de objetos
Reglas de Comparación de Objetos

Ejemplo:

Sim(O’:ConfPaper, refereed)  O’.proc.ref? = true

- Resuelven heterogeneidades esquemáticas

- El conj. de objetos relacionados que definen no

necesariamente coinciden con las extensiones de

ninguna clase.

proceso
Proceso

Entrada:

Set of local objects LO1, LO2.

Clasificación de los objetos locales SC1, SC2.

Relacionamientos entre LO1 y LO2.

Salida:

  • Un nuevo conjunto de objetos integrados IO

Reconciliación de objetos

Ejemplo: Eq(O,O’.prop)

como objeto de DB1 o como valor de DB2?: Estrategia fija

Diferentes dominios: Funciones de conversión

Diferentes valores: Funciones de decisión

  • Una nueva clasificación para estos objetos.
caracter sticas
Características
  • Aplicable para sistemas débilmente acoplados.
  • Aplicable en ambientes estables
  • Carece de integración de métodos
  • Carece de formas de detectar inconsistencias
  • Usado para read-only
bibliograf a
Bibliografía

[Fang et al. 93] Fang D., Ghandeharizadeh S., McLeod D. And Si A.

The design, implementation and evaluation of an object-based sharing mechanism for federated database systems.

In Proc. Ninth Internat. Conf. on Data Engineering, Vienna, Austria, April 19-23, 1993. Washington, DC,: IEEE Computer Society Press, pp 467-475,1993.

[Scholl et al. 94] Scholl M. H., Scheck H-J. And Tresch M.

Object algebra and views for multiobjectbases.

In Distributed Object Management, M.T. Oszu, U.Dayal and P. Valduriez, Eds. San Mateo, CA: Morgan Kaufmann Publishers,pp353-374,1994.

[VermeerApers96] Vermeer M.W.W. And Apers P.M.G.

On the applicability of schema integration techniques to database interoperation.

ER’96