1 / 13

Diseño de Bases de Datos Distribuidas (4ta Parte)

Diseño de Bases de Datos Distribuidas (4ta Parte). Lic. Bárbara da Silva. Sistemas de Bases de Datos Distribuidas - UCV. Esquema de la Clase. Ejercicio de Transparencia Asignación de Fragmentos Modelo de Asignación Replicación. Ejercicio de Transparencia.

hasana
Download Presentation

Diseño de Bases de Datos Distribuidas (4ta Parte)

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Diseño de Bases de Datos Distribuidas(4ta Parte) Lic. Bárbara da Silva Sistemas de Bases de Datos Distribuidas - UCV

  2. Esquema de la Clase • Ejercicio de Transparencia • Asignación de Fragmentos • Modelo de Asignación • Replicación

  3. Ejercicio de Transparencia Recuperar el nombre del proveedor de un producto. Se asume que: El número del producto es dado por el usuario. Un producto es suplido por un solo proveedor. Escriba la consulta para cada uno de los niveles de transparencia

  4. Asignación de Fragmentos El problema de la asignación consiste básicamente en la distribución optima de un conjunto de fragmentos F = {F1, F2, ..., Fn} sobre una serie de sitios o nodos S = {S1, S2, …, Sm} en los cuales se ejecutan un conjunto de consultas Q = {Q1, Q2, …, Qt} El objetivo es alcanzar un modelo de asignación que minimice el costo total de procesamiento y almacenamiento sin descuidar los tiempos de respuestas.

  5. Asignación de Fragmentos La optimalidad de esta distribución se puede medir en base a dos criterios: • Costo Mínimo: Minimizar los costos de • Almacenamiento • Consulta De un Fi en un Nodo Sj • Actualización • Comunicación • Rendimiento: • Tiempo de Respuesta • Throughput (número de trabajos procesados por unidad de tiempo)

  6. Asignación de Fragmentos Para realizar la asignación se necesita información sobre: • Base de Datos • Selectividad de Fi con respecto a Qj : El número de tuplas de Fi que será necesario acceder para procesar Qj. • Tamaño de cada fragmento: Cardinalidad x longitud (en octetos) de una tupla del fragmento

  7. Asignación de Fragmentos Para realizar la asignación se necesita información sobre: 2. Aplicaciones • El número de escrituras y lecturas que una consulta Qi hace a un fragmento Fj durante su ejecución. • Aplicaciones actualizan o consultan cuáles fragmentos. • Cuál es el nodo de la red que origina cada consulta.

  8. Asignación de Fragmentos Para realizar la asignación se necesita información sobre: 3. Cada nodo de la Red • Costo unitario de almacenamiento de datos en un nodo. • Costo unitario de procesamiento de datos en un nodo. 4. Red • Velocidad de comunicación • Tiempo de latencia en la comunicación • Cantidad de trabajo adicional a realizar para una comunicación.

  9. Modelo de Asignación El modelo de asignación propuesto intenta minimizar el costo total de procesamiento y almacenamiento mientras intenta de satisfacer ciertas restricciones del tiempo de respuesta. Min (TOC) donde TOC = Costo Total Sujeto a: Restricciones del tiempo de respuesta, restricciones de almacenamiento y restricciones de tiempo de procesamiento., Se posee la variable de decisión xij que significa: xij = 1 si el fragmento Fi es almacenado en el nodo j, 0 en caso contrario

  10. Modelo de Asignación TOC =  STCjk +  QPCi Sk  S Fj  F qi Q • Costo del Almacenar Fj en Sk STCjk = USCk * size(Fj) * xjk 2. Costo de Procesar el query qi QPCi = PCi + TCi PCi = ACi + IEi + CCi TCi = TCUi + TCRi

  11. Modelo de Asignación Donde: • USCk es la unidad de costo de almacenar datos en el nodo Sk • size(Fj) es el tamaño del fragmento Fj • xjk indica si el fragmento Fj es almacenado en el nodo Sk. • PC es el costo de procesamiento • TC es el costo de transmisión. • AC es el costo de acceso • IE es el costo de mantener la integridad • CC es el costo de control de la concurrencia. • TCUi es el componente de actualización de la transmisión • TCRi es el costo del componente de consultas

  12. Modelo de Asignación Las restricciones a tomar en cuenta son: • La restricción de tiempo de respuesta debe ser especificada como: Tiempo de ejecución de qi  máximo tiempo de respuesta de qi, qi Q • La restricción de almacenamiento es:  STCjk  Capacidad de almacenamiento del nodo Sk, Sk S Fj F • La restricción de procesamiento es:  procesamiento de qi en Sk  Capacidad de procesamiento de Sk, Sk S qi Q

  13. Replicación Se debe tomar la decisión de que alternativa de replicación tomar: • No soportar replicación: cada fragmento reside en un solo sitio. • Replicación completa: cada fragmento en cada uno de los sitios. • Replicación parcial: cada fragmento en alguno de los sitios.

More Related