1 / 42

HA-2094 Bases de datos documentales LECCION 02 Jorge Arias Guía de clase

HA-2094 Bases de datos documentales LECCION 02 Jorge Arias Guía de clase. Unidad 1. Introducción a la Teoría de Sistemas Sistemas aplicables a la Archivística Elementos de un Sistema electrónico de Gestión documental Unidad 2. Introducción a la teoría de bases de datos y su aplicación en las

nguyet
Download Presentation

HA-2094 Bases de datos documentales LECCION 02 Jorge Arias Guía de clase

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. HA-2094 Bases de datos documentalesLECCION 02Jorge AriasGuía de clase Unidad 1. Introducción a la Teoría de Sistemas Sistemas aplicables a la Archivística Elementos de un Sistema electrónico deGestión documental Unidad 2. Introducción a la teoría de bases de datos y su aplicación en las normativas archivísticas Generalidades de Sistemas Gestores y Bases de datos Prueba de asimilación No. 1 Salida.

  2. HA-2094 Bases de datos documentalesLECCION 02Jorge Arias 1. Introducción a la teoría de sistemas • Sistemas aplicables a la archivística • Elementos de un Sistema electrónico deGestión documental • 1. La base de datos • Es el elemento más importante pues el aprovechamiento que se le pueda dar al sistema depende de la calidad de su ccontenido • El contenido de la base de puede incluir: • información de documentos • Documentos completos • Metadatos de documentos • Información de administración del sistema • Información de seguridad

  3. HA-2094 Bases de datos documentalesLECCION 02Jorge Arias 1. Introducción a la teoría de sistemas • Sistemas aplicables a la archivística • Elementos de un Sistema electrónico deGestión documental • 2. Dispositivos especializados de hardware • Escaneres y dispositivos de Digitalización: Los documentos originales, una vez preparados, son transformados en documentos digitales, los cuales serán guardados o almacenados. • Servidores: Contienen la información previamente digitalizada. Los usuarios finales se conectaran a un servidor para poder acceder a dicha información, para su modificación o revisión.

  4. HA-2094 Bases de datos documentalesLECCION 02Jorge Arias 1. Introducción a la teoría de sistemas • Sistemas aplicables a la archivística • Elementos de un Sistema electrónico deGestión documental • 3. Dispositivos especializados de software • Gestores documentales: Programas de apoyo al proceso de gestión de la documentación que se maneja. • Existen soluciones informáticas para : • - la gestión documental • - administración de archivos digitales • - para administración de bibliotecas de diversa índole.

  5. HA-2094 Bases de datos documentalesLECCION 02Jorge Arias 1. Introducción a la teoría de sistemas • Sistemas aplicables a la archivística • Elementos de un Sistema electrónico deGestión documental • 4. Dispositivos especializados de red • Por medio de las redes los usuarios podrán acceder a la información que se encuentra en los servidores. • Las redes pueden ser locales, aunque también se puede acceder a la información por Internet

  6. HA-2094 Bases de datos documentalesLECCION 02Jorge Arias 1. Introducción a la teoría de sistemas • Sistemas aplicables a la archivística • Elementos de un Sistema electrónico deGestión documental • 5. Usuarios del Sistema • Personas que se registran en el sistema como usuarios • Personas que acceden a la informacióna través de una cuenta de • Usuario • El acceso a los documentos y su consulta electrónica se hace de acuerdo a los niveles de seguridad asignados a cada usuario registrado

  7. HA-2094 Bases de datos documentalesLECCION 02Jorge Arias 1. Introducción a la teoría de sistemas • Sistemas aplicables a la archivística • Elementos de un Sistema electrónico deGestión documental • 6. Administradores del Sistema • que es el encargado del control de : • - La producción digitalización de los documentos • - Su codificación e indexan en la base de datos del servidor • - La identificación de ls ubicación física del documento original • - La asignación, a cada documento lógico de las claves de acceso • - Que los documentos digitalizados se almacenen en su • correspondiente fichero

  8. HA-2094 Bases de datos documentalesLECCION 02Jorge Arias 1. Introducción a la teoría de sistemas • Sistemas aplicables a la archivística • Ejemplos de Sistemas electrónico deGestión documental • DocShare Gestión Documental, Sistema de Gestión Documental • Bitcubo, Software de Gestion Documental y del conocimiento • Innova Systems, Lider en Gestion Documental • Docunet, Software de Gestion Documental • OrfeoGPL, Software de Gestion Documental libre bajo licencia GPL • Yerbabuena Software, Gestión Documental Inteligente y Open Source • Documany, Gestión Documental Colaborativa para PYMEs • Axentria, Gestión Documental (Montevideo - Uruguay) • Semantica DMS, Sistema de Gestión Documental • Sistema ATHENTO • Sistema DOKMEE • Sistema ICA-ATOM • 13. Roda (Repositorio de Objetos Digitales Auténticos)

  9. HA-2094 Bases de datos documentalesLECCION 02Jorge Arias2. Introducción a la teoría de bases de datos y su aplicación en la normativa archivística Generalidades de Sistemas Gestores y Bases de datos Sistemas de gestión de base de datos Los sistemas de gestión de bases de datos SGBD (en inglés database management system,abreviado DBMS) son un tipo de software muy específico, dedicado a servir de interfaz entre la base de datos, el usuario y las aplicaciones que la utilizan. Por medio de estos se hace gestión de manera clara, sencilla y ordenada del conjunto de datos que posteriormente se convertirán en información relevante para una organización

  10. HA-2094 Bases de datos documentalesLECCION 02Jorge Arias2. Introducción a la teoría de bases de datos y su aplicación en la normativa archivística Generalidades de Sistemas Gestores y Bases de datos Objetivos que deben cumplir los SGBD • Abstracción de la información. Los SGBD ahorran a los usuarios detalles acerca del almacenamiento físico de los datos. Da lo mismo si una base de datos ocupa uno o cientos de archivos, este hecho se hace transparente al usuario. Así, se definen varios niveles de abstracción. • Independencia. La independencia de los datos consiste en la capacidad de modificar el esquema (físico o lógico) de una base de datos sin tener que realizar cambios en las aplicaciones que se sirven de ella. • Consistencia. En aquellos casos en los que no se ha logrado eliminar la redundancia, será necesario vigilar que aquella información que aparece repetida se actualice de forma coherente, es decir, que todos los datos repetidos se actualicen de forma simultánea. Por otra parte, la base de datos representa una realidad determinada que tiene determinadas condiciones, por ejemplo que los menores de edad no pueden tener licencia de conducir. El sistema no debería aceptar datos de un conductor menor de edad. En los SGBD existen herramientas que facilitan la programación de este tipo de condiciones

  11. HA-2094 Bases de datos documentalesLECCION 02Jorge Arias2. Introducción a la teoría de bases de datos y su aplicación en la normativa archivística Generalidades de Sistemas Gestores y Bases de datos Otros objetivos que deben cumplir los SGBD • Seguridad. La información almacenada en una base de datos puede llegar a tener un gran valor. Los SGBD deben garantizar que esta información se encuentra segura de permisos a usuarios y grupos de usuarios, que permiten otorgar diversas categorías de permisos. • Manejo de transacciones. Una transacción es un programa que se ejecuta como una sola operación. Esto quiere decir que luego de una ejecución en la que se produce una falla es el mismo que se obtendría si el programa no se hubiera ejecutado. Los SGBD proveen mecanismos para programar las modificaciones de los datos de una forma mucho más simple que si no se dispusiera de ellos. • Tiempo de respuesta. Lógicamente, es deseable minimizar el tiempo que el SGBD tarda en darnos la información solicitada y en almacenar los cambios realizados

  12. HA-2094 Bases de datos documentalesLECCION 02Jorge Arias2. Introducción a la teoría de bases de datos y su aplicación en la normativa archivística Generalidades de Sistemas Gestores y Bases de datos Tipos de Bases de datos Según la variabilidad de los datos almacenados • Bases de datos estáticas • Bases de datos dinámicas Según el contenido • Bases de datos bibliográficas • Bases de datos de texto completo • Directorios • Bases de datos o "bibliotecas" de información química o biológica

  13. HA-2094 Bases de datos documentalesLECCION 02Jorge Arias2. Introducción a la teoría de bases de datos y su aplicación en la normativa archivística Generalidades de Sistemas Gestores y Bases de datos Modelos de bases de datos Bases de datos jerárquicas Base de datos de red Bases de datos transaccionales Bases de datos relacionales Bases de datos multidimensionales Bases de datos orientadas a objetos Bases de datos documentales Bases de datos deductivas Gestión de bases de datos distribuida

  14. HA-2094 Bases de datos documentalesLECCION 02Jorge Arias2. Introducción a la teoría de bases de datos y su aplicación en la normativa archivística Generalidades de Sistemas Gestores y Bases de datos Los sistemas de gestión de base de datos con soporte SQL más utilizados son, por orden alfabético: • DB2 • Firebird • Informix • Interbase • MySQL • Oracle • PostgreSQL • SQLite • SQL Server • Sybase ASE

  15. HA-2094 Bases de datos documentalesLECCION 02Jorge Arias2. Introducción a la teoría de bases de datos y su aplicación en la normativa archivística Generalidades de Sistemas Gestores y Bases de datos Los sistemas de gestión de base de datos con soporte SQL más utilizados son, por orden alfabético: DB2: es una marca comercial, propiedad de IBM, bajo la cual se comercializa un sistema de gestión de base de datos. Es un motor de base de datos relacional que integra XML de manera nativa, lo que IBM ha llamado pureXML, que permite almacenar documentos completos dentro del tipo de datos xml para realizar operaciones y búsquedas de manera jerárquica dentro de éste, e integrarlo con búsquedas relacionales. Firebird: es un sistema de administración de base de datos relacional (o RDBMS) (Lenguaje consultas: SQL) de código abierto, basado en la versión 6 de Interbase, cuyo código fue liberado por Borland en 2000. Su código fue reescrito de C a C++. El proyecto se desarrolla activamente, el 18 de abril de 2008 fue liberada la versión 2.1 y el 26 de diciembre de 2009 fue liberada la versión 2.5.0 RC1. Informix: es una familia de productos RDBMS de IBM, adquirida en 2001 a una compañía (también llamada Informix o Informix Software) cuyos orígenes se remontan a 1980. Interbase: es un Sistema de Administración y gestion de Base de Datos Relacionales (RDBMS) desarrollado y comercializado por la compañía Borland Software Corporation y actualmente desarrollado por su ex-filial CodeGear. Interbase se destaca de otros DBMS's por su bajo consumo de recursos, su casi nula necesidad de administración y su arquitectura multi-generacional. InterBase corre en plataformas Linux, Microsoft Windows y Solaris

  16. HA-2094 Bases de datos documentalesLECCION 02Jorge Arias2. Introducción a la teoría de bases de datos y su aplicación en la normativa archivística Generalidades de Sistemas Gestores y Bases de datos MySQL: es un sistema de gestión de base de datos relacional, multihilo y multiusuario con más de seis millones de instalaciones. MySQL AB —desde enero de 2008 una subsidiaria de Sun Microsystems y ésta a su vez de Oracle Corporation desde abril de 2009— desarrolla MySQL como software libre en un esquema de licenciamiento dual. Por un lado se ofrece bajo la GNU GPL para cualquier uso compatible con esta licencia, pero para aquellas empresas que quieran incorporarlo en productos privativos deben comprar a la empresa una licencia específica que les permita este uso. Está desarrollado en su mayor parte en ANSI C. Oracle : es un sistema de gestión de base de datos relacional, desarrollado por Oracle Corporation. Se considera a Oracle como uno de los sistemas de bases de datos más completos destacando: soporte de transacciones, estabilidad, escalabilidad y soporte multiplataforma. Su dominio en el mercado de servidores empresariales ha sido casi total hasta hace poco, recientemente sufre la competencia del Microsoft SQL Server de Microsoft y de la oferta de otros RDBMS con licencia libre como PostgreSQL, MySql o Firebird. Las últimas versiones de Oracle han sido certificadas para poder trabajar bajo GNU/Linux PostgreSQL: es un sistema de gestión de base de datos relacional orientada a objetos y libre, publicado bajo la licencia BSD. Como muchos otros proyectos de código abierto, el desarrollo de PostgreSQL no es manejado por una sola empresa sino que es dirigido por una comunidad de desarrolladores y organizaciones comerciales las cuales trabajan en su desarrollo. Dicha comunidad es denominada el PGDG (PostgreSQL Global Development Group).

  17. HA-2094 Bases de datos documentalesLECCION 02Jorge Arias2. Introducción a la teoría de bases de datos y su aplicación en la normativa archivística Generalidades de Sistemas Gestores y Bases de datos SQLite: es un sistema de gestión de bases de datos relacional compatible con ACID, contenida en una relativamente pequeña biblioteca en C. SQLite es un proyecto de dominio público creado por D. Richard Hipp. A diferencia de los sistema de gestión de bases de datos cliente-servidor, el motor de SQLite no es un proceso independiente con el que el programa principal se comunica. En lugar de eso, la biblioteca SQLite se enlaza con el programa pasando a ser parte integral del mismo. El programa utiliza la funcionalidad de SQLite a través de llamadas simples a subrutinas y funciones. Esto reduce la latencia en el acceso a la base de datos, debido a que las llamadas a funciones son más eficientes que la comunicación entre procesos. El conjunto de la base de datos (definiciones, tablas, índices, y los propios datos), son guardados como un sólo fichero estándar en la máquina host. Este diseño simple se logra bloqueando todo el fichero de base de datos al principio de cada transacción Microsoft SQL Server: es un sistema para la gestión de bases de datos producido por Microsoft basado en el modelo relacional. Sus lenguajes para consultas son T-SQL y ANSI SQL. Microsoft SQL Server constituye la alternativa de Microsoft a otros potentes sistemas gestores de bases de datos como son Oracle, Sybase ASE, PostgreSQL, Interbase, Firebird o MySQL. Sybase ASE: Adaptive Server Enterprise (ASE) es el motor de bases de datos (RDBMS) insignia de la compañía Sybase. ASE es un sistema de gestión de datos, altamente escalable, de alto rendimiento, con soporte a grandes volúmenes de datos, transacciones y usuarios, y de bajo costo

  18. HA-2094 Bases de datos documentalesLECCION 02Jorge Arias2. Introducción a la teoría de bases de datos y su aplicación en la normativa archivística i. Diferentes formas de representación física de archivos de datos a. DEFINICIONES ¿ Que son datos ? Dato: es una representación simbólica (numérica, alfabética, algorítmica etc.) que describe un atributo o característica de alguna entidad ¿ Que es información ? Información: un conjunto de datos relacionados que proporcionan un significado o sentido a algo.

  19. HA-2094 Bases de datos documentalesLECCION 02Jorge Arias2. Introducción a la teoría de bases de datos y su aplicación en la normativa archivística PREGUNTA ¿ Qué entendemos por Archivos de Datos? Podríamos definir los archivos de datos como: cualquier elemento de información que tiene algún significado y que está almacenado en un espacio dentro de un computador y a los cuales accedemos por medio del nombre que les damos. Dentro de este significado se podrían mencionar como ejemplos: • Un documento de word • Una hoja de excel • Una presentación en power point • Un dibujo hecho en paint • Un texto con algún sentido editado en cualquier procesador como el bloc de notas

  20. HA-2094 Bases de datos documentalesLECCION 02Jorge Arias2. Introducción a la teoría de bases de datos y su aplicación en la normativa archivística ¿ Qué es una base de Datos? ¿ Una hoja de Excel es una base de Datos? En realidad, una hoja de excel u otro conjunto de datos similar, con estructura, contenido y significado, es un archivo de datos. Un Archivo de datos es un conjunto de elementos de información relacionados entre si y que fueron definidos por su creador. Los archivos de datos pueden ser: - Numéricos - Alfabéticos - Binarios - de formato libre (archivos txt) - con formato estructurado (como las hojas de excel)

  21. HA-2094 Bases de datos documentalesLECCION 02Jorge Arias2. Introducción a la teoría de bases de datos y su aplicación en la normativa archivística Desde el punto de vista de su representación física, un archivo de datos es una secuencia de bits, bytes, líneas o registros cuyo significado es definido por el creador del archivo y por el usuario. El archivo de datos se puede manipular como una unidad mediante operaciones tales como: - Abrir - Cerrar -Crear - Destruir -copiar - renombrar - listar Los elementos de información individuales que conforman un archivo de datos se pueden manipular con acciones tales como: - Leer - Escribir - Modificar - Eliminar

  22. HA-2094 Bases de datos documentalesLECCION 02Jorge Arias2. Introducción a la teoría de bases de datos y su aplicación en la normativa archivística Los archivos de datos pueden caracterizarse por su: Volatilidad, Actividad y Tamaño. Volatilidad : Se refiere a la frecuencia con la que se inserta o elimina información. Actividad: Se refiere al porcentaje de los elementos de información de un archivo al que se tuvo acceso en un periodo de tiempo dado. Tamaño: Se refiere a la cantidad de información que conforma el archivo.

  23. HA-2094 Bases de datos documentalesLECCION 02Jorge Arias2. Introducción a la teoría de bases de datos y su aplicación en la normativa archivística Los archivos de datos se caracterizan por su estado, en Físicos y lógicos Archivo de datos Físico: La información vista desde la perspectiva de hardware. Ejemplos: • el archivo X está formado por los sectores 3, 10 y 15 del disco duro del computador. • el archivo Y formado por es la secuencia de bytes localizados en la RAM en el bloque 0A703h:03000h al 0A703h:04200h. Archivo de datos Lógico: Constituido por datos cuyo significado esta definido por el usuario. Generalmente, un archivo lógico se representa de manera formateada o tabular Ejemplo: el archivo Y es la información de 1000 artículos, cada uno con su código, descripción y precio.

  24. HA-2094 Bases de datos documentalesLECCION 02Jorge Arias2. Introducción a la teoría de bases de datos y su aplicación en la normativa archivística CONCEPTO DE ORGANIZACIÓN DE ARCHIVOS. Se refiere a las diferentes maneras en las en que puede ser organizada y accedida la información en estos Dado que hay 2 niveles de visión de los archivos (Archivo de datos físico y archivo de datos lógico), se puede hablar también de 2 aspectos de organización de archivos: Organización de archivos físicos y de archivos lógicos. Organicación de Archivos lógicos:Se refiere a la organización desde el punto de vista lógico. Por ejemplo, para acceso secuencial, acceso directo, indexado, Organicación de Archivos físicos:Se refiere a la administración de archivos desde la perspectiva física, particularmente la organización del almacenamiento en disco a nivel de pistas y sectores.

  25. HA-2094 Bases de datos documentalesLECCION 02Jorge Arias2. Introducción a la teoría de bases de datos y su aplicación en la normativa archivística ORGANIZACIÓN FISICA DE LOS ARCHIVOS Para entender de mejor manera la organización física de los archivos se deben conocer 2 aspectos importantes: • la asignación de espacio libre • asignación de espacio de almacenamiento al archivo. La asignación de espacio a un archivo, depende de la manera en que el Sistema Operativo de los equipos controla los lugares del disco que no están siendo ocupados.

  26. HA-2094 Bases de datos documentalesLECCION 02Jorge Arias2. Introducción a la teoría de bases de datos y su aplicación en la normativa archivística CONTROL DEL ESPACIO LIBRE Para la administración y el control del espacio libre los sistemas operativos utilizan diferentes métodos teóricos: • Vector de Bits • Listas Ligadas • Por Agrupacion • Por Contador

  27. HA-2094 Bases de datos documentalesLECCION 02Jorge Arias2. Introducción a la teoría de bases de datos y su aplicación en la normativa archivística

  28. HA-2094 Bases de datos documentalesLECCION 02Jorge Arias2. Introducción a la teoría de bases de datos y su aplicación en la normativa archivística

  29. HA-2094 Bases de datos documentalesLECCION 02Jorge Arias2. Introducción a la teoría de bases de datos y su aplicación en la normativa archivística

  30. HA-2094 Bases de datos documentalesLECCION 02Jorge Arias2. Introducción a la teoría de bases de datos y su aplicación en la normativa archivística Por agrupacion Es similar a la lista ligada, solo que en este se tiene por cada sector, un grupo de apuntadores a varios espacios vacios, al final de cada bloque se tiene un apuntador a otro grupo de apuntadores.

  31. HA-2094 Bases de datos documentalesLECCION 02Jorge Arias2. Introducción a la teoría de bases de datos y su aplicación en la normativa archivística

  32. HA-2094 Bases de datos documentalesLECCION 02Jorge Arias2. Introducción a la teoría de bases de datos y su aplicación en la normativa archivística Por contador Aqui, por cada conjunto de bloques contiguos que estén vacios, se tiene un apuntador a un número de inicio y el tamaño del grupo de sectores vacios.

  33. HA-2094 Bases de datos documentalesLECCION 02Jorge Arias2. Introducción a la teoría de bases de datos y su aplicación en la normativa archivística

  34. HA-2094 Bases de datos documentalesLECCION 02Jorge Arias2. Introducción a la teoría de bases de datos y su aplicación en la normativa archivística ASIGNACIÓN DE ESPACIO A ARCHIVOS DE DATOS Se refiere a la forma en que un Sistema Operativo controla los lugares del disco ocupados por cada archivo El S. O. controla básicamente la identificación del archivo, sector de inicio y sector final. Para el control del espacio ocupado en disco se utilizanr los métodos teóricos: • Asignación Contigua • Asignación Ligada • Asignación indexada.

  35. HA-2094 Bases de datos documentalesLECCION 02Jorge Arias2. Introducción a la teoría de bases de datos y su aplicación en la normativa archivística Asignación contigua : consiste en asignar el espacio en disco de tal manera que las direcciones de todos los bloques correspondientes a un archivo definen un orden lineal

  36. HA-2094 Bases de datos documentalesLECCION 02Jorge Arias2. Introducción a la teoría de bases de datos y su aplicación en la normativa archivística Asignación contigua VENTAJAS La cabeza de lectura no se mueve demasiado en la lectura de un archivo. DESVENTAJAS Produce fragmentación externa.

  37. HA-2094 Bases de datos documentalesLECCION 02Jorge Arias2. Introducción a la teoría de bases de datos y su aplicación en la normativa archivística Asignación ligada: En este método, cada archivo es una lista ligada de bloques de disco. En el directorio hay un puntero al bloque de inicio y un puntero al bloque final para cada archivo. En cada uno de los bloques donde se encuentra un archivo hay un punyero al siguiente bloque de la lista.

  38. HA-2094 Bases de datos documentalesLECCION 02Jorge Arias2. Introducción a la teoría de bases de datos y su aplicación en la normativa archivística

  39. HA-2094 Bases de datos documentalesLECCION 02Jorge Arias2. Introducción a la teoría de bases de datos y su aplicación en la normativa archivística • Asignación ligada • VENTAJAS: • No produce fragmentación externa. • DESVENTAJAS: • La cabeza de lectura se puede mover demasiado en la lectura de un archivo.  • Si una liga se pierde, se perderá el archivo completo.  • Es ineficiente para la implementación de archivos directos.  • Se necesita un campo extra para el apuntador.

  40. HA-2094 Bases de datos documentalesLECCION 02Jorge Arias2. Introducción a la teoría de bases de datos y su aplicación en la normativa archivística Asignación indexada • La asignación ligada resuelve problemas de fragmentación externa, sin embargo, la asignación ligada no soporta eficientemente el acceso directo a los archivos. La asignación indexada resuelve este problema poniendo todos los apuntadores en una sola localidad: El bloque índice. • Cada archivo tiene su bloque índice, El cual es un arreglo de direcciones de bloques de disco. • La i-ésima entrada en el bloque índice apunta al i-ésimo bloque que conforma el archivo. En el directorio se controla la dirección del bloque índice de cada archivo.

  41. HA-2094 Bases de datos documentalesLECCION 02Jorge Arias2. Introducción a la teoría de bases de datos y su aplicación en la normativa archivística

  42. HA-2094 Bases de datos documentalesLECCION 02Jorge Arias2. Introducción a la teoría de bases de datos y su aplicación en la normativa archivística VENTAJAS: • No produce fragmentación externa • Eficiente para la implementación de archivos directos DESVENTAJAS • Existe desperdicio cuando hay archivos pequeños • Desbordamiento de bloque índice. (Solución: creación de un esquema ligado; el ultimo bloque índice apunta a otro índice)

More Related