1 / 11

Introducción

World Wide Web M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción http://www.inf.udec.cl/~andrea. Introducción.

neka
Download Presentation

Introducción

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. World Wide WebM.Andrea Rodríguez TastetsDIIC - Universidad de Concepciónhttp://www.inf.udec.cl/~andrea

  2. Introducción • La Web se inicia en marzo de 1989 propuesto por el investigador Tim Berners-Lee, como un proyecto de desarrollo de un sistema de hipertexto, es decir un sistema de creación y distribución de documentos, que permitiera compartir información desarrollada en diferentes aplicaciones, de forma sencilla y eficiente, entre equipos de investigadores ubicados en distintos lugares geográficos.

  3. Requerimientos iniciales • Obtener una interfaz consistente, es decir el sistema debería permitir una conexión que al menos asegurara una transferencia de datos consistente (lo que envío es obtenido intacto). • Permitir incorporar un amplio rango de tecnologías y distintos tipos de documentos. • Proveer de una herramienta que permita leer los documentos desde cualquier lugar y por cualquier individuo que este navegando dentro de este almacén, y deberá permitir que cualquier documento sea accequible en forma paralela por dos o más personas de forma sencilla.

  4. Posteriormente • A principios de 1993 se vio surgir al browser Mosaic, que cumplía con todos los requerimientos que se buscaban (funcionamiento en diversas plataformas, poseer una interfaz grafica y fácil de usar), lo que produjo su éxito inmediato. Después aparecieron Netscape de Netscape Inc. e Internet Explorer de Microsoft. Finalmente a fines de 1994 y principios de 1995, se formó el Consorcio World Wide Web o W3C que esta bajo la dirección del fundador de la Web

  5. Desafíos de RI  Datos distribuidos sobre diferentes plataformas  Datos volátiles  Gran volumen de datos  Datos redundantes y no estructurados  Calidad de los datos  Datos heterogeneos.

  6. Directorios son Robot • Directorios o buscador sin Robot: estos buscadores son administrados por personas. Debido a esta razón están limitados en el tamaño de la base de datos que contiene los documentos indexados, es decir limitan el campo de búsqueda. Los documentos se indexan después de un análisis que también es hecho por personas, es decir, su crecimiento se limita a la velocidad de trabajo de las personas (incluye actividades como: agregar páginas nuevas, eliminar páginas que han expirado o que han sido eliminadas, etc.).

  7. Máquinas de Búsqueda • La indexación de documentos es realizada automáticamente a través de SW que indexa las páginas existentes en la Web.

  8. Arquitectura Crawler-Indexer

  9. Arquitectura de Cosecha

  10. Ranking • Modelos más usados: Boolean o Vector y sus variaciones • Ranking tiene que realizarse sin accesar el texto,sólo el índice • Los algoritmos de ranking son “top secret” • Es casi imposible determinar el recall

  11. Ranking • No sólo texto,pero también hyperlinks • La importancia de una página depende de quién apunta ella o a quién apunta. • La web como una grafo dirigido

More Related