230 likes | 416 Views
Búsqueda y Obtención de Información. Contenido de esta presentación. Búsquedas avanzadas Booleanas. Entornos. Sistemas de información relevantes Motores de búsqueda especializados. Web Invisible Bases de datos especializadas Catálogos de bibliotecas. Las Consecuencias. Es letal
E N D
Contenido de esta presentación • Búsquedas avanzadas • Booleanas L. Codina - UPF
Entornos • Sistemas de información relevantes • Motores de búsqueda especializados. Web Invisible • Bases de datos especializadas • Catálogos de bibliotecas L. Codina - UPF
Las Consecuencias • Es letal • Mucha información (ruido) • Perder información (silencio) • Necesitamos • Solamente información relevante (precisión), pero • Toda la información relevante (exhaustividad) L. Codina - UPF
Las Soluciones • Necesitamos • Conocer las fuentes • Fuentes críticas de cada sector de actividad o rama del conocimiento • Saber buscar • Conocer los principios unificadores de la búsqueda • Ecuaciones de búsqueda • Uso efectivo de los formularios de búsquedas avanzadas L. Codina - UPF
Búsqueda simple • Palabra(s) clave(s) • Un único término • Ejemplos: web • Problema: ruido • Dos o más términos yuxtapuestos (sin sintaxis, términos separados por espacios en blanco) • Ejemplos: web móvil • Problema: falsas coordinaciones • Frase • Una frase o una palabra clave compuesta rodeada por comillas • Ejemplos: “la web móvil y los medios de comunicación” • Problema: silencio • Recomendación general • Uso de búsquedas avanzadas L. Codina - UPF
Búsquedas avanzadas Booleanas L. Codina - UPF
Parametrizadas • Palabras clave • Restricción por campos o parámetros • Los más habituales • Título • Tema • Fecha de publicación • Autor • Lengua • Ejemplo • Título: “cine musical” • Entre: 1960 y 1980 L. Codina - UPF
Parametrizadas Catálogos: Catálogo Athenea de la UPO http://athenea.upo.es/ REBIUN http://rebiun.absysnet.com/ Bases de datos: ISOC del CSIC En http://athenea.upo.es/ buscar ISOC Dialnet: http://dialnet.unirioja.es/ Buscadores académicos: SCIRUS http://www.scirus.com/ L. Codina - UPF
Booleanas - 1 • Basada en álgebra de Boole • Operadores principales • AND • OR • NOT • Forma simple • t1 OP t2 • Dónde: • t1 es una palabra clave • OP es uno de los operadores principales (AND, OR, NOT) • Concepto de ecuación • t1 OP t2 = conjunto de documentos L. Codina - UPF
Booleanas - 2 • Forma compuesta • (t1 OP t2) OP (t3 OP t4) • Ejemplos • (cine OR vídeo) AND (ayudas OR becas) • (sitcom OR “comedia de situación”) AND (niños OR adolescentes) L. Codina - UPF
Booleanas - 3 • Uso • AND > reduce resultados y aumenta precisión • OR > aumenta resultados y reduce precisión • NOT > reduce resultados y aumenta precisión • Balance: • AND > aumenta precisión pero elimina información • OR > aumenta resultados pero incrementa el ruido • NOT > reduce el ruido pero elimina información L. Codina - UPF
Cuadro resumen L. Codina - UPF
Problemas - 1 • AND > • Falsamente intuitivo • No corresponde necesariamente con el uso del “y” gramatical • Ejemplo: “necesito información sobre la obras de teatro y novelas que han sido adaptadas para cine y televisión” • Traducción booleana incorrecta: • (teatro AND novela) AND (cine AND televisión) • Problema: el usuario perderá información muy relevante • Traducción booleana correcta: • (teatro OR novela) AND (cine OR televisión) • Ventaja: el usuario consigue una gran precisión sin pérdida de información L. Codina - UPF
Búsquedas Combinadas • Combinan ecuaciones • Parametrizadas • Booleanas • Ejemplo • (Título artículo= “web móvil” AND publicidad) AND (Años= 2010-2012) • Interpretación: buscamos artículos sobre la web móvil y la publicidad, pero siempre que esas palabras clave aparezcan en el título, y se hayan publicado en los últimos dos años. L. Codina - UPF
Ejemplo: CSIC Formulario de búsqueda combinada en CSIC L. Codina - UPF
Problemas - 2 • OR • Anti intuitivo • término 1 o bien término 2, o ambos • cuantos más términos, más ruido, no menos • En la lengua natural, la partícula “O” puede tener dos significados: • Incluyente • Excluyente • Cómo operador booleano siempre es incluyente L. Codina - UPF
Problemas 3 • NOT • Anti intuitivo • Puede destruir información: elimina por igual información relevante y no relevante • Ejemplo: “necesito información sobre publicidad de refrescos, pero siempre que sean bebidas para adultos” • Con la ecuación: (refrescos AND publicidad) NOT jóvenes • Perdemos este documento: “Resultados de una investigación sobre publicidad de marcas de refrescos para jóvenes y adultos” L. Codina - UPF
Ejercicio 1 • Dada la siguiente necesidad de información: “becas y ayudas para producciones de cine y vídeo”, ¿cuál de las siguientes ecuaciones es mejor?: • (becas AND ayudas) AND (cine AND vídeo) • (becas OR ayudas) AND (cine OR vídeo) L. Codina - UPF
Ejercicio 2 • Dada la siguiente pregunta: “necesito información sobre mascotas”, ¿cuál es la mejor ecuación?: • perros AND gatos • perros OR gatos L. Codina - UPF
Ejercicio 3 • ¿Podría enunciar en lenguaje natural la interpretación de esta ecuación booleana?: • (legislación OR directivas) AND (europa OR estados unidos) AND ((niños OR adolescentes) NOT (videojuegos)) L. Codina - UPF
Ejercicio 4 • ¿Podría ofrecer un ejemplo de formalización en una ecuación booleana del siguiente problema de información?: • “posicionamiento en la web móvil de marcas de ciudades en Europa y Canadá utilizando técnicas SEO o bien técnicas SEM” L. Codina - UPF
Ejemplo de sistemas relevantes • Motores académicos • Scirus • Google Scholar • Bases de datos académicas (multidisciplinares) • Dialnet • CSIC • Bases de datos profesionales (Humanistas) • Historical Abstracts • Fondo antiguo de la USE: http://fondosdigitales.us.es/ • Fondo antiguo del Laboratorio de arte: http://fototeca.us.es/ • Cartoteca Digital http://cartotecadigital.icc.cat/ • Portal de Humanidades Liceushttp://0-www.liceus.com.athenea.upo.es/cgi-bin/aco/excellence_quees.asp?opcion=2 • Acceso a Pares http://pares.mcu.es/ • Europeanahttp://www.europeana.eu/portal/ • Hemerotecas digitales http://bitelia.com/2012/09/hemerotecas-digitales-online-espanol L. Codina - UPF