1 / 74

Accéder aux informations nécessaires avec efficience

Accéder aux informations nécessaires avec efficience. Mode de recherche : recherche par mots-clés Outils : moteurs et métamoteurs. Principales sources utilisées

skah
Download Presentation

Accéder aux informations nécessaires avec efficience

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Accéder aux informations nécessaires avec efficience Dollara.fr - 2013

  2. Mode de recherche : recherche par mots-clésOutils : moteurs et métamoteurs Dollara.fr - 2013

  3. Principales sources utilisées Recherche éveillée sur Internet : mode d'emploi : outils et méthodes pour explorer le Web : Web visible, Web invisible, Web social, Web temps réelFoenix-Riou, Béatrice - Paris : Lavoisier : Bases publications, DL 2011 Dollara.fr - 2013

  4. Principales sources utilisées Net recherche 2010 : le guide pratique pour mieux trouver l'information utile et surveiller le web Véronique Mesguich et Armelle Thomas. Préface d'Olivier Andrieu Collection : Sciences et techniques de l'information, 2010. Dollara.fr - 2013

  5. Caractéristiques du contexte • ce mode de recherche s’est largement imposée devant les autres modes de recherche ; • plébiscitée par les internautes pour sa simplicité ; • démocratisation de la pratique de la recherche d’information, réduction de la « fracture numérique » ; • MAIS, baisse globale de la qualité des recherches : pour être efficace, cette méthode induit généralement un travail conséquent en amont décrit ci-dessous. Dollara.fr - 2013

  6. De quoi s’agit-il ? Dollara.fr - 2013

  7. De la recherche par mots-clés sur le texte intégral des pagesWeb via des moteurs ou métamoteurs de façon automatique. • L’utilisateur saisit un ou plusieurs mots-clés dans le formulaire • La requête est lancée sur le texte intégral des pages enregistrées par le moteur (La page de résultats affiche la liste et les extraits des (copies de) pages contenant le(s)mot(s)-clé(s) (à la date de l’indexation) • Un clic sur le titre affiche la page aujourd’hui sur le Web Dollara.fr - 2013

  8. Analyse de la présentation des résultats Dollara.fr - 2013

  9. Dollara.fr - 2013

  10. Quand utiliser ce mode de recherche ? Dollara.fr - 2013

  11. Résultats convaincants pour les questions factuelles (adresse, dates, etc.) OU pour des questions très générales (avoir une idée d’ensemble sur un sujet) Dollara.fr - 2013

  12. Comment fonctionne un moteur et quelles sont les incidences sur la recherche ? Dollara.fr - 2013

  13. Le moteur est constitué de trois éléments : • un robot ou bot/crawler/spider qui parcourt le web de liens en liens. Il parcourt le contenu des sites Web à intervalles réguliers et de façon automatique. Il teste tous les liens hypertextes et fait une copie des pages visitées sur une base de données structurée. Dollara.fr - 2013

  14. Il se connecte aussi à toutes les pages soumises par les éditeurs de sites (référencement) http://www.google.fr/submit_content.html Le robot n’indexera pas forcément toutes les pages d’un site. Dollara.fr - 2013

  15. Mise à jour de la base de données (délai de rafraîchissement) : - varie selon les moteurs et selon le type de pages - de quelques secondes à plusieurs mois - les pages issues de blogs ou de sites de microblogging sont indexés en temps quasi réel - une page régulièrement mise à jour et souvent consultée sera visitée beaucoup plus fréquemment. Dollara.fr - 2013

  16. un index Il s’occupe de l’indexation automatique des pages Web collectées par le robot pour construire l’index de la base de données ainsi constituée par exploration successive. Il contient tous les mots de toutes les pages rapatriées par le robot.  Il contient la copie des pages telles qu’elles étaient le jour de la visite du robot. Il indexe donc: le texte intégral de la page, l’URL et les différentes balises méta (titre, mot clé, etc.) Dollara.fr - 2013

  17. une interface web Elle met en relation le système et l’usager. L’usager peut lancer une requête par mots sur l’index du moteur, à l’aide d’une syntaxe propre à chaque moteur. Dollara.fr - 2013

  18. Google me permet-il de retrouver une page consultée il y a un an ? Je recherche la page http://dollara.fr/references.htmlContenant des informations sur les établissements collaborateurs de l’organisme Dollara.fr - 2013

  19. Google me permet-il de retrouver une page consultée il y a un an ? Les moteurs n’archivent pas les documents qui ont été modifiés ou qui ont disparu. Ce n’est pas parce que vous avez vu une page un jour sur le Web que vous la retrouverez forcément. La solution de recours pour retrouver une page disparue : la « Wayback Machine » sur le site www.archive.org. Fondé en 1996, Internet Archive est un organisme à but non lucratif, dont l’objectif est de constituer une bibliothèque de pages web accessible de façon permanente. La bibliothèque regroupe plus de 150 milliards de pages web archivées depuis 1996. Dollara.fr - 2013

  20. Fonctionnalités disponibles sur un moteur Consulter les aides en ligne. • Les recherches sont-elles effectuées de manière anonyme sur les moteurs ? Les moteurs de recherche disposent de l’historique des mots-clés recherchés par les usagers sur leur index ; l’internaute est identifié par son adresse IP. Les données sont censées être détruites après un temps plus ou moins long. Dollara.fr - 2013

  21. Incidences sur la recherche • 1.une requête par mots clés sur un moteur va chercher sur son index, qui contient le texte de toutes les pages rapatriées par le robot. Dollara.fr - 2013

  22. Dollara.fr - 2013

  23. 2. la requête doit être formulée de manière très précise si l’on ne veut pas avoir trop de bruit. Dollara.fr - 2013

  24. 3. La page actuelle peut être différente de celle indexées par le robot: effacée, mise à jour, déplacée on peut cliquer sur le titre d’un résultat et avoir le message « Erreur 404 page not found » OU les snippets (extraits des pages copiés par le robot) ne sont pas trouvables sur la page actuelle Dollara.fr - 2013

  25. 4. il est nécessaire d’interroger plusieurs moteurs : - ils n’ont pas la même couverture du web - ils utilisent des algorithmes de classement différents - la recherche se fait sur l’index du moteur-sur la copie des pages telles qu’elles étaient lorsqu’il les a copiées CfFiche pratique algorithme de pertinence Dollara.fr - 2013

  26. - L’interrogation de plusieurs moteurs à l’aide d’une même requête donne des premières pages de résultats trèsdifférents. Essayez sur Google et Bing avec la requête: Pollution air Dollara.fr - 2013

  27. Illustration avec Google Source: AmitSinghal, Technologies behind Google ranking , 7/16/2, http://googleblog.blogspot.com/2008/07/technologies-behind-google-ranking.html008 Google explique en 2008 l’évolution de ces critères de classification : les attentes des utilisateurs sont passées de « donnez-moi ce que je dis » à « donnez-moi ce que je veux ». Google a donc fait évoluer sa technologie autour de trois points : - comprendre le contenu des pages web : « We find the official homepage for Sprovieri Gallery in London for the Italian query [galleria sprovierilondra], even though the official page does not have either London or Londra on it. ” Dollara.fr - 2013

  28. Illustration avec Google Source: Amit Singhal, Technologies behind Google ranking , 7/16/2, http://googleblog.blogspot.com/2008/07/technologies-behind-google-ranking.html008 - comprendre la requête de l’internaute Correcteur orthographique: « [kofee annan] is really searching for Mr. Kofi Annan, and is prompted: Did you mean: kofi annan;“ Synonymes: “e.g., it knows that the word 'Dr' in the query [Dr Zhivago] stands for Doctor whereas in [Rodeo Dr] it means Drive.” Dollara.fr - 2013

  29. Illustration avec Google Source: AmitSinghal, Technologies behind Google ranking , 7/16/2, http://googleblog.blogspot.com/2008/07/technologies-behind-google-ranking.html008 - Comprendre l’internaute lui-même Système de localisation : la même question ne donnera pas la même réponse selon le pays d’où elle est posée. Dollara.fr - 2013

  30. 5. Les moteurs n’interrogent qu’une partie de leur index : il ne faut absolument pas se fier aux premières estimations des moteurs - les moteurs ne communiquent plus sur la taille de leur index depuis 2005 : la performance d’un moteur réside dans la qualité et non la quantité. - poursuite des efforts pour augmenter la couverture de leur index et réduire le délai de rafraîchissement des pages (certains moteurs travaillent sur le temps réel et indexent des documents dès leur mise en ligne sur le web). Dollara.fr - 2013

  31. Quel est le modèle économique ? Dollara.fr - 2013

  32. les moteurs de recherche proposent gratuitement leurs services aux internautes • les revenus publicitaires représentent la plus grande source de financement des moteurs (98% pour Google). • présence de liens sponsorisés ou liens commerciaux : les annonces sont contextualisées, c’est-à-dire en rapport avec les mots-clés utilisés pour la recherche par l’internaute. L’annonceur n’est facturé que ci celui-ci clique sur le lien publicitaire selon le principe du « coût par clic » ou CPC. Dollara.fr - 2013

  33. certains mots-clés étant plus demandés que d’autres, un système d’enchères régule l’ensemble (des sociétés achètent aux enchères certains mots clés afin de se retrouver dans les premiers résultats d'une requête comprenant ce mot) • Google va très loin dans ce principe de gratuité pour l’utilisateur financée par les revenus publicitaires, en proposant de très nombreux produits et services à ses usagers. Dollara.fr - 2013

  34. Quelles sont les statistiques ? Dollara.fr - 2013

  35. nette domination mondiale du moteur Google ; • accord de partenariat sur 10 ans entre Yahoo! et Microsoft en été 2009.Bing est le nouveau moteur de recherche utilisé sur les sites de Yahoo! partout dans le monde ; • de nombreux sites moteurs ou répertoires travaillent avec des bases de pages crawlées ou des répertoires de sites et des technologies appartenant à d’autres.Exemple : Mozbot est développé à partir de l’index de Google - http://www.mozbot.fr Dollara.fr - 2013

  36. plusieurs moteurs d’origine américaine, comme Google, Yahoo!, Bing ou Ask existent également en version française ; l’index est sensiblement équivalent entre la version française et américaine, mais les réponses en français vont généralement être privilégiées ; • « much ado about nothing » : plusieurs moteurs qui ont fait parler d’eux ont fermé leurs portes (Wikia Search) ou bien ont des audiences très marginales (Exalead, Cuil, Gigablast) ; • émergence de moteurs spécialisés par pays : Baidu, moteur chinois, Yandex, moteur russe • importance accrue de marchés spécifiques à la téléphonie mobile (contrats liant les fabricants de téléphones aux moteurs leaders) et aux réseaux sociaux (partenariat entre Bing et Facebook). Dollara.fr - 2013

  37. Dollara.fr - 2013

  38. Les moteurs disparus depuis 2001 • Infoseek • Ecila • Excite (en tant que technologie moteur) ; il vivote sous la forme d’un portail. • Webtop (Dialog) • Lokace et Northern Light • Teoma (racheté en 2001 par Ask) • Altavista et Alltheweb (en tant qu’entités développant leurs propres technologies) ; en 2003, Yahoo a racheté Overture, propriétaire du moteur Altavista et de la division Web Search de Fast, l’éditeur du moteur Alltheweb. Dollara.fr - 2013

  39. Les moteurs disparus depuis 2001 • Inktomi, racheté par Yahoo! en 2003 • Ask (racheté en 2005 par InterActiveCorp) • Wisenut en 2007 • Accoona • Powerset (spécialisé en « langage naturel ») racheté par Live Search en 2008 • Arrêt en tant que moteur Web de la technologie Ask; Ask évolue vers des marchés de niche, développant son service de questions-réponses et l’accès à des services structurés. • WikiaSearch en 2009 • Alltheweb en avril 2011 Dollara.fr - 2013

  40. Il existe de nombreux baromètres dont la vocation est de mesurer, au fil des mois, l’évolution des parts de marché des principaux outils de recherche. AT Internet http://www.atinternet.fr/ressources/ressources/etudes-publiques/barometre-des-moteurs/ Permet de suivre les principales évolutions des parts de visites des moteurs en Allemagne, en Espagne, en France et au Royaume-Uni sur l’ensemble des visites provenant des moteurs de recherche. Dollara.fr - 2013

  41. Focus sur Google • raisons du décollage : rapidité, simplicité, orientation pur moteur, tri de pertinence révolutionnaire • raisons du maintien : avalanches d’innovations, de nouveaux produits et de nouveaux services, soit par création directe, soit par rachat d’entreprises ; • la société va toujours plus loin : achat d’un satellite pour améliorer Google Earth, toujours plus de photographies des rues pour améliorer Google Street View ; • fonctionnalités récentes : à partir de la page de résultats, options de filtrage des résultats et fonctionnalités supplémentaires Dollara.fr - 2013

  42. Dollara.fr - 2013

  43. Quelle méthodologie de recherche dans un moteur ?Deux approches et des outils d’aide à la formulation Dollara.fr - 2013

  44. Deux approches : - utiliser le moteur pour identifier des sources pertinentes, des sources susceptibles de répondre => les mots clés devront être relativement génériques (énergie renouvelable)Objectif : - repérer quelques sites à explorer Conseil : affichage de 100 documents par page. Pour ce type de requête, on pourrait interroger un répertoire. - se connecter à un site que l’on connaît mais que l’on n’a pas enregistré dans ses favoris. Dollara.fr - 2013

  45. - utiliser le moteur pour localiser le document pertinent => les mots clés devront être relativement précis. Réfléchir aux mots susceptibles de se trouver dans le texte intégral des pages web. Selon le nombre de pages obtenues, on affinera la requête en ajoutant des mots clés, en utilisant des opérateurs avancés, en supprimant des mots clés et en ajoutant des synonymes, etc. => du choix des mots clés dépendra la pertinence des résultats Dollara.fr - 2013

  46. Précisions sur cette deuxième approche : Étape 1 de la formulation: bien formuler sa requête: prendre garde aux guillemets, aux accents et aux diverses formes des mots-clés. Étape 2 de la formulation : analyse des résultats de recherche. Si trop de résultats : affiner sa requête en utilisant les différents opérateurs (recherche sur le titre, le nom de domaine, l’URL, etc.). Dollara.fr - 2013

  47. Conseils Pour affiner la recherche, entrer les opérateurs directement dans le champ de recherche du moteur et ne pas utiliser la formulaire de recherche avancée. Exemple : rechercher l’expression « bibliothèques numériques » dans le titre des pages et le mot France dans le reste de la page. => Impossible avec les formulaire de recherche avancée Dollara.fr - 2013

  48. Des outils d’aide à la formulation - Fonction Didyoumean? - Termes associés d’Exalead À la requête : « énergie des marées » Choix de cliquer sur le terme pour les rajouter à la requête ou au contraire l’exclure : chaque ajout ou suppression génère l’affichage d’une nouvelle liste de termes associés. Dollara.fr - 2013

  49. Des outils d’aide à la formulation pour les professionnelsdu référencement et pour les webmasters : • générateur de mots clés de Google bfr.li/fdl5ko • Kwmap http://www.kwmap.com • Google Trends http://www.google.fr/trends Dollara.fr - 2013

  50. Quelle syntaxe d’interrogation des moteurs ? Dollara.fr - 2013

More Related