folksonomies scientifiques une tude exploratoire comparative
Download
Skip this Video
Download Presentation
Folksonomies scientifiques : une étude exploratoire comparative

Loading in 2 Seconds...

play fullscreen
1 / 41

Folksonomies scientifiques : une étude exploratoire comparative - PowerPoint PPT Presentation


  • 117 Views
  • Uploaded on

Folksonomies scientifiques : une étude exploratoire comparative. Dominique Besagni, Cecilia Fabry, Claire François, Clotilde Roussel INIST / CNRS Evelyne Broudoux UVSQ, DICEN. Objectifs généraux de l’étude. De quoi se composent les folksonomies scientifiques ?

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about ' Folksonomies scientifiques : une étude exploratoire comparative' - dieter


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript
folksonomies scientifiques une tude exploratoire comparative

Folksonomies scientifiques : une étude exploratoirecomparative

Dominique Besagni, Cecilia Fabry,

Claire François, Clotilde Roussel

INIST / CNRS

Evelyne Broudoux

UVSQ, DICEN

objectifs g n raux de l tude
Objectifs généraux de l’étude

De quoi se composent les folksonomies scientifiques ?

  • Une question : que révèlent les usages ?
    • Activité réelle des usagers dans et hors les groupes ?
    • Représentativité des domaines scientifiques ?
  • Méthodologie
    • Une entrée par les groupes
    • Une entrée par les tags

2

objectifs sp cifiques de l tude
Objectifs spécifiques de l’étude

Quels groupes utilisent quels tags pour quels articles ?

  • Informations sur les groupes
      • Membres
      • Tags utilisés
      • Articles et/ou références répertoriés dans les bibliothèques des groupes
      • Dates (utilisateur et/ou article)
  • Analyses
      • Dynamique des groupes
        • Taille, âge des groupes, dernière arrivée d’un membre
      • Activité des groupes
        • Taille des bibliothèques, dernier article ajouté,
        • Tags associés aux articles
      • Analyse de contenu
        • Réseau de partage des tags par les groupes

3

protocole op ratoire
Protocole opératoire
  • Récupération des données à partir de pages HTML :
    • Scripts Perl
    • Module WWW::Mechanize qui peut :
      • décharger les pages HTML,
      • suivre les liens,
      • remplir les formulaires,
      • cliquer sur les boutons,
      • gérer les cookies,
      • mais ne peut pas interpréter JavaScript (exemple 2Collab) !
      • (existe pour la plupart des langages : java, python, ruby, php ...)
    • Module WWW::RobotRules :
      • respect des consignes du serveur

4

protocole op ratoire1
Protocole opératoire

Récupération des données à partir d’une API :

Sur certains sites comme Bibsonomy

Scripts Perl

Module WWW

requête simple,

syntaxe dépendante du site,

résultat sous forme de fichiers XML,

Module XML::TokeParser

5

recherche des groupes
Recherche des groupes

URL : http://www.citeulike.org/groups/browse

7

recherche sur un groupe 1
Recherche sur un groupe (1)

URL : http://www.citeulike.org/group/22

8

recherche sur un groupe 2
Recherche sur un groupe (2)

URL : http://www.citeulike.org/group/22

9

recherche sur un groupe 3
Recherche sur un groupe (3)

URL : http://www.citeulike.org/groupfunc/22/members

10

recherche sur un groupe 4
Recherche sur un groupe (4)

URL : http://www.citeulike.org/group/22/article/1073937

11

r sultats
Résultats
  • Effectifs et dynamique des groupes
  • Activité des groupes
  • Tags utilisés par l’ensemble des groupes
  • Réseau d’un sous-ensemble :
    • 17 groupes partageant le tag « deforestation »

12

citeulike effectifs des 2871 groupes
CiteUlike : Effectifs des 2871 groupes

Max 99 membres

1434 groupes d’un seul membre

13

dynamique des groupes

2009

2005

2009

2006

21%

2004

2005

9%

37%

2008

2007

15%

17%

2006

2008

2007

Dynamique des groupes

Année de création

6%

38%

11%

14%

31%

dernier membre ajouté

14

le groupe contenant le d inscrits
Le groupe contenant le + d’inscrits

Bioinformatics

  • Groupe libre
  • 99 membres
  • Crée le 10/10/2007
  • Dernier membre ajouté le 06/08/2009
  • 3 769 articles
  • Dernier article ajouté le 18/09/2009
  • Description :

Analysis and modelling of molecular biology data

15

activit des groupes
Activité des groupes

Max 27 741 articles

236 groupes avec un seul article

524 groupes sans articles

16

activit des groupes1

2009

2005

2009

2006

6%

38%

11%

33%

14%

2007

18%

2008

2005

31%

23%

3%

2006

2008

2007

7%

15%

Activité des groupes

dernier membre ajouté

dernier article ajouté

17

le groupe contenant le d articles
Le groupe contenant le + d’articles

Le plus gros groupe n’est géré que par 2 utilisateurs.

Il est actif depuis plus d’un an et est mis à jour très régulièrement

C. elegans /WormBase

  • Groupe libre
  • 2 membres
  • Crée le 02/08/2008
  • Dernier membre ajouté le 17/09/2008
  • 27 741 articles
  • Dernier article ajouté le 14/09/2009
  • Description :
    • Articles of note for the nematode research community in general and the C. elegans community in particular.

18

les groupes de 1 membre
Les groupes de 1 membre

Plus de 350 groupes d’un seul membre ne contenant pas d’article

TESTS ????

Nb groupes

Nb articles

19

les groupes sans article
Les groupes sans article

Un groupe de 14 membres sans articles

Nb groupes

Nb membres

20

les groupes avec 1 seul article
Les groupes avec 1 seul article

150 groupes constitués d’un seul membre ont un seul article

TESTS ????

Nb groupes

Nb membres

21

tags de l ensemble des groupes
Tags de l’ensemble des groupes
  • 68 522 tags
  • 26 668 tags de fréquence 1
  • 43 820 tags dans un seul groupe

22

les tags les plus fr quents
Les tags les plus fréquents

Le vocabulaire du plus gros groupe en terme d’article (27741) se retrouve dans ce classement (C. elegans /WormBase )

23

une biblioth que pour 3 groupes
Une bibliothèque pour 3  groupes
  • Tags :
  • bibtex-import
  • Species
  • Habitat
  • Spatial
  • Control
  • Management
  • Biodiversity
  • Conservation
  • Population
  • Diversity
  • Biological
  • Litchi
  • Mode
  • Plant
  • 45 landscape
  • Botany
  • taxonomy, evolution, physiology, ecology, genetics
  • 11 utilisateurs,
  • 1862 articles,
  • Créé en 2007,
  • dernier utilisateur en 08/2009
  • dernier article en 06/2007
  • 2938 tags
  • EarthEnvironmentalSciences
  • Major researches on various environmental, ecological, socio-economic, geographical, biodiversity issues. From earth climate change to minute soil pores studies. From microbiotic crusts to Amazon forest study. From polar ice caps to Sahara desert.
  • 12 utilisateurs,
  • 1862 articles,
  • Créé en 2008,
  • dernier utilisateur en 08/2009
  • dernier article en 06/2007
  • 2938 tags
  • Entomology
  • taxonomy, ecology, conservation, evolution, physiology, genetics
  • 10 utilisateurs,
  • 1862 articles,
  • Créé en 2007,
  • dernier utilisateur en 09/2009
  • dernier article en 06/2007
  • 2938 tags

28

recherche sur un groupe 11
Recherche sur un groupe (1)

BIBLIOTHEK 2.0

Séparation url (bookmarks) et publications (notices)

effectifs des 169 groupes
Effectifs des 169 groupes

85 groupes de zéro membre ????????

Particularités de ce logiciel le 1er membre donne son nom au groupe et n’est pas compté

Max 47 membres pour le plus grand groupe

dynamique des groupes1
Dynamique des groupes

Année de création

dernier article ajouté

50% des groupes sont mis à jour depuis janvier 2010

conclusion perspectives
Conclusion - Perspectives
  • Premières analyses exploratoires
    • Analyse guidée par les groupes et les tags
    • Réseaux de groupe par tags partagés
  • Profils des groupes
    • Une activité différenciée dans les groupes
      • Des testeurs en nombre (groupes de 1 personne)
      • Des petits groupes très actifs (2 personnes)
      • Des groupes qui continuent de croître sans activité de tagging
    • Des longues traines de tags

40

conclusion perspectives1
Conclusion - Perspectives
  • Les domaines représentés
    • Les groupes représentant les domaines
  • Reste à évaluer
    • Le poids de l’activité des individus hors groupes
    • Le poids des références importées des autres serveurs (recoupements)

41

ad