Contexte de la production et de l’évaluation scientifique

Contexte de la production et de l’évaluation scientifique Gabriel Gallezot

Plan • Usage de l’IST par les chercheurs • La communication Scientifique • L’évaluation scientifique • … appropriation « du numérique » et indicateurs émergents

Bases Bibliographiques Banques de données Revues, ouvrages Colloques Archives Ouvertes Editeurs, agrégateurs Site web, page perso, blog Liste de discussion Bibliothèques Usage de l’information Rechercher: IR/épistémè … Les ressources Types de documents Formats de documents Modalités d’accès aux documents

Communication Scientifique(schéma dia suivante) • un processus au cœur de la recherche • le chemin "traditionnel" qu'emprunte l'IST • Montre les types de doc et les statuts des doc Schéma bouleversé par • l’accès réseaux • prod. numérique • les entrepôts numériques --> en terme rapidité et spectre documentaire

Communication scientifique modèle 70’ Source : Julie M. Hurd JASIST 51(14), 2000

Ex. « Code documentaire » pour l’évaluation ACL : Articles dans des revues internationales ou nationales avec comité de lecture répertoriés dans les bases de données internationales ACLN: Articles dans des revues avec comité de lecture non répertoriés dans des bases de données internationales. ASCL : Articles dans des revues sans comité de lecture, INV: Conférences invité. ACT : Communications avec actes dans un congrès international ou national COM: Communications sans actes dans un congrès international ou national AFF : Communications par affiche dans un congrès international ou national OS : Ouvrages scientifiques (ou chapitres de ces ouvrages) OV : Ouvrages de vulgarisation (ou chapitres de ces ouvrages) DO : Directions d’ouvrages AP : Autres publications TH : Thèses soutenues Valorisation et brevets: contrats de recherche, les partenariats industriels,..

Cycle de l'édition Rapport GFII sur le libre accès, janvier 2009

Contexte de la recherche Cycle de l’information (usage de l’information et production de résultats)‏ Communication scientifique (diffusion des résultats)‏ Cycle de l'édition (publication des résultats)‏ Acteurs : Pairs Editeurs institutions La question de l’évaluation

La question de l'évaluation

Evaluation pour la publication…Evaluation qualitative : a priori, le peer reviewing, … • Auto-évaluation • Collègues de labo (évaluation)‏ • Direction de N° (guest éditor) ou d’ouvrage (sélection/évaluation)‏ • Comité de rédaction (sélection)‏ • Comité scientifique (évaluation)‏ • Editeur (évaluation/correction)‏ • Lecteur (évaluation)‏

… Publication pour l’évaluationEvaluation quantitative : a posteriori, la bibliométrie • À l’origine : Garfield et le Science Citation Index (SCI, 1961) de l’Institute for Scientific Information (ISI), puis JCR (1975) • Des référentiels : Wos OST, ERIH, JQL, liste AeRES, Scopus, …des bases (JournalBase), des listes… • Des mesures : Impact Factor, Classement de Shanghai, H index, Y index, G index, indicateurs OST, Leiden Facteurs • Des évaluations : AeRES, CNU, Université, … Et … d’autres formes d’évaluation et de mesures : enquête SHS/CNRS, faculty of 1000, Citeseer, Citebase, schoolar…voir les diapos suivantes

Les dimensions de la recherche Source : Ph. Laredo, LATTS.doc N°0 2003

Evaluer l’activité “recherche” ? • Pourquoi ? : > le pilotage (DGES, Univ, …) : orientation de la prod sc., répartition bugétaire, recrutement, financement, prime, modulation de service... • Comment ? : quels référentiels ? quels indicateurs ? • Qui ? Quoi ? : les chercheurs, les établissements , les revues, les programmes, ... • Par Qui ? : Ost, Aeres, Cnu, Univ... Un modèle prégnant : publication (article de revue) et valeur de cette publi. par la mesure des citations “reçues” par d’autres publications (bibliométrie) Un modèle dominant(STM) et quasi monopole de l’analyse et du référentiel (Thomson-reuter)

Quel(s) réfentiel(s) ? -> Examen des sources disponibles comme référentiel(s) possible(s) pour l’évaluation ... WoS (Thomson-reuter), Scopus (Elsevier), Google Scholar, ... et après ??? • Bases payantes : Wos (SCI, SSCI,AHCI),Scopus • Bases « invisibles » : interne institution, programme, ... • Bases « ouvertes » : Pubmed, Common Chemistry, ... • Moteurs de recherche : Scholar, Scirus, Scitopia, ... • AO & co : ArXiv, CiteSeer, institionnelle, revues.org, Cairn, Persée, HAL, Driver, Isidore, ... • Listes et références : Aeres, ERIH, JQL, ...F1000 JournalBase • Outils d’interfaçage / Mashup : Eigenfactor, Scimago, SCEAS, Authoratory, Scival, Bibapp... • Web : site labo, perso, programme, ... • Web2.0 : Connotea, CiteUllike, Zotero, mendeley ... Postegenomic, hypothèse, ...

Quelle(s) Mesure(s) ?... “... pour l'essentiel, la quantification est utilisée comme indicateur de qualité » « La meilleure façon de pousser les classements vers le haut, c'est de tuer les sciences humaines. » “ Il est largement accepté qu'une grande lacune des classements, comme des différentes bases bibliométriques – tient à leur incapacité à traduire avec exactitude et de manière adaptée la manière dont les différentes disciplines produisent et diffusent les connaissances, et de plus en plus pour rendre compte des retombées au-delà du périmètre académique. » Extraits Exemples de mesures : Rapport Unesco 2009, Ellen Hazelkorn, RAPPORT OCCASIONNEL No. 15

… quelle(s) influences ? Extrait “... malgré leur durée de vie relativement courte, est qu’il existe déjà des fortes preuves que les classements ont déjà un effet profond sur la prise de décisions et les comportements dans le monde de la recherche ce qui entraînera des conséquences pour la structure des systèmes et l’organisation des institutions. » “ l’application forcée à l’enseignement supérieur de modalités de gouvernance, de gestion et de contrôle se revendiquant de l’industrie et du modèle R&D – où d’ailleurs elles sont loin d’avoir fait leurs preuves – s’avère totalement inadéquate pour favoriser la qualité du travail d’enseignement-recherche et assurer la prise en charge du rôle de l’université vis-à-vis de la société. » “ la mise en concurrence des équipes de recherche et le scorage de leur activité n’apportent aucune ressource pour la qualité des savoirs produits et met gravement en difficulté des collectifs dont le travail est indispensable au développement des disciplines et au fonctionnement des universités. » “ Il convient de changer radicalement la proportion de temps et d’énergie consacrée à produire et transmettre des savoirs par rapport à celle vouée à justifier et évaluer pour permettre aux enseignants-chercheurs et aux équipes de se recentrer sur leurs missions fondamentales » Rapport Unesco 2009, Ellen Hazelko rn, RAPPOR T OCCASIONNEL No. 15 Extrait Motion 71e section CNU Pour Les Aesr

Les mesures

Exemples d'indicateurs mondiaux (Etablissements) Une comparaison de ce que les différents classements mesurent Rapport Unesco 2009, Ellen Hazelkorn, RAPPORT OCCASIONNEL No. 15

« Shangai » - critères • La qualité de l'enseignement (10% de l'évaluation) Le critère « Alumni » : ce critère prend en compte le nombre de prix Nobel (hors littérature et paix) et de médailles Fields reçues par les anciens élèves ayant validé un bachelor, un master ou un doctorat (les distinctions les plus récentes valant plus de points). • La qualité de l'établissement (40% de l'évaluation) Le critère « Award » : ce critère est lié au nombre de prix Nobel (toujours hors littérature et paix) et de médailles Fields obtenus cette fois-ci par les chercheurs (une fois de plus le poids des chercheurs du début du siècle est moins important que les chercheurs en poste). Le critère « HiCi » : le deuxième élément utilisé pour mesurer la qualité de l'établissement est le nombre de chercheurs les plus cités dans leurs disciplines. • Le volume de publications scientifiques (40% de l'évaluation) Le critère « N&S » : ce critère classant prend en compte les articles publiés dans les revues scientifiques « Nature » et « Science » Le critère « PUB » : il comptabilise les articles indexés dans le « Science Citation Index », et le « Arts & Humanities Citation Index ». • La taille de l'établissement (10% de l'évaluation) Source :

Retour sur « Shanghai » • sensibiliser le monde universitaire à son positionnement international (dynamique) • 200X : • Calculé sur les données du WoS qui présentent déjà de nombreux biais (notamment la langue, type de doc, qualité de la base, ...) • Pb multiples liés à l’affiliation des chercheurs (institutions de rattachement, mixité des labos, articles en collaboration, émerite univ A<>B, …) • Pb de nos univ dans la mondialisation: éparpillement , petites tailles, pluridisciplinaires, …

Classement Leidenhttp://www.leidenranking.com/ Ce classement propose 2 types d' indicateurs : Impact et collaboration Impact : Le score moyen de citation (MCS) . Le nombre moyen de citations des publications de l'université. Le score moyen citation normalisée (MNCS) . Le nombre moyen de citations des publications d'une université, compte tenu des différences sur le terrain, année de publication, et le type de document. Une valeur MNCS de 2, par exemple, signifie que les publications d'une université ont été cités 2 fois supérieur à la moyenne mondiale. Proportion des « top » publications 10% (PP top 10% ) . La proportion des publications d'une université qui, par rapport à d'autres publications similaires, appartiennent à la tranche supérieure de 10% les plus fréquemment cités. (indicateur le plus stable)

Classement Leiden (suite) Collaboration Proportion des publications de collaboration (PP collab ) . La proportion des publications d'une université qui ont été co-écrit avec un ou plusieurs autres organisations. Proportion publications internationales de collaboration (PP int collab ) . La proportion des publications d'une université qui ont été co-écrit par deux ou plusieurs pays. La distance moyenne collaboration géographique (MGCD) . La collaboration à distance géographique moyenne des publications d'une université Proportion des publications à longue distance de collaboration (PP > 1000 km ) . La proportion des publications d'une université qui ont une distance géographique de la collaboration de plus de 1000 km.

Zones, pays, régions OST : Observatoire des Sciences et techniques. Incateurs pour la france indice d’impact : c'est le rapport de la part mondiale de citations sur la part mondiale de publications

Zones, pays, régions • Part de publications scientifiques • Indice de spécialisation scientifique • Part de citations • Indice d’impact relatif • Indice d’impact espéré • Ratio de citations relatif • Indice d’activité par classe de citations • Part d’articles en co-publication Les 8 indicateurs de l’OST Ex. Rapport OST 2010 Source :

Facteur d’impact Revues • ISI calcule le facteur d’impact d’une revue de la façon suivante: Le nombre total de citations faites en 2004 d’articles publiés au cours des deux années précédentes (2002 & 2003) est divisé par le nombre total d’articles publiés au cours des deux années précédentes 1630 523 Citations en 2004 d’éléments publiés en 2002 et 2003 Nombre total d’articles publiés en 2002 et 2003 3.117 = Source : ISI thomson

H index : Jorge E. Hirsch (2005) . Relation entre un nombre total de publications et leurs citations > coïncidence approximative entre un nombre équivalent de publications et de citations. Ex : h index = 10 => environ 10 publications citées au moins 10 fois • G index : Egghe, Leo (2006) : un g-index de 10 => 10 papiers dont la somme des citations est au moins de 100 • A- index, H-b index , scHolar index, … Démo avec POP ou Tenurometer ou google scholar citation h index et variantes CHERCHEUR

ISIHighlyCited.com « …an expert gateway to the most highly influential scientists and scholars worldwide » « ISIHighlyCited.com highlights the top 250 preeminent individual researchers in each of 21 subject categories who have demonstrated great influence in their field as measured by citations to their work » CHERCHEUR

Exemple de H-index pour un auteur Pouyssegur J* ( le seul ISIHighlyCited pour l'UNS ) Scholarometer – Google scolar Scopus WOK

facteur y • tient compte de la distinction entre les deux notions de « popularité » et de « prestige ». C’est le produit de « ISI IF and Weighted PageRank »

Retraction index Nouvel indicateur, le « retraction index » : Fang, Ferric C., et Arturo Casadevall. 2011. « Retracted Science and the Retraction Index ». Infection and Immunity 79(10): 3855-3859. Correlation entre L'IF et le retractation index Voir le blog sur les articles « retirés »

La fraude « annoncée » de plus en plus importe : Fang, Ferric C., R. Grant Steen, et Arturo Casadevall. 2012. « Misconduct accounts for the majority of retracted scientific publications ». Proceedings of the National Academy of Sciences. Et Pierre Barthélémy, « passeurdesciences » http://passeurdesciences.blog.lemonde.fr/2012/10/03/la-fraude-scientifique-est-plus-repandue-recherche/ Voir : l'outil pour les articles similaires. " l'augmentation des rétractions et des manquements à l'éthique peut résulter, au moins en partie, du système de la science au résultat, basé sur la logique économique de la prime au vainqueur, qui confère au premier des récompenses disproportionnées, sous la forme de subventions, de postes et de prix, à une période où le financement de la recherche se restreint ".

Les instances d'évaluation

Êtes-vous « publiant » ? selon l’AERES(doc 2007)http://wiki-urfist.unice.fr/wiki_urfist/images/7/7d/Criteres_Identification_Publiants.pdf AeRES remplacée par une nouvelle « agence » : Haut Conseil à l'évaluation => HCERES Missions en cours de définition L’activité d’une unité de recherche fait l’objet d’une appréciation qualitative, fondée principalement sur l’évaluation par les pairs, complétée par un certain nombre d’indicateurs aussi objectifs que possible. A l’estimation globale de la qualité de la production scientifique et du rayonnement d’un laboratoire, s’ajoute la prise en considération de l’organisation et de la répartition des travaux entre ses membres. L’un des indicateurs est une estimation de la proportion des chercheurs et enseignants-chercheurs "publiants". Production Scientifique de rang A pour 4 ansScu Liste revues AeRES : Peut-être de nouveaux critères ?, selon les recommandations de l’Academie des Sciences au MESR

Est considéré comme une production scientifique de rang A pour l’AeRES : • une publication dans une revue internationale avec comité de lecture (ou une revue considérée comme de très bon niveau par la communauté dans certaines disciplines), • un chapitre d'ouvrage ou un ouvrage de recherche reconnu internationalement (ou de portée nationale en SHS), • pour le secteur STIC ou SHS, un article long dans un congrès international à comité de sélection considéré comme sélectif par la communauté, • pour le secteur SHS, la constitution de bases de données accessibles ou de corpus de référence, les éditions critiques • un brevet déposé à l'international. Il est clair que la participation à des colloques est un indice de l'activité scientifique mais la très grande variabilité qualitative de l'évaluation des actes des colloques ne permet pas de les retenir comme élément pertinent d'appréciation.

Evaluation Labo par l’AERES(4 volets de la notation) • Qualité scientifique et production (qualité et quantité des publis) • Rayonnement et attractivité, intégration dans l'environnement (relations internationales, contrats nationaux, prix, ...) • Stratégie, gouvernance et vie du laboratoire (implication dans l’univ, politique de recrutement, ... • Appréciation du projet (analyse du « quadriennal »)

CNU Voir site CP- CNU : qualification et… recommandation de chaque section :

Les études et rapports sur d'évaluation

Principales Recommandations pourL’évaluation individuelle des chercheurs et des enseignants-chercheurs en sciences exactes et expérimentales(Rapport Academie des Sciences du 8 juillet 2009 au MESR) Pour une déontologie incontestable 1 -Assurer la qualité des évaluateurs à partir de pré-requis définis par l'AERES 2 -Imposer une déclaration obligatoire des conflits d'intérêt directs et indirects, signée par les évaluateurs, et remplacement au sein du comité si nécessaire 3 -Limiter la durée des mandats à trois ans avec rotation annuelle par tiers pour dissocier les lobbies Évaluation de l’activité de recherche 4 -Réaffirmer la valeur primordiale de l'évaluation directe des travaux scientifiques à partir des publications originales et éventuellement d’auditions

...suite 5 -Encadrer la bibliométrie en s'assurant qu’elle soit utilisée de façon rigoureuse, en évitant tous les biais trop souvent négligés, en adaptant les indicateurs selon les disciplines, et en l’intégrant à l’évaluation qualitative. Encourager le développement d’une recherche critique de nouveaux indicateurs 6 -Donner la place qu'elle mérite à la recherche appliquée pour ceux qui s'y consacrent 7 -Prendre en considération les critères objectifs de notoriété scientifique nationale et internationale Évaluation de l’activité d’enseignement 8 -Etablir une grille d'évaluation de l'enseignement en donnant une large place à l’appréciation des étudiants 9 -Intégrer des critères objectifs tels que le contenu et l’originalité de l’enseignement ou la production d’ouvrages pédagogiques Évaluation des charges d’intérêt collectif 10 -Prendre en compte les charges d’intérêt collectif, plus particulièrement celles impliquant des responsabilités importantes

...suite Autres mesures importantes 11 -Réduire le nombre des évaluations au strict nécessaire, en distinguant les évaluations approfondies (recrutements et autres étapes-clés de la carrière), des évaluations de suivi 12 -Procéder aux recrutements en deux étapes : admissibilité sur dossier, admission après audition et examen approfondis 13 -Toute évaluation ne doit être entreprise que si elle peut conduire à des conséquences significatives pour l’intéressé. Créer des structures de ressources humaines en vue d’une aide à une évolution de la carrière des personnels en difficulté 14 -Bien mettre en perspective le rôle de l’évaluation nationale (essentielle pour l’activité de recherche) et de l’évaluation locale (la mieux placée pour l’évaluation de l’enseignement et celle des charges d’intérêt collectif) en veillant néanmoins à ce que les structures locales d’évaluation incluent un pourcentage suffisant d’experts extérieurs.

Rapport Académie des Sciences17 janvier 2011DU BON USAGE DE LA BIBLIOMETRIE POUR L'ÉVALUATION INDIVIDUELLE DES CHERCHEURS « L’évaluation individuelle des chercheurs reste très subjective et soumise à de nombreux biais potentiels. L’Académie a souhaité se pencher sur les pratiques bibliométriques quantitatives censées être plus objectives, et émettre un certain nombre de recommandations sur l’usage de la bibliométrie qui pourrait, moyennant le respect de règles rigoureuses, aider à l’évaluation qualitative. Ces règles devraient être reconnues à un niveau au moins européen. Le problème est d’autant moins simple que l’évaluation bibliométrique fait débat, avec des avis souvent tranchés pour ou contre son utilisation, dépendant en grande partie, mais pas seulement, des disciplines. » Voir aperçu du rapoort en PDF -> les quelques points surlignés

Rapport de L’Inria2007 Les indicateurs sont des instruments de mesure importants mais qui doivent être utilisés de manière éclairée en respectant des règles de base : • Les indicateurs actuels sont essentiellement des facteurs d'impact ce qui n'est pas synonyme de qualité. • Il faut simplement s'attacher aux ordres de grandeur des indicateurs car même l'utilisation de sources diverses ne permet pas d'obtenir une grande précision. • Il est nécessaire de corriger les indicateurs par l'avis d'experts. • Il est nécessaire d'utiliser plusieurs indicateurs. • Il est nécessaire de recouper des sources diverses pour obtenir une information pertinente.

JournalBase Une étude et un futur référentiel ? • 5 bases sont étudiées. Les bases SSCI (2012 revues) et AHCI (1166 revues) du WOS (Thomson-reuter) comportent (en 2009) quelques 3178 revues, quand Scopus, base d’Elsevier en recense 6200, l’ERIH liste 5200 titres, et l’AERES en dénombre 6000. • journalbase, résultats de la concordance et de la curation des 5 bases, recense 9551 revues différentes en SHS • ... La suite sur :

(re)penser l'évaluation

Appropriation du « numérique » (re)penser • le cycle de l’info • la communication scientifique • l’évaluation de la recherche

Source : JimGray, 4thParadigm, 2009 eScience • Appropriation des technologies, pratiques informationnelles nouvelles ou renouvelées (diffusion et accès) • Data deluge – Big data – Open data – data curation • Gain de productivité ? (bouclage rapide du cycle) • Gain de créativité ? (tertiarisation documentaire)

Production scientifique et compartimentation des savoirs...vers l’interdisplinarité • Spécialisation de la R • Évaluation de la R => accroissement de la Pub. Sc. (données, textes, revues, etc)‏ Il faut : • Mieux connecter • Mieux partager • Ouvrir le spectre documentaire • La KDD D’après Swanson (1986)‏

Communication scientifique modèle 2020 Source : Julie M. Hurd JASIST 51(14), 2000

Une histoire de la communication scientifique[ dispositif de publication renouvelé ] micro-ordinateur A partir de : GUÉDON, J. (2001). In Oldenburg's Long Shadow : Librarians, Research Scientists, Publishers, and the Control of Scientific Publishing. In Creating the Digital Future : Association of Research Libraries,138th Annual Meeting, Toronto, Ontario (Canada), May 23-25, 2001.

Indicateurs émergents ?IF, Shanghai, h index et quoi d’autre ? > Des spécificités pour les domaines Sc. Par ex. SHS : • Importance Revues/Ouvrages ? • Internationnalisation des disciplines ? > Des pistes (les dia. suivantes) : • Système d’information (SI) local • Interfaçage / Mashup • visibilité internationale des références “hors marché de l’information” : le “scholar web” (AO, outils spécialisés,…)

Contexte de la production et de l’évaluation scientifique