Ceci est une ancienne révision du document !


Décentralisation des données de la recherche

D'aucuns s'inquiètent de l'usage que peux être fait de la mesure des publications d'articles scientifiques et de leur audience. Ces usages peuvent aller de la sociologie et de l'histoire des sciences à… la quantifications néo-managériales ou au marketing académique.

Faut-il donc refuser de transmettre ses publications, métadonnées seules ou avec document consultable à une plate-forme les centralisant ? HAL est ce type de plate-forme, avec pour mission l'accès libre. Accès libre ou fermé n'enpêche pas la centralisation et les craintes qui peuvent l'accompagner.

Comment alors accepter ce “moissonnage” exhaustif, à destination de certains usages et à la fois garder l'autorité sur l'usage qui en est fait ? On peut penser aux modalités techniques suivantes :

  • une organisation publie des articles. Elle ne les offre pas en consultation mais chacun des auteurs transmets infos et fichiers à l'agrégateur de manière indépendante. Le gain pour l'institution comme pour chacun des auteurs consiste dans un meilleur signalement et une meilleure accessibilité de son travail.
  • l'agrégateur (tel que Hal) remplit ses missions de signalement, de mise en consultation et de mesures, avec la plus grande exhaustivité possible.

Imaginons l'infrastructure alternative suivante :

  • l'institution possède et déploie de son côté un CMS de consultation de ses publications (idéalement une application libre, dont le développement et la maintenance est mutualisé entre toutes les institutions de recherche, y compris les agrégateurs publiques. L'institution devient autonome en termes de signalement/consultation de son travail auprès des chercheurs/lecteurs.
  • l'institution transmets ses sources à un ou plusieurs agrégateurs qui ont pour mission un signalement exhaustif, une consultation et la fouille de données dans un corpus plus large voire complet, ainsi que le mesure des usages sur ces données.

Les données étant consultées à la fois chez l'institution et chez l'agrégateur, une mesure d'usage exhaustive demande que l'institution transmette ses données d'usage à l'agrégateur qui les ajoutera aux siennes.

Imaginons alors que l'institution se trouve en désaccord avec l'exploitation faite par l'agrégateur de ces données et mesures. L'institution étant autonome sur le plan du signalement et de la consultation de ses travaux elle a peu ou pas à perdre en coupant les protocoles d'échange avec l'agrégateur : fin de la transmission des sources et des mesures d'usages en provenance de sa propre plate-forme. Elle peut cependant poursuivre cet échange avec d'autres agrégateurs ou des institutions proches en termes de discipline, notamment pour une accessibilité depuis l'étranger, etc.

Certes elle ne pourra pas supprimer les articles et mesures déjà transmises. L'agrégateur pourra pendant un certain temps extrapoler sur ces données. Mais cela ne pourra pas durer sans dévaluer complètement la mission “mesure d'usages” de l'agrégateur en question. Cela sera d'autant plus vrai que toutes les institutions source pourront emboîter le pas à la première et assécher complètement l'agrégateur.

Quelles technologies pour transmettre et échanger fichiers, messages (commentaires) et données (métadonnées, mesures d'usage).

  • Git ou équivalent : permet la gestion et la fusion de version. Ce logiciel permet par exemple de fusionner d'éventuels changements apportés au fichier par l'agrégateur et par l'éditeur. D'un côté l'éditeur peut devoir corriger une coquille ou enrichir une structuration XML, alors que l'agrégateur de son côté aura les moyens d'enrichir une bibliographie d'article avec des DOI (c'est le cas de Cairn, du cléo, de Erudit.org, etc.), travail pour lequel l'éditeur n'a ni compétences ni outils.
  • un dépôt Git permettrait aussi de mutualiser les métadonnées. Fichiers .txt, .xml.
  • les mesures d'usage : .csv
  • Activitypub : fédération de commentaires. Ok.
2018/06/15 13:55 · chloe

Faites ce que je dis...

Pourquoi les chercheurs qui prônent l'ouverture (accès gratuit car travail produit et financé par le salaire universitaire et les fonds publics de recherche), les communs, la fin de l'Auteur avec un grand A et les licences libres publient-ils des ouvrages payants, en leur nom propre (et non dans celui de leur groupe ou labo de recherche) et sous copyright ?

Il faut revoir soit la théorie, soit la pratique, en tout ou partie. Il y a un petit souci de cohérence. Espérons que les droits d'auteur sont reversés à l'université…

2018/06/04 11:50 · chloe · 38 commentaires

Wikipedia n'a pas de rédaction donc Wikipedia n'est pas une source (2)

Petites précision par rapport au billet précédant :

Par auteur il faut aussi entendre rédaction, d'où mon changement dans le titre de ce billet. On peut attribuer sa confiance à une source morale par le biais de la confiance accordée non pas aux auteurs proprement dits mais à sa rédaction. On ne sait pas exactement qui a écrit un article donné mais on sait qu'il a reçu l'aval de sa rédaction dont la raison d'être est précisément de définir des critères de qualité, justesse, méthode, etc (notions trop complexes pour ne pas les mettre entre parenthèses dans un billet si court).

WP n'a pas plus de rédaction qu'elle n'a d'auteurs. Par contre elle a une fondation, Wikimedia, laquelle a des orientations (libre, collaboratif, etc…). Ces orientations sont détachées de la notion de crédibilité du contenu (simplement parce que ça n'est pas son objet), ce pourquoi le lecteur ne peut pas baser sa confiance sur Wikimedia.

La confiance est une relation. Or sur le plan de la confiance le lecteur de WP n'a personne avec qui créer cette relation. Elle ne peut donc être source de confiance.

2018/05/05 13:53 · chloe

Wikipedia n'a pas d'auteurs donc WP n'est pas une source.

Une petite réflexion au sortir du séminaire Construction de l'autorité numérique (URFIST-ENC, Paris) et de la présentation

Lire la suite...

2018/05/04 13:06 · chloe · 19 commentaires

Ok, Google, ne me calcule pas

L'expression “(ne pas) calculer quelqu'un” s'emploie pour dire (ne pas) remarquer, ignorer, snober quelqu'un, volontairement ou pas.

Au cours de la séance du 4 décembre du séminaire “Éditorialisation et écritures numériques” a été évoquée, ce qui n'est pas nouveau, la question de la calculabilité de nos comportements et par voie de conséquence de notre “identité” sur le web. Dans le numérique, environnement de calcul, nous sommes toujours calculés, toujours remarqués, toujours identifiés.

Où l'on regrette de ne pas être plus souvent snobés…

2017/12/05 12:18 · chloe · 18 commentaires

L'absence de volume visible ou l'aspect zen du livre numérique

Beaucoup ont regretté, depuis son avènement, que le livre numérique ne nous permette plus de nous rendre compte de notre état d'avancement dans notre lecture. “Où en suis-je par rapport à la fin ?”
Je propose que nous le prenions comme un outil vers le zen, une opportunité d'être “ici et maintenant” : “je suis là ou je suis dans ma lecture. La fin arrivera quand elle arrivera.”

C'est aussi peut-être la fin du “trop gros” livre pour nos jeunes ou moins jeunes lecteurs…

2017/12/05 12:06 · chloe · 37 commentaires

Des dispositifs qui jouent et des humains qui lisent

Je me réjouis, en lisant le texte de Louise Merzeau, « Éditorialisation collaborative d’un événement »1), de lire cette phrase :

le dispositif permet d’apprivoiser la densité conceptuelle et langagière des interventions en la rendant jouable.

C'est le terme jouable qui m'intéresse ici en ce qu'il rejoint ma réflexion sur le vocabulaire de substitution à outil (et autres dispositifs, machines, supports, etc.) “de lecture”. Il y a peu j'en appelais ici à un terme en français équivalent à “player” : moteur, projecteur, propulseur…

Les dispositifs jouent nos discours et les humains les lisent.
Merci Louise.

2017/11/02 20:57 · chloe · 19 commentaires

Chapitre et numérique

Dans le cadre d'un colloque sur le chapitre à l'université de Montréal, Marcello Vitali-Rossati, parlant de la discrétisation inhérente au numérique dit

dans le numérique on doit renégocier les formes de discrétisation

dans le sens où, là où nous avions sur le papier des chapitre, sections, paragraphes, etc, quelles sont les unités minimales de discrétisation qui peuvent légitimer le discours, à l'instar du chapitre qui “marque” le livre ?

Pourquoi cet impératif de renégociation des formes de discrétisation ? Le grain “chapitre” est défini par l'auteur2). Il peut faire 100 pages comme une ligne. C'est une décision auctoriale. Le chapitre est un élément narratif, il n'a pas de dimension, que l'on soit dans le monde analogique ou numérique. L'auteur y met ce qu'il veut : un vers, cent pages ou une vidéo. L'auteur peut aussi rédiger un livre sans chapitre.

Quant à l'étendue des segments, si le bit est peut-être l'unité minimale du numérique, la molécule d'encre en est-elle l'équivalent sur le papier ? Quant au web comme unité la plus grande, je verrais en parallèle le texte de Michel Foucault sur le livre comme “nœud dans un réseau” :

[…] l’unité matérielle du volume n’est-elle pas une unité faible, accessoire, au regard de l’unité discursive à laquelle il donne support ? Mais cette unité discursive, à son tour, est-elle homogène et uniformément applicable ? Un roman de Stendhal ou un roman de Dostoïevski ne s’individualisent pas comme ceux de La Comédie humaine ; […] C’est que les marges d’un livre ne sont jamais nettes ni rigoureusement tranchées : par-delà le titre, les premières lignes et le point final, par-delà sa configuration interne et la forme qui l’autonomise, il est pris dans un système de renvois à d’autres livres, d’autres textes, d’autres phrases : nœud dans un réseau. […] Le livre a beau se donner comme un objet qu’on a sous la main ; il a beau se recroqueviller en ce petit parallélépipède qui l’enferme : son unité est variable et relative3).

Tout cela pour dire que la rupture logique entre l'analogique et le numérique ne me semble pas fortement établie en matière de discrétisation des éléments du discours.
De quel ordre est donc cette rupture, si tant est qu'il y a rupture ?

2017/11/02 20:40 · chloe · 18 commentaires

Revue et conversation scientifique

Actuellement en visite à Montréal, au contact de la chaire de recherche en Écritures numériques j'entends que

la revue sert à avoir une conversation scientifique, et non pas à publier des articles.

“Conversation scientifique” et “article” s'opposent-ils ? Il me semble au contraire qu'un texte délimité, un argument fini, sont une excellente base de conversation. Après quoi il est heureux de proposer un argument revu, renforcé ou relativisé.

Notre histoire scientifique, culturelle, artistique semble valider ce modèle en terme de créativité.

Quelque chose m'échappe.

2017/11/02 16:50 · chloe · 18 commentaires

Encyclopédie papier figée ?

Une encyclopédie papier présente-t-elle un résultat figé ? Non, en témoignent les millésimes propres à l'identification de tels projets éditoriaux. Ils étaient “figés” souvent pour 1 an avant d'être mis à jour. Ce type d'édition a toujours été précisément “liquide”, ou “ouvert” en écriture, mais avec la contrainte mécanique du papier.

2 changements dans le passage au numérique :

  • la temporalité de la mise à jour : permanente ou millésimée selon le projet, C'est bien ici l'éditeur et non la technique qui détermine la temporalité,
  • la question de la référence à citer qui peut demander selon le cas d'inclure jour et heure de consultation, rendant complexe l'accord entre lecteurs sur une définition, une citation, stable.
2017/11/02 16:36 · chloe · 22 commentaires

Anciens billets >>

1)
Louise Merzeau, « Éditorialisation collaborative d’un événement », Communication et organisation, 43 | 2013, 105-122. http://communicationorganisation.revues.org.faraway.u-paris10.fr/4158
2)
1 ou des auteurs, anonymes comme identifiés…
3)
Michel Foucault, L’Archéologie du savoir, Paris, Gallimard, 1969.
Dernière modification : le 2024/01/06 10:17