Décentralisation des données de la recherche

D'aucuns s'inquiètent de l'usage que peux être fait de la mesure des publications d'articles scientifiques et de leur audience. Ces usages peuvent aller de la sociologie et de l'histoire des sciences à… la quantifications néo-managériales ou au marketing académique.

Faut-il donc refuser de transmettre ses publications, métadonnées seules ou avec document consultable à une plate-forme les centralisant ? HAL est ce type de plate-forme, avec pour mission l'accès libre. Accès libre ou fermé n'enpêche pas la centralisation et les craintes qui peuvent l'accompagner.

Comment alors accepter ce “moissonnage” exhaustif, à destination de certains usages et à la fois garder l'autorité sur l'usage qui en est fait ? On peut penser aux modalités techniques suivantes :

  • une organisation publie des articles. Elle ne les offre pas en consultation mais chacun des auteurs transmets infos et fichiers à l'agrégateur de manière indépendante. Le gain pour l'institution comme pour chacun des auteurs consiste dans un meilleur signalement et une meilleure accessibilité de son travail.
  • l'agrégateur (tel que Hal) remplit ses missions de signalement, de mise en consultation et de mesures, avec la plus grande exhaustivité possible.

Imaginons l'infrastructure alternative suivante :

  • l'institution possède et déploie de son côté un CMS de consultation de ses publications (idéalement une application libre, dont le développement et la maintenance est mutualisé entre toutes les institutions de recherche, y compris les agrégateurs publiques. L'institution devient autonome en termes de signalement/consultation de son travail auprès des chercheurs/lecteurs.
  • l'institution transmets ses sources à un ou plusieurs agrégateurs qui ont pour mission un signalement exhaustif, une consultation et la fouille de données dans un corpus plus large voire complet, ainsi que le mesure des usages sur ces données.

Les données étant consultées à la fois chez l'institution et chez l'agrégateur, une mesure d'usage exhaustive demande que l'institution transmette ses données d'usage à l'agrégateur qui les ajoutera aux siennes.

Imaginons alors que l'institution se trouve en désaccord avec l'exploitation faite par l'agrégateur de ces données et mesures. L'institution étant autonome sur le plan du signalement et de la consultation de ses travaux elle a peu ou pas à perdre en coupant les protocoles d'échange avec l'agrégateur : fin de la transmission des sources et des mesures d'usages en provenance de sa propre plate-forme. Elle peut cependant poursuivre cet échange avec d'autres agrégateurs ou des institutions proches en termes de discipline, notamment pour une accessibilité depuis l'étranger, etc.

Certes elle ne pourra pas supprimer les articles et mesures déjà transmises. L'agrégateur pourra pendant un certain temps extrapoler sur ces données. Mais cela ne pourra pas durer sans dévaluer complètement la mission “mesure d'usages” de l'agrégateur en question. Cela sera d'autant plus vrai que toutes les institutions source pourront emboîter le pas à la première et assécher complètement l'agrégateur.

Quelles technologies pour transmettre et échanger fichiers, messages (commentaires) et données (métadonnées, mesures d'usage).

  • Git ou équivalent : permet la gestion et la fusion de version. Ce logiciel permet par exemple de fusionner d'éventuels changements apportés au fichier par l'agrégateur et par l'éditeur. D'un côté l'éditeur peut devoir corriger une coquille ou enrichir une structuration XML, alors que l'agrégateur de son côté aura les moyens d'enrichir une bibliographie d'article avec des DOI (c'est le cas de Cairn, du cléo, de Erudit.org, etc.), travail pour lequel l'éditeur n'a ni compétences ni outils.
  • un dépôt Git permettrait aussi de mutualiser les métadonnées. Fichiers .txt, .xml.
  • les mesures d'usage : .csv
  • Activitypub : fédération de commentaires. Ok.
2018/06/15 15:55 · chloe

Faites ce que je dis...

Pourquoi les chercheurs qui prônent l'ouverture (accès gratuit car travail produit et financé par le salaire universitaire et les fonds publics de recherche), les communs, la fin de l'Auteur avec un grand A et les licences libres publient-ils des ouvrages payants, en leur nom propre (et non dans celui de leur groupe ou labo de recherche) et sous copyright ?

Il faut revoir soit la théorie, soit la pratique, en tout ou partie. Il y a un petit souci de cohérence. Espérons que les droits d'auteur sont reversés à l'université…

2018/06/04 13:50 · chloe · 1 commentaire

Wikipedia n'a pas de rédaction donc Wikipedia n'est pas une source (2)

Petites précision par rapport au billet précédant :

Par auteur il faut aussi entendre rédaction, d'où mon changement dans le titre de ce billet. On peut attribuer sa confiance à une source morale par le biais de la confiance accordée non pas aux auteurs proprement dits mais à sa rédaction. On ne sait pas exactement qui a écrit un article donné mais on sait qu'il a reçu l'aval de sa rédaction dont la raison d'être est précisément de définir des critères de qualité, justesse, méthode, etc (notions trop complexes pour ne pas les mettre entre parenthèses dans un billet si court).

WP n'a pas plus de rédaction qu'elle n'a d'auteurs. Par contre elle a une fondation, Wikimedia, laquelle a des orientations (libre, collaboratif, etc…). Ces orientations sont détachées de la notion de crédibilité du contenu (simplement parce que ça n'est pas son objet), ce pourquoi le lecteur ne peut pas baser sa confiance sur Wikimedia.

La confiance est une relation. Or sur le plan de la confiance le lecteur de WP n'a personne avec qui créer cette relation. Elle ne peut donc être source de confiance.

2018/05/05 15:53 · chloe

Wikipedia n'a pas d'auteurs donc WP n'est pas une source.

Une petite réflexion au sortir du séminaire Construction de l'autorité numérique (URFIST-ENC, Paris) et de la présentation

Lire la suite...

2018/05/04 15:06 · chloe · 0 commentaire

Ok, Google, ne me calcule pas

L'expression “(ne pas) calculer quelqu'un” s'emploie pour dire (ne pas) remarquer, ignorer, snober quelqu'un, volontairement ou pas.

Au cours de la séance du 4 décembre du séminaire “Éditorialisation et écritures numériques” a été évoquée, ce qui n'est pas nouveau, la question de la calculabilité de nos comportements et par voie de conséquence de notre “identité” sur le web. Dans le numérique, environnement de calcul, nous sommes toujours calculés, toujours remarqués, toujours identifiés.

Où l'on regrette de ne pas être plus souvent snobés…

2017/12/05 13:18 · chloe · 0 commentaire

L'absence de volume visible ou l'aspect zen du livre numérique

Beaucoup ont regretté, depuis son avènement, que le livre numérique ne nous permette plus de nous rendre compte de notre état d'avancement dans notre lecture. “Où en suis-je par rapport à la fin ?”
Je propose que nous le prenions comme un outil vers le zen, une opportunité d'être “ici et maintenant” : “je suis là ou je suis dans ma lecture. La fin arrivera quand elle arrivera.”

C'est aussi peut-être la fin du “trop gros” livre pour nos jeunes ou moins jeunes lecteurs…

2017/12/05 13:06 · chloe · 19 commentaires

Des dispositifs qui jouent et des humains qui lisent

Je me réjouis, en lisant le texte de Louise Merzeau, « Éditorialisation collaborative d’un événement »1), de lire cette phrase :

le dispositif permet d’apprivoiser la densité conceptuelle et langagière des interventions en la rendant jouable.

C'est le terme jouable qui m'intéresse ici en ce qu'il rejoint ma réflexion sur le vocabulaire de substitution à outil (et autres dispositifs, machines, supports, etc.) “de lecture”. Il y a peu j'en appelais ici à un terme en français équivalent à “player” : moteur, projecteur, propulseur…

Les dispositifs jouent nos discours et les humains les lisent.
Merci Louise.

2017/11/02 21:57 · chloe · 0 commentaire

Chapitre et numérique

Dans le cadre d'un colloque sur le chapitre à l'université de Montréal, Marcello Vitali-Rossati, parlant de la discrétisation inhérente au numérique dit

dans le numérique on doit renégocier les formes de discrétisation

dans le sens où, là où nous avions sur le papier des chapitre, sections, paragraphes, etc, quelles sont les unités minimales de discrétisation qui peuvent légitimer le discours, à l'instar du chapitre qui “marque” le livre ?

Pourquoi cet impératif de renégociation des formes de discrétisation ? Le grain “chapitre” est défini par l'auteur2). Il peut faire 100 pages comme une ligne. C'est une décision auctoriale. Le chapitre est un élément narratif, il n'a pas de dimension, que l'on soit dans le monde analogique ou numérique. L'auteur y met ce qu'il veut : un vers, cent pages ou une vidéo. L'auteur peut aussi rédiger un livre sans chapitre.

Quant à l'étendue des segments, si le bit est peut-être l'unité minimale du numérique, la molécule d'encre en est-elle l'équivalent sur le papier ? Quant au web comme unité la plus grande, je verrais en parallèle le texte de Michel Foucault sur le livre comme “nœud dans un réseau” :

[…] l’unité matérielle du volume n’est-elle pas une unité faible, accessoire, au regard de l’unité discursive à laquelle il donne support ? Mais cette unité discursive, à son tour, est-elle homogène et uniformément applicable ? Un roman de Stendhal ou un roman de Dostoïevski ne s’individualisent pas comme ceux de La Comédie humaine ; […] C’est que les marges d’un livre ne sont jamais nettes ni rigoureusement tranchées : par-delà le titre, les premières lignes et le point final, par-delà sa configuration interne et la forme qui l’autonomise, il est pris dans un système de renvois à d’autres livres, d’autres textes, d’autres phrases : nœud dans un réseau. […] Le livre a beau se donner comme un objet qu’on a sous la main ; il a beau se recroqueviller en ce petit parallélépipède qui l’enferme : son unité est variable et relative3).

Tout cela pour dire que la rupture logique entre l'analogique et le numérique ne me semble pas fortement établie en matière de discrétisation des éléments du discours.
De quel ordre est donc cette rupture, si tant est qu'il y a rupture ?

2017/11/02 21:40 · chloe · 0 commentaire

Revue et conversation scientifique

Actuellement en visite à Montréal, au contact de la chaire de recherche en Écritures numériques j'entends que

la revue sert à avoir une conversation scientifique, et non pas à publier des articles.

“Conversation scientifique” et “article” s'opposent-ils ? Il me semble au contraire qu'un texte délimité, un argument fini, sont une excellente base de conversation. Après quoi il est heureux de proposer un argument revu, renforcé ou relativisé.

Notre histoire scientifique, culturelle, artistique semble valider ce modèle en terme de créativité.

Quelque chose m'échappe.

2017/11/02 17:50 · chloe · 0 commentaire

Encyclopédie papier figée ?

Une encyclopédie papier présente-t-elle un résultat figé ? Non, en témoignent les millésimes propres à l'identification de tels projets éditoriaux. Ils étaient “figés” souvent pour 1 an avant d'être mis à jour. Ce type d'édition a toujours été précisément “liquide”, ou “ouvert” en écriture, mais avec la contrainte mécanique du papier.

2 changements dans le passage au numérique :

  • la temporalité de la mise à jour : permanente ou millésimée selon le projet, C'est bien ici l'éditeur et non la technique qui détermine la temporalité,
  • la question de la référence à citer qui peut demander selon le cas d'inclure jour et heure de consultation, rendant complexe l'accord entre lecteurs sur une définition, une citation, stable.
2017/11/02 17:36 · chloe · 0 commentaire

Sortir de la confusion entre lecture et projection

Un livre papier n'est pas une “machine à lire”4). Un ordinateur, une tablette, non plus. Les uns comme les autres sont des “players” : ce sont des “machines à présenter” le livre. Ils sont sur le plan logique identiques à un magnétoscope qui projette sur une télé.

Seul l'humain lit, avec comme “machine” son œil, ses doigts, ses oreilles et son cerveau (auxquels il faudrait ajouter sa culture, son vécu, etc.).

Une fois le livre (ou toute autre forme éditoriale) rendu, le mode de lecture est le même dans le numérique et le papier.

Il serait bon de revenir au terme employé il y a peu de “moteur” de blog. Application et hardware sont des moteurs de formes éditoriales variées. Ils les rendent, restituent, projettent, propulsent (selon le terme souvent convenu en bas des pages de “sites”) selon la demande de l'éditeur. Ces productions éditoriales sont ensuite lues par quelqu'un.

Vocabulaire à adopter (y compris pour l'ensemble presse/papier) :

  • rendu
  • restitution
  • projection
  • propulsion
2017/10/23 16:54 · chloe · 3 commentaires

Pour une ontologie REST (ou Ressource/État(State)/Représentation ?) du document (quel que soit l'ordre de discours), fertile aussi bien dans un environnement analogique que numérique

Chloé 2017/06/13 13:22 Le tableau suivant est une évolution de celui que vous trouverez dans Le texte original, ci-après. Les changements principaux sont :

  • comparer un article à un roman (et non un journal à un roman). Un journal est une collection de textes et à ce titre non comparable avec un texte unique.
  • Nous avons distingué dans notre réflexion Publication/émission et Réception/Rendu et préféré ici nous en tenir à la publication (nous reviendrons ultérieurement sur le rendu qui fait d'une certaine façon l'objet d'un post ici).

Lire la suite...

2017/09/22 19:52 · 0 commentaire

Le document REST : continuité logique entre analogique et numérique

Une façon de réunir et schématiser ce que j'écrivais dans deux précédents textes, Sur la lecture directe ou indirecte et Pour une ontologie REST du document analogique comme numérique.

  • quel que soit le format du document, numérique, analogique, papier, vidéo, nous sommes toujours en lecture “indirecte”5). Il n'existe rien que l'on puisse appeler une “lecture directe”, non médiatisée, non outillée, à moins de considérer que la lecture sur un support papier avec des yeux sans lunettes en soit l'archétype. Ce qui serait d'une part arbitraire (non fondé) et réducteur, d'autre part, puisqu'il nous est impossible de lire un livre papier dans le noir, sans lampe ou lumière du jour, donc sans médiation.
  • la lecture est toujours un phénomène organique. Avant les organes de lecture, qui ne sont pas des outils, il y a des outils de représentation/rendu pour lesquels il serait bon de trouver un terme français équivalent à “player”. Ils vont de la lunette à l'écran en passant par l'ordinateur, le logiciel et jusqu'à la lumière.
  • nous pouvons ici penser la continuité logique entre les processus de fabrication, de représentation et de lecture de documents qu'ils soient papier ou numérique. Il n'y a pas de rupture logique. Il y a une simple évolution technique : simple au niveau logique et historique (nous sommes dans la continuité de l'histoire des techniques), complexe au niveau épistémologique du fait de l'implication pour la stabilité de la représentation.

Travaillant personnellement sur le texte j'ai grisé dans le schéma ci-dessous les éléments relatifs à d'autres media (image, film…) sans que cela ne représente un jugement de valeur ou n'ait d'implication scientifique.

Lire la suite...

2017/05/15 12:40 · chloe · 2 commentaires

R. Chartier et le Monde de la textualité numérique

Quelques citations de Roger Chartier qui sont pour moi très symptomatiques d'une vision très peu constructiviste du “Numérique”.

La question qui se pose est : cette vision permet-elle une réflexion pertinente sur l'édition à l'heure du numérique ?

Référence : Chartier, Roger. “Qu’est-ce qu’un livre ? Grandeurs et misères de la numérisation”. Fussman, Gérard. La mondialisation de la recherche : Compétition, coopérations, restructurations. Paris : Collège de France, 2011. Web. <http://books.openedition.org/cdf/1579>.

Il n’en va plus de même dans le monde de la textualité numérique puisque les discours ne sont plus inscrits dans des objets qui permettent de les classer, de les hiérarchiser et de les reconnaître dans leur identité propre. C’est un monde de fragments décontextualisés, juxtaposés, indéfiniment recomposables, sans que soit nécessaire ou désirée la compréhension de la relation qui les inscrit dans l’œuvre dont ils ont été extraits.
Cette écriture polyphonique et palimpseste, ouverte et malléable, infinie et mouvante, bouscule les catégories qui, depuis le XIIIe siècle, sont le fondement de la propriété littéraire, de toutes les pratiques et habitudes de lecture.
unités textuelles éphémères, multiples et singulières, composées à la volonté du lecteur, qui ne sont en rien des pages définies une fois pour toutes. L’image de la navigation sur le réseau, devenue si familière, indique avec acuité les caractéristiques de cette nouvelle manière de lire, segmentée, fragmentée, discontinue, qui défie profondément la perception des livres comme œuvres, des textes comme des créations singulières et originales, toujours identiques à elles-mêmes et, pour cette raison même, propriété de leur auteur.

En résumé, voici la liste des éléments nécessaires du livre et de la lecture numérique selon Roger Chartier, et que l'on retrouve souvent ailleurs :

  • fragmentation
  • décontextualisation
  • indéfiniment recomposables, palimpseste, malléable, mouvante, composées à la volonté du lecteur
  • écriture polyphonique (collaborative)
  • ouverte
  • infinie, éphémère
  • lecture segmentée, fragmentée, discontinue

L'on m'accordera a minima que ces propos sont assez peu nuancés…

Chacune de ces assertions est une possibilité, et non une nécessité. Nous ne sommes pas dans le monde du numérique qui imposerait ses Lois à l'instar des lois de la physique (elles-mêmes régulièrement discutées et revues), mais dans l’Ère du numérique, au sens temporel. Nous pourrions même dire l'Âge du numérique. Nous avons inventé de nouveaux outils qui seront les nôtres, jusqu'aux prochaines technologies que nous inventerons. Ces outils offrent de nombreuses nouvelles possibilités (parmi lesquelles la fragmentation des textes, oui, en effet), la plupart sans doute encore impensées, mais qui précisément émaneront de notre pensée et non pas d'une nécessité numérique.

2016/12/15 12:10 · chloe · 0 commentaire

Sur la lecture directe ou indirecte

Une petite remarque sur un sujet lu et relu depuis 15 ans et qui me dérange toujours autant.


Selon de nombreux articles et réflexions il semble assez évident que sur le papier

le document est directement perceptible, c'est-à dire sans outil intermédiaire de forte technicité (sinon pour certains des lunettes)6).

Si je développe cette phrase je peux écrire sans la trahir

Une fois le texte fabriqué et livré au format papier “le document est directement perceptible, c'est-à dire sans outil intermédiaire de forte technicité (sinon pour certains des lunettes).”

Ce que les auteurs écrivent sous une autre forme qui évacue un peu rapidement la problématique

même si la production de l'imprimé passe par un fort appareillage technique, la lecture du papier est, nous l'avons dit, directe ou presque7).

alors que le lecteur numérique doit a contrario, selon les auteurs, acquérir individuellement de nombreux outils de traitement, restitution et connexion pour pouvoir lire un document.

Il y a un problème logique dans cette comparaison : on compare la lecture d'un document papier une fois fabriqué et livré à la fabrication en cours d'un texte numérique.
Si l'on prend dans les deux cas, papier et numérique, le document livré, alors la lecture ne demande pas plus d'outil dans un cas que dans l'autre si ce n'est, éventuellement, des lunettes. Nous avons dans le premier cas une fabrication/distribution très en amont du lecteur. Dans le cas du numérique elle est déplacée en partie au point d'être finalisée sur son poste individuel et en fonction de certains de ses outils : navigateur, polices de caractères, taille de l'écran, préférences choisies ou non, etc.
Le déplacement et les modalités de cette fabrication/distribution numérique a des impacts importants, et il peut en avoir sur la question de la lecture longue, courte, linéaire ou non, certes, mais il n'a pas d'incidence sur la question de la lecture directe ou indirecte. Nous lisons toujours avec nos yeux, avec ou sans lunettes. Comme sur le papier.
Il n'y a pas de différence dans l'outillage de lecture (yeux, lunettes) mais dans l'outillage et la temporalité de fabrication, livraison (qui se produit, ou se finalise, “chez” le lecteur),

2016/12/15 12:03 · chloe · 0 commentaire
1)
Louise Merzeau, « Éditorialisation collaborative d’un événement », Communication et organisation, 43 | 2013, 105-122. http://communicationorganisation.revues.org.faraway.u-paris10.fr/4158
2)
1 ou des auteurs, anonymes comme identifiés…
3)
Michel Foucault, L’Archéologie du savoir, Paris, Gallimard, 1969.
4)
Escarpit, R. (1992). Sociologie de la littérature (8ᵉ éd.). Paris: Presses Universitaires de France. Consulté à l’adresse http://ressources-socius.info/index.php/reeditions/17-reeditions-de-livres/173-i-sociologie-de-la-litterature-i
5)
En contradiction avec ce que postule Roger T. Pedauque (Document : forme, signe et médium, les re-formulations du numérique. 2003) et Bruno Bachimont (2004)
6) , 7)
Roger T. Pédauque. Document : forme, signe et médium, les re-formulations du numérique. 2003. <sic 00000511>
Dernière modification : le 2024/01/06 11:17