Archives de Tag: crowdsourcing

[Veille] Crowdsourcing et digital humanities : le projet Digital Mellini

Par défaut

Peccadille nous signale sur son carnet de recherche Isidore et Ganesh (j’adore le titre, ça va sans dire) un projet du Getty Research Institute destiné à fournir aux chercheurs un outil de travail collaboratif (édition de texte et annotation) autour de la publication de l’inventaire de la collection romaine de la famille Mellini.

Je vous laisse lire la longue et passionnante analyse de Peccadille, qui pointe à juste titre l’intérêt d’un tel projet :

  • utilisation des outils numériques pour permettre le travail collaboratif des chercheurs
  • création d’une interface de crowdsourcing agréable et intuitive, à la fois pour le travail en commun et pour les échanges entre contributeurs
  • utilisation d’outils open source et d’un format d’édition normalisé (TEI)

Pour ma part, ce qui me semble le plus notable par rapport à d’autres projets similaires (par exemple le remarquable – et européen – Monasterium) :

  • l’initiative vient de l’institution de conservation elle-même, en collaboration avec les chercheurs : on voit ici tout l’intérêt des digital humanities pour les bibliothèques, musées, services d’archives, etc. Qu’est-ce qu’on attend pour travailler de façon plus étroite avec ces chercheurs ?
  • l’interaction entre les contributeurs est au cœur du processus de transcription et surtout de validation. C’est clairement l’un des manques avérés de la plupart des projets de crowdsourcing dans le domaine patrimonial, comme on a pu le noter dans l’Etat de l’art réalisé l’an dernier à la BnF : dans la plupart des cas l’interaction (échanges, discussion, demande d’avis ou de conseil, confrontation de points de vue, etc.) est impossible, et quand elle l’est c’est dans un espace séparé de l’interface d’annotation (forum, FAQ) ce qui en rend l’utilisation fastidieuse et donc rare. Le projet Correct auquel j’ai la chance de participer fait ce même pari de l’interaction entre correcteurs comme levier de la participation, dans ce cas en s’appuyant sur un réseau social dédié. A suivre…

« Connecting people », les Archives de Vendée et le Web participatif

Par défaut

Non, non, ce blog n’est pas (complètement) mort. Il est juste en hibernation profonde (on le comprend et on l’envie), avec quelques rares soubresauts de conscience.

Donc, avant de retourner dormir roulée en boule au fond de ma grotte, voici en guide de soubresaut le compte-rendu de la journée d’étude « La recherche aux archives, nouveaux outils, nouveaux publics » organisée par les Archives de la Vendée le 29 novembre dernier, que j’ai rédigé pour la lettre Archivistes ! de l’AAF (oui, je me suis réveillée assez longtemps pour publier sur ce blog, pas pour écrire un billet spécifiquement dédié, on en reparlera à la fonte des neiges…).

Marmotte

Bon, ben c'est pas tout, ça, mais après tous ces efforts je vais peut-être retourner me coucher, moi... (CC BY-NC-SA A. Fauth, source : Flickr)

A l’occasion de l’inauguration de nouveaux outils innovants en ligne, les Archives de Vendée ont réuni les archivistes et leurs usagers pour une journée d’étude « La recherche aux archives, nouveaux outils, nouveaux publics » : se sont ainsi rencontrés les professionnels qui collectent et classent les documents pour les diffuser, les contributeurs bénévoles qui participent à leur description, et les chercheurs qui les utilisent pour écrire l’histoire locale. L’amphithéâtre accueillait pas moins de 400 personnes, tandis que les absents pouvaient suivre en direct les débats grâce au « live tweet » de quelques participants connectés.

Comme le rappelle en préambule M. Thierry Heckmann, directeur des Archives de Vendée, les relations entre les archives et leurs publics subissent une profonde mutation à l’heure du numérique. Si Internet multiplie la visibilité des archives et facilite le travail en réseau, les Archives doivent s’adapter aux usages du public internaute pour offrir de nouveaux services. Et il ne faut pas hésiter à remettre en cause certaines pratiques archivistiques traditionnelles, qui doivent elles aussi s’adapter aux usages du Web. Une description plus fine des contenus est désormais adaptée à la diffusion de documents numérisés et à l’indexation par les moteurs de recherche : il est donc temps de réhabiliter l’inventaire à la pièce, tout en développant les pratiques automatisées d’OCR (reconnaissance optique des caractères) qui permettent une indexation et une recherche en plein texte. Des inventaires détaillés et des textes interrogeables par les moteurs de recherche faciliteront le travail des chercheurs et augmenteront la notoriété des archives sur le Web.

La matinée s’ouvre par deux tables rondes, autour des recherches sur les personnes et des recherches sur les territoires, destinées à présenter les nouveaux outils proposés par les Archives de Vendée, leur constitution et leur enrichissement collaboratif, ainsi que leurs usages. Elles confrontent les points de vue des archivistes, des contributeurs, mais aussi des usagers et utilisateurs de ces outils.

Les Archives de Vendée ont en effet initié depuis quelques années les travaux qui aboutissent aujourd’hui à la mise en ligne d’un ensemble remarquable d’outils de diffusion innovants et collaboratifs :

  • Noms de Vendée : cette base de données de relevés nominatifs (issus de l’état civil, d’actes notariés, etc.), fondée sur une collaboration originale entre un généalogiste créateur et administrateur de la base, des contributeurs (historiens, généalogistes), et les Archives départementales, fournit l’accès à 1,5 millions de noms.
  • Trois dictionnaires collaboratifs, le dictionnaire des Vendéens, le dictionnaire historique des communes, le dictionnaire des toponymes, proposent des notices très riches et structurées sur l’histoire locale, assorties d’interfaces de recherche dynamiques, en particulier cartographiques. Ces dictionnaires ont pu être constitués grâce à l’apport de contributions massives de chercheurs, et s’enrichiront des apports et dépouillements d’une communauté de contributeurs, en particulier en lien avec les campagnes de numérisation et de mise en ligne de fonds d’archives.
  • Le L@boratoire des internautes est un outil beaucoup moins structuré que les précédents, dont la souplesse permet précisément des échanges plus libres avec les usagers, et des propositions de participation beaucoup plus variées : identification de photographies ou de personnes, éphéméride collaboratif, travaux scientifiques en réseaux (par exemple constitution d’un guide des sources sur la guerre de Vendée), etc. Le L@boratoire est destiné à enrichir les autres outils, les inventaires, la description des archives numérisées, en fédérant une communauté de contributeurs assidus ou occasionnels.

Un effort particulier est en effet réalisé pour intégrer tous ces nouveaux outils dans une véritable plateforme constituée par l’ensemble de l’offre numérique des Archives de Vendée : les dictionnaires s’appuient sur le dépouillement des inventaires et archives en ligne auxquels ils font systématiquement référence, et ils se répondent et se citent entre eux autant que possible. La multiplication des outils répond aux multiples besoins et usages des publics, sans conduire à une fragmentation mais plutôt à un cercle vertueux qui appuie la recherche historique sur les ressources archivistiques.

L’alimentation collaborative de ces outils pose bien entendu la question de la qualité et de la vérification des données. Les enrichissements sont donc réalisés sous le contrôle d’un comité qui veille à leur qualité, et en particulier à la mention systématique des sources. Les contributeurs réguliers sont encadrés et conseillés. Et en fin de compte, le contrôle lui-même est collaboratif, puisque chacun peut signaler les erreurs qu’il est amené à constater.

Les tables rondes font également la part belle aux contributeurs et utilisateurs de ces outils, afin d’incarner leurs usages et de donner vie à leurs contenus. L’intervention de Maïwenn Bourdic revient en particulier sur l’évolution des pratiques des généalogistes sur Internet, qui éclairent les besoins et usages de ce public. Internet a permis la diffusion massive de données généalogiques, que ce soit par les particuliers, les associations ou les services d’archives, mais il a aussi donné une ampleur exceptionnelle à une pratique ancienne des généalogistes : l’entraide. Finalement, cette entraide généalogique est peut-être la matrice de la participation massive de ces publics aux entreprises collaboratives initiées par les services d’archives, qui s’attachent de la même façon à favoriser les échanges, la diffusion des données, l’implication dans l’ouverture des archives au plus grand nombre.

Les différentes conclusions de la matinée permettent ensuite de replacer ces projets collaboratifs dans leur contexte archivistique, numérique, administratif et politique.

En effet, même si les réalisations des Archives de Vendée restent largement innovantes, surtout en France, elles s’inscrivent dans le mouvement plus vaste de la culture participative, et plus particulièrement des « Archives participatives ». Les projets de diffusion patrimoniale s’appuient de plus en plus sur une interaction avec les usagers, que ce soit sur les sites des institutions elles-mêmes ou via les médias sociaux ; les archives doivent s’inscrire dans cet écosystème où l’interaction est la norme.

Au-delà d’échanges et de contributions plus ou moins superficiels, les Archives peuvent ainsi  aller jusqu’à susciter une « participation » des usagers, au sens où la définit l’archiviste américaine Kate Theimer, c’est-à-dire la mise en œuvre de véritables compétences et connaissances des usagers, une interaction de haut niveau, de caractère scientifique. Il peut s’agir d’une contribution des usagers à la description des contenus, à l’amélioration de l’accès (tagging, indexation collaborative, identification de photographies, etc.), voire d’une véritable co-construction, via un apport de contenus scientifiques ou de matériaux patrimoniaux par les usagers (transcriptions collaboratives des contenus, travaux de recherche scientifique mis en valeur sur Wikipédia ou sur des sites dédiés, enrichissement des collections par intégration d’archives personnelles, etc.). Les outils collaboratifs des Archives de Vendée sont au croisement de ces deux niveaux de participation avancée des usagers.

Le directeur chargé des Archives de France, M. Hervé Lemoine, souligne ainsi la nécessité pour les services d’archives de passer d’une politique de l’offre à une politique de la demande, de s’interroger sur les véritables besoins de leurs publics. Afin de donner une indispensable dimension nationale à la politique de diffusion sur le Web des archives, il appelle à la constitution d’un portail national, point d’accès unique aux collections archivistiques françaises, qui serait un outil de reconnaissance et de visibilité pour l’ensemble des services d’archives.

Les tables rondes de l’après-midi s’attachent à présenter les ressources mises en ligne par les Archives de Vendée et leurs utilisations par les historiens qui donnent un contrepoint passionnant et une justification évidente au travail des archivistes.

La qualité et la diversité des recherches historiques sur les documents vendéens sont particulièrement soutenues par le soin apporté à la description des fonds numérisés. Un inventaire pièce à pièce, parfois assorti d’un OCR des documents textuels, permet en effet une indexation fine des contenus, et une optimisation du moteur de recherche.

Par ailleurs, les Archives de Vendée ont pu bénéficier d’un partenariat original avec le Service historique de la Défense, qui a abouti au classement, à la numérisation et finalement à la diffusion sur le site Web des Archives de Vendée d’un ensemble remarquable de pièces relatives à la guerre de Vendée et conservées au SHD à Vincennes. Le site vendéen peut ainsi devenir un véritable portail des sources sur l’histoire de la Vendée où qu’elles soient conservées.

Les pratiques collaboratives ne sont alors plus seulement le fait des historiens et généalogistes, mais aussi des services d’archives entre eux-mêmes, grâce auxquels le partage et la dissémination des documents profitent au plus grand nombre.

Web 2.0 et archives : savoir perdre le contrôle

Par défaut

Web 2.0

Méditons un instant sur cette vérité profonde. Ommmmm.... CC-BY-NC-ND Daniel F. Pigatto, source : Flickr.

Voici une présentation fort intéressante de Jane Stevenson (qui fait partie de l’équipe du portail d’archives britannique Archives Hub) sur l’utilisation du Web 2.0 par les services d’archives, « The impact of Web 2.0 on archives« .

Bon, je n’aime pas trop l’expression Web 2.0, trop marketing et faussement geek, je lui préfère « Web participatif », qui est plus intuitivement compréhensible. Mais à part ça, rien à redire à cette excellente présentation, qui ne cache rien des enjeux et risques de ces technologies et usages, tout en parvenant à diffuser un enthousiasme contagieux (d’aucuns diront que j’étais déjà contaminée… certes, j’avoue).

Je trouve particulièrement intéressante la partie intitulée « Letting go« , qui répond aux inquiétudes de la plupart des archivistes (oui, les archivistes sont des control freaks, il faut l’assumer pour avoir une chance d’en guérir…).  Pour tirer tout le bénéfice du Web participatif et des apports des usagers (aide à la description des documents, ajouts d’archives personnelles, commentaires et échanges, etc.), il faut apprendre à perdre le contrôle (de façon raisonnable et encadrée, bien entendu), tant sur les contenus et descriptions réalisés par les internautes que sur les informations qu’ils peuvent échanger entre eux dans les espaces mis à leur disposition.

Les retombées en termes de fréquentation, de valeur ajoutée, d’échanges, de réputation valent largement le coup.

Alors, apprenons à laisser aller, à laisser faire, à laisser filer. Nous avons plus à y gagner qu’à y perdre.