Dans le cadre de la série d’événements intitulée de la virtualité, la Communauté de pratique sur la place et la posture de la littérature québécoise en ligne dont Rhizome est l’instigateur articule ses réflexions et ses actions autour de cinq grands chantiers : la création, la reconnaissance, la découvrabilité, la pérennisation ainsi que la littératie numérique.

Pour le chantier Pérennisation, les membres de la communauté de pratique ont invité Jean-Philippe Humblot à produire un essai sur le sujet. Ce texte fait ainsi office de point de départ d’une discussion en visioconférence (et diffusée en direct sur Facebook Live) entre les membres, le grand public et l’auteur.


PAR JEAN-PHILIPPE HUMBLOT

Principe et acteurs du dépôt légal en France

Institué en 1537 par le bon roi François Ier, le dépôt légal (DL) stipule que chaque livre diffusé en France doit être déposé à la Bibliothèque royale, devenue aujourd’hui Bibliothèque nationale de France (BnF). Alors que l’imprimerie, inventée au siècle précédent par Gutenberg, a permis l’essor de la production écrite et sa diffusion massive, le pouvoir monarchique cherche à conserver une forme de contrôle sur la circulation des idées. Mais c’est un motif plus noble qui est alors mis en avant : « [N]ous avons délibéré de faire retirer, mettre et assembler en notre librairie toutes les œuvres dignes d’être vues qui ont été ou seront faites, [pour y avoir recours] si de fortune [elles] étaient […] perdues de la mémoire des hommes.1» Vaste et respectable mission !

Au fil du temps, le législateur français a progressivement étendu l’obligation de dépôt à d’autres objets présentant un enjeu patrimonial : monnaies, médailles, cartes, plans, partitions, affiches, etc. Au xxe siècle, les enregistrements sonores sont à leur tour inclus dans l’obligation, suivis des vidéogrammes2 et enfin, des documents multimédias en 1975.

Collections multimédias de la BnF et essor de la diffusion dématérialisée

Dans les années 1970, on entend par multimédia les documents associant différents types de supports, tels les méthodes d’apprentissage de langue qui mêlent supports écrits et enregistrements sonores ou diapositives. Mais dans les années 1980, avec l’apparition des premières plateformes informatiques domestiques, micro-ordinateurs et consoles de jeu, une actualisation s’impose : elle a lieu en 1992, ouvrant la porte aux jeux vidéo et documents multimédias au sens où nous l’entendons aujourd’hui. Cette extension s’est encore accrue en 2006 avec la promulgation de la Loi relative au droit d’auteur et aux droits voisins dans la société de l’information (loi DADVSI)  qui élargit considérablement le périmètre du DL3 et permet notamment de cibler les sites internet et toute la production numérique, audiovisuelle ou informatique, diffusée de façon dématérialisée4.

Ce dernier terme peut paraître étonnant, mais il faut rappeler qu’historiquement, le DL porte sur des objets matériels diffusés auprès du public français. Pendant plusieurs décennies, les documents numériques ont été édités sur des supports informatiques tels que les disquettes, disques optiques (CD/DVD/…) ou cartouches de jeu vidéo. C’est aujourd’hui de moins en moins vrai, et on qualifie de dématérialisée toute œuvre diffusée autrement que sur un support de stockage édité. Cela concerne par exemple les œuvres audiovisuelles (films, séries, musique, etc.) proposées par des plateformes de diffusion comme Netflix, ou encore des jeux et logiciels diffusés depuis des plateformes numériques (Google Play Store, Apple App Store, Steam…). La disparition progressive du support physique comme moyen de mise à disposition constitue un nouveau défi pour la collecte et la conservation de ces œuvres.

C’est dans ce contexte législatif et conformément à sa mission que la BnF a entrepris depuis plusieurs décennies la collecte d’une grande diversité d’objets numériques ainsi qu’une réflexion sur la meilleure façon de les conserver et d’en fournir un accès pérenne au profit des chercheurs5. Au titre de sa mission, la BnF a ainsi pu constituer des collections sans équivalent, qu’elle a complétées et enrichies par une politique volontariste d’acquisitions ou en suscitant des donations de la part d’autres institutions et collectionneurs privés ; cet effort a notamment été orienté vers le domaine de l’art numérique, peu ou pas concerné par l’édition commerciale et donc par le DL.

Photo : salle de lecture des collections audiovisuelles et multimédias de la Bibliothèque nationale de France, en rez-de-jardin
© Eric Sempé / BnF

Cas de l’art numérique6

L’art numérique a fait l’objet d’une attention particulière en raison de l’effervescence expérimentale dont il témoigne et de sa représentativité en termes d’appropriation technologique, venant d’un secteur reconnu pour son inventivité et sa créativité. Dans ce domaine, la production se divise en une large portion d’œuvres éditées sur supports, disquettes et disques optiques, mais aussi une activité expérimentale foisonnante qui se traduit par toutes sortes de manifestations, installations, happenings, living art, etc. Si la première partie relève bien de la législation française et de l’obligation de dépôt, ce n’est pas le cas de la deuxième, qui constitue un secteur plus informel, non édité ou diffusé sur les canaux commerciaux classiques, pour lequel la récupération et la conservation posent des difficultés importantes.

En effet, la production éditée et diffusée auprès d’un large public suppose une relative standardisation : une œuvre d’artiste faisant l’objet d’une édition sur cédérom doit pouvoir s’installer sur une machine standard, traditionnellement un PC utilisant Microsoft Windows ou un Macintosh exploitant une des versions d’Apple MacOS. La forte composante audiovisuelle et interactive de ces documents nécessite l’exploitation de composants logiciels normalisés dédiés à la conception multimédia tels qu’Apple Quicktime, Adobe Director ou Flash, désormais obsolète, ou encore Microsoft DirectX. En cela, ces documents diffèrent peu d’autres titres multimédias tels que les cédéroms interactifs (visites virtuelles de musées, encyclopédies, méthodes d’apprentissage…) ou certains jeux vidéo.

Les œuvres d’artiste qui n’entrent pas dans ce modèle d’édition et de diffusion auprès du public exploitent généralement le même type d’équipements que décrit précédemment (PC sous Windows / Mac sous MacOS), mais disposent rarement d’un programme d’installation automatique : le créateur est capable de déployer manuellement son œuvre sur le nombre voulu de machines, mais n’a aucune raison d’en faire une version diffusable, pouvant s’installer automatiquement, comme c’est le cas pour une œuvre multimédia commercialisée sur un support informatique et destinée au grand public. Les œuvres sont paramétrées par leur concepteur au gré des conditions particulières de chaque exposition, en fonction de leurs nécessités propres7 et peuvent exploiter des facilités de programmation peu documentées, s’avérant ainsi difficiles à faire fonctionner après quelques années. De plus, les créateurs n’hésitent pas à modifier ou à enrichir les plateformes matérielles qu’ils exploitent : la modification de l’électronique des machines ou l’ajout de composants internes spécifiques8 peut rendre la nécessité de pérennisation particulièrement complexe, voire impossible.

Stratégie de conservation des documents multimédias : la virtualisation

Afin de mettre en lumière cette complexité, il est nécessaire d’expliciter la stratégie générale mise en œuvre par la BnF pour assurer la préservation et le maintien de l’accès aux documents multimédias. Partant du constat que les supports et les machines concernés ont une durée de vie relativement courte (rappelons que le DL trouve ses origines en 1537 !), particulièrement si on la compare à celle des documents plus traditionnels fondés sur l’utilisation de l’encre et du papier, la Bibliothèque nationale de France a opté pour une stratégie de virtualisation la plus complète possible.

Virtualiser un support informatique consiste à en relire toute l’information binaire et à la conserver dans un fichier appelé « image du support » ou plus simplement « image9 ». En effet, les supports concernés, magnétiques ou optiques, ont tendance à se dégrader après quelques décennies, et nécessitent par ailleurs des matériels électroniques (ordinateurs, lecteurs optiques, lecteurs de disquettes, etc.) relativement fragiles, dont la durée de vie est elle aussi limitée, et dont le renouvellement n’est pas envisageable à long terme10. La première urgence consiste donc à décharger (dump) les supports originaux en assurant la plus grande authenticité possible à ce transfert d’information. Ceci peut relever du défi lorsqu’il s’agit de documents parfois anciens ou mal conservés (en particulier dans le cas des dons ou de l’acquisition de documents sur le marché de l’occasion), ou simplement protégés contre la copie par des mécanismes de MTP11 (Mesures Techniques de Protection ou DRM : Digital Rights Management)…

Une fois les supports virtualisés et leur image enregistrée au sein d’un système de stockage pérenne (la BnF exploite à cette fin des solutions robotisées et doublonnées de bandes LTO12), une deuxième étape consiste à substituer aux équipements informatiques requis pour leur exécution (ordinateurs, consoles, périphériques mobiles…) une version elle-même virtualisée : de la même façon que les supports n’offrent aucune garantie d’accès sur le long terme, les machines nécessaires basées sur des composants électroniques ou des plastiques peu résistants au-delà de quelques décennies doivent être remplacées par des solutions plus pérennes.

Principe de l’émulation

C’est là qu’intervient la technologie de l’émulation13. Elle consiste à substituer à ces équipements un équivalent logiciel, capable à la fois d’interpréter les programmes originaux et d’en restituer les interactions sur une machine contemporaine. Concrètement, sans avoir à modifier le programme d’origine, ce dernier pourra être exécuté au sein d’une machine virtuelle simulant une machine ancienne sur une machine moderne : un PC d’aujourd’hui tournant sur MS Windows 10 pourra ainsi simuler un PC des années 1990 exécutant MS Windows 98 ou un Macintosh exécutant MacOS 8, mais aussi une console de jeux (Nintendo, Sega, Sony…), et sera en mesure de restituer l’ensemble des interactions prévues avec l’utilisateur. Au fil de l’évolution technologique, il faudra peut-être à l’avenir adapter les émulateurs déjà existants, mais en aucun cas il ne sera nécessaire de modifier les images faites à partir des supports originaux14. Cette stratégie de conservation épargne ainsi toute nécessité future de migration, comme cela peut être le cas pour les documents textuels (PDF, Winword…), image (JPG, TIFF…) ou audiovisuels (MPEG…), avec les inconvénients que cela provoque, tels les problèmes bien connus de mise en page ou la perte d’information lorsqu’on passe d’un format compressé à un autre.

La stratégie qui vient d’être décrite, mise en œuvre depuis le début des années 2000, a démontré sa pertinence et son efficacité. Elle permet aujourd’hui un accès satisfaisant aux collections constituées depuis les années 1980 sans imposer un recours aux matériels d’origine. Ainsi, même si la BnF dispose de ces matériels encore en état de fonctionnement, la consultation des logiciels des années 1980-1990 développés pour des machines telles que l’Apple II, l’Atari ST, le Commodore 64, l’Amstrad CPC, les Thomson TO7/MO5, l’Amiga, ou encore les diverses consoles de jeux ayant existé avant l’an 2000, s’effectue prioritairement au moyen d’émulateurs.

L’émulation comporte des avantages et des inconvénients : au rang des avantages, citons la possibilité offerte à l’utilisateur de mettre en pause l’exécution d’un programme, d’avoir accès à la mémoire de la machine (afin d’examiner les coulisses du programme, d’en comprendre les algorithmes, ce qui nécessite une expertise certaine…), éventuellement de sauter les étapes d’un jeu, d’enregistrer des états mémoire15 de l’ordinateur de façon à revenir directement à un moment particulier de l’exécution d’un programme, de sauvegarder des parcours de consultation ou de réaliser des captures d’écran.

Le revers de la médaille de l’utilisation des émulateurs est qu’une partie de l’expérience utilisateur est perdue ou dénaturée : un écran cathodique est remplacé par un écran plat qui ne fournit pas la même impression visuelle ; d’autres périphériques (clavier, souris, manette…) ne sont pas ceux d’origine, ce qui entraîne une modification des sensations attendues. La vitesse d’exécution peut également être difficile à ajuster et provoquer certains effets indésirables.

Photo : Micro-ordinateur Thomson TO7 (1983)

Un exemple éloquent est celui du Thomson TO7, qui était doté d’un « crayon optique » permettant de pointer directement un objet affiché sur le moniteur de l’ordinateur : l’émulateur correspondant s’exécute sur un PC et utilise la souris comme dispositif de pointage, car il n’existe pas de périphérique équivalent au crayon optique pour les PC16. Malgré cette différence, l’émulation reste une solution satisfaisante pour conserver l’accès à ces documents et procure un degré d’authenticité acceptable dans la plupart des cas. En outre, certaines pertes d’authenticité peuvent s’avérer des avantages : ainsi, le chargement d’un logiciel enregistré sur une cassette logicielle sur un Thomson TO7 nécessitait en 1985 plusieurs dizaines de minutes d’attente et se soldait souvent par un échec assorti d’un message d’erreur… Dans ce cas, il fallait rembobiner la cassette et redémarrer la lecture, sans être certain de sa réussite. Avec l’émulation, la lecture d’une cassette numérisée ne prend que quelques millisecondes et n’échoue jamais, permettant un accès quasi instantané au document. Cette perte d’authenticité doit évidemment être signalée au chercheur, mais constitue a priori un atout considérable en faveur de ce mode de diffusion.

Conservation de l’art numérique

On l’aura compris avec ce qui précède, l’art numérique constitue un sous-ensemble particulier des collections multimédias de la BnF, mais soulève des difficultés analogues quant à sa conservation et son accès pérenne. Il pose cependant un défi supplémentaire, car les œuvres concernées ne sont généralement pas accompagnées d’un logiciel ou d’une documentation permettant d’en faire l’installation automatique.

De par sa mission officielle, la Bibliothèque nationale de France s’emploie donc à repérer et à sensibiliser les acteurs de ce domaine, puis à les accompagner pour réaliser le dépôt. Cette activité d’ordre pédagogique consiste à aider les artistes à anticiper les besoins liés à la conservation pérenne de leurs créations et à faciliter leur archivage. Plusieurs projets de collaboration avec des centres de création numérique ont été lancés en vue de récupérer massivement des œuvres conçues dans les années 1990 et 2000 (par ex., au sein de l’atelier de création du Cube, centre d’art numérique d’Issy-les-Moulineaux). Des colloques et interventions diverses ont lieu régulièrement sur ce thème depuis une vingtaine d’années, permettant aux créateurs de rencontrer des conservateurs et de mieux cerner l’enjeu du dépôt à la BnF en vue de garantir la postérité de leurs œuvres17. Des collaborations plus ponctuelles et expérimentales ont permis de redonner vie à des créations parfois très anciennes (par ex., avec Jacques Donguy pour des œuvres écrites pour l’Atari ST) ou pour archiver des œuvres éphémères contemporaines (par ex., des captures de parcours commentées d’espaces créés dans Second Life18).

La BnF est également partenaire de l’Université Paris 8 dans le cadre du projet « Machines à lire les arts numériques : interface et médiation » de l’École Universitaire de Recherche ArTeC19, qui prolonge le projet « Art numérique et postérité : modélisation des œuvres d’art numérique et de leur dispositif de lecture » du Labex Arts-H2H, initié en 2015. Ces projets visent aussi bien à améliorer qu’à normaliser la description des œuvres, d’en assurer la rejouabilité et la médiation, et d’en promouvoir le dépôt.

Ils s’appuient en particulier sur la participation de Chu-yin Chen, artiste et professeure à ATI (Arts et Technologies de l’image), directrice de l’équipe recherche Image Numérique et Réalité Virtuelle (INREV), de Marie-Hélène Tramus, professeure émérite, fondatrice du département Arts et Technologies de l’Image (ATI), de Florent Aziosmanoff, théoricien, producteur d’œuvres d’art numérique et fondateur du Living Art Lab, et de Philippe Bootz, maître de conférences et membre du laboratoire Paragraphe (Université Paris 8), chercheur et créateur dans le domaine de la littérature numérique, ainsi que sur la contribution de nombreux chercheurs ou étudiants intéressés par ces questions.

Photo : « Joue de la musique pour mon poème », Philippe Bootz

Valorisation de l’art numérique

Le projet « Machines à lire » s’inscrit dans les objectifs de la BnF en matière de valorisation de ses collections. À l’occasion de la refonte de son site historique situé rue Richelieu dans le centre de Paris, l’établissement a prévu l’ouverture de deux espaces grand public, avec l’inauguration de la salle Ovale et d’un musée. Ces deux espaces, de même que les salles historiquement dévolues à la consultation des fonds audiovisuels du site François-Mitterrand, verront la mise à disposition de postes dédiés à la présentation d’une sélection exemplaire d’œuvres d’art numérique, dont certaines issues du domaine de la littérature numérique, mises en valeur par une éditorialisation originale. Les premières œuvres proposées concerneront des artistes tels que Tibor Papp, Luc Courchesne, Michel Jaffrenou, ou encore Edmond Couchot et Michel Bret.

Photo : « Orion », Tibor Papp

Une thèse réalisée par Céline Thomas20 à Paris 8 en collaboration avec la BnF dans le cadre du projet « Art numérique et postérité » a permis de définir un ensemble de métadonnées sous forme de graphes arborescents visant à décrire le plus finement possible les œuvres d’art numérique et à prendre en compte leurs spécificités. Compte tenu des difficultés techniques décrites précédemment pour conserver l’accès à ces documents, il est important de rassembler une large documentation témoignant de ces œuvres, des dispositifs associés et des intentionnalités qu’elles renferment (par ex., sous la forme de parcours commentés et d’entretiens d’explicitation avec les artistes). Dans de nombreux cas, seule cette description restera accessible à l’avenir, d’où sa grande importance. Dans d’autres cas, la récupération des éléments logiciels ou audiovisuels constitutifs d’une œuvre ne sera pas suffisante. En effet, comme il a été dit, l’installation et la configuration de ces éléments nécessitent parfois un vrai travail d’ingénierie pour permettre leur exécution sur une machine contemporaine, qui peut aller jusqu’à leur réécriture. Ce travail de restauration ne peut être fait qu’au cas par cas et représente une tâche particulièrement chronophage, très difficile à automatiser. Enfin, dès qu’il aura été possible de se placer dans une situation comparable à celle des documents édités, c’est-à-dire en se dotant d’une procédure d’installation documentée ou automatique, l’œuvre d’art numérique pourra être considérée comme n’importe quel document appartenant aux collections multimédias de la BnF et son accès pourra être garanti.

Dans la perspective de l’ouverture de la salle Ovale, le projet « Machines à lire » a pour ambition de donner accès sur un même poste et de façon transparente à une collection d’œuvres d’art numérique couvrant une large période historique. Chaque œuvre est associée à une machine virtuelle (une des formes possibles de machines à lire) qui consiste en un émulateur préconfiguré pour exécuter une œuvre unique dans son contexte technique virtualisé. Pour simplifier et accélérer l’accès à ces œuvres, chaque émulateur est démarré directement avec un état mémoire particulier21 de façon à ce que l’utilisateur n’ait pas à assister au démarrage de la machine virtuelle et de son système d’exploitation. Cette technique permet également d’empêcher toute modification de la machine virtuelle et d’être parfaitement assuré du lancement correct de l’œuvre sélectionnée.

Photo : Salle Ovale de la Bibliothèque nationale de France

Conclusion (provisoire)

Insistons encore une fois : la préservation et la pérennisation de l’accès aux œuvres d’art numérique restent une gageure. Beaucoup d’obstacles peuvent interférer avec ces objectifs, en particulier toute modification technique des équipements utilisés. Les émulateurs sont efficaces pour simuler des machines standards, mais toute modification matérielle spécifique suppose une adaptation du logiciel d’émulation qui, lorsqu’elle est possible, représente un travail complexe pouvant nécessiter des ressources importantes.

Dans cet essai, nous avons ainsi détaillé la stratégie générale de conservation adoptée par la BnF, qui repose sur les techniques de virtualisation. Des approches alternatives, fondées sur la maintenance ou la restauration des équipements informatiques, sont parfaitement envisageables et sont exploitées par d’autres institutions. Toutefois, compte tenu du volume de ses collections et de sa mission patrimoniale qui l’oblige à se projeter sur des horizons de plusieurs décennies voire plusieurs siècles, la BnF n’envisage pas de modifier sa stratégie.

L’effort de description formelle des œuvres et la capture de leur présentation restent indispensables. Des travaux de recherche doivent être poursuivis dans ce sens, tout comme doit se poursuivre la sensibilisation des créateurs aux enjeux de conservation. À cette fin, la Bibliothèque nationale de France est disposée à partager son expérience en la matière à l’échelle internationale et à faire bénéficier de ses compétences techniques – en ce qui a trait aux questions de conservation pérenne, de la description ou du signalement des œuvres, etc. – les différents acteurs de ces domaines et futurs déposants qui se manifesteront auprès d’elle.

1 Ordonnance de Montpellier, 28 décembre 1537


2 Pour savoir ce qu’est un vidéogramme


3 Sur l’histoire du dépôt légal en France et ses déclinaisons à travers le monde, notamment au Québec ou au Canada, voir Dépôt légal et Dépôt légal en France.


4 Le texte cite précisément les documents « faisant l’objet d’une communication au public par voie électronique » (code du patrimoine, article L131-2).


5Les lecteurs accrédités peuvent consulter tous les documents en bibliothèque de recherche. Aucun document de dépôt légal ne peut être retiré des collections, ni emprunté. La BnF les conserve pour l’éternité. 


6 L’art numérique désigne un ensemble varié de catégories de création utilisant les spécificités du langage et des dispositifs numériques, ordinateur, interface ou réseau. Il s’est développé comme genre artistique depuis le début des années 1960.


7 Par exemple, en fonction du contexte de présentation de l’œuvre, du nombre d’écrans utilisés, de la distance entre le public et l’œuvre, etc.


8Cartes vidéo/audio, capteurs pour l’acquisition extérieure, communication télématique sur internet ou hors internet comme le réseau téléphonique, etc.


9 On peut pousser l’analogie en assimilant le fichier image à une sorte de photographie de l’ensemble des informations contenues sur un support donné. À titre d’exemple, voir https://fr.wikipedia.org/wiki/Image_disque


10Les matériels n’étant plus fabriqués et trop complexes à réparer.


11 Gestion des droits numériques


12 SPAR (Système de préservation et d’archivage réparti)


13 Émulation


14 On pourrait prendre l’analogie suivante : pour lire un document Word (.doc) datant de 1997, la version actuelle de MS Winword doit convertir préalablement le fichier vers le format actuel des documents Word (.docx). Alternativement, si on dispose d’un émulateur de PC sur lequel on a installé Windows 98 et la suite Office 1997, on peut ouvrir le même fichier sans avoir à le convertir puisqu’il est dans le format connu d’Office 1997.


15 L’état d’un ordinateur à un instant donné se caractérise essentiellement par le contenu de sa mémoire. Le passage en mode « veille prolongée » d’un ordinateur consiste à copier ce contenu sur le disque dur et de réaliser l’opération inverse au moment du « réveil » de la machine.


16 On pourrait aussi envisager l’utilisation d’un écran ou d’une tablette tactile.


17 Par exemple, « Témoigner des arts électroniques », journée d’étude (2000), « Donner à voir l’art numérique à la BnF », journée d’étude (2017), « Art numérique et postérité », colloque de clôture (2017).


18 Second life


19 Les arts numériques interface et médiation


20 « Regards croisés sur la préservation de l’art numérique : perspectives, expectatives et champs disciplinaires à l’œuvre », sous la direction de Chu-yin Chen

21 Cet état mémoire correspond à celui de la machine virtuelle après le démarrage de son système d’exploitation et de l’œuvre visualisée. Tout se passe comme si on réveillait une machine qu’on aurait mise en veille juste après le lancement de l’œuvre.