Knowtex Blog

Les contenus numériques : de l’immédiateté à l’archivage

Le 11 novembre 2010 par Xavier Reverdy

Vendredi 5 novembre, de nombreux acteurs de la culture numérique et de la culture scientifique étaient réunis à La Cantine pour partager leur expérience. Retour sur l’atelier consacré à la « temporalité et la persistance des contenus numériques ».

Selon Philippe Bourlitio, fondateur et animateur du site Sciences et Démocratie, les internautes ont besoin de temps pour se documenter sur un dossier complexe avant de pouvoir se permettre d’émettre un avis. En même temps, ce sont les nouveautés qui les entraînent vers les dossiers de fond.

Pierre Mounier (Hypothèses) complète en soulignant que réagir à l’actualité est lié au sujet. Dans le cadre des sciences humaines et sociales sur lesquelles il travaille, il remarque que les gens ont tendance à réagir de façon sélective sur les sujets et se demande si c’est le cas dans les sciences dures.

Le reste des participants s’accordent sur le fait que les médias s’adaptent à la demande du public même dans le domaine scientifique. Le choix du sujet d’actualité peut se faire en étant poussé par l’air du temps. Des sujets moins porteurs mais aussi importants pourront ainsi être laissés de côté.

La question de la temporalité

Philippe Bourlitio poursuit le débat sur la temporalité des contenus et l’influence importante des moteurs de recherche. En prenant l’exemple du plus important, Google, il explique que les dossiers relativement anciens de Sciences et Démocratie ont parfois la chance de se trouver en tête de certaines recherches, ce qui leur permet d’avoir une excellente visibilité.

Toutefois, d’après la majorité des participants, les choses sont en train d’évoluer puisque Google semble accorder de plus en plus d’importance au contenu récent. Pour Philippe Bourlitio, il n’y a pas de solution idéale face à ce qui paraît être une tendance. Sans visibilité, pas de participants et donc pas de débat ! La seule parade actuelle est de mettre à jour très fréquemment les contenus pour continuer à être bien référencé.

Autre élément : la façon de consommer l’actualité pourrait être en train de changer (1) avec le développement des smartphones. Question importante soulevée par Philippe Bourlitio : n’est-ce pas enfermer l’actualité dans des canaux ayant une portée beaucoup plus faible de diffusion ? Faut-il s’adapter à ce nouveau type de médias en plus de ceux déjà existants ?

Pour ce qui est du rapport au flux de l’information, Twitter est un bon exemple. Personne ne peut suivre l’actualité récente en permanence à cause de la surabondance de contenus. Sur Twitter, le rapport à l’actualité se fait à un instant donné et il devrait être un point d’entrée à tous ces contenus. En pratique, il existe des différences de comportement notables, certains se contenant d’un simple survol de l’actualité, sans chercher à approfondir les sujets.

Le problème de l’archivage

Autre enjeu : le format. Il devrait être pérenne pour pouvoir espérer conserver le contenu. Un ancien élève de l’ENS indique, à titre d’exemple, qu’un ensemble de conférences à l’ENS ont été enregistrées au format « RealTime » à l’époque mais que plus personne n’utilise ce format aujourd’hui. Dans la mesure où personne ne fait le travail de transfert sur des supports modernes, l’information est en train de se perdre…

Le problème se pose aussi pour le format HTML de certains sites – comme Sciences et Démocratie – qui ne permet pas une utilisation simple avec les nouveaux outils informatiques. Il existe un réel besoin d’évoluer en permanence pour suivre les progrès technologiques afin de pérenniser l’information car la conversion d’anciens contenus vers des nouveaux formats est coûteuse.

En ce qui concerne l’archivage physique des données sur des supports pérennes, le CINES (Centre Informatique National de l’Enseignement Supérieur) s’occupe en particulier des données scientifiques et techniques en France. Cet organisme effectue le transfert de l’information vers de nouveaux formats au fur-et-à-mesure de l’évolution de la technologie pour assurer une conservation optimale.

Cependant, d’après plusieurs participants, la pérennisation de l’accès physique même à ces données est rendue difficile. L’exemple le plus flagrant est bien entendu celui de données protégées dans d’anciens silos nucléaires qui sont difficiles d’accès (ce qui est paradoxalement une sécurité supplémentaire pour leur conservation).

Le problème de l’indexation des données

Une partie des usagers aimerait une bibliothèque numérique sur le web mais l’actualité reste malheureusement très difficile à indexer. De plus, une mauvaise indexation induit une grande difficulté pour retrouver des contenus plus anciens. Il est même difficile de choisir de laisser ou non l’accès à d’anciens articles en ligne.

Geocities, site d’hébergement Web gratuit fermé par Yahoo ! en 2009, a vu par exemple une partie de son contenu ressortir en ligne sur The Pirate Bay grâce à des passionnés (900 Go de données compressées tout de même). Par ailleurs, Archives.org tente d’indexer une partie d’Internet. De façon plus globale, différents projets montrent qu’il existe bel et bien des tentatives pour essayer de conserver l’information en ligne.

Tout le monde est d’accord pour admettre que le meilleur exemple de sauvegardes d’information concerne les domaines historiques et généalogiques. Leur conservation passe par une numérisation de nombreux documents existants sur des supports périssables (papiers, parchemins etc…) qui deviennent ensuite accessibles sur le Web (de nombreux sites d’archives départementales ont numérisé une partie de leur contenu).

L’un des derniers sujets abordés dans ce débat concerne le monopole de l’information par certaines sociétés. L’exemple le plus flagrant est donné avec les revues scientifiques en ligne (ScienceDirect ou autre). Les Bibliothèques Universitaires, qui ne réitèrent pas leur abonnement faute de budget, perdent toutes le catalogue des revues en question à moins de payer une option particulière. L’accès au contenu se fait pour l’instant au détriment d’une libre circulation des connaissances. Il est donc difficile de conserver l’information – pourtant nécessaire à la recherche dans les Universités – s’il n’y a pas de modèle économique.

Philippe Bourlitio conclue sur le sujet de l’information temps réel. Pour lui, elle ne sert qu’à faire de la veille permanente avec pour conséquence un butinage des utilisateurs qui se contentent souvent de la première page de Google. De là, il se demande comment ne pas se noyer dans l’information à la vue du flux permanent d’informations en temps réel. La seule réponse pertinente qui ressort semble être la nécessité d’éduquer les gens à la recherche d’information ainsi que les sensibiliser à sa sauvegarde, le premier pas dans cette voie étant être le Certificat Informatique et Internet (C2I) intégré aux cursus scolaires et universitaires.

Note

  1. A lire, l’Article de Wired « Le Web est mort » sur la façon de consommer l’actualité.

>> Illustrations : catulle , JoshSemans & Ian-S (Flickr, CC)

3 commentaires

  1. Philippe2S&D le 12 novembre 2010 à 16:15

    Bravo Xavier et merci pour ce billet qui nous permet de garder une trace de nos échanges. Et merci à Knowtex d’en assurer la diffusion et la pérennité ;)

  2. XaReTh le 14 novembre 2010 à 22:47

    Mais ce fut avec grand plaisir d’autant plus que le débat était très intéressant! Merci aussi à Gayané qui m’a beaucoup aidé pour le remanier!

  3. Véronique Etienne le 05 janvier 2011 à 18:08

    Merci pour ce compte-rendu très intéressant !
    Cette phrase me fait réagir : « Le reste des participants s’accordent sur le fait que les médias s’adaptent à la demande du public même dans le domaine scientifique. Le choix du sujet d’actualité peut se faire en étant poussé par l’air du temps. »
    Je suis bien d’accord sur l’air du temps, mais j’ai l’impression (peut-être fausse) qu’il est dicté davantage par les médias que par une demande du public…

Ajoutez un commentaire

Pas encore membre ? Inscrivez-vous pour laisser un commentaire ! Déjà membre ? Connectez-vous

Tous les contenus, sauf exception signalée, sont sous licence Creative Commons BY-NC-SA