15.10.2009

Du nouveau sur la commission sur la numérisation des fonds patrimoniaux des bibliothèques

Finalement c'est Marc Tessier, et non Claude Durand, qui prend la tête d'une commission "sur la numérisation des fonds patrimoniaux des bibliothèques" (voir communiqué ministériel). La commission sera chargée d’étudier l’opportunité et les modalités d’un éventuel
accord avec un opérateur privé, pour numériser ou mettre en ligne les fonds des bibliothèques. Ses conclusions sont attendues pour la mi-décembre.

Claude Durand, ancien président des éditions Fayard, a "jeté l'éponge", selon l'expression du Figaro. Marc Tessier est ancien directeur général du Centre national de la cinématographie (CNC), ancien président de France Télévisions et actuel directeur général de Vidéo futur entertainment group.

Dernière minute : Claude Durand explique les raisons de son retrait à Livres Hebdo.  Il souhaitait simplement répondre à la question "faut-il traiter avec Google", mais pas étudier les modalités d'un accord. Manifestement pas tout compris au film, M. Durand.

Et si vous vous demandez quoi penser de tout ça, allez faire un petit tour sur le blog Affordance d'Olivier Ertzcheid et son post "Google Books : quoi faire ?" dont j'extrais la recommandation suivante :" arrêter de réfléchir, de colloquer, de soliloquer, de journéed'étudier ... Nous avons en main tous les éléments. Essayons de les appliquer."

 

 

19:58 Publié dans Bibliothèques | Lien permanent | Commentaires (1) | Envoyer cette note | Tags : numérisation, réutilisation |

09.10.2009

La commission Durand sur la numérisation des livres : c’est pas déjà tout réfléchi ?

L’annonce d’un éventuel partenariat entre la BNF et Google a déclenché une importante polémique. Le ministre de la culture, Frédéric Mitterrand nomme une commission de réflexion sur la numérisation des livres, dont il confie la présidence à Claude Durand, ancien PDG de Fayard. Elle a deux mois pour proposer une stratégie.

Sauf qu’on a déjà réfléchi, beaucoup et intelligemment, au ministère de la culture : rapport Ory-Lavollée (disponible en pdf) sur la diffusion numérique du patrimoine en 2002, rapport du groupe de travail sur la diffusion et la réutilisation des données culturelles plus récemment. La démarche de la Bnf, explorant les possibilités de partenariat avec le privé, n’est pas un acte aventureux et surprenant, pas plus que l’accord effectivement conclu entre Google et la bibliothèque de Lyon.

Bon, on avait un peu oublié le rapport passionnel que semblent entretenir les Français avec le Patrimoine, la Culture, la Mémoire. On avait oublié de donner à cette réflexion un caractère public, d’expliquer, de permettre aux intéressés (public, medias, professionnels) de suivre le même chemin. On s’apprêtait enfin à diffuser une charte du ministère sur la diffusion et la réutilisation des données culturelles, sans mesurer la transgression qu’elle représenterait sans doute pour beaucoup. Alors on ne se vante pas d’avoir réfléchi, on dit qu’on va réfléchir.

Dans un laps de temps si court, il serait étonnant que la commission Durand renouvelle profondément la réflexion. Rendez-vous dans deux mois.

11:34 Publié dans Divers | Lien permanent | Commentaires (0) | Envoyer cette note | Tags : numérisation, réutilisation |

12.01.2009

La numérisation et les partenariats public/privé

J'ai dépouillé rapidement le dernier numéro de la revue Culture et recherche, réunissant les actes de la conférence européenne qui s'est tenue en novembre 2008 sur la numérisation du patrimoine culturel. Toutes les présentations sont très succinctes et c'est souvent frustrant, mais le tout compose un panorama très vivant et accessible, un état sommaire de la question à l'échelle européenne.

Mention spéciale pour les communications visant à présenter les modalités et surtout les raisons (tout simplement parce que c'est plus efficace) des partenariats conclus pour la numérisation de leurs collections par la BM de Lyon avec Google, et par les Archives nationale du Royaume-Uni avec plusieurs  sociétés. Intéressante aussi, l'intervention de Patrick Danowski, du comité allemand Wikimedia, sur la réutilisation des données des bibliothèques, pour sa critique des pratiques des bibliothèques "traditionnelles" qui considèrent que, puisqu'elles numérisent les documents, le produit de cette numérisation leur appartient et n'entre pas dans le domaine public (même si l'original relève de ce dernier), et pour cette petite phrase "Mais surtout l'expérience du projet Wikipédia montre que c'est principalement la possibilité de réutilisation commerciale qui génère les projets les plus intéressants".

 

13:06 Publié dans Archives | Lien permanent | Commentaires (0) | Envoyer cette note | Tags : numérisation, réutilisation |

04.11.2008

Les archives des unités de la guerre 14-18 en ligne

Les sites et forums de généalogistes en bruissent déjà : le ministère de la Défense vient de mettre en ligne "les journaux des unités de la Guerre 14-18". Cela s'est fait très discrètement en attendant l'inauguration officielle prévue demain, 5 novembre. Il s'agit des archives des unités françaises engagées dans le conflit  (Journaux de marche et d'opérations des unités de l'armée de terre ou de l'armée de l'Air, complétés pour ces derniers par des comptes-rendus d’opérations, des rapports techniques d’ascensions, des carnets de vol,  etc. Journaux de bord des bâtiments de la marine mais aussi registres de correspondance, journaux de bord, journaux de navigation).

3,3 millions de pages, numérisées en environ 18 mois par la société SAFIG (corrigez-moi si je me trompe) et mis en ligne par AJLSM via Pleade3 (oui, je touche des royalties à chaque clic). Coût ? Allez, environ 700 000 euros, hébergement non compris.

21:27 Publié dans Archives | Lien permanent | Commentaires (0) | Envoyer cette note | Tags : site internet, numérisation |

27.07.2008

Conservation à long terme des documents numérisés

Via @rchinet-aedaa (c'est bien, cette initiative des étudiants en archivistique d'Angers), j'apprends la publication par le MINCUL (oui, c'est facile) d'un document relatif à la conservation des documents numériques.

Dénué de toute prétention, il se fixe pour seule ambition de sensibiliser les acteurs du ministère de la Culture ainsi que les autres acteurs culturels aux enjeux de la conservation à long terme des documents numérisés, en présentant thématiquement des ressources déjà publiées sur les réseaux. Les thèmes : normes et standards, politique de conservation, production de documents numérisés, supports et infrastructures de stockage, questions juridiques, projets et expériences en cours.

Utile. 

 

 

12:14 Publié dans Archives | Lien permanent | Commentaires (0) | Envoyer cette note | Tags : archivage électronique, numérisation |

07.06.2008

Un accord TGN/NARA

Le 20 mai dernier, NARA (Archives nationales des USA) a annoncé qu'elle venait de conclure un accord avec TGN (sites Ancestry), pour la numérisation et la mise en ligne d'archives intéressant la généalogie. La numérisation se fera sur place, dans les locaux de NARA, la consultation en ligne des documents sera (bien sûr) payante, mais des accès libres seront possibles à partir de postes de consultation installés dans toutes les salles de consultation de NARA. TNG fournira à NARA une copie des fichiers numériques ainsi que des métadonnées, dont NARA pourra se servir librement à l'issue d'une période de 5 ans. Je n'ai pas regardé en détail les termes de l'accord, qui me paraît assez proche de l'accord TNG/TNA.

C'est moins cet accord lui-même qui m'a intéressé que le fait que NARA en ait soumis le projet à commentaires sur internet dès le 10 mars. Je sais, je me suis déjà pâmée devant cette transparence, mais cette pratique est tellement difficile à imaginer en France, où on semble préfèrer les effets d'annonce (au fait, où il en est, ce projet de portail généalogique ?). Dommage, cependant, les commentaires n'étaient pas publics, cette transparence a donc quand même des limites. Mais le débat s'est tout de même engagé, via certains blogs et sites. Voir notamment, le billet d' Archivesnext, un archiviste de NARA réagissant à un billet de Free government information, et les 11 commentaires qu'il a suscités. Avec ça, on a un éventail assez complet des positions possibles.

 

 

11:04 Publié dans Archives | Lien permanent | Commentaires (0) | Envoyer cette note | Tags : numérisation, réutilisation |

29.03.2008

Le TIFF est trop lourd

De plus en plus en plus nombreuses sont les institutions qui croulent déjà sous le poids des fichiers résultant de leurs campagnes de numérisation et qui, planifiant les campagnes à venir, se rendent compte que cela va coûter cher, très cher en simple stockage. Partant de ce constat, la Koninklijke Bibliotheek (la bibliothèque nationale néerlandaise) a décidé de réviser sa stratégie de conservation. Jusqu"à présent, elle faisait comme tout le monde, en conservant ses masters au format TIFF, sans compression aucune. Dans un rapport tout récent, elle livre les résultats de la réflexion et des tests qu'elle a menés pour déterminer quels formats pourraient constituer une alternative au TIFF pour la conservation à long terme de ses masters. En introduction, l'acception du terme master est précisée (Images bitmap qui sont des copies de haute qualité d'un original et dont, le plus souvent, on dérive des fichiers destinés, eux, à l'accès et l'utilisation) comme sont précisées les raisons pour lesquelles on peut envisager de conserver ces masters dans le long terme : parce que ce sont les fichiers de substitution d'un original fragile et qu'aucun autre mode de substitution n'est possible, parce que la numérisation a été si coûteuse et dévoreuse de temps que la renumérisation est inenvisageable, parce que le master est en même temps le fichier d'usage. Cette très rapide mise au point montre d'ailleurs au passage combien leur politique de numérisation est au clair et je me promets bien de revenir sur la question, comme sur la notion de master, mais restons-en aux formats. Quatre formats ont été passés en revue :

• JPEG 2000, partie 1 : compression avec (lossy) et sans perte (lossless)
• PNG 1.2
• Basic JFIF 1.02 (JPEG)
• TIFF LZW

Les conclusions du rapport permettent de recommander :

JPEG 2000 sans perte et PNG pour la substitution, avec plutôt un avantage à JPEG 2000.

JPEG 2000 et JPEG quand la renumérisation n'est pas envisageable et que l'on peut s'accomoder d'une perte d'information. Sinon retour à la case 1. 

JPEG 2000 avec perte et JPEG avec un fort taux de compression quand le master est aussi le fichier d'usage. 

Bref, JPEG 2000, le nouveau standard qu'il faut connaître

 

 

19:11 Publié dans Archives | Lien permanent | Commentaires (3) | Trackbacks (0) | Envoyer cette note | Tags : numérisation |

26.03.2008

NARA sur le point de conclure un accord cadre avec TGN

NARA a soumis à commentaires (quelle transparence, quand même, moi je n'en reviens pas !) les termes d'un accord cadre qu'elle souhaite conclure avec TG N(mais oui, cette même société qui essaie de mettre un pied en France, voir mon précédent billet) pour la numérisation et la mise en ligne de documents qu'elle conserve. Les principales dispositions de l'accord sont les suivantes :

  1. Les documents à numériser seront choisis d'un commun accord entre TGN et NARA
  2. NARA recevra une copie des fichiers numériques
  3. Les chercheurs auront un accès libre aux images numérisées et à l'indexation réalisée par TNG à partir des salles de lecture de NARA.
  4. L'accord est non exclusif
  5. TGN paye les frais liés à la numérisation, la conservation (à vérifier en ce qui concerne celle des copies remises à NARA), la création des metadonnées...

 

18:37 Publié dans Archives | Lien permanent | Commentaires (0) | Envoyer cette note | Tags : numérisation, réutilisation |

05.02.2008

Réutilisation des données publiques : le cas des Archives nationales du Royaume-Uni

Au moment où Ancestry.com et autres Geneanet se lancent à l'assaut des services d'archives français et, surtout, des sources numérisées ou numérisables dont ils pourraient monnayer l'accès en ligne, j'ai cru bon d'aller voir ce qui se faisait chez nos voisins britanniques.

Les Archives nationales du Royaume-Uni (TNA) proposent des licences non-exclusives à tous ceux qui désirent exploiter leurs données, contre royalties qui vont de 7 à 15%.

Pour numériser plus rapidement ses collections, TNA propose également depuis quelques années une LIA (licensed internet Associateships), pour une durée de 10 ans renouvelables. Les partenaires financent tout (de la préparation et la numérisation des documents au développement des applications nécessaires à leur exploitation en passant par l'hébergement des fichiers), et bénéficient d'une exclusivité tandis que les Archives nationales perçoivent des royalties sur les transactions tout en promouvant de diverses manières les services du partenaire, notamment en faisant de leur propre site un portail d'accès vers ces services.TNA s'entoure quand même de quelques précautions d'ordre éthique (le partenaire et ses pratiques doivent être compatibles avec la mission, les règles, les valeurs de TNA), financier (le partenaire doit pouvoir prouver qu'il a les épaules assez solides), technique (le site du partenaire doit respecter les règles gouvernementales pour l'accessibilité des sites internet et se conformer à certaines spécifications), juridique (le partenaire n'acquiert aucun droit de propriété intellectuelle sur les documents numérisés ou les fichers dérivés de cette numérisation. En revanche, sa propriété sur les applications développées, l'indexation ou les transcriptions qu'il aurait réalisé, etc., est bien entendu reconnue). TNA demande également un accès gratuit multi-utilisateurs pour ses sites de consultation de Kew et Islington. De plus, TNA reste maître de la stratégie puisque c'est elle qui fixe les ensembles qui peuvent faire l'objet d'une LIA.

C'est sur ces bases que TNA a conclu un accord avec findmypast.com, pour la mise en ligne des listes de passagers au départ des Iles britaniques entre 1890 et 1960, ou avec S&N Genealogy Supplies pour celle de registres d'état-civil.

Le tout s'inscrit  dans un dispositif national, piloté par l' Office of Public Sector Information (OPSI) et visant à mettre en oeuvre la directive européenne sur la réutilisation des données publiques, inscrite dans la législation nationale depuis 2005.

 

06:45 Publié dans Archives | Lien permanent | Commentaires (0) | Trackbacks (0) | Envoyer cette note | Tags : numérisation, réutilisation, diffusion |

03.02.2008

Archives en ligne : 5 points à garder en tête

Le 25 janvier dernier, table ronde organisée dans le cadre des Rencontres 2008 du cinéma de patrimoine et des films restaurés et prix Henri Langlois (c'est peut-être un peu long, comme intitulé de manifestation, non ?). Trop d'intervenants, qui ont présenté leur institution et leur problématique en guise d'introduction à un échange qui n'a pas eu le temps d'avoir lieu, dommage. Seul Jean-Yves de Lépinay, qui intervenait avec la double casquette de directeur des programmes du Forum des images et membre du P.I.A.F (Professionnels des images et des archives de la francophonie, à ne pas confondre avec le Portail international archivistique francophone !), a su d'emblée poser un discours fort, récapitulant heureusement en 5 points des idées que je n'avais jusqu'ici vu surgir dans mon agrégateur que de façon dispersée. J'ai malheureusement perdu les notes que j'avais prises, mais voici ce dont je me souviens :

1- La numérisation n'est pas un moyen de préservation, mais de diffusion.

OK, mais au prix que cela coûte, mieux vaut penser à conserver les fichiers dans le long terme ! D'autre part, ne pas utiliser les originaux permet de les préserver (logique de substitution). Enfin, l'intervenant n'a pas vraiment dégagé les perspectives que permettent d'ouvrir ce constat (Voir le rapport de l'OCLC, Shifting gears : gearing up to get into the flow, dont j'ai déjà parlé dans un billet).

2- Ce qui est sur internet oblitère ce qui n'y se trouve pas.

OK, sauf si je ne néglige pas de mettre en ligne mes instruments de recherche (aussi sommaires soient-ils ?), même si les documents correspondants ne sont pas en ligne. Evidemment ce qui est décrit (en ligne ou pas) oblitère ce qui ne l'est pas, mais c'est une vieille problématique !

3- Une mise en ligne ne se conçoit pas sans documentarisation (= description, indexation), voire une redocumentarisation, longue et coûteuse. 

OK, mais on part rarement de rien en la matière ! Tout le problème est de savoir si on se satisfait de l'existant, aussi imparfait soit-il, du moment qu'il permet un accès aux documents, ou si on s'astreint à le peaufiner afin de multiplier les accès et accroître la granularité de l'ensemble. Là encore, voir Shifting gears : gearing up to get into the flow.

4- Mise en ligne = fragmentation.

J'ai tout de suite acquiescé mentalement en pensant  à mes propres stratégies de lecture sur internet (butinage, focalisation) et au fait qu'un coup de Google peut vous propulser au milieu d'une page du contexte de laquelle on ne connaît rien, mais Lépinay ne parlait pas de cela mais tout simplement des possibilités offertes à l'internaute de "sampler", mixer, "mashuper", voire redocumentariser lui-même les documents mis à sa disposition.

5- La mise en ligne oblige les "médiateurs", (médiateur entre le public et le document) au rang desquels se rangeait J.-Y. de Lépinay et au rang desquels je me range volontiers, à reconsidérer leur rôle. Une des voies s'ouvrant à eux consiste en l'animation de communautés visant à construire collaborativement un savoir, une redocumentarisation (voir mon post sur les usages de Flickr, qui mériterait d'être mis à jour quant à l'initiative de la Bibliothèque du Congrès qui vient de mettre, pour ceux qui l'ignoreraient encore, près de 3000 photos sur ce site, et pour les réfractaires, affordance vous explique en quoi c'est chouette).

14:50 Publié dans Archives | Lien permanent | Commentaires (1) | Envoyer cette note | Tags : numérisation, web 2.0 |

Toutes les notes