« TNA et la perennité des données numériques | Page d'accueil | Mémoire des hommes, made in USA »
29.03.2008
Le TIFF est trop lourd
De plus en plus en plus nombreuses sont les institutions qui croulent déjà sous le poids des fichiers résultant de leurs campagnes de numérisation et qui, planifiant les campagnes à venir, se rendent compte que cela va coûter cher, très cher en simple stockage. Partant de ce constat, la Koninklijke Bibliotheek (la bibliothèque nationale néerlandaise) a décidé de réviser sa stratégie de conservation. Jusqu"à présent, elle faisait comme tout le monde, en conservant ses masters au format TIFF, sans compression aucune. Dans un rapport tout récent, elle livre les résultats de la réflexion et des tests qu'elle a menés pour déterminer quels formats pourraient constituer une alternative au TIFF pour la conservation à long terme de ses masters. En introduction, l'acception du terme master est précisée (Images bitmap qui sont des copies de haute qualité d'un original et dont, le plus souvent, on dérive des fichiers destinés, eux, à l'accès et l'utilisation) comme sont précisées les raisons pour lesquelles on peut envisager de conserver ces masters dans le long terme : parce que ce sont les fichiers de substitution d'un original fragile et qu'aucun autre mode de substitution n'est possible, parce que la numérisation a été si coûteuse et dévoreuse de temps que la renumérisation est inenvisageable, parce que le master est en même temps le fichier d'usage. Cette très rapide mise au point montre d'ailleurs au passage combien leur politique de numérisation est au clair et je me promets bien de revenir sur la question, comme sur la notion de master, mais restons-en aux formats. Quatre formats ont été passés en revue :
• JPEG 2000, partie 1 : compression avec (lossy) et sans perte (lossless)
• PNG 1.2
• Basic JFIF 1.02 (JPEG)
• TIFF LZW
Les conclusions du rapport permettent de recommander :
JPEG 2000 sans perte et PNG pour la substitution, avec plutôt un avantage à JPEG 2000.
JPEG 2000 et JPEG quand la renumérisation n'est pas envisageable et que l'on peut s'accomoder d'une perte d'information. Sinon retour à la case 1.
JPEG 2000 avec perte et JPEG avec un fort taux de compression quand le master est aussi le fichier d'usage.
Bref, JPEG 2000, le nouveau standard qu'il faut connaître !
19:11 Publié dans Archives | Lien permanent | Commentaires (3) | Trackbacks (0) | Envoyer cette note | Tags : numérisation
Trackbacks
Voici l'URL pour faire un trackback sur cette note : http://thinkingtwice.hautetfort.com/trackback/1538894
Commentaires
Bonjour,
On peut s'étonner que le rapport ne mentionne pas le format JPEG XR qui devrait en théorie succéder au JPEG et qu'il semble ignorer que, malgré ses indéniables qualités, le format JPEG 2000 souffre d'un grave handicap: il est très peu supporté et l'industrie l'ignore pratiquement.
Cordialement
Ecrit par : Patrick Peccatte | 29.03.2008
En fait, le rapport ne fait pas l'impasse sur le "handicap" du format JPEG 2000 et dit très clairement qu'il souffre du désavantage de ne pas avoir été adopté par l'industrie, de n'être supporté ni par les navigateurs ni par les applications dédiées au traitement de l'image numérique.
Cependant, on est dans une logique un peu particulière, d'une part, une conservation à long terme et, d'autre part, effectuée par des institutions qui ont le choix de monter les applications qui leur conviennent pour mettre à disposition leurs données sur le web.
Le dernier lien que j'ai placé pointe sur un rapport de février dernier "JPEG 2000 - a Practical Digital Preservation
Standard?", lequel décrit les pratiques de plusieurs institutions ( et non des moindres : Harvard University Library, Library and Archives Canada, Library og Congress) qui ont déjà adopté JPEG 2000 et la façon dont elles l'ont intégré dans des projets web tels que Civil War
maps in the American Memory collection ou Chronicling America.
Quant au JPEG XR, pourquoi le rapport n'en parle-t-il pas ? Sans doute parce qu'il ne s'agit pas (encore) d'un standard et qu'il est encore, si j'ai bien compris, un format propriétaire, puisqu'il s'agit d'un format microsoft en cours de standardisation. Il semblerait que ce format offre moins de fonctionnalités que le JPEG2000 du point de vue des métadonnées, or, les métadonnées, pour un archiviste ou un bibliothécaire, c'est devenu l'alpha et l'oméga, donc je ne sais pas trop quel accueil est susceptible de réserver la communauté professionnelle à ce format, lorsqu'il sera standardisé.
Ecrit par : Thinking twice | 29.03.2008
Merci beaucoup pour toutes ces précisions.
Mes remarques pointaient juste le risque qu'il peut y avoir à choisir un format qui n'a pas véritablement réussi sa percée industrielle, à tel point que le comité JPEG va très probablement retenir XR (anciennement HD) comme successeur de JPEG:
http://www.clubic.com/actualite-93812-jpeg-microsoft-photo-jpeg-xr.html
http://fr.wikipedia.org/wiki/HD_Photo
Pour ce qui est des métadonnées, les formats récents supportent tous à ma connaissance XMP (eXtensible Metadata Platform) standard de fait qui permet de définir des schémas métiers très souples. Je note d'ailleurs que cette technologie XMP est malheureusement sous-estimée (et même très souvent ignorée) dans le monde des archives et bibliothèques, voir la remarques de la LoC à propose de leur projet collaboratif sur Flickr:
http://www.loc.gov/rr/print/flickr_pilot_faq.html#iptc
Ecrit par : Patrick Peccatte | 30.03.2008