05.04.2008

Métadonnées de préservation : PREMIS

Le groupe de travail PREMIS (Preservation Metadata: Implementation Strategies) vient de publier la deuxième version de son dictionnaire des métadonnées de préservation (Data dictionary for Preservation Metadata).

Les métadonnées de préservation sont définies comme celles utiles à un entrepôt pour mener à bien le processus de conservation à long terme du document numérique, c'est-à-dire celles permettant d'assurer la viabilité, la restitution, la compréhension, l'authenticité et l'identité des données préservées. Cette catégorie rassemble donc des métadonnées souvent considérées comme relevant de types différents, notamment les metadonnées dites administratives ou techniques.

Pour définir ces métadonnées, PREMIS a établi un modèle, dont on trouvera une présentation claire sur le blog "les Petites cases". Ce modèle a servi de base à un schéma XML compatible avec le schéma METS (qui supporte lui-même l'EAD, ouf, on est sauvé !).

L'élaboration de ce dictionnaire se base notamment sur l'observation des pratiques mises en oeuvre dans de nombreux entrepôts qui font référence, ce qui rend la lecture de l'introduction particulièrement intéressante. Par exemple : 

"The survey by the Implementation Strategies Subgroup showed that repositories have implemented several different architectures for storing metadata. Most commonly, metadata isstored in relational database tables. It is also common to store metadata as XML documents in an XML database, or as XML documents stored with the content data files. Other methods include proprietary flat file formats and object-oriented databases. Most respondents were using two or
more of these methods. (For more information, see the Implementation Survey Report2.)Storing metadata elements in a database system has the advantages of fast access, easy update,and ease of use for query and reporting. Storing metadata records as digital objects in repositorystorage along with the digital objects the metadata describes also has advantages: it is harder to separate the metadata from the content, and the same preservation strategies that are applied to
the content can be applied to the metadata. Recommended practice is to store critical metadata in both ways".