Les métadonnées, qu’est ce que c’est ?

11

Les métadonnées servent à décrire ou à définir une autre donnée (photo texte son ou vidéo). Elles sont définies dans le cadre du modèle ressource description Framework (RDF).

La premières métadonnées contenues dans un fichier numérique est son nom de fichier. Mais il est possible de compléter ces informations avec le titre, les mots-clés, les informations de droits d’auteur, le nom de l’auteur etc.

Ci-dessous nous nous intéresserons essentiellement aux métadonnées qui concernent les photos.

En photo on distingue deux types de métadonnées : les EXIF et les IPTC.

Les métadonnées en photos (EXIF et IPTC)

Où sont stockées les métadonnées ?

Pour des ressources non digitales (livre, disque, ou objet de musée) les métadonnées sont évidemment externes à ses ressources. Avant l’arrivée massive de l’informatique ces données étaient stockées dans des tiroirs sur des fiches cartonnées aujourd’hui elles sont numérisées est enregistrées dans les systèmes informatiques.

Cette externalisation des métadonnées est notamment utiliser des systèmes documentaires (bibliothèque, médiathèque)

Il faut faire attention à toujours garder associer l’objet et ses métadonnées.

Lorsqu’il s’agit de ressources digitales (photo, MP3, documents MS Office ou OpenOffice etc.) les métadonnées peuvent être internes à ces ressources.

Cela simplifie le classement, mais aussi la recherche de ces documents.

Le balisage d’une ressource informatique consiste à enregistrer les métadonnées utiles à la description du document utile notamment pour les images (EXIF et IPTC) pour les fichiers MP3 (chmps ID3) les autres fichiers multimédias.

Une photo (ou autres types de documents) ainsi balisée transporte avec elle ses propres métadonnées il n’y a donc plus risque de perte parce que celle-ci est téléchargée, copiée ou répliquée.

Le balisage des documents numériques présentent des limitations importantes :

  • Il ne peut se substituer à la description à l’aide de métadonnées stockées dans une base de données.
  • Tous les logiciels ne sont pas capables de lire ou de préserver les métadonnées incluses dans un fichier numérique. Ainsi il arrive avec certains logiciels (généralement gratuit) que les métadonnées disparaissent lorsqu’on modifie le fichier.

Les métadonnées EXIF :

Exif est une abréviation de EXchangeable Image File. ces métadonnées sont automatiquement enregistrées dans les documents elles définissent les informations d’ordre technique.

Ce format de métadonnées n’est pas standardisé, il est toutefois utilisé par de nombreux constructeurs d’appareils photographiques numériques.

Un éditeur de métadonnées EXIF est un non-sens, dans la mesure où ces métadonnées sont automatiquement enregistrées par le boîtier qui réalise les photos.

Les métadonnées IPTC :

L’ IPTC (International Press and Telecommunications Council) est une organisation internationale créée en 1965 pour développer et promouvoir des standards d’échange de données à destination de la presse.

Le sous-ensemble de ce modèle appelé Application record N° 2 a servi de base en 1994 à la société Adobe pour définir dans son logiciel Photoshop les informations associées à une image. C’est ce sous-ensemble qui est communément appelé métadonnées (ou champs ou informations ou en-têtes ou headers)IPTC.

Les informations IPTC/IIM sont constituées de 33 métadonnées de type interne, c’est-à-dire stockées à l’intérieur des fichiers images.

DataSet (numéro du champ) Nom du champ Description Traduction et Commentaire
5 Object Name non répétable, 64 caractères maximum Nom de l’objet
7 Edit Status non répétable, 64 caractères maximum Statut éditorial
10 Urgency non répétable, un seul caractère Priorité
15 Category non répétable, 3 caractères maximum Catégorie – ce champ est obsolète
20 Supplemental Category répétable, 32 caractères maximum Catégorie supplémentaire – ce champ est obsolète
22 Fixture Identifier non répétable, 32 caractères maximum Identificateur
25 Keywords répétable, 64 caractères maximum Mots-clés
30 Release Date non répétable, 8 caractères, forme AAAAMMJJ Date de disponibilité
35 Release Time non répétable, 11 caractères, forme HHMMSS±HHMM Heure de disponibilité, suit la norme ISO8601.
Ex. 090000-0500 = disponible à 9h00, temps de New York (5 heures avant TU)
40 Special Instructions non répétable, 256 caractères maximum Instructions spéciales
45 Reference service répétable, 10 caractères maximum. Optionnel Service de référence (doit être suivi des champs 47 et 50)
47 Reference Date obligatoire si le champ 45 est présent, 8 caractères, forme AAAAMMJJ Date de référence
50 Reference Number obligatoire si le champ 45 est présent, 10 caractères maximum Numéro de référence
55 Date Created non répétable, 8 caractères, forme AAAAMMJJ Date de création de l’objet
60 Time Created non répétable, 11 caractères, forme HHMMSS±HHMM Heure de création de l’objet, suit la norme ISO8601.
65 Originating Program non répétable, 32 caractères maximum Programme ayant créé l’objet
70 Program version non répétable, 10 caractères maximum Version du programme ayant créé l’objet
75 Object cycle non répétable, un seul caractère Cycle de l’objet
‘a’ = le matin, ‘b’ = l’après-midi, ‘c’ = matin et après-midi
80 By-line répétable, 32 caractères maximum Créateur de l’objet (auteur): nom du rédacteur, du photographe, etc.
85 By-line Title répétable, 32 caractères maximum Titre du créateur ou des créateurs.
Ex. « Staff Photographer », « Envoyé spécial »
90 City non répétable, 32 caractères maximum Ville
95 Province/State non répétable, 32 caractères maximum Province/État
100 Country/Primary Location Code non répétable, 3 caractères Code du pays, suit la norme ISO3166 (codes pays sur 3 caractères)
101 Country/Primary Location Name non répétable, 64 caractères maximum Libellé du pays
103 Original Transmission Reference non répétable, 32 caractères maximum Référence de la transmission (code)
105 Headline non répétable, 256 caractères maximum Titre
110 Credit non répétable, 32 caractères maximum Crédit (fournisseur de l’objet)
115 Source non répétable, 32 caractères maximum Source (propriétaire intellectuel de l’objet)
116 Copyright Notice non répétable, 128 caractères maximum Copyright
118 Contact répétable, 128 caractères maximum Contact
120 Caption/Abstract non répétable, 2000 caractères maximum Description, Résumé, Commentaire
122 Writer/Editor répétable, 32 caractères maximum Auteur de la Description (du champ 120)
130 Image Type non répétable, 2 caractères Type de l’image

 

  • Certains logiciels permettent d’ajouter des champs pour préciser certaines données.
  • Le « nom du champs » n’est pas toujours identiques d’un logiciel à un autre ainsi le champs n°5 est appelé « title » (titre) dans photoshop. Ce terme est repris par de nombreux autres logiciels.

Je ne m’attarde pas sur les données XMP (Extensible Metadata Platform) car cette norme appartient à Adobe (photoshop).

Dans le prochain article nous verrons quelles sont les métadonnées utiles pour le photographe amateur et comment il peut les remplir.

11 COMMENTAIRES

  1. salut pyrros
    Article très technique
    EXIF ok mais IPTC juste entendu donc je ne connais pas du tout, je pense pas m’en servir de suite.
    Te sers-tu du 2e ?
    Le froid est toujours là? . Nous c’est la tornade giovanna et elle fait demi-tour donc : pluie -vent
    Amicalement Thierry

  2. Merci je comprend mieux maintenant donc très important pour rechercher dans ta base et aussi sur la toile pour être (en haut de l’affiche) sur les moteurs de recherche , » un peux comme des tags « 

LAISSER UNE RÉPONSE