Les métadonnées, qu’est ce que c’est ?

15

Les métadonnées servent à décrire ou à définir une autre donnée (photo texte son ou vidéo). Elles sont définies dans le cadre du modèle ressource description Framework (RDF).

Les premières métadonnées contenues dans un fichier numérique est son nom de fichier. Mais il est possible de compléter ces informations avec le titre, les mots-clés, les informations de droits d’auteur, le nom de l’auteur etc.

Ci-dessous nous nous intéresserons essentiellement aux métadonnées qui concernent les photos.

En photo on distingue deux types de métadonnées : les EXIF et les IPTC.

Les métadonnées en photos (EXIF et IPTC)

Le stockage des métadonnées

Pour des ressources non digitales (livre, disque ou objet de musée) les métadonnées sont évidemment externes à ses ressources. Avant l’arrivée massive de l’informatique ces données étaient stockées dans des tiroirs sur des fiches cartonnées. Aujourd’hui à la place des fiches cartonnées on utilise des systèmes informatiques.

On retrouve cette externalisation des métadonnées notamment dans des systèmes documentaires (bibliothèque, médiathèque). Il faut faire attention à toujours garder associé l’objet et ses métadonnées. Lorsqu’il s’agit de ressources digitales (photo, MP3, documents MS Office ou OpenOffice, etc.) les métadonnées peuvent être internes à ces ressources. Cela simplifie le classement, mais aussi la recherche de ces documents.

Le balisage ou l’enregistrement des métadonnées

Le balisage d’une ressource informatique consiste à enregistrer les métadonnées utiles à la description du document notamment pour les images (EXIF et IPTC) pour les fichiers MP3 (chmps ID3).

Une photo (ou autres types de documents) ainsi balisée transporte avec elle ses propres métadonnées. Si le document se fait télécharger, copier ou répliquer, ce sera avec ses métadonnées. Cependant, certains logiciels effacent les métadonnées pour gagner quelques kilo-octets. Certains sites, certaines plateformes comme Facebook et Instagram effacent, elles aussi, les métadonnées.

Le balisage des documents numériques présente des limitations importantes :

  • Il ne peut se substituer à la description à l’aide de métadonnées stockées dans une base de données.
  • Tous les logiciels ne sont pas capables de lire ou de préserver les métadonnées incluses dans un fichier numérique.
  • Certaines plateformes effacent les métadonnées pour réduire le poids des documents

Les différentes métadonnées utilisées en photographie

Les métadonnées EXIF :

Exif est une abréviation de EXchangeable Image File. Lors de la création d’un document le logiciel de la machine écrit les EXIFs. Elles définissent les informations d’ordre technique.

À ce jour, il n’y pas de standard pour ces données. Les boitiers photos écrivent automatiquement les EXIfs dans les métadonnées des photos. Les logiciels de post-traitement tels que Lightroom et Photoshop peuvent lire les données EXIFs.

Un éditeur de métadonnées EXIF est un non-sens. Ces métadonnées sont automatiquement enregistrées par le boîtier qui réalise les photos. Il ne sert à rien de vouloir modifier des métadonnées sauf à vouloir tricher pour un concours photo.

Les métadonnées IPTC :

L’ IPTC (International Press and Telecommunications Council) est une organisation internationale créée en 1965 pour développer et promouvoir des standards d’échange de données à destination de la presse.

Le sous-ensemble de ce modèle appelé « Application record N° 2 » a servi de base en 1994 à la société Adobe pour définir dans son logiciel Photoshop les informations associées à une image. Communément les métadonnées de ce sous-ensemble (ou champs ou informations ou en-têtes ou headers) désigne les IPTC.

33 métadonnées que l’on trouve dans les fichiers image

Les informations IPTC/IIM sont constituées de 33 métadonnées de type interne. On les retrouve dans les fichiers images.

DataSet (numéro du champ)Nom du champDescriptionTraduction et Commentaire
5Object Namenon répétable, 64 caractères maximumNom de l’objet
7Edit Statusnon répétable, 64 caractères maximumStatut éditorial
10Urgencynon répétable, un seul caractèrePriorité
15Categorynon répétable, 3 caractères maximumCatégorie – ce champ est obsolète
20Supplemental Categoryrépétable, 32 caractères maximumCatégorie supplémentaire – ce champ est obsolète
22Fixture Identifiernon répétable, 32 caractères maximumIdentificateur
25Keywordsrépétable, 64 caractères maximumMots-clés
30Release Datenon répétable, 8 caractères, forme AAAAMMJJDate de disponibilité
35Release Timenon répétable, 11 caractères, forme HHMMSS±HHMMHeure de disponibilité, suit la norme ISO8601.
Ex. 090000-0500 = disponible à 9h00, temps de New York (5 heures avant TU)
40Special Instructionsnon répétable, 256 caractères maximumInstructions spéciales
45Reference servicerépétable, 10 caractères maximum. OptionnelService de référence (doit être suivi des champs 47 et 50)
47Reference Dateobligatoire si le champ 45 est présent, 8 caractères, forme AAAAMMJJDate de référence
50Reference Numberobligatoire si le champ 45 est présent, 10 caractères maximumNuméro de référence
55Date Creatednon répétable, 8 caractères, forme AAAAMMJJDate de création de l’objet
60Time Creatednon répétable, 11 caractères, forme HHMMSS±HHMMHeure de création de l’objet, suit la norme ISO8601.
65Originating Programnon répétable, 32 caractères maximumProgramme ayant créé l’objet
70Program versionnon répétable, 10 caractères maximumVersion du programme ayant créé l’objet
75Object cyclenon répétable, un seul caractèreCycle de l’objet
‘a’ = le matin, ‘b’ = l’après-midi, ‘c’ = matin et après-midi
80By-linerépétable, 32 caractères maximumCréateur de l’objet (auteur): nom du rédacteur, du photographe, etc.
85By-line Titlerépétable, 32 caractères maximumTitre du créateur ou des créateurs.
Ex. « Staff Photographer », « Envoyé spécial »
90Citynon répétable, 32 caractères maximumVille
95Province/Statenon répétable, 32 caractères maximumProvince/État
100Country/Primary Location Codenon répétable, 3 caractèresCode du pays, suit la norme ISO3166 (codes pays sur 3 caractères)
101Country/Primary Location Namenon répétable, 64 caractères maximumLibellé du pays
103Original Transmission Referencenon répétable, 32 caractères maximumRéférence de la transmission (code)
105Headlinenon répétable, 256 caractères maximumTitre
110Creditnon répétable, 32 caractères maximumCrédit (fournisseur de l’objet)
115Sourcenon répétable, 32 caractères maximumSource (propriétaire intellectuel de l’objet)
116Copyright Noticenon répétable, 128 caractères maximumCopyright
118Contactrépétable, 128 caractères maximumContact
120Caption/Abstractnon répétable, 2000 caractères maximumDescription, Résumé, Commentaire
122Writer/Editorrépétable, 32 caractères maximumAuteur de la Description (du champ 120)
130Image Typenon répétable, 2 caractèresType de l’image
  • Certains logiciels permettent d’ajouter des champs pour préciser certaines données.
  • Le « nom du champs » n’est pas toujours identiques d’un logiciel à un autre. Ainsi le champs n°5 (object name) se nomme « title » (titre) dans Photoshop. De nombreux autres logiciels reprennent le terme de « titre ».

Les données XMP

Adobe l’éditeur de logiciels tels que Photoshop ou Lightroom a créé les données XMP (Extensible Metadata Platform). Ces données ne semblent être utilisé que par les logiciels édités par Adobe. On les trouve soit dans le fichier, soit dans un fichiers. Les données XMP permettent les retouches non destructives comme le traitement des fichiers RAW.

L'utilité des métadonnées et des données IPTC-EXIF

Les métadonnées utiles pour les photographes

Pour le photographe amateur ou professionnel utiliser et remplir correctement les métadonnées IPTC peut représenter un gain de temps énorme lors de l’exportation de ces photos notamment s’il diffuse ses photos sur de nombreux supports multimédias. Aujourd’hui les sites Internet, qui permettent aux photographes de partager leurs photos, reconnaissent de plus en plus les données IPTC et EXIF. Cependant, certaines plateformes refusent encore de les utiliser. Google utilise les métadonnées pour connaitre le nom de l’auteur d’une photo.

Les métadonnées sont même obligatoires pour ceux qui déposent leurs photos dans des agences. Sans cela les clients ne peuvent retrouver les photos. Certaines agences imposent des règles pour remplir les métadonnées. D’autres sont plus laxistes. Il apparait cependant que les photos qui se vendent disposent de leur métadonnées, en plusieurs langues.

Ainsi il devient possible aux photographes de ne plus avoir à modifier leur description leurs mots-clés et autres données pour les faire apparaître sur chacun des sites Internet.

Les moteurs de recherches n’utilisent pas les métadonnées

Aujourd’hui Google Image diffuse les métadonnées des photos lors d’une recherche, on peut donc imaginer que prochainement Google et les autres moteurs de recherches prendront en compte ces données. Attention cependant, les métadonnées ne semblent pas utilisées pour améliorer le référencement des images. Leur présence ou leur absence ne semble pas etre un critère pour le SEO des photos.

3 Groupes d’IPTC pour les photographes

Les données IPTC indispensables en photographie :

DataSet (numéro du champ)Nom du champDescriptionTraduction et Commentaire
80By-linerépétable, 32 caractères maximumCréateur de l’objet (auteur): nom du rédacteur, du photographe, etc.
115Sourcenon répétable, 32 caractères maximumSource (propriétaire intellectuel de l’objet)
25Keywordsrépétable, 64 caractères maximumMots-clés
55Date Creatednon répétable, 8 caractères, forme AAAAMMJJDate de création de l’objet
90Citynon répétable, 32 caractères maximumVille
101Country/Primary Location Namenon répétable, 64 caractères maximumLibellé du pays
105Headlinenon répétable, 256 caractères maximumTitre
120Caption/Abstractnon répétable, 2000 caractères maximumDescription, Résumé, Commentaire

Ces métadonnées se révèlent presque indispensable pour que le photographes puisse faire connaitre son identité. Les photographes professionnels utilisent ces données, mais les amateurs ont aussi tout intérêt à les utiliser.

  • Les logiciels peuvent automatiser l’écriture des 80 et 115. Dans la case 80 je note mon prénom et mon nom suivi de l’adresse de mon site Internet. Dans la case 115 je note aussi l’adresse de mon site Web. Pour les autres il faudra le faire lors de chaque reportage ou séance photo.
  • Pour le N°25, les mots-clés devront être issus de thesaurus ou d’une banque de mots-clés. De nombreux thesaurus sont désormais en ligne. Toutefois, si certains mots-clés ne se trouvent pas en des thesaurus, il convient de créer son propre thesaurus.
  • Le N°55 peut-être redondant avec les données EXIF.
  • Les N°90 et 101 peuvent être complétées de données GPS. Toutefois celui-ci sera inscrit dans un champ supplémentaire non prévu actuellement.
  • Le N°105 correspond au titre du reportage ou de la séance photo.
  • Le N°120 est une description de la photo. De nombreux sites le propose en légende de la photo.

Les données IPTC optionnelles :

DataSet (numéro du champ)Nom du champDescriptionTraduction et Commentaire
5Object Namenon répétable, 64 caractères maximumNom de l’objet
95Province/Statenon répétable, 32 caractères maximumProvince/État
  • Le N°05 je note une courte description de la photo qui viendra compléter son nom. (exemple : métadonnée qui donnera le nom de fichier suivant «IMG_XXXX_metadonnees.jpg»)
  • Le N°95 complète les champs précédents 105 et 120 et permettent d’indiquer la région de prise de vue.

Les données IPTC inutiles pour les photographes :

Toutes les autres métadonnées se révèlent inutiles pour les photographes amateurs. Par contre, les agences traitant avec la presse quotidienne les utilisent.

Les données EXIF parfois utilisées :

Les EXIFs utilisées par les logiciels

Les logiciels utilisent les données EXIF. Cela permet par exemple de connaitre la nature du fichier et de lui appliquer des algorithmes.

Cela permet aussi de classer les photos avec des critères techniques comme le sens de l’image. Enfin on peut trouver des informations concernant la date ou l’heure de création du fichier ce qui permet ici aussi de mieux classer les photos, sans utiliser les IPTC.

Les EXIFs pour les curieux

J’ai fait le choix de laisser les données Exif de mes photos dans le fichiers que je diffuse sur internet afin de donner la possibilité aux plus curieux et particulièrement aux photographes de mieux comprendre les conditions de prise de vue de mes photos.

D’autres font le choix de les supprimer pour gagner quelques Ko dans les poids des images. J’ai fait ce choix afin de donner la possibilité aux photographe curieux de mieux comprendre la technique de mes photos, mais faut-il encore savoir y accéder.

Dans le prochain sujet, je présenterai comment écrire et lire les métadonnées.

15 COMMENTAIRES

  1. salut pyrros
    Article très technique
    EXIF ok mais IPTC juste entendu donc je ne connais pas du tout, je pense pas m’en servir de suite.
    Te sers-tu du 2e ?
    Le froid est toujours là? . Nous c’est la tornade giovanna et elle fait demi-tour donc : pluie -vent
    Amicalement Thierry

  2. Merci je comprend mieux maintenant donc très important pour rechercher dans ta base et aussi sur la toile pour être (en haut de l’affiche) sur les moteurs de recherche , » un peux comme des tags « 

LAISSER UNE RÉPONSE

Please enter your comment!
Please enter your name here

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.