MPEG-4, le codage multimédia pour le troisième millénaire page 1/3

 
  Les nouveaux modes d'utilisation des programmes multimédia (Télévision Numérique Standard ou à Haute Définition, ADSL, Video on Demand -VOD-, DVD Haute Définition Blu Ray , Télévision pour mobiles...) qui sont apparus au début du millénaire, exploitent une gamme de débits numériques très étendue de quelques dizaines de kilobits par seconde (kbits/s) pour la transmission vers les mobiles à quelques dizaines de mégabits par seconde (Mbits/s) pour les applications HD.
Dans cet univers mouvant et foisonnant les notions de flexibilité et d'évolutivité en même temps que celle de compromis débit / qualité ont pris une importance fondamentale.
MPEG-4 a été conçu pour répondre à ces besoins... Et encore plus ! .
 
François Luxereau

L'arrivée des méthodes de compression des données d'images animées a été, il y a une vingtaine d'années, quelque chose de véritablement magique. Comment imaginer que l'on pouvait éliminer la moitié ou les trois quarts des données tout en conservant la possibilité de visionner confortablement une séquence...?. Les algorithmes de compression JPEG puis MPEG-1 et MPEG-2 ont depuis lors livré leurs secrets.

Tous les pixels ne sont pas égaux en droits.
Ces méthodes que je viens de citer souffrent d'un handicap; elles traitent de manière identique tous les pixels des images. Or ceux-ci n'ont pas tous la même fonction, la même origine, la même existence, ni la même importance.
Il est évident que le décor d'un studio de journal télévisé, apporte moins d'information que le visage et la voix du journaliste. De plus il ne change pas d'une minute à l'autre ni du jour au lendemain..

Il est donc venu aux esprits des spécialistes, afin d'améliorer les performances des codages, de représenter un programme audiovisuel comme une collection d'éléments identifiables, séparables et regroupables, mais de natures ou de fonctions différentes.
C'est la notion d'objets audiovisuels (images naturelles, textes, graphismes, environnements "3D", sons naturels ou synthétiques) qui apparaît.

Chacun de ces objets qui constituent une scène, sera soumis au type de codage le plus efficace compte tenu de sa nature.
Chaque lettre d'un titre ou d'un sous-titre, qui peut correspondre à plusieurs milliers de pixels (c'est à dire plusieurs milliers de fois 3 x 8 bits, au minimum, en RVB), peut être parfaitement défini grâce aux 8 bits du code ASCII, plus quelques bits d'attributs (couleur, police, taille....).
On sait également tout l'intérêt des traitements en mode vectoriel pour les graphismes

Ces éléments peuvent être rendus interdépendants temporellement et spatialement par l'intermédiaire d'un "descripteur de scène" (scene descriptor).

Les objectifs
Les travaux sur le codage MPE-4 (ISO/IEC 14496), "le codage multimédia pour le troisième millénaire", comme on le nomme parfois, ont commencé en 1995, une première parution a eu lieu en 1998. Il est devenu Standard International en 2000 ; il continue à évoluer.

Il est défini comme "orienté objets".
On parlera notamment d'Audio Visual Objects (AVO ), Video Objects (VO) et de Video Objects Planes ( VOP), ces derniers représentant un ensemble d'objets visuels (VO) qui doivent être manipulés simultanément dans une scène.
Il peut s'agir d'objets naturels (d'un aspect apparenté à la photographie) ou d'objets réalisés en images de synthèse. On pourra, par exemple, construire une scène comme la collection hiérarchique des objets suivants :
  - un présentateur, enregistré sur fond bleu, et sa parole (deux objets)
- un décor en images de synthèse 3 D constitué de deux objets, un fauteuil et un lampadaire
- une image de synthèse 2D
- un logo de chaîne codé ASCII
- une horloge provenant d'un générateur électronique codé
- une musique MIDI
Il s'agit en quelque sorte des éléments d'un programme avant passage dans le mélangeur.

 
Décomposition d'une scène en objets audiovisuels

Le but est d'assurer, pour les programmes multimédia (depuis la télésurveillance jusqu'à la haute définition), une standardisation technologique à tous les niveaux : production, distribution et diffusion.
Si l'objectif d'un faible débit (inférieur à 64 kb/s) a été essentiel au début des travaux, on s'est assez vite rendu compte que la notion d'objets indépendants assurait bien d'autres avantages, notamment des possibilités de décodage des programmes à plusieurs niveaux de qualité (effet d'échelle, adaptabilité, ou scalability) ainsi que des possibilités d'interaction du spectateur avec le contenu de la scène.
Le développement de nouveaux types d'outils de création et de manipulation d'objets de synthèse ouvre également des applications dans les domaines des jeux, de la réalité virtuelle, de la téléprésence, de l'imagerie scientifique......

L'effet de changement d'échelle (scalability), est fondamental dans MPEG-4.
Il peut être spatial (un décodeur peut n'utiliser qu'une fraction du flux de données afin d'afficher des images dans une résolution réduite), temporel (une séquence vidéo peut être reproduite avec moins d'images par seconde qu'elle n'en comportait à l'origine) ou encore qualitatif (les données sont organisées en couches : une couche de base accompagnée de couches d'extension -Enhancement Layer- permettant un affichage progressif de la qualité).

Cette technique d'adaptabilité aux besoins de l'utilisateur ou aux performances du matériel peut porter sur l'image entière ou sur un seul objet.

La norme MPEG-4 est extrêmement complète puisqu'elle comporte 21 parties qui définissent depuis les généralités du système (part 1) jusqu'aux applications graphiques interactives en langage Java (Java Graphic Framework eXtension ; part 21), la spécification de la transmission des polices de caractères (part 18), les méthodes de transport du flux des données sur Internet (part 8) en passant par les codages vidéo (part 2) et audio (part 3). La partie 10, sans doute la plus importante aujourd'hui, concerne la transmission ou l'enregistrement de programmes multimédia.

MPEG-4 a prouvé son efficacité dans le domaine de la télévision numérique ainsi que dans celui des applications graphiques et multimédia interactives avec des débits pouvant aller de 64 kb/s jusqu'à 4 Mb/s pour les applications les plus exigeantes (limite supérieure qui a été récemment étendue à 1,2 Gb/s pour les besoins du cinéma numérique).
 
Date :01/06/2008 Source: Rédac Auteur :FL Société: JPL

 
 
 
 
 
 
Cet espace est disponible pour vos liens commerciaux et vos publicités