| |
| |
Les
nouveaux modes d'utilisation des programmes multimédia
(Télévision Numérique Standard
ou à Haute Définition, ADSL, Video
on Demand -VOD-, DVD Haute Définition Blu
Ray , Télévision pour mobiles...)
qui sont apparus au début du millénaire,
exploitent une gamme de débits numériques
très étendue de quelques dizaines
de kilobits par seconde (kbits/s) pour la transmission
vers les mobiles à quelques dizaines de
mégabits par seconde (Mbits/s) pour les
applications HD.
Dans cet univers mouvant et foisonnant les notions
de flexibilité et d'évolutivité
en même temps que celle de compromis débit
/ qualité ont pris une importance fondamentale.
MPEG-4 a été conçu pour répondre
à ces besoins... Et encore plus ! . |
| |
François
Luxereau
|
L'arrivée des méthodes de compression
des données d'images animées a été,
il y a une vingtaine d'années, quelque chose
de véritablement magique. Comment imaginer que
l'on pouvait éliminer la moitié ou les
trois quarts des données tout en conservant la
possibilité de visionner confortablement une
séquence...?. Les algorithmes de compression
JPEG puis MPEG-1 et MPEG-2 ont depuis lors livré
leurs secrets.
Tous
les pixels ne sont pas égaux en droits.
Ces méthodes que je viens de citer souffrent
d'un handicap; elles traitent de manière identique
tous les pixels des images. Or ceux-ci n'ont pas tous
la même fonction, la même origine, la
même existence, ni la même importance.
Il est évident que le décor d'un studio
de journal télévisé, apporte
moins d'information que le visage et la voix du journaliste.
De plus il ne change pas d'une minute à l'autre
ni du jour au lendemain..
Il
est donc venu aux esprits des spécialistes,
afin d'améliorer les performances des codages,
de représenter un programme audiovisuel comme
une collection d'éléments identifiables,
séparables et regroupables, mais de natures
ou de fonctions différentes.
C'est la notion d'objets audiovisuels (images naturelles,
textes, graphismes, environnements "3D",
sons naturels ou synthétiques) qui apparaît.
Chacun de ces objets qui constituent une scène,
sera soumis au type de codage le plus efficace compte
tenu de sa nature.
Chaque lettre d'un titre ou d'un sous-titre, qui peut
correspondre à plusieurs milliers de pixels
(c'est à dire plusieurs milliers de fois 3
x 8 bits, au minimum, en RVB), peut être parfaitement
défini grâce aux 8 bits du code ASCII,
plus quelques bits d'attributs (couleur, police, taille....).
On sait également tout l'intérêt
des traitements en mode vectoriel pour les graphismes
Ces
éléments peuvent être rendus interdépendants
temporellement et spatialement par l'intermédiaire
d'un "descripteur de scène" (scene
descriptor).
Les
objectifs
Les travaux sur le codage MPE-4 (ISO/IEC 14496), "le
codage multimédia pour le troisième
millénaire", comme on le nomme parfois,
ont commencé en 1995, une première parution
a eu lieu en 1998. Il est devenu Standard International
en 2000 ; il continue à évoluer.
Il
est défini comme "orienté objets".
On parlera notamment d'Audio Visual Objects (AVO
), Video Objects (VO) et de Video Objects
Planes ( VOP), ces derniers représentant
un ensemble d'objets visuels (VO) qui doivent être
manipulés simultanément dans une scène.
Il peut s'agir d'objets naturels (d'un aspect apparenté
à la photographie) ou d'objets réalisés
en images de synthèse. On pourra, par exemple,
construire une scène comme la collection hiérarchique
des objets suivants :
| |
-
un présentateur, enregistré sur
fond bleu, et sa parole (deux objets)
- un décor en images de synthèse
3 D constitué de deux objets, un fauteuil
et un lampadaire
- une image de synthèse 2D
- un logo de chaîne codé ASCII
- une horloge provenant d'un générateur
électronique codé
- une musique MIDI |
Il
s'agit en quelque sorte des éléments d'un
programme avant passage dans le mélangeur.
| |

Décomposition
d'une scène en objets audiovisuels
|
Le
but est d'assurer, pour les programmes multimédia
(depuis la télésurveillance jusqu'à
la haute définition), une standardisation technologique
à tous les niveaux : production, distribution
et diffusion.
Si l'objectif d'un faible débit (inférieur
à 64 kb/s) a été essentiel au
début des travaux, on s'est assez vite rendu
compte que la notion d'objets indépendants
assurait bien d'autres avantages, notamment des possibilités
de décodage des programmes à plusieurs
niveaux de qualité (effet d'échelle,
adaptabilité, ou scalability) ainsi que des
possibilités d'interaction du spectateur avec
le contenu de la scène.
Le développement de nouveaux types d'outils
de création et de manipulation d'objets de
synthèse ouvre également des applications
dans les domaines des jeux, de la réalité
virtuelle, de la téléprésence,
de l'imagerie scientifique......
L'effet
de changement d'échelle (scalability),
est fondamental dans MPEG-4.
Il peut être spatial (un décodeur peut
n'utiliser qu'une fraction du flux de données
afin d'afficher des images dans une résolution
réduite), temporel (une séquence vidéo
peut être reproduite avec moins d'images par
seconde qu'elle n'en comportait à l'origine)
ou encore qualitatif (les données sont organisées
en couches : une couche de base accompagnée
de couches d'extension -Enhancement Layer- permettant
un affichage progressif de la qualité).
Cette
technique d'adaptabilité aux besoins de l'utilisateur
ou aux performances du matériel peut porter
sur l'image entière ou sur un seul objet.
La
norme MPEG-4 est extrêmement complète
puisqu'elle comporte 21 parties qui définissent
depuis les généralités du système
(part 1) jusqu'aux applications graphiques interactives
en langage Java (Java Graphic Framework eXtension
; part 21), la spécification de la transmission
des polices de caractères (part 18), les méthodes
de transport du flux des données sur Internet
(part 8) en passant par les codages vidéo (part
2) et audio (part 3). La partie 10, sans doute la
plus importante aujourd'hui, concerne la transmission
ou l'enregistrement de programmes multimédia.
MPEG-4
a prouvé son efficacité dans le domaine
de la télévision numérique ainsi
que dans celui des applications graphiques et multimédia
interactives avec des débits pouvant aller de
64 kb/s jusqu'à 4 Mb/s pour les applications
les plus exigeantes (limite supérieure qui a
été récemment étendue à
1,2 Gb/s pour les besoins du cinéma numérique).
|