Structures de codage mixte de parole et musique.

Résumé:

Le cadre de cette thèse est un contrat CTI financé par le CNET-France Telecom, dont l’objectif est de définir un codeur à débit variable hiérarchique, à délai réduit et de bonne qualité. Voici un sommaire en Francais de ma dérnière publication à ICASSP98: Le travail présenté dans ce papier est réalisé dans le cadre d’études réclamées par l’UIT-T visant à développer de nouveaux services de communication de groupes (services d’audio et visioconférences numériques, téléphonie sur haut-parleur, etc.). On propose un codeur audiofréquence en bande FM (fréquence d’échantillonnage = 32 kHz) susceptible de transmettre aussi bien de la parole que de la musique à un débit inférieur ou égal à 64 kbit/s par voie monophonique (seul le codeur à 64 kbit/s est décrit dans ce papier). Parmi les contraintes que doit respecter tout bon syst\`eme de codage à savoir les contraintes relatives à la qualité, la complexité, le retard et la tenue aux erreurs de transmission, l’originalité de ce travail provient de la priorité donnée à la limitation du retard à une valeur la plus faible possible tout en cherchant à maintenir la qualité équivalente à celle fournie par le codeur MPEG1 layer 2 (i.e. la quasi-transparence). En effet, si la contrainte portant sur le retard est peu exigeante lorsque les applications visées sont de type diffusion, cette contrainte est beaucoup plus forte pour une application de type communication de groupes. Le retard algorithmique admissible maximal a été fixé à 25 ms (environ 3 fois inférieur à celui du standard MPEG).

Mot-Clés : Audiofrequence Compression Parole Musique