Dans la téléphonie numérique, le signal analogique est numérisé grâce à un codeur-décodeur, appelé codec qui se situe dans le terminal lui-même. Les données numériques sont encapsulées dans un paquet IP qui est ensuite transporté par le réseau IP. C’est la raison pour laquelle on parle de ToIP (Telephony over IP). La ToIP correspond donc à un transport de paquets IP de bout en bout, les paquets partant du téléphone IP d’un utilisateur pour aller au téléphone IP d’un autre utilisateur. Ces paquets transportent des octets téléphoniques.
La téléphonie est une application temps réel tenant compte de l’interaction humaine qui demande des temps d’aller retour de la parole de 600 ms au maximum. Au dessus de 600 ms on considère que l’application est de type talkie-walkie. En supposant un réseau symétrique cela représente 300 ms dans chaque sens.
Deux phases bien distinctes se succèdent, la phase signalisation qui a pour objectif de signaler au correspondant la demande et ensuite la conversation téléphonique elle-même. Ces deux grandes étapes sont :
-
La signalisation. Une signalisation démarre la session. Le premier élément à considérer est la localisation du récepteur (User Location). Cette localisation s’effectue par une conversion de l’adresse du destinataire (adresse IP ou adresse téléphonique classique) en une adresse IP d’une machine qui puisse joindre le destinataire (qui peut être le destinataire lui-même). Le récepteur peut être un combiné téléphonique classique sur un réseau d’opérateur télécoms ou une station de travail (lorsque la communication s’effectue d’un combiné téléphonique vers un PC). Le protocole DHCP (Dynamic Host Configuration Protocol) et les passerelles spécialisées (gatekeeper) sont employés à cette fin. Ensuite l’établissement de la communication doit se faire. Cela passe par une acceptation du terminal destinataire, que ce dernier soit un téléphone, une boîte vocale ou un serveur Web. Plusieurs protocoles de signalisation sont utilisés pour cela, en particulier le protocole SIP (Session Initiation Protocol) de l’IETF. Comme son nom l’indique, SIP est utilisé pour initialiser la session. Une requête SIP contient un ensemble d’en-têtes, qui décrivent l’appel, suivis du corps du message, qui contient la description de la demande de session. SIP est un protocole client-serveur, qui utilise la syntaxe et la sémantique de HTTP. Le serveur gère la demande et fournit une réponse au client.
Trois types de serveurs gèrent différents éléments : un serveur d’enregistrement (Registration Server), un serveur relais (Proxy Server) et un serveur de redirection (Redirect Server). Ces serveurs travaillent à trouver la route : le serveur proxy détermine le prochain serveur (Next-Hop Server), qui, à son tour, trouve le suivant, et ainsi de suite. Des champs supplémentaires de l’en-tête gèrent des options, comme le transfert d’appel ou la gestion des conférences téléphoniques.
-
Transport de l’information téléphonique. Les paquets doivent être acheminés en des laps de temps très courts ; il faut donc contrôler le réseau. Deux grandes classes de solution peuvent être envisagées : l’utilisation du protocole RTP (Real-time Transport Protocol) qui a pour rôle d’organiser les paquets à l’entrée du réseau et de les contrôler à la sortie de façon à reformer le flot avec ses caractéristiques de départ (vérification du synchronisme, des pertes, etc.). Dans ce cas, l’application de téléphonie s’adapte au réseau. Dans le second cas, le réseau doit s’adapter à l’application et donc mettre en place des solutions d’acheminement en fonction des contraintes du client.
Ces deux phases illustrent la relative complexité de la téléphonie sur IP. De nombreuses variantes existent, mais elles ne différent que par les protocoles utilisés. À cette complexité s’ajoutent les problèmes liés à la traversée du réseau qui doit garantir des temps de transit acceptable pour que l’application téléphonique puisse se dérouler dans de bonnes conditions.
Nous allons examiner ces deux phases plus en détail.
La phase principale consiste à transporter les paquets d’une extrémité à l’autre, en traversant les deux terminaux, émetteur et récepteur, de type PC ou téléphone IP, les modems, les réseaux d’accès, les passerelles, les routeurs, etc.
On peut considérer que le temps de traversée d’un PC et de son codec demande quelques millisecondes, la paquétisation de 5 à 16 millisecondes, la traversée d’un modem quelques millisecondes également, celui d’un routeur ou d’une passerelle de l’ordre de la milliseconde s’il n’y a aucun paquet en attente et celui d’un réseau IP quelques dizaines de millisecondes.
L’addition de ces temps montre que la limite maximale de 300 ms permettant l’interactivité est rapidement atteinte. La figure suivante illustre ce processus.
Figure - Équipements à traverser par une communication téléphonique sur IP
Avantages de la ToIP
La téléphonie n’a jamais été une application simple. Les contraintes temps réel et de synchronisation pèsent lourdement sur sa mise en œuvre, et la téléphonie par paquet ne fait que compliquer le transport.
Cependant, au moins deux raisons expliquent le succès de la téléphonie par paquet, et plus spécifiquement de la téléphonie sur IP :
-
la convergence. Quel que soit le type de données véhiculées, le réseau est unique : les flux de voix, de vidéo, de textes et d’applicatifs transitent sur le même réseau. Les communications deviennent plus riches, et sans avoir besoin de multiplier les canaux de transport, les utilisateurs peuvent, par exemple, envoyer un compte rendu d’activité en même temps qu’ils téléphonent avec leur correspondant. Pour les utilisateurs, la convivialité est accrue. En entreprise, la productivité est améliorée. Pour les administrateurs, un seul réseau est à administrer, ce qui simplifie grandement la gestion.
-
Optimisation des ressources. Le réseau IP utilisant un transfert de paquets, l’utilisation des ressources est optimisée en comparaison des solutions de type commutation de circuits. En effet, le réseau RTC, qui utilise une commutation de circuits, dédie des ressources pour toute la durée de la communication, que ces ressources soient utilisées ou non. Or, les très nombreux silences d’une conversation téléphonique rendent le dimensionnement du canal réservé systématiquement trop grand : un silence n’a pas besoin d’être transmis. De la même manière, pour que la voix supporte simultanément la superposition de deux paroles correspondant aux deux intervenants d’une communication téléphonique (full duplex), les réseaux RTC doivent allouer pour chaque intervenant deux canaux différents, l’un en émission et l’autre en réception. Or, dans la pratique, lors d’une conversation téléphonique, une seule personne parle en même temps. Les ressources sont globalement gaspillées. La réservation effectuée dans les réseaux RTC a donc un coût nettement supérieur à celui d’un réseau IP.
-
Intégration. Grâce à l’intégration de la téléphonie parmi de nombreuses autres applications, le coût du transport devient pratiquement nul. Le réseau permettant d’effectuer le transport est le réseau cœur des opérateurs, celui qui effectue tous les transports de données. Ces opérateurs, qui étaient auparavant obligés de maintenir au moins deux réseaux, celui de téléphonie et celui de données, n’en ont plus qu’un seul à maintenir. L’intégration supplémentaire de la télévision dans le réseau de données fait également chuter les coûts de transport de cette application.
-
Des services exclusifs. Certains services sont propres aux réseaux IP. Par exemple, le service de présence, consistant à détecter si un utilisateur est connecté au réseau ou non, est adapté au réseau IP, car il n’impose pas de réservation de ressources pour une communication, ce qui n’est pas le cas du réseau RTC. De façon analogue, pour le nomadisme des utilisateurs, il est plus simple d’avoir accès, partout dans le monde, au réseau IP qu’au réseau téléphonique.
-
Disparition des commutateurs locaux. Liée à la précédente, cette nouvelle donne résulte de la possibilité de gérer les téléphones depuis le réseau de l’opérateur (système Centrex). Des solutions intermédiaires, comme les PBX-IP, permettent de passer petit à petit des circuits numériques aux communications par paquet IP.
La téléphonie devient ainsi une application du réseau IP comme une autre, si ce n’est qu’elle nécessite une qualité de service particulière. De ce fait, les modems ADSL qui amènent chez l’utilisateur la connectivité IP constituent la porte d’entrée de la téléphonie IP. Le modem l’intègre avec les applications de données (messagerie, transfert de fichiers, P2P), la télévision, la visiophonie, etc.
En 2007, cette intégration n’est pas encore finalisée puisque la plupart des postes téléphoniques ne sont pas encore des postes IP capables d’émettre directement des paquets IP. Il faut un point de connexion spécifique sur le modem pour indiquer que le flux est une parole téléphonique.
De même, le flux de télévision se distingue des autres applications par un accès spécifique sur le modem. Cependant, dès que les téléphones et les télévisions seront IP, le réseau de domicile ne fera aucune différence entre ces applications. C’est le modem qui, en filtrant les flux, découvrira les paquets de téléphonie et les paquets de télévision pour les traiter en conséquence.
La téléphonie sur Wi-Fi
La technologie de ToIP sans fil a pour objectif de permettre aux utilisateurs de téléphoner directement en IP, donc à un coût extrêmement bas et depuis de nombreux points sans avoir besoin d’une connexion physique. Elle représente un pas supplémentaire vers la convergence des flux audio, vidéo et données sur un médium unique.
La problématique de la ToIP sur Wi-Fi est évidemment semblable à celle de la téléphonie sur réseau terrestre, si ce n’est qu’il s’y ajoute la difficulté de réaliser la traversée de l’interface air dans un laps de temps suffisamment court pour satisfaire à la contrainte temps réel. Il s’agit d’une vraie difficulté dans la mesure où les équipements raccordés au point d’accès Wi-Fi sont a priori indépendants les uns des autres. De plus, les environnements Wi-Fi offrent un débit particulièrement fluctuant, et il est quasiment impossible de connaître le débit disponible à l’instant suivant.
Les terminaux de ToIP sur Wi-Fi assurent les fonctions de codec, de paquétisation et d’encapsulation dans la trame Ethernet pour transiter sur le réseau Wi-Fi.
Déjà importantes dans les réseaux IP, les pertes de paquets sont particulièrement courantes en sans-fil. La perte d’un paquet entraîne la perte d’une bribe de parole. Pour une bonne qualité d’écoute, le taux de perte de paquets doit être inférieur à 20 %. Pour faire baisser le taux d’erreur sur l’interface radio, la technologie Wi-Fi réémet automatiquement les trames, augmentant d’autant le temps de traversée du réseau.
Si le taux d’erreur dépasse une certaine limite, la transmission d’un élément binaire est effectuée sur deux signaux d’horloge à la place d’un seul, ce qui diminue le débit d’un facteur deux. Dans le cas d’un réseau IEEE 802.11b, le débit de base passe alors de 11 Mbit/s à 5,5 puis à 2 puis à 1 Mbit/s. Cette baisse du débit pose un énorme problème de qualité de service, puisque la bande passante n’est plus du tout celle attendue. De plus, le débit réel correspond approximativement à la moitié du débit brut.
Une autre contrainte vient du fait que la confidentialité des communications entre usagers doit être préservée des écoutes clandestines. Cette précaution est d’autant plus indispensable lorsqu’il s’agit de transmissions sans fil, puisque l’interface air est par nature ouverte et accessible à toute personne située dans la portée des ondes hertziennes. Bien qu’indispensable, la gestion de la sécurité engendre un débit supplémentaire, qui peut nuire aux données temps réel, ce qui nécessite de trouver un compromis entre sécurité et rapidité des flux.
Une première solution pour introduire de la qualité de service vient de l’adoption de la norme 802.11e. En effet, cette norme s’est assignée l’objectif de spécifier la gestion au niveau MAC de la qualité de service de façon à permettre aux paquets de téléphonie de passer en priorité.
Ce mécanisme repose sur le principe de différenciation de service au niveau du contrôle d’accès. Les stations gèrent les priorités de leurs flux et y affectent des temporisateurs. Un flux temps réel a de la sorte un temporisateur d’émission plus court qu’un flux moins sensible au délai, ce qui le favorise pour émettre. Cette solution améliore le passage de la téléphonie sur IP mais elle n’est pas décisive puisqu’elle ne donne qu’un ordre de priorité partiel et qu’en cas de surcharge il a été démontré que cette solution n’était pas vraiment satisfaisante en augmentant trop le temps de passage par le réseau Wi-Fi.
Une autre solution, celle implémentée dans les contrôleurs Ucopia est de détecter, grâce à un filtre, le passage d’une signalisation téléphonique et de contrôler l’ensemble des flux et surtout les flux les plus gourmand pour que le point d’accès reste non saturé. Cette solution réduit donc le débit de certaines applications pour privilégier les flots téléphoniques. Cette solution est efficace mais elle se place au niveau 3 au contraire de la norme IEEE 802.11e qui se passe au niveau 2, ce qui demande à ce que cette méthode soit implémentée dans un contrôleur pour partager la ressources de filtrage et les ressources du niveau 3 à 7 puisque cela va d’un traitement de niveau paquet jusqu’au filtre applicatif.
La sécurité
Pour sécuriser une communication téléphonique dans un réseau et plus particulièrement dans un réseau sans fil, il faut doter l’environnement d’un certain nombre de fonctions, qui peuvent être prises en charge soit par l’infrastructure achetée pour réaliser le réseau lui-même, soit par de nouveaux éléments de réseau à ajouter.
De façon plus précise, il faut intervenir auprès de quatre grands types d’éléments d’infrastructure, l’infrastructure qui permet l’authentification des clients et des équipements de réseau, le matériel et le logiciel nécessaires pour réaliser la sécurité sur l’interface radio, les éléments de réseau nécessaires pour filtrer les paquets et détecter les attaques et enfin les machines nécessaires pour gérer les accès distants lorsque les utilisateurs se déplacent. Ces quatre points sont décrits dans la suite :
-
Infrastructure d’authentification. La norme IEEE 802.1x recommande l’usage de serveurs RADIUS (Remote Authentication Dial-In User Server). L’authentification peut être réalisée par un serveur situé dans le domaine visité ou à l’extérieur de ce dernier. Cette architecture établit un cercle de confiance, grâce auquel un message d’authentification est relayé par plusieurs serveurs liés les uns aux autres par des associations de sécurité. La solution classique est de mettre un serveur RADIUS dans un concentrateur ou un proxy si la société ou l’opérateur possède déjà un serveur d’authentification. Le contrôleur Ucopia est capable d’offrir ces deux services.
-
Sécurité radio. La sécurité radio vise à assurer la confidentialité, l’intégrité et la signature des paquets. Ces services sont délivrés par des protocoles tels que WEP (Wired Equivalent Privacy), TKIP (Temporal Key Integrity Protocol) ou CCMP (Counter with CBC MAC Protocol), normalisés par le comité IEEE 802. Ils utilisent des clés déduites d’une clé maîtresse au terme de la procédure d’authentification. Cette sécurité peut-être plus ou moins forte en fonction des besoins de l’utilisateur pour aller d’un mécanisme d’authentification par carte à pouce jusqu’à des accès par mot de passe sur un portail.
-
Filtrage des paquets. La fiabilité de cette opération repose sur la signature des paquets à l’aide des clés déduites de l’authentification. Grâce à ce mécanisme, les trames qui pénètrent dans le système de distribution sont sûres (pas de risque de spoofing). Des systèmes de filtrage (point d’accès ou portail) gèrent les privilèges des paquets IP (destruction des paquets illicites) et permettent de réaliser et de facturer des services de QoS (Quality of Service).
-
Accès aux services distants (roaming). L’accès à des services distants peut être désigné de façon générique sous l’appellation de services VPN (Virtual Private Network). Par exemple, on peut mettre en œuvre des liens sécurisés interdomaines à l’aide des protocoles IPsec ou SSL.
Conclusion
Pour les opérateurs comme pour les entreprises, le passage à la ToIP est obligatoire dans un laps de temps de quelques années pour rester compétitif. Un avantage immédiat est d’étendre la couverture aux réseaux sans fil. Mais ce ticket d’entrée peut s’avérer rapidement rentable par les avantages de l’intégration et de la convergence.
Simplicité, interopérabilité, sécurité, mobilité et surtout qualité de service sont les composants de base pour convaincre les industriels comme les utilisateurs de franchir le pas. Tels sont les défis actuels que la ToIP dans les réseaux sans fil doit relever.
Un standard unique s’imposerait plus facilement que l’addition de tous les standards proposés, la difficulté étant de préserver les promesses mises bout à bout de ces technologies. Une fois le standard approuvé, l’interopérabilité entre équipements à une large échelle imposerait aux constructeurs de respecter les mêmes normes d’implémentation.
En constatant l’intérêt suscité par Wi-Fi aujourd’hui, on peut imaginer que le sans-fil devienne l’atout différenciateur pour l’émergence des technologies de ToIP. En cas de doute, la convergence des données vers un modèle tout-IP, pour la voix, la vidéo et les données à la fois, deviendra une évidence pour favoriser dans l’avenir l’essor de la ToIP sans fil.