Le comptage des domaines et des hôtesCette FAQ vise à:
Sommaire :
Pourquoi dénombrer les domaines et les hôtes ?Le système des serveurs de noms (DNS), qui a pour fonction première de fournir l'adresse IP d'une machine à partir de son nom, recéle sous une forme distribuée la liste des machines connectées à l'Internet . Le rassemblement et le traitement de cette liste au moyen de procédures automatisées constitue la source la plus facilement accessible d'informations relativement exhaustives sur la taille de l'Internet. Qu'entend-on exactement par "domaine" et par "hôte" ?Du point de vue des procédures de comptage:
Qui effectue des relevés, avec quelle fréquence, depuis quand ?Relevés semestriels (janvier, juillet) de l'Internet mondial. Les relevés de Network Wizards prennent la suite de ceux du SRI pour constituer une série continue depuis août 1981 (fréquences variables cependant). Présente un décompte des hôtes et des domaines par TLD pour l'ensemble de l'Internet. Ces relevés sont complétés d'un sondage partiel afin d'estimer le pourcentage de machines en service. Ils fournissent également un palmarès des noms de machine les plus courants. Relevés mensuels de l'Internet européen depuis octobre 1990. Présente un décompte des hôtes et des domaines par TLD pour les domaines sous juridiction du RIPE. Existe t'il une procédure standardisée ?Il existe une RFC de janvier 92 (RFC 1296), qui n'a pas statut de standard, mais qui explicite le mode de collecte des données entre 1981 et 1991. Le document décrit la procédure suivie et le fonctionnement du programme ZONE chargé de collecter l'information depuis 1986. Le rédacteur de la RFC1296 (Mark K.Lottor) a été l'auteur des relevés périodiques de SRI qu'il poursuit maintenant chez Network Wizards. Le document de 1992 faisait état de problèmes croissants de quantités de données à traiter qui imposaient une révision du programme de collecte. Il n'existe pas de mise à jour connue qui précise ce qu'il est advenu.
Comment se déroule la procédure de collecte ?Selon RFC 1296:
A quel point les résultats sont-ils fiables ?Les programmes de collecte se heurtent à des obstacles divers:
Pourquoi constate t'on des écarts avec les domaines enregistrés aux NICs ?Les domaines enregistrés auprès des NICs constituent une déclaration d'intention d'occupation d'un espace d'adressage IP. Les domaines relevés dans le DNS l'occupation effective de cet espace adaptée en fonction du contexte. D'une part, l'espace d'adressage réservé à l'enregistrement n'est pas toujours totalement occupé, d'autre part l'espace global est éventuellement subdivisé en sous-domaines. Le nombre d'hôtes est-il représentatif de quelque chose ?Les hôtes dénombrés en explorant l'espace du DNS recouvrent des réalités très disparates:
Les proportions de chacun des cas ci-dessus peuvent varier assez fortement d'un réseau à l'autre en fonction de la typologie des infrastructures, du degré de modernité des installations, des us et coutumes locaux, etc... Deux réseaux présentant des nombres d'hôtes strictement identiques dans les relevés peuvent recéler des usages très différents dans la réalité, en termes quantitatifs comme qualitatifs. De même, les taux d'erreurs dans le dénombrement varient fortement en fonction des conditions locales. Tout cela rend les comparaisons très aléatoires. Malgré tout, on peut supposer sans trop de risque de se tromper que les pratiques locales restent relativement constantes dans le temps, ou du moins qu'elles n'évoluent que graduellement, donc que les proportions relatives d'erreurs et de chaque type d'usage ne varient qu'assez peu au sein d'un ensemble donné. L'ensemble en question peut être n'importe quelle entité géographique, culturelle, économique, etc... pour autant qu'on sache en délimiter les contours de manière suffisamment invariable et lui rattacher les décomptes d'hôtes et de domaines. On peut donc considérer que l'observation des taux de croissance dans une même série et pour un ensemble donné représente effectivement quelque chose, à savoir la dynamique de développement matériel consacré à l'Internet au sein de cet ensemble. Si l'on souhaite comparer plusieurs entités, des pays par exemple, il est opportun de transformer les quantités en indices pour comparer les évolutions respectives plutôt que les quantités elles-mêmes. Est-ce que tous les hôtes situés en France se retrouvent dans le domaine .fr ?Loin de là ! Il n'y a pas obligation d'enregistrer les domaines français auprès du NIC France, qui gère le domaine .fr. Ceux qui le souhaitent peuvent tout aussi bien s'adresser à InterNIC et s'enregistrer sous un TLD à trois lettres , voire auprès d'autres registres. D'ailleurs beaucoup le font puisque le NIC France identifie par exemple un peu plus de domaines français enregistrés sous .COM que sous .FR (sans compter ceux enregistrés sous .ORG, .NET ou autres). Il en va de même dans les autres pays, et ce dans des proportions différentes bien qu'assez élevées dans l'ensemble (> 50%). Il s'ensuit que les comparaisons faites à partir des nombres d'hôtes rattachés aux TLDs à 2 lettres (par pays) sont fondées sur bien peu de choses puisqu'elles ignorent à la fois la partie immergée des icebergs et leurs densités, qui ne sont pas identiques. Est-il possible de rattacher les recensements d'hôtes et de domaines à des pays ?En théorie, l'exercice n'est pas totalement impossible, dans la pratique il n'est pas simple. La méthode utilisée par le NIC-France pour identifier les domaines européens dans le .COM consiste à comparer les adresses IP des domaines avec la liste des objets INETNUM qui précisent à quel pays est rattaché juridiquement le réseau concerné. Dans le cas ci-dessus, le NIC-France applique la méthode aux domaines enregistrés, toutefois cette même méthode pourrait être appliquée aux domaines et hôtes relevés par le Network Wizards ou par le RIPE NCC en mettant en relation chaque adresse IP relevée avec la liste des objets INETNUM pour en déterminer le rattachement à un pays ou un autre sans se fier au suffixe de nom de domaine (TLD). Dans la mesure où il s'agit d'un traitement local qui ne fait pas appel au réseau (sauf pour télécharger les fichiers de données au départ), cela est faisable par quiconque peut obtenir d'un côté les fichiers sources des relevés et de l'autre la base de données des objets INETNUM. Pourquoi ne pas se contenter de redressements au prorata ?En admettant que l'on puisse obtenir de l'InterNIC les nombres de domaines par pays enregistrés sous des TLDs à 3 lettres, on pourrait penser qu'un redressement des nombres d'hôtes relevés au prorata des domaines enregistrés pourrait constituer une approximation suffisante. Toutefois, la validité du raisonnement suppose que le nombre d'hôtes / domaine soit relativement constant d'un TLD à l'autre. Cela n'est malheureusement pas le cas, loin de là, conduisant à des écarts de l'ordre du simple au double suivant l'interprétation que l'on fait (nombre d'hôtes / domaine pris selon la moyenne du TLD à 3 lettres ou selon la moyenne du pays redressé ?). Cette méthode vaut certes mieux que pas de redressement du tout, mais elle reste très aléatoire. Par ailleurs, la tendance à l'internationalisation des enregistrements de domaines est plutôt croissante et cela devrait s'accentuer avec la mise en application du MoU de l'IAHC et l'apparition de zones franches comme les NuNames du W3C. Dès lors, les chiffres bruts des TLDs seront de moins en moins significatifs et les redressements au prorata seront de moins en moins applicables. Comment peut-on savoir si un hôte est en service ?Le fait qu'un hôte soit enregistré dans le DNS ne signifie pas qu'il existe physiquement, ni qu'il soit en service. Hors, c'est bien le fait qu'il soit en service et accessible qui est significatif d'usage, et non le fait que son adresse figure quelque part dans une table du DNS. La procédure permettant de vérifier qu'un hôte est bien en service et accessible par l'Internet s'appelle PING et consiste à lui adresser des paquets de test pour voir si un écho en revient. Si l'hôte est bien vivant, le requérant reçoit en retour le temps d'accès en millisecondes ainsi que le nom (ou l'adresse IP) de l'hôte sondé. Cette procédure est néanmoins assez lourde en temps et en consommation de ressources du réseau, aussi elle n'est utilisée que partiellement par Network Wizards pour sonder le taux de réponse à travers un échantillon limité (1%). Le taux de réponse ainsi obtenu est ensuite extrapolé à l'ensemble. Ces sondages révèlent que seulement 20% environ des hôtes recensés sont effectivement en service. (NB: Ping par TLD ou global ?). Ce type de relevés pourrait-il être perfectionné ?
|
|
Notes:
|