Skip to main content
CheckTown
Outils Dev

Analyseur d'URL : structure et composants des URL

Publié le 5 min de lecture
Dans cet article

Comprendre la structure des URL

Une URL (Uniform Resource Locator) est l'adresse d'une ressource sur le web. Chaque URL suit un format structure qui indique au navigateur ou aller et comment y parvenir. Comprendre cette structure est essentiel pour les developpeurs web, les specialistes SEO et toute personne travaillant avec des API web.

Une URL complete peut contenir jusqu'a sept composants distincts : le scheme (protocole), le nom d'utilisateur et le mot de passe (authentification), l'hote (domaine), le port, le chemin, la chaine de requete et le fragment (hash). La plupart des URL n'en utilisent que quelques-uns, mais les connaitre tous aide a debugger des URL complexes.

Comment fonctionne l'analyse d'URL

L'analyse d'URL decompose une chaine URL en ses composants individuels selon la RFC 3986. Chaque composant a des regles specifiques sur les caracteres autorises et leur signification.

  • Protocole (scheme) — la methode utilisee pour acceder a la ressource : http, https, ftp, mailto ou des schemas personnalises comme myapp://
  • Hote — le nom de domaine ou l'adresse IP du serveur. Peut inclure des sous-domaines (api.example.com) ou etre une adresse IPv4/IPv6
  • Chemin — l'emplacement specifique de la ressource sur le serveur. Les segments sont separes par des barres obliques et peuvent contenir des caracteres encodes

Essayez gratuitement — sans inscription

Analyser une URL →

Travailler avec les parametres de requete

Les parametres de requete sont des paires cle-valeur ajoutees a une URL apres le point d'interrogation (?). Ils sont le moyen le plus courant de transmettre des donnees dans les requetes GET et sont largement utilises dans les API, le suivi analytique et la recherche.

  • Format de base — les parametres utilisent des paires cle=valeur separees par des esperluettes : ?page=2&sort=name&order=asc
  • Encodage URL — les caracteres speciaux doivent etre encodes en pourcentage : les espaces deviennent %20 ou +, les esperluettes dans les valeurs deviennent %26
  • Parametres de tableau — certaines API utilisent des cles repetees (color=red&color=blue) ou la notation entre crochets pour les tableaux
  • Valeurs vides et manquantes — ?key= (chaine vide) differe de ?key (pas de valeur) dans de nombreux frameworks serveur
  • Ordre des parametres — techniquement les parametres URL ne sont pas ordonnes, mais certaines API dependent de l'ordre pour le cache ou la validation de signature

Conseils pour le debogage d'URL

Les URL qui semblent correctes au premier coup d'oeil peuvent contenir des problemes d'encodage subtils, des composants manquants ou des caracteres inattendus. Ces conseils aident a detecter rapidement les problemes courants.

  • Toujours decoder avant de lire — les URL encodees en pourcentage sont difficiles a lire. Decodez d'abord pour voir les valeurs reelles envoyees
  • Verifiez le double encodage — %2520 signifie que le signe pourcentage lui-meme a ete encode (%25 = %), indiquant que l'URL a ete encodee deux fois
  • Attention aux barres obliques finales — /api/users et /api/users/ peuvent etre routes differemment selon la configuration du serveur
  • Inspectez le fragment — le fragment hash n'est jamais envoye au serveur. Si votre code cote serveur en a besoin, vous devez utiliser une autre approche
  • Validez l'hote — les fautes de frappe dans les noms de domaine sont courantes. Verifiez les points manquants, les caracteres inverses ou les mauvais TLD

Foire aux questions

Quelle est la difference entre URL, URI et URN ?

Un URI (Uniform Resource Identifier) est le terme general pour tout identifiant d'une ressource. Une URL (Uniform Resource Locator) est un URI qui inclut l'emplacement et la methode d'acces. Un URN (Uniform Resource Name) est un URI qui nomme une ressource sans specifier l'emplacement. En pratique, la plupart des gens utilisent URL et URI de maniere interchangeable.

Pourquoi certains caracteres d'URL sont-ils encodes avec des signes de pourcentage ?

L'encodage URL convertit les caracteres ayant une signification speciale dans les URL en un format sur. Par exemple, un espace devient %20 car les espaces ne sont pas valides dans les URL. L'esperluette (&) separe les parametres de requete, donc une esperluette litterale dans une valeur doit etre encodee en %26.

Quelle peut etre la longueur d'une URL ?

Il n'y a pas de limite officielle dans la specification HTTP. Cependant, la plupart des navigateurs supportent des URL jusqu'a environ 2 048 caracteres. Les navigateurs modernes comme Chrome supportent jusqu'a 2 Mo. Les limites cote serveur varient. Pour une compatibilite maximale, gardez les URL sous 2 000 caracteres et utilisez les requetes POST pour les grandes charges de donnees.

Outils associés