3 - Comprendre les urls
Nous avons vu que le Web est constitué de l'ensemble des documents hypertextes accessibles via un navigateur par exemple.
Mais comment parvenir à trouver une ressource parmi cette multitude ?
1 - Qu'est-ce qu'une URL ?
Les parties de cours sont destinées à être analysées avant de répondre aux questions.
1.1 Vocabulaire
Navigateur Web
C'est le nom des logiciels permettant d'explorer le Web. Ce sont des clients HTTP qui se connectent à des serveurs HTTP.
Le protocole HTTP est basé sur une communication en 3 étapes principales :

Il existe deux types de navigateurs Web
- Le navigateur libre
- Le navigateur propriétaire
Le code source est disponible et on peut y accéder librement. On peut donc savoir exactement comment il fonctionne, ce qu'il enregistre, ou pas.
Exemple : Firefox, Brave, Chromium (et pas Chrome attention !)
Le code source n'est pas disponible, on ne sait donc pas ce que le navigateur fait réellement, on ne voit que ce qu'il montre. Exemple : Edge, Chrome...
Attention : un navigateur peut suivre et enregistrer toute votre navigation. Son choix est donc très important.
Moteur de recherche
Un site Web qui propose d'interroger sa base de données pour obtenir un ensemble de liens pertinents liés à votre demande.
Certains moteurs de recherche sont respectueux des données personnelles : Qwant, Duck Duck Go...
D'autres beaucoup moins : Google, Bing... qui mémorisent vos recherches et votre navigation à l'aide de moyen indirect.
1.2 URL
URL veut dire Uniform Resource Locator, soit « localisateur uniforme de ressource ».
Ce système permet d'effectuer une demande sans ambiguïté : chaque URL ne renvoie qu'une ressource unique.
http://info.cern.ch/hypertext/WWW/TheProject.html
L'URL est composée de plusieurs parties :
- Le protocole : on explique dans quelle "langue" on parle. Ici http
- Des caractères indiquant qu'on va donner l'adresse d'un serveur : ://
- L'adresse du serveur à joindre : on explique à qui on veut parler. Ici info.cern.ch
- L'adresse de la ressource sur ce serveur : Ici / hypertext/WWW/TheProject.html. L'adresse est ici absolue depuis la racine du serveur qui est symbolisée par le premier /.
1.3 HTTP ou HTTPS ?
HTTP veut dire Hypertext Transfer Protocol (soit protocole de transfert hypertexte). C'est le protocole de base du Web.
Simple, ce protocole a un gros défaut : il ne chiffre pas les données lors du transfert. Si quelqu'un écoute la communication, il peut donc connaitre la teneur de l'échange entre le serveur et le client.
HTTPS (avec un S pour sécurisé) est une variante du HTTP : le message est chiffré.Seul le serveur et le client peuvent connaitre la teneur de l'échange.
1.1 Vocabulaire
Navigateur Web
C'est le nom des logiciels permettant d'explorer le Web. Ce sont des clients HTTP qui se connectent à des serveurs HTTP.
Le protocole HTTP est basé sur une communication en 3 étapes principales :

4 grands types de réponse :
- Code 200 : le serveur fournit une réponse et dit que tout s'est bien passé.
- Code 300 : le serveur vous dit que vous avez déjà la ressource en mémoire et qu'elle n'a pas été modifié depuis votre dernière visite.
- Code 404 : le serveur a compris et traité votre demande mais ne trouve aucune ressource correspond à l'URL fournie.
- Code 500 : le serveur a compris mais une erreur est survenu lors du traitement.
Il existe deux types de navigateurs Web
- Le navigateur libre
- Le navigateur propriétaire
Le code source est disponible et on peut y accéder librement. On peut donc savoir exactement comment il fonctionne, ce qu'il enregistre, ou pas.
Exemple : Firefox, Brave, Chromium (et pas Chrome attention !)
Le code source n'est pas disponible, on ne sait donc pas ce que le navigateur fait réellement, on ne voit que ce qu'il montre. Exemple : Edge, Chrome...
Attention : un navigateur peut suivre et enregistrer toute votre navigation. Son choix est donc très important.
Moteur de recherche
Un site Web qui propose d'interroger sa base de données pour obtenir un ensemble de liens pertinents liés à votre demande.
Certains moteurs de recherche sont respectueux des données personnelles : Qwant, Duck Duck Go...
D'autres beaucoup moins : Google, Bing... qui mémorisent vos recherches et votre navigation à l'aide de moyens indirects.
01° Ouvrir un navigateur (qui est un client HTTP) et copier l'adresse ci-dessous dans la barre d'adresse du navigateur. vous devriez atteindre une page Web, celle du CERN concernant le Web.
http://info.cern.ch/hypertext/WWW/TheProject.html
Attention : ne tapez pas l'adresse dans la barre d'adresse d'un moteur de recherche. Tapez bien cela directement dans la barre d'adresse du navigateur. Sur certains navigateurs, celle-ci est maintenant cachée par défaut...
1.2 URL
URL veut dire Uniform Resource Locator, soit « localisateur uniforme de ressource ».
Ce système permet d'effectuer une demande sans ambiguïté : chaque URL ne renvoie qu'une ressource unique.
http://info.cern.ch/hypertext/WWW/TheProject.html
L'URL est composée de plusieurs parties :
- Le protocole : on explique dans quelle "langue" on parle. Ici http
- Des caractères indiquant qu'on va donner l'adresse d'un serveur : ://
- L'adresse du serveur à joindre : on explique à qui on veut parler. Ici info.cern.ch
- L'adresse de la ressource sur ce serveur : Ici / hypertext/WWW/TheProject.html. L'adresse est ici absolue depuis la racine du serveur qui est symbolisée par le premier /.
02° Déterminer, à partir de l'URL fournie ci-dessous :
https://doc.infoforall.fr/commun/images/accueil_blender_150.png
- le protocole,
- le serveur à joindre,
- la ressource demandée sur le site
...CORRECTION...
- le protocole : https, attention au S.
- le serveur à joindre :
doc.infoforall.fr
- la ressource à faire sur le site : /commun/images/accueil_blender_150.png
1.3 HTTP ou HTTPS ?
HTTP veut dire Hypertext Transfer Protocol (soit protocole de transfert hypertexte). C'est le protocole de base du Web.
Simple, ce protocole a un gros défaut : il ne chiffre pas les données lors du transfert. Si quelqu'un écoute la communication, il peut donc connaitre la teneur de l'échange entre le serveur et le client.
HTTPS (avec un S pour sécurisé) est une variante du HTTP : le message est chiffré.Seul le serveur et le client peuvent connaitre la teneur de l'échange.
03° Quelques questions liées à la sécurité :
- Quel est le problème de sécurité énorme rencontré si vous vous connectez à un site en HTTP pour réaliser un paiement en ligne et fournir des informations bancaires ?
- Comment connaître facilement la nature HTTP ou HTTPS de la communication ?
- Quelle doit-être la couleur du cadenas à gauche de l'adresse s'il fonctionne bien en HTTPS et que le site a été certifié pour faire du commerce en ligne ?
...CORRECTION...
- Le manque de sécurité ne provient pas du site en lui-même (un site en HTTP peut être tenu par des gens sérieux). NEANMOINS, s'ils sont sérieux, ils devraient savoir qu'on peut assez facilement écouter les paquets qui transitent jusqu'à eux. Transmettre des informations bancaires en HTTP (en clair donc) n'est pas sérieux à l'heure actuelle.
- Il suffit de regarder le début de l'URL ou de regarder à gauche de l'URL si il y a un cadenas d'une couleur ou d'une autre.
- Le simple HTTPS ne garantit pas le sérieux en lui-même : pour des échanges sensibles (notamment bancaires), il faut s'assurer de la présence d'un cadenas VERT.
04° HTTPS signifie-t-il que le site est sérieux et qu'on peut lui transmettre des informations bancaires sans problème ?
...CORRECTION...
La sécurité ne provient pas du signe HTTPS. Le S signifie juste que la communication entre vous et le site est chiffrée et que vous discutez bien avec le propriétaire du nom de domaine.
Un escrot peut toujours se faire passer pour un site sérieux dans un premier temps. Comme tout commerce en réalité !
Avant de lancer un paiement, tenter donc de vous renseigner sur ce site via un moteur de recherche. Cherchez des avis de clients par exemple.
Sortons maintenant de ces histoires de protocoles et revenons à la dernière partie de l'URL : celle où on donne le chemin d'accés.
Les clients et serveurs HTTP sont créés avec une volonté de robustesse : ils sont capables de compléter des URL incomplètes.
05° Testez les URL suivantes :
Cas A http://info.cern.ch
Cas B https://www.infoforall.fr
Cas C https://doc.infoforall.fr
Cas D https://enthdf.fr
- Si cela fonctionne, sur quelle type de page arrive-t-on ?
- Tous les serveurs proposent-t-ils une page de ce type ?
- Que veut dire que votre demande a subi une redirection (pensez à regarder l'URL obtenue par rapport à l'URL fournie dans le cas D) ?
...CORRECTION...
- Sur la plupart des sites, fournir une URL ne comportant aucune ressource mais juste le nom du serveur vous amène sur la page d'accueil.
- Dans le cas C, on voit que l'accès est refusé car il n'existe pas de page d'accueil : il n'y a donc pas de page d'accueil sur ce serveur : doc.infoforall.fr sert juste à stocker des fichiers pour www.infoforall.fr.
- Une redirection est une action engendrée par le serveur initial qui renvoie votre demande vers un autre serveur. Ici, on envoie une demande vers https://enthdf.fr mais on arrive sur https://connexion.enthdf.fr
2 - Nom de domaine
2.1 Nom de domaine
Un nom de serveur est constitué d'un ensemble de mots séparés par des points.
La toute dernière partie se nomme l'extension.Le nom de domaine.est constitué des deux dernières parties : un mot plus l'extension.
Les parties à gauche du nom de domaine sont les sous-domaines qui sont gérés par le propriétaire du nom de domaine principal.
Exemple
info.cern.ch
- Le nom de domaine est cern.ch
- L'extension est .ch (qui caractérise les sites suisses)
- Le sous-domaine est info.
2.2 Propriétaire d'un nom de domaine
On achete à l'année son nom de domaine auprès d'une société ou association nommée registaire.
Ainsi les noms de domaines d'extension .fr sont gérés par l'Association française pour le nommage Internet en coopération, l'AFNIC.
On peut rajouter autant de sous-domaines que l'on veut à gauche du nom de domaine.
Le propriétaire de infoforall.fr
peut créer :
- www.infoforall.fr
- doc.infoforall.fr
- jecomprendsrienalinformatique.infoforall.fr
- ...
Dans tous les cas, le propriétaire reste le même.
Un autre exemple ?
paypal.infoforall.fr appartient en réalité à infoforall.fr.
infoforall.paypal.fr appartient en réalité à paypal.fr.
Le sous-domaine le plus courant est www pour world wide web. Il était utilisé très couramment pour montrer que cette adresse menait à un site Web.
06° Observer l'adresse pour cette activité dans Firefox. Quelle est la couleur du sous-domaine ?
...CORRECTION...
Firefox affiche le sous-domaine en gris et le domaine principal en noir :
https://www.infoforall.fr/act/snt/comprendre-les-urls/
07° Remplir les cases pour les adresses proposées dans le tableau ci-dessous. Recopier sur votre copie après m'avoir demandé de vérifier vos résultats.
URL | Sous-domaine | Domaine | Extension (fr com ...) |
---|---|---|---|
www.wikipedia.fr | |||
fr.wikipedia.org | |||
wikipedia.don.org | |||
www.amazon.paiement.com |
08° Un e-commerce vous propose de payer un magnifique achat en ligne sur www.paypal.paiement.securise.com. C'est sérieux ou pas cette histoire ? Vous payez ou pas ?
...CORRECTION...
Si vous avez bien suivi, vous n'allez certainement pas être redirigé vers le site de paypal mais vers le site de quelqu'un qui possède le nom de domaine securise.com
et qui y a placé un sous-domaine paiement puis encore un sous-domaine paypal puis un sous-domaine www. Bref, ce n'est pas le propriétaire de paypal.
09° Un e-commerce vous propose de payer un magnifique achat en ligne sur paiement.paypal.xyz. C'est sérieux ou pas cette histoire ? Vous payez ou pas ?
...CORRECTION...
Il s'agit d'un site dont le propriétaire a acheté le nom de domaine paypal.xyz. Comme il ne s'agit pas d'une extension très courante, méfiance...
C'est bien ça le problème d'ailleurs : si on veut être certain que personne ne peut se faire passer pour vous, il faut acheter toutes les associations nom.extension. Pour une société privée cela représente un investissement rentable puisque cela réduit le nombre d'escroqueries qui pourraient nuire à l'image de la marque.
Ici, espérons que les propriétaires légitimes de paypal aient achété tous les noms de domaines possibles.
3 - FAQ
Activité publiée le 16 09 2019
Dernière modification : 27 09 2021
Auteur : ows. h.