SNT Web URL

Identification

Infoforall

3 - Comprendre les urls


Nous avons vu que le Web est constitué de l'ensemble des documents hypertextes accessibles via un navigateur par exemple.

Mais comment parvenir à trouver une ressource parmi cette multitude ?

Documents de cours : pdf ou odt.

1 - Qu'est-ce qu'une URL ?

Les parties de cours sont destinées à être analysées avant de répondre aux questions.

1.1 Vocabulaire

Navigateur Web

C'est le nom des logiciels permettant d'explorer le Web. Ce sont des clients HTTP qui se connectent à des serveurs HTTP.

Le protocole HTTP est basé sur une communication en 3 étapes principales :

1 Requête - 2 - Traitement - 3 - Réponse
Requête - Traitement - Réponse

Il existe deux types de navigateurs Web

  1. Le navigateur libre
  2. Le code source est disponible et on peut y accéder librement. On peut donc savoir exactement comment il fonctionne, ce qu'il enregistre, ou pas.

    Exemple : Firefox, Brave, Chromium (et pas Chrome attention !)

  3. Le navigateur propriétaire
  4. Le code source n'est pas disponible, on ne sait donc pas ce que le navigateur fait réellement, on ne voit que ce qu'il montre. Exemple : Edge, Chrome...

Attention : un navigateur peut suivre et enregistrer toute votre navigation. Son choix est donc très important.

Moteur de recherche

Un site Web qui propose d'interroger sa base de données pour obtenir un ensemble de liens pertinents liés à votre demande.

Certains moteurs de recherche sont respectueux des données personnelles : Qwant, Duck Duck Go...

D'autres beaucoup moins : Google, Bing... qui mémorisent vos recherches et votre navigation à l'aide de moyen indirect.

1.2 URL

URL veut dire Uniform Resource Locator, soit « localisateur uniforme de ressource ».

Ce système permet d'effectuer une demande sans ambiguïté  : chaque URL ne renvoie qu'une ressource unique.

http://info.cern.ch/hypertext/WWW/TheProject.html

L'URL est composée de plusieurs parties :

  • Le protocole : on explique dans quelle "langue" on parle. Ici http
  • Des caractères indiquant qu'on va donner l'adresse d'un serveur : ://
  • L'adresse du serveur à joindre : on explique à qui on veut parler. Ici info.cern.ch
  • L'adresse de la ressource sur ce serveur : Ici  / hypertext/WWW/TheProject.html. L'adresse est ici absolue depuis la racine du serveur qui est symbolisée par le premier /.
1.3 HTTP ou HTTPS ?

HTTP veut dire Hypertext Transfer Protocol (soit protocole de transfert hypertexte). C'est le protocole de base du Web.

Simple, ce protocole a un gros défaut : il ne chiffre pas les données lors du transfert. Si quelqu'un écoute la communication, il peut donc connaitre la teneur de l'échange entre le serveur et le client.

HTTPS (avec un S pour sécurisé) est une variante du HTTP : le message est chiffré.Seul le serveur et le client peuvent connaitre la teneur de l'échange.

1.1 Vocabulaire

Navigateur Web

C'est le nom des logiciels permettant d'explorer le Web. Ce sont des clients HTTP qui se connectent à des serveurs HTTP.

Le protocole HTTP est basé sur une communication en 3 étapes principales :

1 Requête - 2 - Traitement - 3 - Réponse
Requête - Traitement - Réponse

4 grands types de réponse :

  • Code 200 : le serveur fournit une réponse et dit que tout s'est bien passé.
  • Code 300 : le serveur vous dit que vous avez déjà la ressource en mémoire et qu'elle n'a pas été modifié depuis votre dernière visite.
  • Code 404 : le serveur a compris et traité votre demande mais ne trouve aucune ressource correspond à l'URL fournie.
  • Code 500 : le serveur a compris mais une erreur est survenu lors du traitement.

Il existe deux types de navigateurs Web

  1. Le navigateur libre
  2. Le code source est disponible et on peut y accéder librement. On peut donc savoir exactement comment il fonctionne, ce qu'il enregistre, ou pas.

    Exemple : Firefox, Brave, Chromium (et pas Chrome attention !)

  3. Le navigateur propriétaire
  4. Le code source n'est pas disponible, on ne sait donc pas ce que le navigateur fait réellement, on ne voit que ce qu'il montre. Exemple : Edge, Chrome...

Attention : un navigateur peut suivre et enregistrer toute votre navigation. Son choix est donc très important.

Moteur de recherche

Un site Web qui propose d'interroger sa base de données pour obtenir un ensemble de liens pertinents liés à votre demande.

Certains moteurs de recherche sont respectueux des données personnelles : Qwant, Duck Duck Go...

D'autres beaucoup moins : Google, Bing... qui mémorisent vos recherches et votre navigation à l'aide de moyens indirects.

01° Ouvrir un navigateur (qui est un client HTTP) et copier l'adresse ci-dessous dans la barre d'adresse du navigateur. vous devriez atteindre une page Web, celle du CERN concernant le Web.

http://info.cern.ch/hypertext/WWW/TheProject.html

Attention : ne tapez pas l'adresse dans la barre d'adresse d'un moteur de recherche. Tapez bien cela directement dans la barre d'adresse du navigateur. Sur certains navigateurs, celle-ci est maintenant cachée par défaut...

1.2 URL

URL veut dire Uniform Resource Locator, soit « localisateur uniforme de ressource ».

Ce système permet d'effectuer une demande sans ambiguïté  : chaque URL ne renvoie qu'une ressource unique.

http://info.cern.ch/hypertext/WWW/TheProject.html

L'URL est composée de plusieurs parties :

  • Le protocole : on explique dans quelle "langue" on parle. Ici http
  • Des caractères indiquant qu'on va donner l'adresse d'un serveur : ://
  • L'adresse du serveur à joindre : on explique à qui on veut parler. Ici info.cern.ch
  • L'adresse de la ressource sur ce serveur : Ici  / hypertext/WWW/TheProject.html. L'adresse est ici absolue depuis la racine du serveur qui est symbolisée par le premier /.

02° Déterminer, à partir de l'URL fournie ci-dessous :

https://doc.infoforall.fr/commun/images/accueil_blender_150.png

  • le protocole,
  • le serveur à joindre,
  • la ressource demandée sur le site

...CORRECTION...

  • le protocole : https, attention au S.
  • le serveur à joindre : doc.infoforall.fr
  • la ressource à faire sur le site : /commun/images/accueil_blender_150.png
1.3 HTTP ou HTTPS ?

HTTP veut dire Hypertext Transfer Protocol (soit protocole de transfert hypertexte). C'est le protocole de base du Web.

Simple, ce protocole a un gros défaut : il ne chiffre pas les données lors du transfert. Si quelqu'un écoute la communication, il peut donc connaitre la teneur de l'échange entre le serveur et le client.

HTTPS (avec un S pour sécurisé) est une variante du HTTP : le message est chiffré.Seul le serveur et le client peuvent connaitre la teneur de l'échange.

03° Quelques questions liées à la sécurité :

  1. Quel est le problème de sécurité énorme rencontré si vous vous connectez à un site en HTTP pour réaliser un paiement en ligne et fournir des informations bancaires ?
  2. Comment connaître facilement la nature HTTP ou HTTPS de la communication ?
  3. Quelle doit-être la couleur du cadenas à gauche de l'adresse s'il fonctionne bien en HTTPS et que le site a été certifié pour faire du commerce en ligne ?

...CORRECTION...

  1. Le manque de sécurité ne provient pas du site en lui-même (un site en HTTP peut être tenu par des gens sérieux). NEANMOINS, s'ils sont sérieux, ils devraient savoir qu'on peut assez facilement écouter les paquets qui transitent jusqu'à eux. Transmettre des informations bancaires en HTTP (en clair donc) n'est pas sérieux à l'heure actuelle.
  2. Il suffit de regarder le début de l'URL ou de regarder à gauche de l'URL si il y a un cadenas d'une couleur ou d'une autre.
  3. Le simple HTTPS ne garantit pas le sérieux en lui-même : pour des échanges sensibles (notamment bancaires), il faut s'assurer de la présence d'un cadenas VERT.

04° HTTPS signifie-t-il que le site est sérieux et qu'on peut lui transmettre des informations bancaires sans problème ?

...CORRECTION...

La sécurité ne provient pas du signe HTTPS. Le S signifie juste que la communication entre vous et le site est chiffrée et que vous discutez bien avec le propriétaire du nom de domaine.

Un escrot peut toujours se faire passer pour un site sérieux dans un premier temps. Comme tout commerce en réalité !

Avant de lancer un paiement, tenter donc de vous renseigner sur ce site via un moteur de recherche. Cherchez des avis de clients par exemple.

Sortons maintenant de ces histoires de protocoles et revenons à la dernière partie de l'URL : celle où on donne le chemin d'accés.

Les clients et serveurs HTTP sont créés avec une volonté de robustesse : ils sont capables de compléter des URL incomplètes.

05° Testez les URL suivantes :

Cas A http://info.cern.ch

Cas B https://www.infoforall.fr

Cas C https://doc.infoforall.fr

Cas D https://enthdf.fr

  1. Si cela fonctionne, sur quelle type de page arrive-t-on ?
  2. Tous les serveurs proposent-t-ils une page de ce type ?
  3. Que veut dire que votre demande a subi une redirection (pensez à regarder l'URL obtenue par rapport à l'URL fournie dans le cas D) ?

...CORRECTION...

  1. Sur la plupart des sites, fournir une URL ne comportant aucune ressource mais juste le nom du serveur vous amène sur la page d'accueil.
  2. Dans le cas C, on voit que l'accès est refusé car il n'existe pas de page d'accueil : il n'y a donc pas de page d'accueil sur ce serveur : doc.infoforall.fr sert juste à stocker des fichiers pour www.infoforall.fr.
  3. Une redirection est une action engendrée par le serveur initial qui renvoie votre demande vers un autre serveur. Ici, on envoie une demande vers https://enthdf.fr mais on arrive sur https://connexion.enthdf.fr

2 - Nom de domaine

2.1 Nom de domaine

Un nom de serveur est constitué d'un ensemble de mots séparés par des points.

La toute dernière partie se nomme l'extension.

Le nom de domaine.est constitué des deux dernières parties : un mot plus l'extension.

Les parties à gauche du nom de domaine sont les sous-domaines qui sont gérés par le propriétaire du nom de domaine principal.

Exemple

info.cern.ch

  • Le nom de domaine est cern.ch
  • L'extension est .ch (qui caractérise les sites suisses)
  • Le sous-domaine est info.
2.2 Propriétaire d'un nom de domaine

On achete à l'année son nom de domaine auprès d'une société ou association nommée registaire.

Ainsi les noms de domaines d'extension .fr sont gérés par l'Association française pour le nommage Internet en coopération, l'AFNIC.

On peut rajouter autant de sous-domaines que l'on veut à gauche du nom de domaine.

Le propriétaire de infoforall.fr peut créer :

  • www.infoforall.fr
  • doc.infoforall.fr
  • jecomprendsrienalinformatique.infoforall.fr
  • ...

Dans tous les cas, le propriétaire reste le même.

Un autre exemple ?

paypal.infoforall.fr appartient en réalité à infoforall.fr.

infoforall.paypal.fr appartient en réalité à paypal.fr.

Le sous-domaine le plus courant est www pour world wide web. Il était utilisé très couramment pour montrer que cette adresse menait à un site Web.

06° Observer l'adresse pour cette activité dans Firefox. Quelle est la couleur du sous-domaine ?

...CORRECTION...

Firefox affiche le sous-domaine en gris et le domaine principal en noir :

https://www.infoforall.fr/act/snt/comprendre-les-urls/

07° Remplir les cases pour les adresses proposées dans le tableau ci-dessous. Recopier sur votre copie après m'avoir demandé de vérifier vos résultats.

URL Sous-domaine Domaine Extension (fr com ...)
www.wikipedia.fr
fr.wikipedia.org
wikipedia.don.org
www.amazon.paiement.com

08° Un e-commerce vous propose de payer un magnifique achat en ligne sur www.paypal.paiement.securise.com. C'est sérieux ou pas cette histoire ? Vous payez ou pas ?

...CORRECTION...

Si vous avez bien suivi, vous n'allez certainement pas être redirigé vers le site de paypal mais vers le site de quelqu'un qui possède le nom de domaine securise.com et qui y a placé un sous-domaine paiement puis encore un sous-domaine paypal puis un sous-domaine www. Bref, ce n'est pas le propriétaire de paypal.

09° Un e-commerce vous propose de payer un magnifique achat en ligne sur paiement.paypal.xyz. C'est sérieux ou pas cette histoire ? Vous payez ou pas ?

...CORRECTION...

Il s'agit d'un site dont le propriétaire a acheté le nom de domaine paypal.xyz. Comme il ne s'agit pas d'une extension très courante, méfiance...

C'est bien ça le problème d'ailleurs : si on veut être certain que personne ne peut se faire passer pour vous, il faut acheter toutes les associations nom.extension. Pour une société privée cela représente un investissement rentable puisque cela réduit le nombre d'escroqueries qui pourraient nuire à l'image de la marque.

Ici, espérons que les propriétaires légitimes de paypal aient achété tous les noms de domaines possibles.

Nous venons de voir que l'URL permet de localiser avec certitude un serveur particulier et une ressource particulière sur ce site.

Mais comment le serveur et le client parviennent-ils à se comprendre ? Ce sont deux programmes informatiques tournant sur deux machines différentes...

Et c'est bien pour cela que l'URL commence par le protocole utilisé, la façon codifiée de se parler.

Une URL est donc constituée :

  1. Du protocole utilisé (http, https...)
  2. Du nom du serveur qu'on veut contacter
  3. De la ressource voulue sur le serveur

3 - FAQ

Pas de question pour l'instant

Vous savez désormais comme localiser un serveur HTTP précis et lui demander une ressource en passant par l'URL.

Dans l'activité suivante, nous verrons comment ses requêtes sont transmises.

Activité publiée le 16 09 2019
Dernière modification : 27 09 2021
Auteur : ows. h.