SNT Web URL

Identification

Infoforall

2 - Comprendre les urls


Nous avons vu que le Web est constitué de l'ensemble des documents hypertextes accessibles via un navigateur par exemple.

Mais comment parvenir à trouver une ressource parmi cette multitude ?

Documents de cours : pdf ou odt.

1 - Qu'est-ce qu'une URL ?

Les parties de cours sont destinées à être lues avant de répondre aux questions.

1.1 Protocole HTTP

A - Principe

Le protocole HTTP est destiné à faire communiquer deux programmes :

  • Un programme client HTTP qui se connecte à
  • un programme serveur HTTP.

Le protocole HTTP est basé sur une communication en 3 étapes :

1 Requête - 2 - Traitement - 3 - Réponse
Requête - Traitement - Réponse
  1. Le client envoie sa requête (nous verrons qu'il utilise une URL).
  2. Le serveur reçoit et analyse la requête
  3. Le serveur renvoie sa réponse (nous verrons qu'elle contient parfois un texte nommé code-source HTML)
B - Une notion connue : le code de réponse

La réponse HTTP contient un nombre, le code de réponse. Vous connaissez certainement le 404. Les voici :

  • Code 200 : le serveur dit que tout s'est bien passé.
  • Code 404 : le serveur ne trouve aucune ressource correspondant à la requête.
  • Code 300 : le serveur dit que la ressource n'a pas été modifiée depuis la dernière fois que le client lui a demandé. Le client doit juste aller voir dans sa mémoire-cache.
  • Code 500 : le serveur rencontre une erreur de programmation en tentant de résoudre la requête....
C - Le programme client usuel : le navigateur Web
  • Firefox de la fondation Mozilla,
  • le moteur libre Chromium, produit par Google
  • Chrome, une surcouche propriétaire de Chromium, produit par Google.
  • Safari pour Apple
  • Brave, une surcouche libre de Chromium, produit par Brave Software.
  • Safari pour Apple
  • ...

01 ✔° Ouvrir un navigateur (qui est un client HTTP) et copier l'adresse ci-dessous dans la barre d'adresse du navigateur. vous devriez atteindre une page Web, celle du CERN concernant le Web.

http://info.cern.ch/hypertext/WWW/TheProject.html

Attention : ne tapez pas l'adresse dans la barre d'un moteur de recherche. Tapez bien cela directement dans la barre d'adresse du navigateur. Sur certains navigateurs, celle-ci est maintenant cachée par défaut...

1.2 URL

URL veut dire Uniform Resource Locator.

Chaque URL ne renvoie qu'une ressource unique, pas d'ambiguïté possible.

http://info.cern.ch/hypertext/WWW/TheProject.html

L'URL est composée de plusieurs parties :

  • Le protocole : on explique dans quelle "langue" on parle. Ici http.
  • L'adresse du serveur à joindre : on explique à qui on veut parler. On commence par placer des caractères indiquant qu'on commence à donner l'adresse d'un serveur : ://. Ici, le serveur est info.cern.ch.
  • L'adresse de la ressource sur ce serveur : Ici /hypertext/WWW/TheProject.html.
  • Le premier / indique que l'adresse est donnée depuis la racine du site, son "point de départ".

    Explications :

    • / : part de la racine
    • hypertext/WWW/ : va dans le dossier hypertext puis dans le sous-dossier www puis
    • TheProject.html : localise le fichier nommé TheProject.html

02° Déterminer, à partir de l'URL fournie ci-dessous :

https://doc.infoforall.fr/commun/images/accueil_blender_150.png

  • le protocole,
  • le serveur à joindre,
  • la ressource demandée sur le site

...CORRECTION...

  • le protocole : https, attention au S.
  • le serveur à joindre : doc.infoforall.fr
  • la ressource à faire sur le site : /commun/images/accueil_blender_150.png
1.3 HTTP ou HTTPS ?

HTTP veut dire Hypertext Transfer Protocol (soit protocole de transfert hypertexte). C'est le protocole de base du Web.

Ce protocole est simple mais a un gros défaut : il ne chiffre pas les données lors du transfert. Si quelqu'un écoute la communication, il peut donc connaitre la teneur de l'échange entre le serveur et le client.

HTTPS (avec un S pour sécurisé) est une variante du HTTP : le message est chiffré. Seul le serveur et le client peuvent connaitre la teneur de l'échange. ATTENTION : cela ne veut pas vraiment dire que l'interlocateur est de confiance. Cela veut juste dire qu'on ne peut pas vous écouter.

03° Quelques questions liées à la sécurité :

  1. Quel est le problème (énorme) de sécurité rencontré si vous vous connectez à un site en HTTP pour réaliser un paiement en ligne et fournir des informations bancaires ?
  2. Comment connaître facilement la nature HTTP ou HTTPS de la communication ?
  3. Quelle est l'icône située près de la barre d'adresses qui représente le fait que la connexion est chiffrée  ?

...CORRECTION...

  1. Le manque de sécurité ne provient pas du site en lui-même (un site en HTTP peut être tenu par des gens sérieux). NEANMOINS, s'ils sont sérieux, ils devraient savoir qu'on peut assez facilement écouter les paquets qui transitent jusqu'à eux. Transmettre des informations bancaires en HTTP (en clair donc) n'est pas sérieux à l'heure actuelle.
  2. Il suffit de regarder le début de l'URL qui doit commencer par http ou https.
  3. La présence d'un cadenas prouve que le site utilise bien un système de chiffrement.

04° HTTPS signifie-t-il que le site est sérieux et qu'on peut lui transmettre des informations bancaires sans problème ?

...CORRECTION...

La sécurité ne provient pas du signe HTTPS.

Le S signifie juste que la communication entre vous et le site est chiffrée.

En appuyant sur le cadenas, vous pouvez en apprendre un peu plus, notamment vous aurez l'idendité de la société qui permet de sécuriser la communication entre vous et le serveur.

Mais attention, un escrot peut toujours se faire passer pour un site sérieux dans un premier temps. Comme tout commerce en réalité !

Avant de lancer un paiement, tenter donc de vous renseigner sur ce site via un moteur de recherche. Cherchez des avis de clients par exemple.

2 - Qu'est-ce qu'un nom de domaine ?

2.1 Nom de domaine

Un nom de serveur est constitué d'un ensemble de mots séparés par des points.

  • La toute dernière partie se nomme l'extension.
  • Dans info.cern.ch, l'extension est .ch (qui caractérise les sites suisses)

  • Le nom de domaine est constitué des deux dernières parties : un mot plus l'extension.
  • Dans info.cern.ch, le nom de domaine est cern.ch

  • Les parties à gauche du nom de domaine sont les sous-domaines qui sont gérés par le propriétaire du nom de domaine principal.
  • Dans info.cern.ch, le sous-domaine est info.

2.2 Propriétaire d'un nom de domaine

On achete à l'année son nom de domaine auprès d'une société ou association nommée registaire.

Le propriétaire d'un nom de domaine peut rajouter autant de sous-domaines qu'il veut à gauche du nom de domaine.

Les noms de domaines d'extension .fr sont gérés par l'Association française pour le nommage Internet en coopération, l'AFNIC.

Le propriétaire de infoforall.fr peut créer :

  • www.infoforall.fr
  • doc.infoforall.fr
  • jecomprendsrienalinformatique.infoforall.fr
  • ...

Dans tous les cas, le propriétaire reste le même.

Un autre exemple ?

paypal.infoforall.fr appartient en réalité à infoforall.fr.

infoforall.paypal.fr appartient en réalité à paypal.fr.

Le sous-domaine le plus courant est www pour world wide web. Il était utilisé très couramment pour montrer que cette adresse menait à un site Web.

06° Observer l'adresse pour cette activité dans Firefox. Quelle est la couleur du sous-domaine ?

...CORRECTION...

Firefox affiche le sous-domaine en gris et le domaine principal en noir :

https://www.infoforall.fr/act/snt/comprendre-les-urls/

07 ° Remplir les cases pour les adresses proposées dans le tableau ci-dessous. Recopier sur votre copie après m'avoir demandé de vérifier vos résultats.

URL Sous-domaine Domaine Extension (fr com ...)
www.wikipedia.fr
fr.wikipedia.org
wikipedia.don.org
www.amazon.paiement.com

08° Un e-commerce vous propose de payer un magnifique achat en ligne sur www.paypal.paiement.securise.com. C'est sérieux ou pas cette histoire ? Vous payez ou pas ?

...CORRECTION...

Si vous avez bien suivi, vous n'allez certainement pas être redirigé vers le site de paypal mais vers le site de quelqu'un qui possède le nom de domaine securise.com et qui y a placé un sous-domaine paiement puis encore un sous-domaine paypal puis un sous-domaine www. Bref, ce n'est pas le propriétaire de paypal.

09° Un e-commerce vous propose de payer un magnifique achat en ligne sur paiement.paypal.xyz. C'est sérieux ou pas cette histoire ? Vous payez ou pas ?

...CORRECTION...

Il s'agit d'un site dont le propriétaire a acheté le nom de domaine paypal.xyz. Comme il ne s'agit pas d'une extension très courante, méfiance...

C'est bien ça le problème d'ailleurs : si on veut être certain que personne ne peut se faire passer pour vous, il faut acheter toutes les associations nom.extension. Pour une société privée cela représente un investissement rentable puisque cela réduit le nombre d'escroqueries qui pourraient nuire à l'image de la marque.

Ici, espérons que les propriétaires légitimes de paypal aient achété tous les noms de domaines possibles.

Nous venons de voir que l'URL permet de localiser avec certitude un serveur particulier et une ressource particulière sur ce site.

Mais comment le serveur et le client parviennent-ils à se comprendre ? Ce sont deux programmes informatiques tournant sur deux machines différentes...

Et c'est bien pour cela que l'URL commence par le protocole utilisé, la façon codifiée de se parler.

Une URL est donc constituée :

  1. Du protocole utilisé (http, https...)
  2. Du nom du serveur qu'on veut contacter
  3. De la ressource voulue sur le serveur

3 - Comment transférer une communication ?

Maintenant que vous avez compris que les requêtes contiennent une URL et que l'URL contient du texte et qu'on parle de chiffrer le texte, il reste à voir pourquoi on dit "chiffrer".

Et ce sera l'objet de l'activité 1 de la partie SNT-DONNEES qui sera faite en classe entière.

Vous savez désormais comme localiser un serveur HTTP précis et lui demander une ressource en passant par l'URL.

Dans l'activité suivante, nous allons voir comment utiliser ces URLs pour créer une page Web permettant d'en ouvrir d'autres.

Activité publiée le 16 09 2019
Dernière modification : 18 09 2023
Auteur : ows. h.