SNT Web Intro

Identification

Infoforall

1 - Parlons d'Internet et du Web


Le Web est devenu rapidement la vitrine d'Internet, son application phare. Mais elle n'est pas la seule !

Voyons la différence entre Web et Internet.

1 - Internet en deux mots

Avant de parler du Web, il faut peut-être clarifier la différence avec Internet.

Qu'est-ce qu'un réseau informatique ?

Un réseau informatique local est un ensemble d'équipements informatiques reliés entre eux de façon à pouvoir échanger des informations.

Qu'est-ce qu'un réseau informatique local ?

Lorsque les équipements peuvent communiquer entre eux sans passer par Internet, on parle de réseau local.

Equipement courant : le switch (commutateur) est l'un des dispositifs usuels qui permet de relier entre eux les appareils d'un même réseau. On parlera alors de réseau local.

Un réseau
Un petit réseau autonome

Chez vous, le switch (commutateur) est à l'intérieur de votre Box Internet.

Les équipements connectés peuvent être des ordinateurs autonomes mais également des imprimantes ou de simples stations de stockage d'informations.

Qu'est-ce qu'Internet ?

Internet est lui le réseau informatique mondial accessible au public.

Il permet donc de faire communiquer entre eux les réseaux informatiques qui y sont connectés.

Internet est donc un réseau de réseaux informatiques.

Equipements courants : ces réseaux sont reliés entre eux par l'intermédiaire de routeurs qui permettent le transport des messages d'un réseau vers un autre.

Communication entre réseaux via Internet
Communication entre réseaux via Internet

Internet permet donc de faire communiquer deux machines qui ne sont pas sur le même réseau.

Cette communication devra passer ici par des équipements particuliers qu'on nomme les routeurs : ce sont des équipements dont la tâche est de faire transiter les communications. Un ordinateur normal ne gère pas les communications qui ne lui sont pas destinées. La tâche du routeur est au contraire de recevoir et renvoyer du bon côté les communications qui ne lui sont pas destinées au final !

On voit parfois Internet symbolisé par une sorte de nuage (cloud), donnant l'impression d'une immatérialité du réseau. Mais l'infrastructure matérielle est bien présente et indispensable. L'idée derrière le nuage est plutôt qu'il existe un grand nombre de chemins possibles et que ces chemins sont variables en fonction du moment.

Cloud internet
( Image : Bruno Voisin – Wikipedia - CC BY-SA 3.0)

Si l'un des ordinateurs du réseau A veut consulter une page Web accessible via le serveur situé sur le réseau B, une communication va devoir s'établir entre le réseau A et le réseau B.

01° Trouvez un chemin permettant de relier les deux ordinateurs sur le réseau Internet simpliste ci-dessous. Le chemin est-il unique ? Y-a-t'il des routeurs plus critiques que d'autres ?

Communication entre réseaux via Internet

...CORRECTION...

Le chemin n'est pas unique du tout : on peut passer par des routeurs différents pour arriver à destination.

Exemple : A3 - A4 - A5 - X1 - X2 - X6 - B1 - B2 - B3

Il y a quelques routeurs à travers lesquels on passe forçément (A5 - X1 - X6 - B1) mais on peut sinon trouver un chemin de remplacement si l'un des autres routeurs tombent en panne.

Si un de ces routeurs indispensables ici tombe en panne, c'est par contre plus embêtant...

Une Box ADSL domestique fait office à la fois de switch, de routeur et même de modem : en réalité, votre box n'est pas directement reliée à Internet. Avant le routeur de la box se trouve le modem qui va permettre de transmettre via de simples fils électriques les informations au point d'accès de votre fournisseur d'accès à Internet, le FAI. Là bas, c'est pareil : on a d'abord un modem qui retransforme le signal puis enfin le routeur.

Au fait, comment communiquent les ordinateurs ?

Notion de protocole de communication

Un ordinateur ne réflechit pas. C'est une machine qui ne fait que suivre des règles. Pour un ordinateur, communiquer se résume à analyser une suite de nombres et à renvoyer une suite de nombres en fonction de ce qu'il a reçu.

Pour permettre cette communication, il faut donc avoir édicté sur les deux ordinateurs des règles extrêmement précises de fonctionnement : les protocoles.

Vous devez connaitre deux exemples de protocoles utilisés pour Internet.

Le protocole TCP ( Transmission Control Protocol ) est une façon de superviser la bonne transmission d'un message entre deux machines distantes.

Le protocole IP (pour Internet Protocol) est utilisé lui pour réaliser l'adressage et ainsi trouver les bons appareils.

A quoi sert Internet ?

Internet ne sert à rien en lui-même : il s'agit de l'infrastructure matérielle et logicielle qui permet d'établir des communications.

Par contre, il existe une multitude d'applications qui utilisent Internet pour fonctionner. On trouve ainsi :

  • le FTP (File transfert protocol) qui permet le téléversement et le téléchargement sur un serveur distant (l'application date de 1971)
  • les courriers électroniques / emails (1971)
  • Usenet pour envoyer et lire des messages sur les forums de news (1979)
  • IRC (Internet Relay Chat) qui permettait (et permet toujours même si ce n'est plus l'application phrare d'Internet) de s'écrire en temps réel (temps synchrone) contrairment aux emails (asynchrones) (1988)
  • le Web qui permet de lire des documents hypertextes (1991)
  • le pair-à-pair / peer-to-peer / P2P qui permet le transfert décentralisé de documents(1999)
  • et bien d'autres applications disparues ou à naitre

02° Ouvrir un terminal :
LINUX : menu application ou  CTRL+ALT+T 
WINDOWS : menu puis applications puis invite de commande.
Taper la commande suivante (qui risque de ne pas fonctionner depuis un PC d'un lycée).

ping www.infoforall.fr

Elle permet de voir qu'une communication peut s'établir (ou non) entre deux ordinateurs. La commande va vous donner le temps moyen de retour du ping : le signal part de la machine A (la votre), arrive à la machine B (celle faisant tourner le serveur du site) et revient à la machine A. Ping (aller). Pong (retour). Trouver le temps minimum que met le signal pour faire l'aller-retour.

Remarque : si vous êtes dans un lycée, il est possible que la commande ne puisse pas aboutir : votre ping part bien mais les protections mises en place par la "box" du lycée (la passerelle vers Internet) n'acceptera pas de renvoyer le pong vers votre ordinateur. Dans ce cas, allez voir la correction.

Sur Linux : il faut faire cesser les pings à l'aide de  CTRL+C .

...CORRECTION...

PING www.infoforall.fr(http1.paris1.alwaysdata.com (2a00:b6e0:1:20:2::1)) 56 data bytes 64 bytes from http1.paris1.alwaysdata.com (2a00:b6e0:1:20:2::1): icmp_seq=1 ttl=54 time=21.6 ms 64 bytes from http1.paris1.alwaysdata.com (2a00:b6e0:1:20:2::1): icmp_seq=2 ttl=54 time=21.1 ms 64 bytes from http1.paris1.alwaysdata.com (2a00:b6e0:1:20:2::1): icmp_seq=3 ttl=54 time=22.0 ms 64 bytes from http1.paris1.alwaysdata.com (2a00:b6e0:1:20:2::1): icmp_seq=4 ttl=54 time=67.9 ms 64 bytes from http1.paris1.alwaysdata.com (2a00:b6e0:1:20:2::1): icmp_seq=5 ttl=54 time=295 ms 64 bytes from http1.paris1.alwaysdata.com (2a00:b6e0:1:20:2::1): icmp_seq=6 ttl=54 time=215 ms 64 bytes from http1.paris1.alwaysdata.com (2a00:b6e0:1:20:2::1): icmp_seq=7 ttl=54 time=21.1 ms 64 bytes from http1.paris1.alwaysdata.com (2a00:b6e0:1:20:2::1): icmp_seq=8 ttl=54 time=21.9 ms 64 bytes from http1.paris1.alwaysdata.com (2a00:b6e0:1:20:2::1): icmp_seq=9 ttl=54 time=22.7 ms ^C --- www.infoforall.fr ping statistics --- 9 packets transmitted, 9 received, 0% packet loss, time 8009ms rtt min/avg/max/mdev = 21.140/78.773/295.278/97.216 ms

On voit donc que le signal met au minimum 21 ms (milliseconde).

03° Dans quelle ville semble se situer le dernier routeur qui est parvenu à joindre le serveur du site ? Quel semble être le nom de l'hébergeur de ce site ?

PING www.infoforall.fr(http1.paris1.alwaysdata.com (2a00:b6e0:1:20:2::1)) 56 data bytes 64 bytes from http1.paris1.alwaysdata.com (2a00:b6e0:1:20:2::1): icmp_seq=1 ttl=54 time=306 ms

...CORRECTION...

PING www.infoforall.fr(http1.paris1.alwaysdata.com (2a00:b6e0:1:20:2::1)) 56 data bytes 64 bytes from http1.paris1.alwaysdata.com (2a00:b6e0:1:20:2::1): icmp_seq=1 ttl=54 time=306 ms

On voit donc que le serveur est à Paris et qu'il est reliée à une société nommée alwaysdata.

04° Imaginons que le signal mette 21 ms pour faire le trajet Lille-Paris (220 km aller) et Paris-Lille en retour (220 km retour).
A quelle vitesse le signal se déplace-t-il en moyenne ? (on utilisera v = d / t)
Comparer à la vitesse théorique limite : la vitesse de la lumière 300 000 km.s-1.

...CORRECTION...

La distance parcourue est le double de la distance (c'est un aller-retour). On prendra d = 440 km.

Une milliseconde correspond à un millième de seconde. 1 ms = 0.001 s = 1.10-3 s

On en déduit que v = d / t = 440 / 0.021.

Au final, on obtient approximativement v = 21 000 km.s-1.

C'est bien inférieure à la vitesse de 300 000 km.s-1 mais c'est très rapide.

Cela peut donc donner l'illusion de la simultanéité, mais c'est une illusion. Il y a bien un délai entre émission et réception.

D'où vient cette "lenteur" : des temps de calculs de routeurs lorsqu'ils recherchent par où envoyer le message.

2 - Le Web, un ensemble de documents hypertextes

Le Web est l'une des applications qui utilisent Internet pour transmettre leurs données d'une machine à une autre.

Qu'est-ce que le Web ?

De façon fondamentale, le Web est constitué de l'ensemble des documents hypertextes auxquels il donne accès : on relie un document à un autre à l'aide d'un lien qu'on peut utiliser pour basculer vers un nouveau contenu hypertexte sans avoir à parcourir l'ensemble du document initial.

05° Ouvrir Firefox et aller sur Qwant ( https://www.qwant.com/?l=fr ) et faire une recherche sur « web ».

Et voilà : vous avez une nouvelle page texte qui comporte une multitude de liens vers d'autres documents. C'est bien un document hypertexte : un document texte amélioré qui permet d'atteindre un autre document hypertexte à l'aide d'un lien.

06° Ouvrir la page Wikipédia traitant du Web : https://fr.wikipedia.org/wiki/World_Wide_Web.

Sur cette page Wikipedia, vous pourrez visualiser ce qui est le fondement du Web : la présence de liens permettant d'atteindre d'autres pages. Par exemple, en bas de page, dans la rubrique Liens externes, vous trouverez un grand ensemble de ce site de lien qui apparaissent souvent en bleu dans la plupart des navigateurs.

La partie liens externes

07° Cliquer sur le premier lien proposé ci-dessous (info.cern.ch) qui vous propose de vous montrer la première page du Web tel que votre navigateur moderne (votre client HTTP) le voit.

Cliquer ensuite sur le deuxième lien : cette fois, vous verrez le site tel qu'il était visible à l'époque à travers les navigateurs et les écrans d'époque.

Le troisième lien (Learn about the birth of the web) explique (en anglais) que le Web a vu le jour en 1989 au CERN en Suisse sous l'impulsion de Tim Berners-Lee, un chercheur Britannique.

08° Après avoir un peu visité ce premier site historique, répondre à la question suivante : qu'est-ce qui défini le Web ?

  • Les liens ?
  • Les images ?
  • Les sites de partage ?

...CORRECTION...

C'est bien entendu la notion de liens.

Il n'y avait que cela sur ce site !

3 - Visualiser le Web ?

Réaliser une carte du Web dans son ensemble est loin d'être aisé : il faudrait relier chaque page aux pages qu'elle permet de joindre. Tout en sachant que le Web évolue constamment : des liens se créent, des pages disparaissent...

Avec les quelques petits liens de la page Wikipédia:

Visualiser les liens

En plus, certains liens sont des liens internes au site (on reste sur le même site) et d'autres sont des liens externes (on quitte le site pour aller sur un autre site)...

La visualisation du Web peut se faire sous forme de graphe : chaque site est représenté par un cercle et on relie les sites/cercles entre eux en fonction des liens existants. Ce type de représentation donne une multitude d'informations.

Lors de la campagne Européenne de 2009, une équipe a ainsi réalisé un graphe représentant les interactions entre les différents sites parlant de la campagne. On ne montre pas l'intégralité des pages d'un site mais uniquement les liens d'un site à l'autre.

Voici le lien vers ce site (il est possible que la carte ne s'affiche pas):

https://www.touteleurope.eu/actualite/cartographie-de-la-toile-europeenne.html

En voici une copie-écran :

Visualiser les liens des Européennes 2009

J'ai choisi sur l'image ci-dessous de visualiser les liens entrants ou sortants de liberation.fr.
Les liens rouges sont les liens entrants (les sites qui créent un lien vers liberation.fr)
Les liens jaunes sont les liens sortants (les sites dont liberation.fr donnent le lien).
Les liens verts sont les liens réciproques : les deux sites se citent l'un l'autre.

09° En quoi un tel graphe peut-il être intéressant pour un sociologue ou un politologue ?

...CORRECTION...

En lançant des analyses sur les différents liens, on peut parvenir à voir émerger des catégories.

Une fois qu'une catégorie d'individus est définie, on peut tenter de connaitre l'opinion globale de cette catégorie en regardant les sites qu'elle visite. Bien entendu, cela n'est valable que pour le groupe dans sa globalité, pas pour un individu seul.

Par contre, connaitre l'historique de navigation d'une personne permet d'en apprendre beaucoup sur cette personne !


On trouve également assez facilement une autre carte sur le Web : celle réalisée en 2012 par un programmeur russe.

http://internet-map.net/

Sur cette représentation, on ne peut pas voir les liens.

Néanmoins, chaque pays est représenté par une couleur.

Web mondial en 2012

Chaque site possède une taille liée à son trafic et l'algorithme générant la carte semble placer les sites en fonction des hyperliens entre eux et également des centres d'intérêt.

Les couleurs sont les suivantes :

  • en bas à gauche (en jaune) : la Chine
  • en bas à droite (en violet) : le Japon
  • en bleu ciel : les USA
  • en haut à droite (en rouge) : la Russie
  • au milieu à droite (différentes couleurs, violet pour France) : les pays Européens
  • au milieu à gauche (en vert) : l'Inde

10° Explorer le Web de 2012 graçe à cette carte. Répondre aux questions suivantes :

  • Quels sont les grands états de Web en 2012 ?
  • Quels étaient les grands sites français ?
  • Une telle représentation est-elle nécessairement objective ? L'algorithme choisi ou les données sélectionnées ont-elles un impact fort sur la carte obtenue ?

Maintenant que vous savez ce que se cache vraiment derrière le mot web, nous allons peu à peu voir comment on parvient à créer ses fameux liens !

Dans la partie Résumés du site, vous trouverez le résumé PDF de cette activité.

En cours, nous compléterons ce document pdf.

Activité publiée le 02 09 2019
Dernière modification : 28 05 2020
Auteur : ows. h.