SNT Web Intro

Identification

Infoforall

1 - Parlons d'Internet et du Web


Le Web est devenu rapidement la vitrine d'Internet, son application phare. Mais elle n'est pas la seule !

Voyons la différence entre Web et Internet.

Documents de cours : pdf ou odt.

1 - Internet en deux mots

Avant de parler du Web, il faut peut-être clarifier la différence avec Internet.

Qu'est-ce qu'un réseau informatique local ?

Un réseau informatique local est un ensemble d'équipements informatiques reliés entre eux de façon à communiquer sans avoir besoin de sortir du réseau. Les équipements d'un même réseau peuvent donc communiquer entre eux sans passer par Internet par exemple.

Le commutateur (switch en anglais) est l'un des dispositifs usuels qui permet de relier entre eux les appareils d'un même réseau. Chez vous, le commutateur est à l'intérieur de votre Box Internet.

Un réseau
Un petit réseau autonome

Les équipements connectés peuvent être des ordinateurs autonomes mais également des imprimantes ou de simples stations de stockage d'informations.

Nous reviendrons sur le fonctionnement d'Internet dans la partie Internet du cours de SNT.

Qu'est-ce qu'Internet ?

Internet est le réseau informatique mondial accessible au public.

Internet permet donc de faire communiquer deux machines qui ne sont pas sur le même réseau.

Deux équipements situés sur deux réseaux informatiques différents peuvent donc communiquer en passant par Internet : Internet est donc un réseau de réseaux informatiques.

Cette communication devra passer ici par des équipements particuliers qu'on nomme les routeurs : ce sont des équipements dont la tâche est de faire transiter les communications.

Communication entre réseaux via Internet
Communication entre réseaux via Internet

On voit parfois Internet symbolisé par une sorte de nuage (cloud), donnant l'impression d'une immatérialité du réseau. Mais l'infrastructure matérielle est bien présente et indispensable. L'idée derrière le nuage est plutôt qu'il existe un grand nombre de chemins possibles et que ces chemins sont variables en fonction du moment.

Cloud internet
( Image : Bruno Voisin – Wikipedia - CC BY-SA 3.0)
C'est ça le "Cloud" ?

Non. Le Cloud est le nom donné à un type particulier de services accessibles depuis Internet, souvent via une interface Web.

Une entreprise a la possibilité de se créer son propre réseau contenant ses données et ses logiciels. Mais elle doit alors payer le personnel gérant cette infrastructure.

Entreprise gérant elle même son infrastructure

Certaines entreprises (Microsoft, Amazon, Google...) proposent d'utiliser leur propre service pour obtenir les mêmes fonctionnalités sans se préoccuper de la maintenance. L'entreprise A devra donc payer pour ce service.

Service Cloud

Avantage : pas de personnel dédié à cela pour l'entreprise, elle paye une autre entreprise pour réaliser cette tâche spécifique : par effet d'échelle, cette autre entreprise peut donc avoir des équipes très compétences car spécialisées et peut diminuer les coûts d'exploitation par effet d'échelle.

Désavantage : on passe par une société extérieure par gérer nos propres données ! Confiance et honnéteté sont donc des prérequis à ce type de marché. La qualité des accords commerciaux est donc fondamental. Et c'est bien là le problème : les entreprises passent des accords avec des géants de l'Informatique, rodés à ce type de contrats et possèdant des bataillons d'avocats spécialisés.

Nous reviendrons sur le Cloud et les Datacenters dans la partie Données Structurées du cours de SNT.

Un ordinateur normal ne gère pas les communications qui ne lui sont pas destinées. La tâche du routeur est au contraire de recevoir et renvoyer du bon côté les communications qui ne lui sont pas destinées au final !

Si l'un des ordinateurs du réseau A veut consulter une page Web accessible via le serveur situé sur le réseau B, une communication va devoir s'établir entre le réseau A et le réseau B.

01° Trouvez un chemin permettant de relier les deux ordinateurs sur le réseau Internet simpliste ci-dessous. Le chemin est-il unique ? Y-a-t-il des routeurs critiques (c'est à dire à surveiller plus que d'autres pour garantir le bon transit des informations) ?

Communication entre réseaux via Internet

...CORRECTION...

Le chemin n'est pas unique du tout : on peut passer par des routeurs différents pour arriver à destination.

Exemple : A3 - A4 - A5 - X1 - X2 - X6 - B1 - B2 - B3

Il y a quelques routeurs à travers lesquels on passe forçément (A5 - X1 - X6 - B1) mais on peut sinon trouver un chemin de remplacement si l'un des autres routeurs tombent en panne.

Si un de ces routeurs indispensables ici tombe en panne, c'est par contre plus embêtant...

Le répartiteur

Une Box fait office à la fois de commutateur et de routeur. En réalité, votre box n'est pas directement reliée à Internet. Votre connexion arrive dans un local nommé répartiteur. C'est à partir de ce local que votre communication est routée vers votre fournisseur d'accès à Internet.

Boucle locale en cuivre

Au fait, comment communiquent les ordinateurs ?

Notion de protocole de communication

Un ordinateur ne réflechit pas. C'est une machine qui ne fait que suivre des règles. Pour un ordinateur, communiquer se résume à analyser une suite de nombres et à renvoyer une suite de nombres en fonction de ce qu'il a reçu.

Pour permettre cette communication, il faut donc avoir édicté sur les deux ordinateurs des règles extrêmement précises de fonctionnement : les protocoles.

Vous allez découvrir cette année deux protocoles utilisés sur Internet :

Le protocole TCP ( Transmission Control Protocol ) est une façon de superviser la bonne transmission d'un message entre deux machines distantes.

Le protocole IP (pour Internet Protocol) est utilisé pour réaliser l'adressage des machines et ainsi trouver l'appareil avec qui on veut communiquer.

A quoi sert Internet ?

Internet ne sert à rien en lui-même : il s'agit de l'infrastructure matérielle et logicielle qui permet d'établir des communications.

Par contre, il existe une multitude d'applications qui utilisent Internet pour fonctionner. On trouve ainsi :

  • le FTP (File transfert protocol) qui permet le téléversement et le téléchargement sur un serveur distant (l'application date de 1971)
  • les courriers électroniques / emails (1971)
  • Usenet pour envoyer et lire des messages sur les forums de news (1979)
  • IRC (Internet Relay Chat) qui permettait (et permet toujours même si ce n'est plus l'application phrare d'Internet) de s'écrire en temps réel (temps synchrone) contrairment aux emails (asynchrones) (1988)
  • le Web qui permet de lire des documents hypertextes (1991)
  • le pair-à-pair / peer-to-peer / P2P qui permet le transfert décentralisé de documents(1999)
  • et bien d'autres applications disparues ou à naitre

Et ces communications se déroulent à quelle vitesse ?

02° Ouvrir un terminal ou une invite de commande :

  • Sous LINUX : menu application ou  CTRL+ALT+T 
  • WINDOWS : menu puis applications puis invite de commande.
    Taper la commande suivante (qui risque de ne pas fonctionner depuis un PC d'un lycée).
ping www.infoforall.fr

Cette commande ping (comme ping-envoi et pong-retour) permet de voir si une communication peut s'établir (ou non) entre deux ordinateurs. La commande va vous donner le temps moyen de retour du ping : le signal part de la machine A (la votre), arrive à la machine B (celle faisant tourner le serveur du site) et revient à la machine A. Ping (aller). Pong (retour).

Question : trouver le temps minimum que met le signal pour faire l'aller-retour.

Remarque : si vous êtes dans un lycée, il est possible que la commande ne puisse pas aboutir : votre ping part bien mais les protections mises en place par la "box" du lycée (la passerelle vers Internet) n'acceptera pas de renvoyer le pong vers votre ordinateur. Dans ce cas, allez voir la correction.

Sur Linux : il faut faire cesser les pings à l'aide de  CTRL+C .

...CORRECTION...

PING www.infoforall.fr(http10.paris1.alwaysdata.com (2a00:b6e0:1:20:11::1)) 56 data bytes 64 bytes from http10.paris1.alwaysdata.com (2a00:b6e0:1:20:11::1): icmp_seq=1 ttl=55 time=10.8 ms 64 bytes from http10.paris1.alwaysdata.com (2a00:b6e0:1:20:11::1): icmp_seq=2 ttl=55 time=9.04 ms 64 bytes from http10.paris1.alwaysdata.com (2a00:b6e0:1:20:11::1): icmp_seq=3 ttl=55 time=10.1 ms 64 bytes from http10.paris1.alwaysdata.com (2a00:b6e0:1:20:11::1): icmp_seq=4 ttl=55 time=8.93 ms 64 bytes from http10.paris1.alwaysdata.com (2a00:b6e0:1:20:11::1): icmp_seq=5 ttl=55 time=36.2 ms 64 bytes from http10.paris1.alwaysdata.com (2a00:b6e0:1:20:11::1): icmp_seq=6 ttl=55 time=9.28 ms 64 bytes from http10.paris1.alwaysdata.com (2a00:b6e0:1:20:11::1): icmp_seq=7 ttl=55 time=9.19 ms 64 bytes from http10.paris1.alwaysdata.com (2a00:b6e0:1:20:11::1): icmp_seq=8 ttl=55 time=8.55 ms 64 bytes from http10.paris1.alwaysdata.com (2a00:b6e0:1:20:11::1): icmp_seq=9 ttl=55 time=9.22 ms 64 bytes from http10.paris1.alwaysdata.com (2a00:b6e0:1:20:11::1): icmp_seq=10 ttl=55 time=9.61 ms ^C --- www.infoforall.fr ping statistics --- 10 packets transmitted, 10 received, 0% packet loss, time 9014ms rtt min/avg/max/mdev = 8.551/12.094/36.237/8.070 ms

On voit donc que le signal met en moyenne 12 ms (milliseconde).

03° Dans quelle ville semble se situer le dernier routeur qui est parvenu à joindre le serveur du site ? Quel semble être le nom de l'hébergeur de ce site ?

On prendra le résultat suivant :

PING www.infoforall.fr(http10.paris1.alwaysdata.com (2a00:b6e0:1:20:11::1)) 56 data bytes 64 bytes from http10.paris1.alwaysdata.com (2a00:b6e0:1:20:11::1): icmp_seq=1 ttl=55 time=10.8 ms 64 bytes from http10.paris1.alwaysdata.com (2a00:b6e0:1:20:11::1): icmp_seq=2 ttl=55 time=9.04 ms ... 64 bytes from http10.paris1.alwaysdata.com (2a00:b6e0:1:20:11::1): icmp_seq=10 ttl=55 time=9.61 ms ^C --- www.infoforall.fr ping statistics --- 10 packets transmitted, 10 received, 0% packet loss, time 9014ms rtt min/avg/max/mdev = 8.551/12.094/36.237/8.070 ms

...CORRECTION...

PING www.infoforall.fr(http10.paris1.alwaysdata.com (2a00:b6e0:1:20:11::1)) 56 data bytes 64 bytes from http10.paris1.alwaysdata.com (2a00:b6e0:1:20:11::1): icmp_seq=10 ttl=55 time=9.61 ms ^C

On voit donc que le serveur est à Paris et qu'il est reliée à une société nommée alwaysdata.

On voit que les signaux aller-retour ne mettent pas tous le même temps pour faire le trajet. C'est normal : le temps de traitement par les retours est variable en fonction de leur encombrement. Parfois c'est rapide, parfois il faut faire le queue !

04° Imaginons que le signal mette t = 12 ms pour faire le trajet Lille-Paris (220 km aller) et Paris-Lille en retour (220 km retour).

Questions

  1. Quelle est la distance d parcourue au total ?
  2. Exprimer la durée de l'aller-retour en seconde.
  3. A quelle vitesse le signal se déplace-t-il en moyenne ? (on utilisera  v = d / t ). On donnera le résultat en km.s-1.
  4. Comparer à la vitesse théorique limite : la vitesse de la lumière 300 000 km.s-1.

...CORRECTION...

La distance parcourue est le double de la distance (c'est un aller-retour). On prendra d = 440 km.

Une milliseconde correspond à un millième de seconde. 1 ms = 0.001 s = 1.10-3 s

On obtient donc :

t = 12 ms = 12.10-3 s = 0.012 s

On en déduit que v = d / t = 440 / 0.012.

Au final, on obtient approximativement v = 37 000 km.s-1.

Attention : il ne s'agit pas de la vitesse réelle du transfert, juste sa vitesse moyenne en tenant compte du temps de traitement par les routeurs.

C'est bien inférieure à la vitesse de 300 000 km.s-1 mais c'est très rapide.

Cela peut donc donner l'illusion de la simultanéité, mais c'est une illusion. Il y a bien un délai entre émission et réception.

D'où vient cette "lenteur" ?

Le signal ne peut pas se propager plus vite que la lumière (environ 300 000 km.s-1).

La vitesse de communication est en réalité diminuée à cause des temps de calculs de routeurs lorsqu'ils recherchent où envoyer le message ensuite.

Et que cherche le routeur ?

A savoir :

  1. Si la communication est pour lui : il le lit.
  2. Si la communication est pour quelqu'un de son propre réseau : il le transmet au commutateur
  3. Si la communication est pour quelqu'un d'un autre réseau : il regarde sa table de routage pour savoir à qui le transmettre pour qu'il poursuive sa route.

2 - Le Web, un ensemble de documents hypertextes

Le Web est l'une des applications qui utilisent Internet pour transmettre leurs données d'une machine à une autre.

Qu'est-ce que le Web ?

De façon fondamentale, le Web est constitué de l'ensemble des documents hypertextes auxquels il donne accès : on relie un document à un autre à l'aide d'un lien qu'on peut utiliser pour basculer vers un nouveau contenu hypertexte sans avoir à parcourir l'ensemble du document initial.

05° Ouvrir Firefox et aller sur Qwant ( https://www.qwant.com/?l=fr ) et faire une recherche sur le mot «web».

Et voilà : vous avez une nouvelle page texte qui comporte une multitude de liens vers d'autres documents. C'est bien un document hypertexte : un document texte amélioré qui permet d'atteindre un autre document hypertexte à l'aide d'un lien.

Recherche Web

06° Ouvrir la page Wikipédia traitant du Web : https://fr.wikipedia.org/wiki/World_Wide_Web.

La partie liens externes

Sur cette page Wikipedia, vous pourrez visualiser ce qui est le fondement du Web : la présence de liens permettant d'atteindre d'autres pages. Par exemple, en bas de page, dans la rubrique Liens externes, vous trouverez un grand ensemble de ce site de lien qui apparaissent souvent en bleu dans la plupart des navigateurs.

07° Cliquer sur le lien colorié en rose sur l'image ci-dessus (info.cern.ch) qui vous permet d'aller sur un site du CERN qui propose quelques explications sur l'histoire du Web. Vous y trouverez ceci sur la page d'accueil :

Le premier lien propose de visualiser la première page du Web tel que votre navigateur moderne (votre client HTTP) le voit.

Le deuxième lien propose cette fois de visualiser le site tel qu'il était visible à l'époque à travers les navigateurs et les écrans d'époque.

Le troisième lien (Learn about the birth of the web) explique (en anglais) que le Web a vu le jour en 1989 au CERN en Suisse sous l'impulsion de Tim Berners-Lee, un chercheur Britannique.

08° Après avoir un peu visité ce premier site historique, répondre à la question suivante : qu'est-ce qui défini le Web ?

  • Les liens ?
  • Les images ?
  • Les sites de partage ?

...CORRECTION...

C'est bien entendu la notion de liens.

Il n'y avait que cela sur ce site !

3 - Visualiser le Web ?

Réaliser une carte du Web dans son ensemble est loin d'être aisé : il faudrait relier chaque page aux pages qu'elle permet de joindre. Tout en sachant que le Web évolue constamment : des liens se créent, des pages disparaissent...

Avec les quelques petits liens de la page Wikipédia:

Visualiser les liens

En plus, il y a deux types de liens :

  • certains liens sont des liens internes au site (on reste sur le même site) et
  • d'autres sont des liens externes (on quitte le site pour aller sur un autre site)...

La visualisation du Web peut se faire sous forme d'un graphe : chaque site est représenté par un cercle et on relie les sites-cercles entre eux en fonction des liens existants. Ce type de représentation donne une multitude d'informations.


Lors de la campagne Européenne de 2009, une équipe a ainsi réalisé un graphe représentant les interactions entre les différents sites parlant de la campagne. On ne montre pas l'intégralité des pages d'un site mais uniquement les liens d'un site à l'autre. En voici un petit bout :

Visualiser les liens des Européennes 2009

J'ai choisi sur l'image ci-dessous de visualiser les liens entrants ou sortants de liberation.fr.
Les liens rouges sont les liens entrants (les sites qui créent un lien vers liberation.fr)
Les liens jaunes sont les liens sortants (les sites dont liberation.fr donnent le lien).
Les liens verts sont les liens réciproques : les deux sites se citent l'un l'autre.

Voici le lien vers ce site (il est possible que la carte ne s'affiche pas):

https://www.touteleurope.eu/actualite/cartographie-de-la-toile-europeenne.html

09° En quoi un tel graphe peut-il être intéressant pour un sociologue, un politologue ou simplement un publicitaire ?

...CORRECTION...

En lançant des analyses sur les différents liens, on peut parvenir à voir émerger des catégories.

Une fois qu'une catégorie d'individus est définie, on peut tenter de connaitre l'opinion globale de cette catégorie en regardant les sites que cette catégorie de personnes visite. Bien entendu, cela n'est valable que pour le groupe dans sa globalité, pas pour un individu seul.

Par contre, connaitre l'historique de navigation d'une personne permet d'en apprendre beaucoup sur cette personne !

Pour un publicitaire, une taille carte est bien pratique : on voit les sites qui citent Liberation. Imaginons que vous ne puissiez pas placer de publicités sur un site non-commercial A mais que A cite souvent Libération : Bingo, il suffit de mettre la pub sur Libération.


On trouve également assez facilement une autre carte sur le Web : celle réalisée en 2012 par un programmeur russe.

http://internet-map.net/

Sur cette représentation, on ne peut pas voir les liens.

Néanmoins, chaque pays est représenté par une couleur.

Web mondial en 2012

Chaque site possède une taille liée à son trafic et l'algorithme générant la carte semble placer les sites en fonction des hyperliens entre eux.

Les couleurs sont les suivantes :

  • en bas à gauche (en jaune) : la Chine
  • en bas à droite (en violet) : le Japon
  • en bleu ciel : les USA
  • en haut à droite (en rouge) : la Russie
  • au milieu à droite (différentes couleurs, violet pour France) : les pays Européens
  • au milieu à gauche (en vert) : l'Inde

10° Explorer le Web de 2012 graçe à cette carte. Répondre aux questions suivantes :

  • Quels sont les grands états de Web en 2012 ?
  • Quels étaient les grands sites français ?
  • Une telle représentation est-elle nécessairement objective ? L'algorithme choisi ou les données sélectionnées ont-elles un impact fort sur la carte obtenue ?

Maintenant que vous savez ce que se cache vraiment derrière le mot web, nous allons peu à peu voir comment on parvient à créer ses fameux liens !

Dans la partie Résumés du site, vous trouverez le résumé PDF de cette activité.

En cours, nous compléterons ce document pdf.

Activité publiée le 02 09 2019
Dernière modification : 28 05 2020
Auteur : ows. h.