You are using an outdated browser. Please update your browser for a better user experience.

Quelles sont les informations que vous laissez lorsque vous accédez à un site web ?

Naviguer sur le web n'est pas innocent. Qu'importe ce que vous faites, comment vous le faites, qu'importe si vous êtes juste un lecteur ou si vous intéragissez, ce que vous faites laisse une empreinte (numérique, cela va de soi).

Cette empreinte, ou devrais-je dire ces empreintes se situent à différent niveaux et vont de votre ordinateur aux serveurs qui hébergent les sites que vous visitez.

Tout dépend ensuite des services utilisés, la majorité de ces empreintes sont destinées au bon fonctionnement du web, cependant il n'est pas obligatoire de les conserver.

Mais au final, si les CHATONS proposent des services libres pour remplacer les services des GAFAM, qu'est ce qui les différencient réellement de ces derniers ?

Allez, je vais pas vous laisser avec autant d'interrogations, je vais y répondre en partant de votre ordinateur (c'est le même fonctionnement sur votre smartphone ou votre télé connectée à deux trois détails près) pour finir sur le serveur.

Votre ordinateur

Source de votre navigation, tournant très souvent sur Windows, un peu sur MacOS ou une distribution Linux, il s'agit aussi du premier endroit où vous laissez vos empreintes. Lorsque vous accédez à un site (au hasard, DryCat.fr), vous tapez son URL dans votre navigateur favori qui respecte votre vie privée (sinon il est possible que ça laisse plus d'empreintes que celle que je vais citer) et n'envoie pas cette URL ailleurs. Plusieurs choses se produisent alors. Premièrement votre navigateur va contacter le module de résolution de domaine de votre système d'exploitation pour savoir à quelle adresse est logé DryCat.fr (oui, Internet c'est comme des villes, un site habite à telle adresse dans telle région dans tel pays). Ce module de votre système ne connait pas ça et va donc demander à un serveur DNS (l'annuaire des adresses des sites web) qu'on lui a renseigné pour savoir où est logé DryCat.fr. Le serveur DNS va répondre, le module va transmettre l'information au navigateur et zouh, votre page charge.

Sauf que dans toute cette histoire vous avez fait appel (indirectement certes) à 2 outils qui connaissent maintenant quel domaine vous avez demandé :

  • Le module du système peut être assujeti à la télémétrie (un terme pour dire "on siphone tout ce qui passe pour savoir si c'est utile ou pas").
  • Le serveur DNS qui peut journaliser la requête en notant de qui elle vient, qu'est ce qui est demandé, la version du module qui a fait la demande,

Suite à cela votre navigateur va enregistrer cette requête pour qu'une prochaine fois que vous tapez Dry il vous propose directement DryCat.fr. Mais il va aussi calculer combien de fois vous visitez drycat.fr par rapport à Dryusdan.fr pour vous proposer un des sites en premier. Vous arrivez enfin sur le site web, celui ci dépose directement un cookie pour son bon fonctionnement (enfin en théorie). Et hop, une empreinte en plus sur votre ordinateur.

Nous sommes déjà à 4 empreintes laissées dont une seule que vous pouvez effacer.

Le serveur

Votre requête pour afficher le site DryCat.fr passe au travers de votre box Internet puis du réseau de l'opérateur, puis de tous les réseaux transitaires (ceux qui transportent vos paquets) puis le réseau de l'hébergeur pour finir sur le serveur. On va dire, dans nos exemples, que les métadata (les en-têtes des paquets possédant l'adresse d'envoi et l'adresse de réception) sont utilisés à des fins statistiques et anonymisés (on enlève une partie de l'adresse d'envoi) pour dimensionner l'infrastructure. Bref, votre paquet arrive sur le serveur hébergeant DryCat qui indique l'adresse d'envoi. Puis le bon service lit le paquet et en note une partie :

9.9.9.9 - - [03/Mar/2020:11:21:19 +0100] "GET /shelves/informatique HTTP/2.0" 200 3385 "https://wiki.dryusdan.fr/" "Mozilla/5.0 (X11; Fedora; Linux x86_64; rv:73.0) Gecko/20100101 Firefox/73.0

(L'IP est celle de QuadNine et n'a pas fait cette requête)

Votre requête donne plusieurs informations : Votre IP, l'heure ou vous avez accédé au site, la ressource (page ou design) que vous avez demandé, la page à partir de laquelle vous avez fait cette demande, votre navigateur, sa version, la version de votre système d'exploitation. Avec ces informations-là, on peut voir votre parcours sur un site web, si vous êtes resté dessus ou non. Sans utiliser de module type Matomo ou Google Analytics, les données sont déjà très largement verbeuses et permettent d'avoir un avis sur vos habitudes. De plus, s'il est possible de catégoriser les pages visitées, il est donc tout à fait possible de comprendre vos goûts, d'en déduire votre âge...

À savoir qu'une IP ne donne pas le nom et prénom de la personne. Cependant on peut identifier quelqu'un avec une IP si cette personne remplit un formulaire avec nom et prénom ou avec une requête judiciaire (lors d'une plainte par exemple). Les opérateurs sont obligé de conserver les données de connexion (Quelles IPs vous avez visité, combien de fois, combien de temps, votre IP et ainsi donc votre ligne et identifiant de contrat) pendant une durée d'un an également.

Mais donc, un CHATONS est un GAFAM en puissance ?

Oui et... Non, en réalité juste non ! Déjà car il faut énormément de ressources pour calculer tout ça, ensuite car le fonctionnement d'un CHATONS se base sur la confiance. Et pour avoir un intérêt à cela, il faut vendre ces informations. Or, le droit Européen nous protège contre cela.

De plus, lorsque l'on devient un CHATONS, nous adhérons à une charte(Dans la catégorie Neutre de cette charte : le CHATON s’engage à ne pratiquer aucune surveillance des actions des utilisateurs et utilisatrices, autre qu'à des fins administratives, techniques, ou d'améliorations internes des services. Section Alternative : Le CHATON s’engage à ne pas mettre en place de dispositif de suivi des usages des services proposés autres qu’à des fins statistiques, techniques ou administratives) qui l'interdit.

Mais dans ce cas là, comment limiter mes traces ?

Déjà en utilisant un navigateur respectueux de la vie privée (par exemple Firefox), utiliser des services hébergés par un CHATONS (si possible en allant le rencontrer autour d'un café, ça permet de mettre un visage sur un nom). Vous pouvez également utiliser un système d'exploitation libre tel que GNU/Linux (Debian, Ubuntu, Fedora, Solus (que je recommande pour les non techniques)...) Ensuite, en utilisant des serveurs DNS proposés par la FFDN ou ceux mis en place par votre CHATONS local (et pour les plus techniques, vous pouvez très bien installer votre unbound avec un Pi-Hole :) ) Après cela, si vous le souhaitez, changer de fournisseur d'accès internet pour un FAI local c'est sympa aussi, comme ça on peut savoir ce qui sont fait de nos données (coucou FAIMaison).

Mais le RGPD me permet de demander la suppression de toutes mes données, je veux les supprimer de DryCat !

Merci Billy, tu me permets de passer à la section suivante.

Quelles sont les données qu'un hébergeur de service doit récupérer

Et oui avant même de parler RGPD on va parler de droit français. Un hébergeur de service doit légalement conserver les logs d'accès et de modification d'une ressource sur une période de 365 jours selon le droit français. Cela signifie ces lignes :

9.9.9.9 - - [03/Mar/2020:11:21:19 +0100] "GET /shelves/informatique HTTP/2.0" 200 3385 "https://wiki.dryusdan.fr/" "Mozilla/5.0 (X11; Fedora; Linux x86_64; rv:73.0) Gecko/20100101 Firefox/73.0

Le RGPD quand à lui intervient uniquement sur les données collectées et utilisées non anonymement à usage autre que la conservation à des fins légales.

Pour information, pour des cas statistiques, DryCat supprime les deux derniers bits d'une adresse IPv4 et les 64 derniers bits sur une adresse IPv6 afin de récupérer le pays. Après cela, l'IP est oubliée par le programme (qui est libre de surcroit, il s'agit de goaccess).

Avec tout cela, j'espère que vous êtes plus au clair sur les traces que vous laissez peut-être sans même le savoir, et chez qui elles se trouvent. D'où cette question de confiance, et d'existence-même des CHATONS.