Non, nous ne sommes pas traqués sur le net... quoique...

Posté le Sun 07 December 2014 dans Réflexions
Temps de lecture estimé : 4 minute(s).

Lundi, j'ai installé une extension firefox : Lightbeam. Elle permet de voir, sous forme de graphe :

  • Quels sites nous visitons volontairement
  • Quels sites sont appelés dans notre dos, sans que nous le sachions
  • Quels sont les relations entre ces différents sites
  • Quels sites utilisent des cookies.

En gros, cela permet d'avoir une idée des traces que l'on laisse sur le net lorsque l'on visite un site quelconque. Voilà le graphe qui a été généré pour moi après seulement 3 jours d'activité :

Affichés de façon opaque, on retrouve les sites que j'ai visités volontairement. C'est-à-dire pour lesquels j'ai directement saisi l'adresse du site, ou ceux sur lesquels je me suis rendu en suivant un lien. Il y en a 84.

Affichés de façon transparente, les sites visités involontairement. C'est à dire ceux utilisés, référencés par ceux que j'ai visités directement. Il y en a 357. Parmi eux, on retrouve les grands standards comme Google Analytics, Facebook, Twitter. Mais on y trouve surtout énormément de régies publicitaires. Et si on s'attarde un peu plus sur les données, on peut remarquer que certaines de ces régies publicitaires sont omniprésentes.

Si on fait la somme des sites que j'ai visités directement et indirectement, on arrive à 441. Et si on étudie plus particulièrement le régie publicitaire DoubleClick par exemple, on remarque qu'elle est dans mon cas connectée à 134 sites sur les 441 que j'ai visités, soit 30% des sites visités.

Il y a donc un même site, DoubleClick, qui peut suivre et tracer 30% de mon activité internet. Concrètement, cela veut dire que DoubleClick connait un tiers de mon activité sur internet. Il pourra en déduire par exemple :

  • mes goûts musicaux
  • mes lectures
  • les vidéos que je trouve drôles
  • mes goûts culinaires, à travers les recettes que je cherche
  • les vins que je bois
  • les forums que je consulte
  • si je suis plutôt sédentaire ou nomade
  • si je suis un geek

Un peu plus intéressant pour lui, il pourra aussi savoir :

  • si j'achète régulièrement sur internet
  • ce que j'achète
  • si je prends plutôt du haut de gamme ou du discount
  • sur quels site j'ai l'habitude d'aller pour mes achats
  • les heures pendant lesquelles je surfe le plus
  • les heures pendant lesquelles j'achète le plus

Connaissant 30% de mes données personnelles sur ces différents sujets, DoubleClick pourra facilement établir un profil du consommateur que je suis, et me proposer une vraie publicité ciblée, rien que pour moi. Et en plus, il pourra me la proposer sur 30% des sites que je visite.

Plus gênant, si on ajoute à tout cela un algorithme pertinent, qui ne serait à mon avis pas si difficile à écrire, il pourra potentiellement déduire de toutes ces données des informations un peu plus intrusives :

  • ma situation familiale
  • combien j'ai d'enfants, et leur age
  • mon orientation sexuelle
  • si je trompe ma femme
  • mon bord politique
  • ma situation financière
  • quelle est ma banque
  • quelle est ma mutuelle
  • mon état de santé, en fonction des maladies sur lesquelles je me renseigne

Et là, on ne parle plus de profilage de consommateur, mais bel et bien de profilage tout court. Ce n'est plus simplement le consommateur que je suis que l'on étudie, mais directement ma personnalité.

Alors certes, on pourrait répondre à ça que les données récoltées sont anonymes, que nous ne sommes pour DoubleClick qu'un numéro parmi des millions d'autres. On pourrait dire qu'on n'a rien à cacher, que ce n'est pas si grave.

Mais immaginons deux secondes que DoubleClick appartienne à une entreprise comme Google. Immaginons qu'en fait, le numéro que nous sommes pour DoubleClick puisse être lié à notre véritable identité. A notre boite GMail. A nos contacts. A notre historique de recherche. Aux autres traces que nous laissons, comme dans Google Analytics par exemple. A notre téléphone Android, et donc à notre géolocalisation en quasi-temps réel. On ne parlerait plus alors de 30%. Il est difficile de dire à quel point notre profil pourrait être détaillé, mais je pense qu'on se rapprocherait plutôt des 80%.

Et pour ceux qui n'ont rien à cacher, je leur demanderais simplement :

  • n'avez-vous jamais été sur un site peu convenable ?
  • n'avez-vous jamais téléchargé quelque-chose illégalement ?
  • n'avez-vous jamais envoyé un mail dont vous n'êtes pas très fier ?
  • n'avez-vous jamais recherché sur internet les syptômes dont vous soufriez ?
  • n'avez-vous jamais râlé sur internet contre votre employeur ?
  • n'avez-vous jamais cherché sur internet comment réduire vos impôts ?

Et si toutes ces informations étaient partagées avec votre banque, avec votre mutuelle santé, avec les impôts ? Avec vos proches ? Vous n'avez peut-être rien à vous reprocher aujourd'hui, mais si vous faisiez quelque-chose dont vous ne serez pas très fier demain ? Nos données sont déjà collectées, croisées. On le voit bien avec la publicité ciblée. Alors peut-être que tout ce profilage n'existe pas, aujourd'hui. Mais peut-être qu'il existera, demain. Alors il sera trop tard.

Ah, j'oublie le plus important: DoubleClick appartient bel et bien à Google, et ...