La confidentialité dans la recherche sur internet

Il y a eu récemment des déclarations assez effrayantes à propos de Google et de la confidentialité des demandes de recherche. Vous avez peut-être entendu dire que Google a été nominé pour un prix « Big Brother ». Vous avez peut-être également lu que Google sait tout ce que vous avez déjà recherché. Faut-il avoir peur ? Il est temps de boycotter Google pour se protéger, comme l’a appelé le blogueur Gavin Sheridan le mois dernier ?
Relaxer. Oui, il y a des problèmes de confidentialité à prendre en compte lorsque vous effectuez une recherche sur Google. Cependant, ces problèmes sont tout aussi préoccupants pour les autres moteurs de recherche que vous visitez. Plus important encore, la crainte que vous puissiez être personnellement suivi n’est pas réaliste, pour la grande majorité des utilisateurs, du moins par Google lui-même.
Dans cet article, nous examinerons de plus près ce que Google sait exactement de vous, lorsque vous effectuez une recherche – et nous verrons pourquoi vous n’avez pas besoin de vous inquiéter autant pour le moment.
Fait ou fiction?
Il n’est pas étonnant que les gens s’inquiètent pour la confidentialité de Google et des recherches après avoir lu des déclarations comme celles-ci :
Google établit un profil détaillé de vos termes de recherche sur de nombreuses années. Google savait probablement quand vous avez pensé pour la dernière fois que vous étiez enceinte, seo Arras quelles maladies vos enfants ont eues et qui est votre avocat spécialisé dans le divorce.
Je n’aime pas que ses cookies expirent dans 35 ans et qu’il enregistre toutes mes recherches, y compris les plus embarrassantes.
La réalité est que Google ne sait pas qui vous êtes personnellement, en tant qu’individu nommé. Son utilisation de cookies, qui n’est guère unique, ne lui donne pas la capacité magique de voir votre visage et de connaître votre nom, à travers l’écran de votre ordinateur.
Au lieu de cela, tout ce que Google sait, c’est qu’un logiciel de navigation particulier, sur un ordinateur particulier, a fait une demande. Un cookie lui donne la possibilité de voir potentiellement toutes les demandes faites par ce logiciel de navigation particulier, au fil du temps. Cependant, Google ne sait toujours pas qui était assis devant le navigateur lorsque la demande a été faite.
Ressources
740674ce2123e969
Pas de nom, pas d’adresse, pas de numéro de téléphone. En fait, si quelqu’un d’autre est assis devant mon ordinateur, Google ne peut même pas dire que quelqu’un de nouveau est en train de chercher.
Qu’est-ce que Google enregistre ?
Revenons un instant en arrière et voyons ce qui se passe lorsque vous entrez dans Google, pour comprendre comment ce numéro de cookie unique vous est attribué et, surtout, ne dit rien à Google sur qui vous êtes personnellement.
Supposons que vous n’y êtes jamais allé auparavant. Vous visitez le site et recherchez des voitures. Qu’est-ce que Google enregistre ?
Comme indiqué dans sa politique de confidentialité, Google note des éléments tels que l’heure de votre visite, votre adresse Internet et le type de navigateur que vous utilisez. Tout cela est enregistré dans ce qu’on appelle un fichier journal. C’est également une pratique courante pour les serveurs Web de garder une trace de ces informations, donc Google ne fait rien d’inhabituel.
A quoi cela ressemble-t-il ? Voici un exemple simplifié de la façon dont notre « recherche de voitures » peut apparaître dans les journaux de Google :
– 25/mars/2003 10:15:32 – ?q=voitures » – MSIE 6.0 ; Windows NT 5.1 – 740674ce2123e969
Même de la manière simplifiée que j’ai montrée, l’exemple peut encore vous sembler un gâchis. Cela a plus de sens, lorsqu’il est décomposé :
25/mars/2003 10:15:32
?q=voitures
MSIE 6.0 ; Windows NT 5.1
(affiche le navigateur que j’ai utilisé et le système d’exploitation,
MS Internet Explorer 6 sur Windows XP)
740674ce2123e969
Mon adresse Internet
D’après les informations clés ci-dessus, si Google veut savoir qui je suis exactement, l’élément le plus important est mon adresse Internet (c’est ce qu’on appelle mon adresse IP, lorsqu’elle n’est pas résolue » et transformée en nom de domaine) :
Comme vous pouvez le voir, cette adresse ne dit rien sur le fait que je sois personnellement Danny Sullivan. NTL est un grand fournisseur d’accès Internet au Royaume-Uni que j’utilise pour accéder au Web. L’adresse Internet représente le nom de l’ordinateur NTL qui traite mes demandes. (Pour les curieux, la raison pour laquelle le nom de recherche familier Inktomi est mentionné est probablement un vestige de l’époque où Inktomi fournissait des services de mise en cache Internet aux FAI tels que NTL).
NTL lui-même pourrait consulter ses dossiers, puis savoir que je me suis personnellement connecté au Web. Cependant, il ne transmet pas mon nom à Google. Cela signifie qu’au plus, tout ce que Google sait, c’est qu’un utilisateur de NTL est venu nous rendre visite.
Il est vrai que dans certains cas, l’adresse Internet d’une personne peut être liée plus personnellement à ce moment-là. Par exemple, vous travaillez peut-être dans une entreprise où l’ordinateur de tout le monde porte un nom qui correspond au sien. Ensuite, votre adresse Internet pourrait peut-être ressembler à ceci :
De telles situations sont généralement rares. Ils ne garantissent pas non plus que vous êtes personnellement assis devant un ordinateur qui utilise votre nom dans le cadre de son adresse Internet. Néanmoins, c’est une bonne raison pour les administrateurs système de ne pas lier les adresses Internet à des données personnelles comme des noms.
Et le cookie ?
Pourquoi Google voudrait-il savoir que vous l’êtes, de toute façon ? L’une des raisons est que certaines personnes définissent des préférences, telles que voir plus de 10 pages à la fois ou ne voir les résultats qu’en anglais. Il est également utile pour les propres raisons internes de Google de savoir à quelle fréquence des utilisateurs uniques viennent sur son site et comment ils se comportent lors de la recherche.
Malheureusement, Google ne peut pas se fier uniquement à votre adresse Internet pour savoir s’il vous a déjà vu, en tant que chercheur anonyme mais unique. Par exemple, imaginez que je me déconnecte pendant quelques heures, puis que je me reconnecte. Maintenant, mon adresse NTL peut être légèrement différente. Ou si j’ai du mal à obtenir une bonne connexion avec NTL, je peux basculer sur mon compte AOL. Dans tous ces cas, je suis la même personne mais avec trois adresses internet différentes. Cela signifie pour Google, je suis trois personnes différentes.
Un cookie résout ce problème, c’est pourquoi tant de sites les utilisent. Avec un cookie, quel que soit le FAI que j’utilise pour me connecter, Google sait qu’il a déjà vu mon navigateur particulier. C’est parce qu’il place un identifiant numérique unique dans une partie de mon navigateur conçue pour ceux-ci. Ensuite, chaque fois que mon navigateur parle à Google, il envoie mon identifiant unique, afin que Google se souvienne de qui je suis, du moins dans la mesure où je suis un navigateur unique sur un ordinateur particulier.
Google ne sait toujours pas qui je suis personnellement, bien sûr. En effet, si ma femme s’assoit devant mon ordinateur et effectue une recherche, Google n’a aucune idée que l’âge et le sexe de la personne effectuant la recherche ont soudainement changé. Il voit toujours le même cookie, car elle utilise mon navigateur.
De plus, si j’utilise mon ordinateur portable en voyage, celui-ci a un identifiant différent. En ce qui concerne Google, je suis une personne différente. De même, si j’ai Netscape Navigator et Internet Explorer sur mon ordinateur, Google attribuera à chaque logiciel de navigation son propre identifiant unique. Cela signifie que si je change de navigateur, je deviens une personne différente de Google.
La nomination du grand frère
D’après ce qui a été exploré ci-dessus, vous pouvez voir qu’il est possible que Google connaisse toutes les recherches effectuées par un navigateur particulier. Cependant, c’est loin d’avoir un profil personnel de ce qu’une personne nommée a recherché.
Alors, comment sommes-nous passés de Google à l’aide de cookies anonymes à une situation où certaines personnes semblent croire qu’à tout moment, Google peut ordonner votre historique de recherche personnel ? Cela est principalement issu de la nomination de Google par le site Web Google Watch pour les 2003 US Big Brother Awards de Privacy International.
Mon article connexe, Google And The Big Brother Nomination , examine en détail les accusations portées contre Google en matière de confidentialité par Google Watch. C’est un long article, alors permettez-moi de résumer pour dire que je n’ai ressenti aucune des accusations présentées comme un signe que Google lui-même abusait de la vie privée.
De plus, il est important de noter que même si Google a été nominé pour les prix Big Brother, Privacy International lui-même n’a pas sélectionné Google comme finaliste. De toute évidence, Google n’était pas considéré comme une grande menace pour la vie privée.
Néanmoins, certaines personnes ont pris le simple fait que Google a été nominé comme un signe de mauvaise conduite, ce qui est particulièrement mauvais étant donné que n’importe qui peut nommer n’importe quelle entreprise pour le prix. Pire encore, certains ont mal compris les accusations dans la nomination pour supposer à tort que Google doit avoir des profils personnellement identifiables d’eux.
Alors, comment savez-vous que c’est moi personnellement?
Informations personnellement identifiables » C’est une phrase importante à comprendre. Il est utilisé dans le monde de la protection de la vie privée pour dire que certaines entreprises possèdent des informations qui leur permettent de savoir honnêtement et véritablement dans une certaine mesure qui vous êtes personnellement.
Par exemple, dans le cas du cookie de Google, il ne sait rien de personnel sur vous. Comme dit précédemment, il sait seulement qu’un navigateur particulier et anonyme qu’il a vu auparavant a fait une demande.
En revanche, disons que vous êtes un membre Yahoo, où vous avez rempli un formulaire d’inscription donnant votre nom, adresse, âge et autres informations. En supposant que vous n’ayez pas menti en remplissant ce formulaire, Yahoo sait vraiment qui vous êtes, dans une certaine mesure, lorsque vous vous êtes connecté » au site Web. Contrairement à Google, Yahoo possède des informations personnellement identifiables.
De plus, comme Yahoo sait qui vous êtes personnellement lorsque vous êtes connecté, il a la capacité de savoir ce que vous avez personnellement recherché dans le passé, à chaque fois que vous vous êtes connecté. Il en va de même pour tout site de recherche où les utilisateurs peuvent créer des comptes.
Compte tenu de cela, s’inquiéter des cookies anonymes comme avec Google en tant que menace potentielle pour la confidentialité de la recherche est presque déplacé. Au lieu de cela, tout site de recherche avec un système d’enregistrement d’utilisateurs représente une préoccupation plus sérieuse.
L’essor et la chute de Yahoo Impulse Mail
Par exemple, à la fin de l’année dernière, Yahoo envisageait ce qui aurait été la première utilisation significative de l’historique de recherche personnalisé dans l’industrie. Un programme appelé Yahoo Impulse Mail aurait livré des publicités par e-mail ciblées en fonction de ce que vous avez recherché.
Le programme a été révélé dans un rapport de la conférence Direct Marketing Days de l’été dernier. Grâce au programme, toute personne disposant d’un compte de messagerie gratuit chez Yahoo qui n’avait pas refusé de recevoir des publicités de tiers pourrait recevoir des e-mails ciblés en fonction de ses habitudes de recherche. Les spécialistes du marketing n’enverraient pas cela directement, mais à la place, ils viendraient via Yahoo.
En d’autres termes, disons que vous avez recherché des voitures récemment. En conséquence, Yahoo pourrait vous envoyer une annonce par e-mail au nom d’une entreprise comme Ford, car en fonction de vos habitudes de recherche, Yahoo savait que vous étiez intéressé par les voitures.
Lorsque j’ai suivi avec un porte-parole de Yahoo au sujet du programme proposé l’année dernière, j’ai été rassuré que Yahoo ne partagerait aucune information personnelle avec les annonceurs. Ainsi, même s’il connaît mes habitudes de recherche, il ne parlera pas personnellement de moi à quelqu’un comme Ford. Au lieu de cela, il servirait d’intermédiaire.
Nous avons une politique stricte de conservation des informations sur les utilisateurs au sein de Yahoo. Yahoo ne vend ni ne loue les informations des utilisateurs à des tiers », a déclaré la porte-parole de Yahoo, Diana Lee.
On m’a également dit que les informations ne seraient utilisées que sous forme agrégée, impliquant l’anonymat en étant mélangées à de nombreuses autres. Cependant, je ne savais pas quelle protection cela était vraiment censé fournir. J’avais l’impression que Yahoo agrégerait une série de termes liés à une annonce par e-mail particulière, puis ces annonces seraient diffusées à la masse d’utilisateurs qui les recherchaient. Si c’était le cas, cela n’excluait pas le fait que les utilisateurs individuels seraient toujours surveillés personnellement, d’une manière ou d’une autre.
Une autre défense du programme était que les gens pouvaient refuser de recevoir ces e-mails ciblés.
L’essentiel est que les gens se soient inscrits et se soient connectés à leur compte de messagerie avant de faire la recherche », a déclaré Alan Thompson, producteur principal, dans un article sur le programme. Nous sommes très conservateurs en matière de confidentialité.
Pour moi, ce n’était pas rassurant. Bien sûr, vous pouvez refuser de recevoir l’e-mail. Cependant, Yahoo ne vous a pas donné la possibilité de vous désinscrire de la surveillance de la recherche lorsque vous êtes connecté en tant qu’utilisateur. Pour garder vos recherches privées de Yahoo, vous deviez plutôt vous déconnecter ouvertement d’un membre de Yahoo.
Alors, que s’est-il passé avec le programme? Aujourd’hui, Yahoo dit qu’il n’a jamais été officiellement annoncé, malgré l’histoire précédente le positionnant de cette façon. De plus, Yahoo dit qu’il n’a pas l’intention de le dévoiler. La société dit que c’était simplement une idée que certains membres du personnel de Yahoo envisageaient, a été brièvement testée, mais que Yahoo a finalement décidé de ne pas aller de l’avant.
Nous explorons des idées différentes tout le temps. Cela ne signifie pas que tous se concrétisent », a déclaré Lee.
Confidentialité et résultats de recherche personnalisés
Ainsi, la première extraction majeure des historiques de recherche personnelle n’a pas eu lieu. Cela ne veut pas dire qu’il ne reviendra plus. En effet, nous verrons presque certainement une telle exploitation minière se produire lorsqu’un moteur de recherche aura enfin le courage d’essayer des résultats de recherche personnalisés.
Dans un tel système, un moteur de recherche peut vous fournir des résultats personnalisés en fonction de votre âge, de votre sexe et d’autres informations démographiques ou personnelles. Pour ce faire, vous devez vous inscrire auprès du service et accepter qu’il surveille vos recherches et vos sélections d’annonces.
J’ai écrit pour la première fois sur le potentiel de tels systèmes en 1998, et j’ai soulevé les problèmes potentiels de confidentialité impliqués :
J’attends depuis longtemps qu’un journaliste découvre ce qu’un politicien recherche au travail, de la même manière que certains ont recherché des enregistrements de location de vidéos », écrivais-je à l’époque.
La recherche personnalisée reste dans le futur. En effet, Google a acquis une entreprise appelée Outride en septembre 2001 qui travaillait sur une solution de recherche personnalisée. Cependant, Google depuis n’a rien fait de public dans l’espace. Aucun autre moteur de recherche majeur ne suggère non plus qu’ils sont sur le point de le faire. Les préoccupations des utilisateurs concernant la confidentialité ont été un facteur clé pour freiner cette avancée dans la recherche, ont-ils déclaré dans le passé.
Il est temps de mettre en place de meilleures politiques de confidentialité ?
De toute évidence, certaines personnes s’inquiètent de la confidentialité de leurs demandes de recherche, que ce soit sur Google, Yahoo ou tout autre moteur de recherche. Google a pris le plus de chaleur sur ce problème ces derniers temps, et en grande partie sans raison.
Néanmoins, une chose utile que l’ensemble du secteur de la recherche pourrait faire est de réexaminer leurs politiques de confidentialité et d’envisager de les étendre pour fournir plus de détails sur ce qui se passe exactement avec les données de recherche sur une base personnelle.
Ci-dessous, je vais examiner les politiques de seulement deux moteurs de recherche, Yahoo et Google, pour illustrer certains changements et problèmes potentiels. Chris Sherman prévoit également un récapitulatif sur plusieurs autres moteurs de recherche, dans les semaines à venir, pour SearchDay
Politique de confidentialité de Yahoo Search
Lorsque j’ai examiné le programme Yahoo Impulse Mail l’année dernière, une autre défense offerte par Yahoo au sujet du programme proposé était que sa politique de confidentialité indiquait clairement que les recherches étaient surveillées. Examinons la partie de cette politique qui concerne la recherche :
Lorsque les visiteurs effectuent une recherche sur Yahoo, nous gardons une trace des termes de recherche les plus populaires. Vous pouvez enregistrer vos recherches et y accéder depuis votre page Mon Yahoo. La publicité qui vous est montrée peut être liée au terme de recherche que vous avez entré »
C’est l’étendue de l’utilisation des requêtes de recherche par Yahoo. Cela ne suggère en aucun cas que Yahoo puisse associer vos recherches à votre profil personnel, une capacité dont dispose l’entreprise, même si ce n’est pas quelque chose que Yahoo dit qu’il fait actuellement.
Le fait que vous puissiez enregistrer des recherches suggère évidemment que ces recherches enregistrées particulières pourraient être liées à vous. Cependant, c’est aussi une action que vous auriez explicitement choisi de faire.
Enfin, en ce qui concerne la diffusion de publicités, cela se faisait historiquement non pas en fonction de votre profil personnel mais plutôt en personnalisant en temps réel les publicités que vous voyez en fonction des termes que vous avez saisis.
Pourquoi la politique n’est-elle pas plus détaillée ? Mon explication est que jusqu’à présent, Yahoo ni aucun des autres moteurs de recherche n’ont ressenti le souci des consommateurs d’aller plus loin.
Par exemple, Yahoo a une page entière sur son utilisation des cookies, avec des paragraphes et des paragraphes d’informations. Il en va de même pour son utilisation de balises Web ou de bogues Web. Mais la confidentialité des recherches est couverte dans un seul paragraphe ? Ce qui donne? La réponse est que les consommateurs ont été très préoccupés par l’utilisation des cookies et les bogues Web, en particulier compte tenu des histoires alarmistes et des abus réels qui se sont produits.
En revanche, la confidentialité des recherches n’a tout simplement pas été soulevée comme un problème. Je soutiendrais cela en grande partie parce que personne n’en a abusé de quelque façon que ce soit. Bien que cela puisse continuer, les allégations soulevées à propos de Google signifient que l’ensemble du secteur des moteurs de recherche devra mieux expliquer ce qui se passe avec les données de recherche.
Politique de confidentialité de la recherche Google
Par exemple, comme indiqué, certaines personnes pensent que Google a des historiques de recherche personnalisés pour eux. Ce n’est pas le cas, et il devrait le dire dans sa politique de confidentialité. Au lieu de cela, il dit simplement :
Les informations personnellement identifiables vous concernant ne sont volontairement divulguées à aucun tiers.
Cela implique que Google dispose d’informations personnelles sur toute personne effectuant une recherche sur le site et peut causer plus d’inquiétude que de soulagement. Google dit plus tard :
Google ne collecte aucune information unique à votre sujet (telle que votre nom, votre adresse e-mail, etc.) sauf lorsque vous fournissez spécifiquement et sciemment ces informations. Google note et enregistre des informations telles que l’heure, le type de navigateur, la langue du navigateur et l’adresse IP à chaque requête.
C’est plus utile, mais imaginez une section qui explique spécifiquement ce que Google fait avec les recherches. Cela pourrait ressembler à ceci :
Lorsque vous effectuez une recherche sur Google, des informations sont enregistrées avec la recherche effectuée, telles que l’heure de la journée, le type de navigateur que vous avez utilisé, votre adresse Internet et un identifiant d’utilisateur anonyme fourni par notre cookie.
Les informations personnelles, telles que votre nom ou votre adresse e-mail, ne sont pas enregistrées. Google n’exige pas que ces informations soient fournies pour effectuer des recherches sur le Web. Elles peuvent être collectées si vous utilisez d’autres services Google, tels que Google Groupes. Cependant, aucune information personnelle collectée n’est jamais liée à l’identifiant anonyme attribué à vos demandes de recherche.
Google ne fournit jamais d’historique de recherche à des tiers, sauf si la loi l’y oblige. Dans ces cas, les historiques de recherche fournis ne contiennent aucune information personnelle vous concernant.
OK, c’est une idée approximative, ne couvre pas tout et pourrait certainement être mieux écrit. Cependant, une telle politique fournie par Google et d’autres aiderait certainement les consommateurs à mieux comprendre officiellement ce qui se passe lorsqu’ils recherchent. Pour une idée similaire, consultez la belle politique de confidentialité que Yahoo maintient sur l’adresse Internet ou la journalisation IP.
En ce qui concerne les services qui enregistrent des informations personnelles avec les recherches, je pourrais bien les voir offrir une option de désinscription. Ou, s’ils n’autorisent pas une option de retrait, ils devront peut-être fournir de meilleures garanties sur la façon dont ces informations sont protégées ou détruites au fil du temps.