Wie Google jemanden fast über das gesamte Internet verfolgen kann

Während Vorträgen oder gestern in der Vorlesung ernte ich regelmäßig ungläubige Blicke, wenn ich sage:

Wenn ihr ein Google-Konto nutzt – egal in welcher Art – kann euch Google praktisch über das gesamte Internet verfolgen.

Darauf möchte ich kurz im vorliegenden Microblog-Beitrag eingehen.

Zunächst ein paar Zahlen: Aus der Studie Online Tracking: A 1-million-site Measurement and Analysis geht hervor, dass Webseitenbetreiber mit über 80 % Google-Dienste (Google Analytics, DoubleClick, Schriftenarten, usw.) in Anspruch nehmen. Ganz simpel ausgedrückt: Auf 80% der Webseiten werden Google-Dienste in irgendeiner Art genutzt bzw. eingebunden.

Und jetzt nehmen wir mal Folgendes an:

  • Am frühen Morgen loggt sich jemand in sein GMail-Konto ein oder deaktiviert den Flugmodus von seinem Android-Smartphone. Just zu diesem Zeitpunkt bekommt Google praktisch mit, dass ihr »aktiv« werdet. Systembedingt übermittelt euer Gerät (Rechner, Smartphone) dabei auch die öffentliche IP-Adresse eures Anschlusses.
  • Ab diesem Moment hat Google folgende einfache Zuordnung: UserXY ist gerade mit der IP-Adresse »217.23.23.12« unterwegs. Diese einfache Information reicht Google schon aus, um euch fast über das gesamte Internet zu verfolgen – also Nachzuverfolgen welche Webseiten ihr aufruft.

Wie kommt es dazu? Nun beim Aufruf einer Webseite binden viele Webseitenbetreiber vielfach Google-Dienste ein. Dazu zählen bspw. Schriftarten, Werbung, Kartenmaterial, etc. Beim Besuch einer Webseite lädt euer Browser diese unterschiedlichen Ressourcen dann von den Google-Servern nach UND übermittelt wiederum systembedingt eure IP-Adresse.

Machen wir ein simples Praxisbeispiel und besuchen doch einfach mal die Seite von Dr. Schwenke. Dabei werden folgende 5 Google-Server kontaktiert:

  • ajax.googleapis.com
  • fonts.googleapis.com
  • fonts.gstatic.com
  • stats.g.doubleclick.net
  • www.google-analytics.com

Was passiert nun beim Einbinden einer Schrift via Google technisch?:

Host: fonts.googleapis.com
User-Agent: Mozilla/5.0 (X11; Linux x86_64; rv:52.0) Gecko/20100101 Firefox/52.0
Accept: text/css,*/*;q=0.1
Accept-Language: en-US,en;q=0.5
Accept-Encoding: gzip, deflate, br
Referer: https://drschwenke.de/
DNT: 1
Connection: keep-alive
Pragma: no-cache
Cache-Control: no-cache

Sobald der Browser die Schriftart vom Server »fonts.googleapis.com« nachlädt (Request-Header), übermittelt er nicht nur die IP-Adresse, sondern auch den HTTP-Referrer »https://drschwenke.de/«.

Das bedeutet: Durch die »freundliche« Mithilfe von Webseitenbetreibern weiß Google im Grunde ziemlich genau, wo jemand gerade im Internet surft. Sie haben alle dafür notwendigen Informationen:

  • Die IP-Adresse zu einem Google-Konto
  • Den HTTP-Referrer inklusive IP-Adresse

In Anbetracht dieser Möglichkeit erscheint es schon fast paradox, wenn wir über die IP-Adressanonymisierung via Google-Analytics diskutieren.

Hinweis

Mehr Hintergrundinformationen zu diesem Thema: Das kranke WWW: Stop using Google Web-Services.
Der Kuketz-Blog ist spendenfinanziert! Mitmachen ➡