Ghost referral spam bei Google Analytics

Beim heutigen Blick auf den Google Analytics Account für unsere Website k-webs.ch ist uns aufgefallen, dass derzeit wieder ein relativ grosser Teil unseres Traffics durch Spam Referrals zustande kommt. Und dies, obwohl wir seit Semalt und Co. (hier eine informative Zusammenfassung zum Thema: http://philiseo.de/semalt-crawler-blockieren/) bereits eine ellenlange Liste via .htaccess ausgesperrt haben.

 

Eine genauere Recherche führte uns zu der Erkenntnis, dass sich dieser neue Spam nicht so einfach blockieren lässt. social-buttons.com (die wir natürlich nicht verlinken) funktioniert nach einem anderen Prinzip als die altbekannten Referrals. Üblicherweise wird die betroffene Seite aufgerufen, wodurch ein GET Request an Google Analytics gesendet wird. Falls es sich um Spam handelt, kann dieser via .htaccess einfach vom Aufrufen der Seite abgehalten werden. Bei sogenanntem Ghost Referral Spam wird ein anderer Weg genutzt: Analytics Codes werden zufällig ausprobiert, wobei die Chance einen “echten” Code zu treffen scheinbar relativ hoch ist. Nun wird direkt ein GET Request mit diesem Code gesendet, ohne dass die zugehörige Website jemals aufgerufen wurde.

Der Sinn dahinter scheint zu sein, dass unvorsichtige Webmaster die Seite aufrufen, die plötzlich so viel Traffic auf der eigenen Seite produziert und dort entweder Hits generieren oder eventuell sogar Schadcode herunterladen. Ob sich das lohnt mag man bezweifeln, aber die Menge an Referrals dieser Tage deutet doch an, dass man einen gewissen Nutzen daraus schlagen kann.

 

Nur, wie werde ich diese Ghost Referrals wieder los? Wirklich blockieren lassen sie sich nicht, da sie ja nicht über den eigenen Server laufen und somit nicht greifbar für uns sind. Es wurden verschiedene Lösungen beschrieben, von denen wir hier die in unseren Augen nachhaltigste wiedergeben:

Die Lösung basiert auf der Tatsache, dass der Spam immer auf die Startseite der Site verweist, was bei Google Analytics der URI / entspricht. In der Google Analytics Dokumentation ist beschrieben, wie die übermittelte URI durch folgendes JavaScript Snippet überschrieben werden kann:

ga('send', 'pageview', '/my-overridden-page?id=1');

Dies können wir uns nun zunutze machen und auf der Startseite beispielsweise /index.html oder /index.php übermitteln lassen:

ga('send', 'pageview', '/index.html');

Über einen Filter können wir nun bei Analytics selbst alle Seitenaufrufe auf die URI / ausblenden, da diese keine echten Aufrufe mehr sein können. Somit sind die Ghost Referral Spams nicht mehr im Report sichtbar. Ob sich dieser Aufwand wirklich lohnt muss jeder individuell entscheiden, wir behalten die Aufrufe erstmal im Auge und sehen was die Zukunft bringt.

Eine detailliertere Beschreibung zu diesem Problem finden Sie hier: http://veithen.github.io/2015/01/21/referrer-spam.html

Edit 10.06.15 – Ich bin gerade auf diesen umfassenden Artikel zu Spam in Google Analytics gestossen. Dem habe ich nichts mehr hinzuzufügen.

Edit 03.05.16 – Google hat in dieser Frage tatsächlich nachgelegt. Seit einiger Zeit bietet Google Analytics eine Checkbox an, über die ein automatischer Filter für Bots und Spiders aktiviert werden kann. Die Funktion befindet sich unter Verwalten -> Datenansicht -> Einstellungen der Datenansicht:

bots-filtern

Ein Kommentar zu “Ghost referral spam bei Google Analytics

  1. Pingback: Blockieren von Spam anhand der IP-Adresse | k-webs tech blog

Schreiben Sie einen Kommentar

Ihre E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.