Die aktuellen Besucherzahlen des Blogs
Seit diesem Mittwoch purzeln die Besucherzahlen in diesem Blog, wie man gut in den Statistiken sehen kann. Aber er wurde nicht in Suchmaschinen abgewertet oder ist schlecht erreichbar. Vergleiche meiner eigenen Statistiken mit Google Analytics waren immer noch recht unterschiedlich, und auf meiner Seite viel zu hoch. Bisher hatte ich immer nur versucht IP-Bereiche auszufiltern nach Ländern und Blacklisten.Nun bin ich umgestiegen aus eine Kombination aus Session-Cookies und IP`s. Es wird ein Session-Cookie gesetzt, mit einem aktuellen Timestamp (Anzahl der Sekunden seit dem 1. Januar 1970). Wenn dieser gesetzt ist, wird die IP per Ajax an eine weitere Datei übertragen, welche die IP speichert. An dieser Stelle kommt garantiert ein Aufschrei eines jeden Datenschützers. Zur Beruhigung kann ich aber mitteilen, dass die IP-Adresse dabei mit einer Einmal-Verschlüsselung in einen nicht Rückwandlungsfähigen Hash gewandelt wird, und auch dieser wird um Punkt 0 Uhr eines jeden Tages verwandelt in einen einzigen Count, der aussagt wieviele Benutzer am Tag auf dem Blog waren.
Mit dieser Änderung liegt meine Berechnung der Besucherzahlen sogar unter der von Google Analytics. Aber das soll mir recht sein. Ich habe lieber korrekte Zahlen, als zu hohe Werte. Paranoide Besucher mit aktivierter Privatsphäre, die keine Cookies akzeptieren, oder kein Javascript aktiviert haben, werden nicht mitgezählt.
Nach meiner Auffassung ist das in der heutigen Zeit die einzige Möglichkeit die Bots und automatisierten Abfragen nicht mitzuzählen, denn schon lange handelt es sich nicht mehr nur um Suchmaschinen, die sich durch das Internet crawlen. Jeder Server hat die nötigen Fähigkeiten um eine Internetseite auszulesen. In PHP ist curl eine absolut perfekte Funktion dafür, die sogar Cookieinhalte speichern oder Browseridentikationen (Useragents) mitgeben kann. Aber auch jede andere Programmiersprache kann so etwas. Das Auslesen selbst ist absolut problemlos. Die Weiterverarbeitung und Speicherung sind die eigentlichen Probleme der meisten Nutzer solcher Crawler.
Der Artikel wurde am 27.11.2010 von Stefan Kremz + veröffentlicht.
Ähnliche Artikel in diesem Blog
Mein neuer Graph in der Administration vom 05.12.2008
Google updatet wieder vom 30.05.2009
Erste Vorteile eines Blogs vom 14.11.2009
Meine Top-Keywords des Jahres 2010 vom 15.01.2011
Google Analytics mit IP-Anonymizer vom 20.04.2011
Mein neuer Graph in der Administration vom 05.12.2008
Google updatet wieder vom 30.05.2009
Erste Vorteile eines Blogs vom 14.11.2009
Meine Top-Keywords des Jahres 2010 vom 15.01.2011
Google Analytics mit IP-Anonymizer vom 20.04.2011

