Ich habe auch schon darüber nachgedacht, ich setze selbst Webalizer ein und ganz ehrlich ich möchte schon ganz gern wissen wieviele Leute so auf meinen Seiten rumtanzen

Deine Idee ist nicht schlecht aber solche Hashing-Tabellen finde ich nur bedingt sinnvoll. Diese Tabellen sind wieder abgreifbar, wenn sie nur im RAM liegen ist das nur halb so wild aber wer sagt denn das die Tanten vom *KA den Rechner runterfahren und sich nicht per Bundestrojaner Zugang verschaffen

Dazu kommt das eine Stunde vielleicht zu knapp ist. Ein RSS Reader kommt vielleicht alle 2 Stunden wieder und eigentlich willst du den ja nicht zweimal loggen... Das ganze ist nicht ganz trivial, wenns um einen selbst geht alles kein Problem aber wenn es um Kunden geht sehe ich mit der Anonymisierung durch mod-removeip echt ein Kommunikationsproblem

In einer längeren Diskussion zu diesem Thema kam bei uns die folgende Idee auf:
Das gute alte HTTP Protokoll liefert noch massig Informationen an den Webserver die nirgens gelogged werden die aber den Rechner des Clients recht gut beschreiben. In Verbindung mit der IP Adresse sogar für die Dauer der Verbindung sehr eindeutig. Zumindest eindeutig genug für Statistiken

Unser Gedanke ist nun der, diese Daten zu nutzen um die IP Adresse zu überlagern. Dazu verknüpft man einfach die IP mit den nicht geloggten Daten und speichert dann die überlagerte Adresse in den Logs. Dort finden sich dann wieder IP Adressen die aber nichts mit der ursprünglichen zu tun haben. Man nutzt also die Geschwätzigkeit des Protokolls um die Daten zu anonymisieren. Voraussetzung ist natürlich das die Streudaten nicht mitgelogged werden.