Historia przeglądania wystarczy, aby cię zidentyfikować

Historia przeglądania wystarczy, aby cię zidentyfikować

3 września 2020 0 przez Rafał Skrzypek

Identyfikacja użytkownika po historii przeglądania stron internetowych? Tak, to możliwe i nie wymaga nawet szczególnych nakładów. Wystarczy nawet 50 najczęściej odwiedzanych stron, aby reklamodawca był w stanie określić, kto aktualnie kliknął jego baner.

Badacze Mozilli opublikowali ostatnio raport, który może zmrozić praktycznie każdego użytkownika internetu. Okazuje się bowiem, że na podstawie stron, które odwiedzają ludzie, da się precyzyjnie scharakteryzować profil odwiedzającego dowolną stronę. Jak wynika z badań, praktycznie każdy ma na tyle unikalny sposób i „rytm” otwierania witryn, że można określić, kto to jest.

To nie pierwsze takie studia

Podobne badania (Why Johnny Can’t Browse in Peace: On the Uniqueness of Web Browsing History Patterns) prowadzono w 2012 roku na próbie 380 tys. użytkowników. Już wtedy okazało się, że nawet 97% z nich można zidentyfikować posługując się ich internetowymi preferencjami. Naukowcy użyli wtedy specjalnie spreparowanej strony, której CSS miał sprawdzić, jakie domeny z listy 6000 wcześniej zdefiniowanych odwiedzali testowani.

Badania z tego roku przeprowadzono na mniejszej próbie – tylko 52 tys., ale tym razem historia przeglądania pobierana była bezpośrednio z Firefoxa. Co ciekawe, to dokładnie takie same dane, jakie może zdobyć firma zajmująca się analizą ruchu sieciowego na podstawie współdzielonych przez inne instytucje informacji, aplikacji mobilnych lub reklam. Udowodniono, że historia przeglądania 99% użytkowników zdradza ich tożsamość.

Tym razem wzrosła też precyzja rozpoznawania. Osiem lat temu 50% badanych dawało się namierzyć na podstawie 50 adresów. Dziś ta sama liczba domen pozwala na identyfikację 80% odwiedzających. Przy 150 stronach nie ma praktycznie możliwości, aby mechanizm się pomylił.

Okazuje się więc, że w powiedzeniu: „Nikt nie jest anonimowy w internecie” tkwi dużo prawdy. Firmy analitycznie nie potrzebują wiele informacji z naszej przeglądarki, a dane, które otrzymują, mogą być zanonimizowane, aby nas zidentyfikować. Zachowanie prywatności w sieci jest więc praktycznie niemożliwe, co nie znaczy, że nie należy próbować.