Strona informacyjna
Powrót do pulpitu Agregaty, minimalizacja danych i bezpieczeństwo

Bezpieczna analiza statystyczna

Escortometr powstał jako projekt statystyczny. Jego celem nie jest tworzenie katalogu ogłoszeń, archiwum profili ani narzędzia do identyfikowania konkretnych osób. Interesują nas wyłącznie zjawiska widoczne w skali zbiorczej: liczby, trendy, zmiany regionalne i ogólna dynamika rynku.

Od początku przyjmujemy zasadę minimalizacji danych. Jeżeli dana informacja nie jest potrzebna do przygotowania bezpiecznej statystyki, nie powinna trafiać do systemu, nie powinna być zapisywana i nie powinna być później pokazywana użytkownikom.

Zakres publiczny

Tylko agregaty

Na stronie pokazujemy dane zbiorcze, bez profili, linków, telefonów, zdjęć i opisów.

Poziom analizy

Wyniki wyszukiwania

Worker pracuje na licznikach i filtrach, a nie na treści pojedynczych profili.

Dane z poziomu wyszukiwarki

Analizujemy zjawisko, nie osoby.

Workery Escortometru są projektowane tak, aby pracować na poziomie wyników wyszukiwania, filtrów i liczników. W praktyce system odpowiada na pytania typu: ile wyników spełnia dany warunek, jak zmienia się liczba ogłoszeń w czasie albo jak wygląda rozkład danych w województwach.

Nie budujemy kopii zewnętrznych serwisów i nie tworzymy własnego katalogu profili. Publiczny dashboard jest warstwą statystyczną, a nie wyszukiwarką ogłoszeń.

Czego nie zapisujemy

Prywatność jest ważniejsza niż szczegółowość.

W projekcie obowiązują reguły poufności, które ograniczają zakres przetwarzanych informacji. Nie zapisujemy numerów telefonów, zdjęć, opisów ogłoszeń, linków do konkretnych profili, identyfikatorów profili, danych kontaktowych ani historii pojedynczych ogłoszeń.

Jeżeli informacja mogłaby prowadzić do rozpoznania konkretnej osoby albo konkretnego ogłoszenia, nie powinna pojawiać się w publicznym systemie statystycznym.

Bez profili i archiwów

Nie śledzimy pojedynczych ogłoszeń.

Worker nie działa jak crawler odwiedzający profile jeden po drugim. Nie interesuje nas to, kto stoi za konkretnym ogłoszeniem, nie próbujemy ustalać tożsamości i nie tworzymy osi czasu dla pojedynczych profili.

Wyniki prezentowane na stronie są efektem zliczeń i przeliczeń statystycznych. Użytkownik widzi liczby, udziały procentowe, trendy i porównania regionalne, a nie dane źródłowe.

Dlaczego nie pokazujemy pełnych danych

Część informacji mogłaby być technicznie możliwa do zebrania, ale nie oznacza to, że powinna być zbierana lub publikowana. Przyjmujemy zasadę ostrożności: jeżeli jakiś typ informacji mógłby komuś zaszkodzić, prowadzić do identyfikacji albo stworzyć niepotrzebne ryzyko, nie powinien pojawiać się w publicznym dashboardzie.

Dlatego Escortometr nie publikuje szczegółowych rekordów, pojedynczych ogłoszeń ani danych źródłowych. Celem jest zrozumienie szerszych zjawisk, a nie analiza konkretnych osób.

Nie ujawniamy wszystkiego technicznie

Staramy się być transparentni, ale nie publikujemy pełnej specyfikacji działania workerów, reguł bezpieczeństwa i kontroli danych. Pełne ujawnienie szczegółowych mechanizmów mogłoby ułatwić obchodzenie zabezpieczeń albo niewłaściwe wykorzystanie informacji o sposobie działania systemu.

Publicznie opisujemy zasady: brak profili, brak danych kontaktowych, brak zdjęć, brak treści ogłoszeń, brak identyfikatorów i publikowanie wyłącznie agregatów statystycznych.

Dane publiczne są ograniczone

Dashboard pokazuje wybrany zakres.

Publiczny dashboard obejmuje ograniczony horyzont danych, np. ostatnie 60 dni. Pozwala to obserwować aktualne trendy, ale ogranicza ryzyko tworzenia zbyt szczegółowego archiwum widocznego dla każdego odwiedzającego.

Szersze zestawienia, jeżeli są przygotowywane, mają charakter analityczny i zagregowany. Nie są publicznym katalogiem ogłoszeń.

Deduplikacja to szacunek

Nie jest rozpoznawaniem osób.

Jeżeli w projekcie pojawiają się informacje o możliwych duplikatach, służą one wyłącznie poprawie jakości danych zbiorczych. Taki mechanizm nie jest potwierdzeniem, że dwa ogłoszenia należą do tej samej osoby.

Nie publikujemy par ogłoszeń, nie wskazujemy podobnych profili i nie pokazujemy mechanizmów, które mogłyby zostać użyte do śledzenia konkretnych osób.

Podstawowe zasady

Proste reguły zamiast zbędnego ryzyka.

Nie tworzymy katalogu osób. Nie archiwizujemy profili. Nie zapisujemy numerów telefonów, zdjęć ani opisów. Nie pokazujemy surowych danych źródłowych. Pracujemy na agregatach, statystykach i ograniczonym zakresie danych publicznych.

Dzięki temu Escortometr może pokazywać trendy i dane społeczne bez tworzenia narzędzia, które mogłoby kogokolwiek narażać.