Jak zbieramy dane
Bezpieczna analiza statystyczna
Escortometr powstał jako projekt statystyczny. Jego celem nie jest tworzenie katalogu ogłoszeń, archiwum profili ani narzędzia do identyfikowania konkretnych osób. Interesują nas wyłącznie zjawiska widoczne w skali zbiorczej: liczby, trendy, zmiany regionalne i ogólna dynamika rynku.
Od początku przyjmujemy zasadę minimalizacji danych. Jeżeli dana informacja nie jest potrzebna do przygotowania bezpiecznej statystyki, nie powinna trafiać do systemu, nie powinna być zapisywana i nie powinna być później pokazywana użytkownikom.
Dane z poziomu wyszukiwarki
Analizujemy zjawisko, nie osoby.
Workery Escortometru są projektowane tak, aby pracować na poziomie wyników wyszukiwania, filtrów i liczników. W praktyce system odpowiada na pytania typu: ile wyników spełnia dany warunek, jak zmienia się liczba ogłoszeń w czasie albo jak wygląda rozkład danych w województwach.
Nie budujemy kopii zewnętrznych serwisów i nie tworzymy własnego katalogu profili. Publiczny dashboard jest warstwą statystyczną, a nie wyszukiwarką ogłoszeń.
Czego nie zapisujemy
Prywatność jest ważniejsza niż szczegółowość.
W projekcie obowiązują reguły poufności, które ograniczają zakres przetwarzanych informacji. Nie zapisujemy numerów telefonów, zdjęć, opisów ogłoszeń, linków do konkretnych profili, identyfikatorów profili, danych kontaktowych ani historii pojedynczych ogłoszeń.
Jeżeli informacja mogłaby prowadzić do rozpoznania konkretnej osoby albo konkretnego ogłoszenia, nie powinna pojawiać się w publicznym systemie statystycznym.
Bez profili i archiwów
Nie śledzimy pojedynczych ogłoszeń.
Worker nie działa jak crawler odwiedzający profile jeden po drugim. Nie interesuje nas to, kto stoi za konkretnym ogłoszeniem, nie próbujemy ustalać tożsamości i nie tworzymy osi czasu dla pojedynczych profili.
Wyniki prezentowane na stronie są efektem zliczeń i przeliczeń statystycznych. Użytkownik widzi liczby, udziały procentowe, trendy i porównania regionalne, a nie dane źródłowe.
Minimalizacja
Dlaczego nie pokazujemy pełnych danych
Część informacji mogłaby być technicznie możliwa do zebrania, ale nie oznacza to, że powinna być zbierana lub publikowana. Przyjmujemy zasadę ostrożności: jeżeli jakiś typ informacji mógłby komuś zaszkodzić, prowadzić do identyfikacji albo stworzyć niepotrzebne ryzyko, nie powinien pojawiać się w publicznym dashboardzie.
Dlatego Escortometr nie publikuje szczegółowych rekordów, pojedynczych ogłoszeń ani danych źródłowych. Celem jest zrozumienie szerszych zjawisk, a nie analiza konkretnych osób.
Ostrożność
Nie ujawniamy wszystkiego technicznie
Staramy się być transparentni, ale nie publikujemy pełnej specyfikacji działania workerów, reguł bezpieczeństwa i kontroli danych. Pełne ujawnienie szczegółowych mechanizmów mogłoby ułatwić obchodzenie zabezpieczeń albo niewłaściwe wykorzystanie informacji o sposobie działania systemu.
Publicznie opisujemy zasady: brak profili, brak danych kontaktowych, brak zdjęć, brak treści ogłoszeń, brak identyfikatorów i publikowanie wyłącznie agregatów statystycznych.
Dane publiczne są ograniczone
Dashboard pokazuje wybrany zakres.
Publiczny dashboard obejmuje ograniczony horyzont danych, np. ostatnie 60 dni. Pozwala to obserwować aktualne trendy, ale ogranicza ryzyko tworzenia zbyt szczegółowego archiwum widocznego dla każdego odwiedzającego.
Deduplikacja to szacunek
Nie jest rozpoznawaniem osób.
Jeżeli w projekcie pojawiają się informacje o możliwych duplikatach, służą one wyłącznie poprawie jakości danych zbiorczych. Taki mechanizm nie jest potwierdzeniem, że dwa ogłoszenia należą do tej samej osoby.
Nie publikujemy par ogłoszeń, nie wskazujemy podobnych profili i nie pokazujemy mechanizmów, które mogłyby zostać użyte do śledzenia konkretnych osób.
Podstawowe zasady
Proste reguły zamiast zbędnego ryzyka.
Nie tworzymy katalogu osób. Nie archiwizujemy profili. Nie zapisujemy numerów telefonów, zdjęć ani opisów. Nie pokazujemy surowych danych źródłowych. Pracujemy na agregatach, statystykach i ograniczonym zakresie danych publicznych.