Strona informacyjna
Powrót do pulpitu Metodologia, zakres danych i ograniczenia interpretacji

Jak czytać dane w Escortometrze

Escortometr jest dashboardem statystycznym. Oznacza to, że nie pokazuje pojedynczych ogłoszeń, profili ani danych kontaktowych. Pokazuje wyłącznie agregaty: liczby, udziały, rozkłady, trendy i porównania, które opisują zjawisko z większej odległości.

Dane należy traktować jako obraz wycinka rzeczywistości widocznego w publicznych wynikach ogłoszeniowych, a nie jako pełny opis całego seksworkingu. Projekt ma pomagać w obserwacji trendów, a nie w identyfikowaniu osób.

Typ danych

Agregaty

Publicznie prezentowane są wyłącznie dane zbiorcze, bez surowych rekordów.

Zakres publiczny

Ostatnie 60 dni

Widok publiczny służy obserwacji bieżących trendów, nie tworzeniu pełnego archiwum.

Co mierzymy

Skalę i dynamikę zjawiska.

Podstawowe wskaźniki pokazują liczbę wyników spełniających określone warunki, zmiany w czasie, różnice między województwami, największe ośrodki miejskie oraz wybrane cechy deklarowane w ujęciu zbiorczym.

Interesują nas odpowiedzi na pytania typu: ile ogłoszeń widać w danym regionie, czy liczba rośnie lub maleje, jak zmienia się rozkład wieku albo jaki udział mają ogłoszenia z określonymi cechami jakościowymi.

Czego nie mierzymy

Nie analizujemy konkretnych osób.

Escortometr nie jest katalogiem ogłoszeń, wyszukiwarką profili ani narzędziem do śledzenia aktywności. Nie zapisujemy numerów telefonów, zdjęć, opisów, linków do profili, identyfikatorów profili ani historii pojedynczych ogłoszeń.

Jeżeli informacja nie jest potrzebna do stworzenia bezpiecznej statystyki, nie powinna być częścią publicznego dashboardu.

Snapshoty

Dane są odczytami z konkretnego momentu.

Każdy odczyt należy traktować jak snapshot, czyli zapis stanu widocznego w określonym czasie. Liczby mogą zmieniać się wraz z aktualizacją źródeł, usuwaniem ogłoszeń, dodawaniem nowych wpisów albo zmianą dostępności filtrów.

Trendy powstają przez porównywanie kolejnych snapshotów. Jeżeli brakuje poprzedniego odczytu, system nie powinien wymuszać sztucznej zmiany.

Częstotliwość zależy od modułu.

Lżejsze dane, takie jak główne liczby, województwa, ranking miast czy podstawowe wskaźniki jakości, mogą być przeliczane częściej. Cięższe zestawienia, np. rozkłady wielowymiarowe albo raporty badawcze, mogą być aktualizowane rzadziej.

Status aktualizacji powinien być widoczny na osobnej stronie statusu danych. Dzięki temu użytkownik wie, kiedy dane zostały ostatnio przeliczone i czy nie są zbyt stare.

Widok publiczny nie jest pełnym archiwum.

Opublikowane dane na stronie obejmują ograniczony okres - ostatnie 60 dni. Taki zakres wystarcza do obserwacji bieżących trendów, a jednocześnie ogranicza ryzyko tworzenia zbyt szczegółowej historii dostępnej dla każdego.

Szersze archiwa, jeżeli są prowadzone, powinny pozostać zagregowane i dostępne tylko w uzasadnionym celu, np. badawczym lub instytucjonalnym.

Dane deklarowane

Nie są niezależnie potwierdzane.

Cechy takie jak wiek, wzrost, waga, języki, wyjazdy czy inne informacje profilowe należy traktować jako dane deklarowane. Dashboard nie potwierdza ich prawdziwości i nie przypisuje ich do konkretnych osób.

Ich wartość polega na obserwacji rozkładów w dużej skali, nie na ocenie pojedynczych ogłoszeń.

Deduplikacja beta

To szacunek, nie rozpoznanie osoby.

Deduplikacja beta służy wyłącznie poprawie jakości statystyk. Jej celem jest oszacowanie, czy część wyników może zawyżać ogólną liczbę ogłoszeń. Nie jest to potwierdzenie, że dwa wpisy należą do tej samej osoby.

System nie powinien publikować par ogłoszeń, podobnych profili ani szczegółów pozwalających odtwarzać mechanikę śledzenia.

Ograniczenia źródeł

To widoczny wycinek rynku.

Dane internetowe nie opisują całego zjawiska. Obejmują tylko ten fragment, który jest widoczny w publicznych wynikach i możliwy do bezpiecznego zagregowania. Brak danych w danej kategorii nie oznacza braku zjawiska w rzeczywistości.

Porównania między regionami należy interpretować ostrożnie, zwłaszcza gdy zmienia się dostępność źródeł, filtrów albo sposób publikacji ogłoszeń.

Progi prywatności

Stosujemy minimalne progi liczebności.

W trosce o anonimowość osób publikujących ogłoszenia stosujemy minimalne progi liczebności. Jeżeli dana grupa jest zbyt mała, nie pokazujemy dokładnej wartości; ograniczamy wtedy szczegółowość danych albo łączymy kategorię z większą grupą.

Porównywalność

Odczyty są wykonywane automatycznie i porównywalnie.

Odczyty wykonujemy w porównywalny, zautomatyzowany sposób, aby dane były jak najbardziej możliwie wierne. Stała metoda ogranicza przypadkowe różnice między kolejnymi odczytami i ułatwia obserwację realnych trendów.

Odpowiedzialna interpretacja

Liczby nie zastępują kontekstu.

Escortometr może wspierać analizę społeczną, ale nie zastępuje badań terenowych, wywiadów, analiz prawnych ani pracy organizacji społecznych. Dane statystyczne są punktem wyjścia, nie pełnym wyjaśnieniem zjawiska.

Najbezpieczniej czytać dashboard jako barometr trendów, a nie jako kompletną mapę rzeczywistości.