Administracja publiczna usiłuje blokować pobieranie moich danych, ale jej się nie uda

Obserwuję sobie od jakiegoś czasu, jak administracja publiczna (celowo nie będę wymieniał jeszcze konkretnych nazw instytucji, ale nie chodzi tylko o administrację rządową) zaczęła blokować komunikację z poszczególnych adresów IP. Chodzi o blokownie pobierania danych udostępnianych przez tą administrację publiczna na stronach internetowych. Prawdopodobnie w ten sposób administracja usiłuje chronić się przed położeniem ich infrastruktury (albo robi to z zazdrości o dane, chociaż chwilowo nie będę tego uwzględniał w dywagacjach), ale akurat w przypadkach, które obserwuję, pobieranie następuje z poszanowaniem infrastruktury administracji publicznej (nie są pobierane wszystkie dane na raz, a bardzo ostrożnie, by nie przeszkadzać innym użytkownikom Sieci). Uważam, że to zła tendencja. Administracja powinna się jakoś dostosować do potrzeb obywateli, w tym tych, którzy pobierają dane publiczne w celu ich ponownego wykorzystania. Poza wszystkim potrafię sobie wyobrazić (i pewnie też zastosować) kilkanaście sposobów obejścia takich "blokad".

Kiedyś rozmawiałem z jednym ministrem o pobieraniu danych z serwisu ministerstwa. Zaszokowany zaczął pytać, dlaczego chcę kopiować jego serwis. Odpowiedziałem, że to wcale nie jest jego serwis, tylko mój. On nim tylko czasowo zarządza i chciałbym, by robił to w odpowiedni sposób. Był bardzo skonfundowany. Postulat właściwego zarządzania serwisami dotyczy nie tylko ministrów, ale też szefów urzędów centralnych, sądów, etc.

Otóż przy kilku projektach dotyczących wykorzystywania danych publicznych obserwuję w kilku instytucjach próby blokowania ruchu po porcie 80 (a więc takim, z którego korzystają użytkownicy przeglądarek internetowych) z niektórych adresów IP. Wytypowano najpewniej crawlery, które pobierają informacje publikowane na stronach urzędów i ktoś uznał, że to dobry pomysł, by je zablokować. Oczywiście to tylko czasowe utrudnienie. Tego typu blokadę można obejść. Aby ustrzec się przed kopiowaniem opublikowanych treści administracja publiczna musiałaby zablokować całkiem dostęp do swoich stron z internetu. A to byłoby bez sensu.

Zgodnie z art. 32 Konstytucji RP:

1. Wszyscy są wobec prawa równi. Wszyscy mają prawo do równego traktowania przez władze publiczne.
2. Nikt nie może być dyskryminowany w życiu politycznym, społecznym lub gospodarczym z jakiejkolwiek przyczyny.

To samo musi dotyczyć możliwości (równego) dostępu do treści publikowanych na urzędowych (prawda, że urzędowych?) stronach internetowych.

Zwłaszcza, gdy pobieranie następuje w taki sposób, by równomiernie kierować ruchem (pobieraniem), by "nie robić peaków", czyli aby nie przeszkadzać innym użytkownikom Sieci w wygodnym korzystaniu z udostępnianych przez administracje publicznych informacji (por. Ewentualny atak serwerów Policji uważam za głupotę i nieodpowiedzialność).

Temu miał też służyć przepisy art. 23e znowelizowanej ustawy o dostępie do informacji publicznej:

Udostępnienie informacji publicznej w celu ponownego wykorzystywania nie może wprowadzać ograniczenia korzystania z tej informacji przez innych użytkowników,
chyba że jest to niezbędne dla prawidłowego wykonywania zadań publicznych.

Przepis sam w sobie nie jest doskonały. Stanowi tylko "sugestię", ale nikomu, kto ma zamiar na poważnie ponownie wykorzystywać informacje z sektora publicznego nie będzie zależało, by "zarzynać" źródło. Dlatego dane pobiera się z umiarem, stopniowo, z poszanowaniem innych użytkowników i z poszanowaniem samej infrastruktury publicznej.

Poza tym blokowanie IP to jest stale ten sam problem, który dotyczy podstaw prawnych działania administracji publicznej w Sieci (to jeden z elementów rekomendacji z warsztatu MAiC, któremu miałem przyjemność współprzewodniczyć; por. MAiC opublikował raporty powarsztatowe). Albo to, co administracja publiczna publikuje w Sieci to urzędowe publikacje, albo działają bezprawnie. Wybór jest prosty, ale kłopotliwy. Jeśli działają bezprawnie - ktoś powinien odpowiedzieć za przekroczenie uprawnień. Również karnie. Jeśli to publikacje urzędowe, to pewnie są BIP-ami, a jeśli są BIP-ami...

W każdym razie: wiem, że nie tylko ja mogę obserwować blokowania adresów IP przy mirrorowaniu całej administracji publicznej. Również koledzy i koleżanki zajmujący się komercyjnym re-use, też są czasem blokowani. Każdej akcji towarzyszy reakcja i dlatego w sytuacji zablokowania danego adresu trzeba zacząć się ukrywać. Co wcale nie zmienia natężenia pobierania. Po prostu obchodzi się drobne utrudnienia. Jak wspomniałem - aby zablokować mirrorowanie administracji publicznej - trzeba by zablokować wszystkim dostęp do treści. A tego pewnie nikt nie wprowadzi (poza tym, że sam postuluję ograniczenie liczby pączkujących bez podstawy prawnej serwisów internetowych administracji publicznej).

No, dobrze. Zatem co w zamian? Proponuję, by stworzyć kodeks dobrych praktyk, a raczej zbiór best practices w zakresie udostępniania informacji publicznych do re-use. Przypuszczam, że taki kodeks będzie też miło powitany przez branże (komercyjna i niekomercyjną). To, obok udostępniania otwartych API, to szansa na to, by administracja publiczna przyjęła sugestie pozwalające jej na dostosowanie się do realiów i oczekiwań.

Ale nie zablokujecie nikomu możliwości kopiowania publikowanych informacji. "Niedasie". Teraz już wiecie. Pogódźcie się z tym. I przestańcie przeszkadzać obywatelom.

Opcje przeglądania komentarzy

Wybierz sposób przeglądania komentarzy oraz kliknij "Zachowaj ustawienia", by aktywować zmiany.

kodeks dobrych praktyk reuse

ksiewi's picture

Czy mnie pamięć myli, czy Ty przypadkiem nie byłeś przeciwko kodeksom dobrych praktyk jakiś czas temu, w jakiejś innej sprawie?

Nie myli Cię pamięć

VaGla's picture

Nie myli Cię pamięć. Ostrożnie podchodzę do samoregulcji biznesu. To czasem element uciekania przed powszechnie obowiązującym prawem w sfery miękkie, niezagrożone sankcjami (jak w zdaniu "branża polska woli samoregulację, niż sytuację, w której prawodawca silnie przykręci śrubę, wprost zakazując pewnych działań, albo, gdy regulator po prostu zacznie stosować przepisy" (por. Branża reklamowa zachwyca się behawioralnym targetowaniem reklam, które niepokoi Komisję Europejską oraz Kongres USA)). Tu zaś chodziło mi nie tyle o samoregulację (jak administracja publiczna zacznie się oficjalnie samoregulować, ignorując art. 7 Konstytucji, to zginęliśmy), a kodeks w znaczeniu zbiór. Zbiór dobrych praktyk - w sensie "best practices". Dziękuję za czujność. Uzupełnię o to powyższy felieton, by rozwiać wątpliwości).
--
[VaGla] Vigilant Android Generated for Logical Assassination

Zapewne jest to ochrona

Zapewne jest to ochrona przed DoSowaniem. Blokada następuje po przekroczeniu określonej liczby połączeń z jednego numeru IP w określonym czasie. Np. 300 połączeń na 30 sekund.

Administracja blokuje...

A czasami takie blokowanie nie jest łamaniem prawa?
Przecież robot służy właśnie dostępowi do informacji publicznej, więc jego blokowanie jest uniemożliwieniem działania...

W mojej opinii czas pomysleć o narzędziu

które działałoby tak - uczestnik programu "Nasza Polska" instaluje sobie wtyczkę do FF, Chrome, Opery i wtyczka owa za pomocą http ściąga potrzebne dane do cache jego przeglądarki, zaś za pomocą p2p ( niekoniecznie, ale czemu nie?) - przesyła je do sejmometru.
Przy stosownej powszechności programu - zablokować należy każdego w tym kraju - co zresztą rząd prędzej czy później zrobi ( ale wtedy blokada neta to będzie nasz najmniejszy problem)...

Z tym blokowaniem jest jak z

Z tym blokowaniem jest jak z pracą przynajmniej części naszej administracji. Niektórym wydaje się, że jak COŚ tam zrobili to wystarczy. A już fakt, że dziecko potrafi to obejść jest już nieistotny.

Sposób myślenia "onych" pokazuje przykład ministra, który mówi o "jego stronach". To niestety bardzo często spotykany sposób myślenia "onych"

http://pogodynka.pl/polska/os

http://pogodynka.pl/polska/ostrzezenia

Instytut utrzymywany z naszych podatków nawet informacje o zagrożeniach reglametuje...

Piotr VaGla Waglowski

VaGla
Piotr VaGla Waglowski - prawnik, publicysta i webmaster, autor serwisu VaGla.pl Prawo i Internet. Członek Rady ds Cyfryzacji przy Ministrze Cyfryzacji, ekspert w Departamencie Oceny Ryzyka Regulacyjnego Ministerstwa Rozwoju, felietonista miesięcznika "IT w Administracji" (wcześniej również felietonista miesięcznika "Gazeta Bankowa" i tygodnika "Wprost"). Uczestniczył w pracach Obywatelskiego Forum Legislacji, działającego przy Fundacji im. Stefana Batorego w ramach programu Odpowiedzialne Państwo. W 1995 założył pierwszą w internecie listę dyskusyjną na temat prawa w języku polskim, Członek Założyciel Internet Society Poland, pełnił funkcję Członka Zarządu ISOC Polska i Członka Rady Polskiej Izby Informatyki i Telekomunikacji. Był również Członkiem Rady Informatyzacji przy MSWiA, członkiem Zespołu ds. otwartych danych i zasobów przy Komitecie Rady Ministrów do spraw Cyfryzacji oraz Doradcą społecznym Prezesa Urzędu Komunikacji Elektronicznej ds. funkcjonowania rynku mediów w szczególności w zakresie neutralności sieci. W latach 2009-2014 Zastępca Przewodniczącego Rady Fundacji Nowoczesna Polska, w tym czasie był również Członkiem Rady Programowej Fundacji Panoptykon. Więcej >>