Rejestry publiczne da się wyposażyć w XML i udostępniać obywatelom informacje bezpłatnie

Captcha na stronach KRSW USA oficjalne publikatory zaczynają kosztować 0$ (zero dolarów), a poprzednio wydawnictwa "Official Journals of Government" kosztowały 17 tys $ za roczną prenumeratę jednego tytułu ("$17,000/year per product"). Jak to możliwe, że the Government Printing Office oraz the Office of the Federal Register postanowiły zejść z ceną do zera? Być może w USA ktoś uznał, że organizacja państwowa nie powinna działać jak sklepik. Sprawa nie jest taka prosta i czarno-biała, ale widać w USA kolejne działania p. Viveka Kundry, piastującego funkcję Federal Chief Information Officer-a (por. Chmura zastąpi pudełka, czyli dlaczego mi ręce opadły, gdy Prezydent RP promuje Google). W Polsce zamiast szeroko udostępniać informacje i pozwalać na jej wykorzystanie (w dowolnym, legalnym celu), zakłada się w serwisach CAPTCHA.

O amerykańskich publikatorach pisze Cory Doctorow w tekście US gov't drops price of journals from $17k to $0, adds XML to Federal Register!. Cytuje tam Carla Malamuda, który od pewnego czasu toczy walkę o udostępnianie informacji z sektora publicznego, w szczególności o udostępnianie obywatelom treści przyjmowanego i obowiązującego powszechnie w USA prawa (por. Jak przekonać Sejm, by przestał zabraniać korzystać z materiałów? Brać przykład z Malamuda?).

Doctorow linkuje do Government Printing Office (Open Source America's Operating System). Malamud zaś linkuje do FedThread.org/ ("a new way of interacting with the Federal Register"). Pod tym ostatnim linkiem można m.in. przeczytać:

The Federal Register is "[t]he official daily publication for rules, proposed rules, and notices of Federal agencies and organizations, as well as executive orders and other presidential documents." It's published by the U.S. government, five days a week. The Federal Register tells you what your government is doing, in a lot more detail than get from the news media.

Otóż to. W USA zaczyna się dziać coś, co opisywałem m.in. w tekście Przejmujemy państwo. W Polsce będzie z tym nieco trudniej, bo u nas - jak uważam:

  1. nie ma jednej osoby, która odpowiedzialna byłaby tylko i wyłącznie za stworzenie systemu otwierania i udostępniania informacji z sektora publicznego (dla przykładu: wikipedystyczne hasło poświęcone Vivekowi Kundrze, piastującemu funkcję Federal Chief Information Officer (CIO) of the United States of America; taką funkcję przewiduje amerykańska ustawa E-Government Act of 2002; por. również Teraz znowu likwidują ministerstwa i ich serwisy internetowe oraz Wielki Generalny Webmaster?),
  2. ludzie w administracji publicznej wydają się zazdrośnie strzec posiadanych informacji, być może dlatego, że uważają, iż "kto ma informacje, ten ma władzę", a jak się ma informacje, to jednemu można dać (sprzedać), a innemu nie (por. Wawel chroni prawa fotografów???), Otworzono nowy sklep: Narodowe Archiwum Cyfrowe, No i powstał Narodowy Instytut Audiowizualny wraz z Co słychać w kulturze w erze cyfrowej?)
  3. mamy problemy techniczne z wprowadzeniem niedyskryminującej informatyzacji administracji publicznej (m.in. znany spór o otwarte standardy, o mechanizmy wejścia na ścieżkę uzależnienia - vendor lock in i to nie tylko w sferze zamówień publicznych na partykularne systemy teleinformatyczne, ale również jest kłopot z pokusą, obserwowaną czasem u niektórych "zewnętrznych dostawców", by wielokrotnie "sprzedawać" organizacji państwowej te same treści, np. opracowania, w taki sposób, by państwo nie mogło tego dalej udostępniać etc., albo zakładać "prywatne monopole" na komercyjne korzystanie z informacji z sektora publicznego (por. również Prywatne folwarki społeczeństwa informacyjnego za publiczne pieniądze, Ogłaszanie aktów prawnych - Rządowe Centrum Legislacji mówi: tylko PDF oraz Po konferencji "Dostęp do pomocy i informacji prawnej" (wideo)),
  4. pokutuje brak jasnej roli, jaką organizacja państwowa ma spełniać we współczesnym społeczeństwie informacyjnym (są tacy, którzy uważają, że państwo jest tu prawie komercyjnym graczem na rynku, nie dostrzegają przy tym, że organizacja państwowa istnieje dla wszystkich obywateli i efekt jej pracy powinien być dostępny dla wszystkich, to na funkcjonowanie tej organizacji płacimy podatki).

Na marginesie - proszę zapoznać się z prezentacją mec. Konarskiego, który na niedawnej konferencji przedstawiał ministerialne założenia do ustawy o ponownym wykorzystaniu informacji z sektora publicznego publicznej (por. Potencjalnie szykuje się zmiana definicji "informacji publicznej"). Musimy takie ustawodawstwo mieć, ponieważ wynika to z Dyrektywy 2003/98/WE Parlamentu Europejskiego i Rady z dnia 17 listopada 2003 r. w sprawie ponownego wykorzystywania informacji sektora publicznego (por. Komisja daje nam 2 miesiące na transpozycję "ponownego wykorzystania informacji).



Prezentacja mec. Xawerego Konarskiego pt. "Projekt ustawy o ponownym wykorzystaniu informacji publicznej", opublikowany w serwisie Vimeo przez mec. Rafała Ciska. Na obejrzenie tego nagrania należy przeznaczyć 20 minut

A co się dzieje w Polsce? W serwisie KRS założono kilka dni temu skrypt CAPTCHA (Completely Automated Public Turing test to tell Computers and Humans Apart), aby - broń Boże - nikt automatycznie nie pobierał informacji publikowanych na stornach Departamentu Informatyzacji i Rejestrów Sądowych Ministerstwa Sprawiedliwości. Mogłoby to być niebezpieczne. Ludzie oglądaliby te informacje w prywatnych serwisach, a nie na stronach sygnowanych "rządową pieczęcią". A przecież dla bezpieczeństwa i wiarygodności tych informacji nie jest przeszkodą, że poza oficjalnym rejestrem będą one również w "powszechnym obiegu i wykorzystaniu"...

screenshot serwisu Krajowego Rejestru Sądowego

Screenshot serwisu Krajowego Rejestru Sądowego

Nawiasem mówiąc: moim zdaniem organizacja państwowa nie jest od tego, by udostępniając informacje publiczne oceniać, w jakim celu te informacje potem będą wykorzystywane (dlatego uważam, że uzależnienie warunków udostępnienia od wskazania celu, jest sprzeczne z rolą, jaką powinno odgrywać państwo).

Opcje przeglądania komentarzy

Wybierz sposób przeglądania komentarzy oraz kliknij "Zachowaj ustawienia", by aktywować zmiany.

Captcha w KRS

Moim zdaniem CAPTCHA w KRS to dobre rozwiązanie - ma zapobiec przeciążeniu serwerów rządowych.

Natomiast - równolegle z tym (a jeszcze lepiej - wcześniej) powinna zostać udostępniona "płaska" wersja bazy danych, tak by każdy zainteresowany mógł ściągnąć całą bazę od razu (i nie zajeżdżałby serwisu)... Ale to chyba nasz standard - lepiej postawić ograniczenie niż udrożnić kanał/drogę etc.

KRS za CAPTCHĄ

Albo zrobić to w sposób dostępny dla Google'a i w ogóle łatwy w przeszukiwaniu, przystępny, dostępny, żeby komercyjne podmioty nie miały interesu w kopiowaniu i tworzeniu klonów KRS. A dużo jest innych pasjonatów badania polskiej przedsiębiorczości poza tymi, co klony bazy stawiają online? A może "wyszukiwanie po prezesach zarządów" to już jakieś naruszenie ochrony danych osobowych?

A masz jakieś wiarygodne informacje, że ten serwis jest "zajeżdżany" albo że rachunki za hosting wzrosły? Ja mam setki gigabajtów za grosze. No, nie w Polsce, tylko w USA. ;) Może ta CAPTCHA to z innych względów?

KRS niechętnie by uwolnił bazę

xpert17's picture

W tej chwili za wydrukowanie kilku kartek z danymi firmy oddziały KRS-u kasują 30 złotych polskich. Cena ta nijak ma się do wkładu pracy urzędnika (kilka uderzeń w klawisze, wyjęcie kartek z drukarki i zszycie zszywaczem). Oczywiście można mówić, że te pieniądze idą na "utrzymanie infrastruktury informatycznej", ale fakty przeczą temu rozumowaniu.

Gdyby pełne dane z bazy danych KRS były w prosty i wygodny sposób dostępne i widoczne dla wszystkich na oficjalnym serwerze Ministerstwa Sprawiedliwości (na przykład na stronie serwowanej przez https, uwiarygodnionej certyfikatem), rację bytu straciłby biurokratyczny nonsens dołączania do jakiegokolwiek pisma tzw. "wyciągu z KRS, nie starszego niż 3 miesiące", kosztującego oczywiście 30 zł. Ten plik kartek potrzebny jest i na poczcie, i do podpisania jakiejkolwiek umowy, i do załatwienia najbłahszej nawet sprawy urzędowej. Jak łatwo policzyć, w roku trzeba go kupować od polskich sądów rejestrowych co najmniej 4-5 razy (co zapewnia sądowi przypływ gotówki w wysokości min. 150 zł rocznie za samo drukowanie kartek - nie mówię o żadnych wpisach do rejestru, zmianach, bo to wymaga innych czynności i płaci się za to osobno). Rejestr on-line psuje ten doskonały biznes.

Jest komentarz fundacji Sunlight

VaGla's picture

Jest komentarz fundacji Sunlight: Federal Register XML Release. W ten sposób uwolnienie informacji "z sektora publicznego" wiąże się z ruchami obywatelskimi na rzecz transparentności, a raczej - mówiąc po polsku - przejrzystości życia publcznego. Odnośnie ułatwień dla biznesu można zacytować fragment:

That scraping and parsing, which has too long been the stuff of third party government data wranglers, is all too familiar a limitation for citizen develpers. The story goes like this. The government prepares data and documents (sometimes) in a useful structured format, like XML. They then publish that information without the valuable structure, in a format like PDF or plain text. Programmers then copy the text from a web page each day, and try to restructure the useful information to make government data more useful.

--
[VaGla] Vigilant Android Generated for Logical Assassination

Captcha w KRS

Ciekawe czy osoby odpowiedzialne za wprowadzenie mechanizmu CAPTCHA zdają sobie sprawę, że w ten sposób praktycznie uniemożliwiły dostęp do danych KRSu osobom niewidomym, niedowidzącym.
Czy to przypadkiem nie jest forma dyskryminacji osób niepełnosprawnych? Choć w sumie w państwie, w którym uniemożliwia się osobom niewidomym skorzystania z czynnego prawa wyborczego to jakoś nie powinno specjalnie dziwić...

Piotr VaGla Waglowski

VaGla
Piotr VaGla Waglowski - prawnik, publicysta i webmaster, autor serwisu VaGla.pl Prawo i Internet. Członek Rady ds Cyfryzacji przy Ministrze Cyfryzacji, ekspert w Departamencie Oceny Ryzyka Regulacyjnego Ministerstwa Rozwoju, felietonista miesięcznika "IT w Administracji" (wcześniej również felietonista miesięcznika "Gazeta Bankowa" i tygodnika "Wprost"). Uczestniczył w pracach Obywatelskiego Forum Legislacji, działającego przy Fundacji im. Stefana Batorego w ramach programu Odpowiedzialne Państwo. W 1995 założył pierwszą w internecie listę dyskusyjną na temat prawa w języku polskim, Członek Założyciel Internet Society Poland, pełnił funkcję Członka Zarządu ISOC Polska i Członka Rady Polskiej Izby Informatyki i Telekomunikacji. Był również Członkiem Rady Informatyzacji przy MSWiA, członkiem Zespołu ds. otwartych danych i zasobów przy Komitecie Rady Ministrów do spraw Cyfryzacji oraz Doradcą społecznym Prezesa Urzędu Komunikacji Elektronicznej ds. funkcjonowania rynku mediów w szczególności w zakresie neutralności sieci. W latach 2009-2014 Zastępca Przewodniczącego Rady Fundacji Nowoczesna Polska, w tym czasie był również Członkiem Rady Programowej Fundacji Panoptykon. Więcej >>