Ochłap informacji publicznej od afery do afery

Mamy klasyczną sytuację. Oto pod wpływem afery ktoś decyduje się udostępnić nieco danych, by jakoś poradzić sobie z sytuacją. Chodzi oczywiście o komunikat na stronach Sejmu RP, a raczej nie komunikat, tylko "Informacje dotyczące wyjazdów zagranicznych posłów". Tymczasem takie akcyjne działanie nie jest rozwiązaniem problemu braku przejrzystości działań władzy publicznej. Takie informacje powinny być stale dostępne w BIP (w przypadku Sejmu i Senatu to strony tych instytucji) i być stale aktualne. Dodatkowo powinny być udostępniane nie jedynie w plikach PDF, ale również w postaci nadającej się do automatycznego przetwarzania. Dla mnie byłoby super, gdyby to było udostępniane również poprzez API.

Dzięki temu, że udostępniono dane na temat wyjazdów - "zwyczajni ludzie" mogą teraz badać i analizować te dane. Mamy zatem społeczny audyt działania państwa. Już media zdążyły napisać tekst "Cudów" w podróżach posłów ciąg dalszy. Adam Hofman miał być w Londynie, a występował w radiu, a na Twitterze czytam, że Poseł M.A. Kamiński w dniach 23-27/06 "był" w delegacji w Strasburgu! A tymczasem... No cóż. To jest właśnie jeden z powodów, dla których zabiegam o to, by w Biuletynach Informacji Publicznej były publikowane aktualne, kompletne, rzetelne informacje na temat umów zawieranych z instytucjami publicznymi i związane z publicznymi pieniędzmi. Wykazy, które zawierają dane wskazujące na tożsamość podmiotów zawierających takie umowy z państwem. Dlatego też uważam, że nadmierna anonimizacja orzeczeń sądowych jest niewłaściwa (por. Nadmierna anonimizacja orzeczeń prowokuje wnioski o dostęp do informacji publicznej oraz Uchwała SN w sprawie wyboru Prezydenta RP pokazuje, że państwo stoi na głowie). Zwłaszcza, gdy sądy anonimizują nazwy organów i ich siedziby, a zwłaszcza wówczas, gdy chodzi o wyroki, w których Skarb Państwa działając przez takie organy przegrywa setki tysięcy złotych np. tytułem odszkodowania za naruszenia praw autorskich. Bo wyobraźcie sobie, że jednym kliknięciem dowiadujecie się, które ministerstwo w zeszłym roku (albo w ostatnim miesiącu) przegrało najwięcej tysięcy złotych?

Tymczasem można sobie pokliklać we wspomniane Informacje dotyczące wyjazdów zagranicznych posłów. Co ciekawe - owe "informacje" opublikowano w strukturze strony Sejmu RP w dziale "dla mediów", jakby obywatele nie nie byli tu właściwymi adresatami. A przecież prasa - zgodnie z ustawą Prawo prasowe - korzysta z takich samych praw w zakresie dostępu do informacji publicznej, jak wszyscy inni obywatele, a więc korzysta z dostępu na zasadach ustawy o dostępie do informacji publicznej oraz Konstytucji RP. Ale nie. Opublikowano w dziale "dla prasy". Jeśli obywatele nie będą się tego domagali, to te "informacje" nie będą aktualizowane, kolejne ochłapy nie zostaną rzucone mediom i dotychczasowa praktyka nieudostępniania informacji publicznej obywatelom (w tym obywatelom będącym prasą) będzie miała się dobrze.

Zgodnie z art 61 ust 4 w związku z art. 202a i następnych Uchwały Sejmu RP z dnia 30 lipca 1992 r. Regulamin Sejmu Rzeczypospolitej Polskiej Kancelaria Sejmu RP udostępnia informacje publiczne w "Systemie Informacyjnym Sejmu", czyli w takim sejmowym odpowiedniku Biuletynu Informacji Publicznej (por. Taka obserwacja dotycząca obowiązywania ciasteczkowego prawa w aktywności informacyjnej Parlamentu). Regulamin Sejmu odwołuje się nawet do ustawy o dostępie do informacji publicznej...

Drogi Marszałku Sejmu RP, zarządź, proszę, by na internetowych stronach Sejmu RP informacje o delegacjach, dodatkowej kasie branej przez posłów, informacje tego typu, które właśnie zostały opublikowane incydentalnie, by takie informacje stale były publikowane w odpowiedniej zakładce. Zarządź, Drogi Marszałku Sejmu, by na stronach Sejmu RP był też publikowany stale aktualny, kompletny wykaz umów zawieranych przez Kancelarię Sejmu RP. Wykaz umów nie w skanach i ubranych w kontenerek PDF, tylko w postaci nadającej się do automatycznego pobierania i przetwarzania. Wykaz, który opublikowany byłby w taki sposób, by nie była anonimizowana tożsamość podmiotów, z którymi te umowy są zawierane, by było wiadomo czego te umowy dotyczą, kiedy zostały zawarte, na jaki okres i jakie są kwoty tych umów. Wszak chodzi o stałe, nie zaś pojawiające się tylko w wyniku jakiejś afery, budowanie (pogłębianie) zaufania obywateli do państwa.

I właśnie do tego służy re-use informacji publicznej. By obywatele mogli kontrolować działanie państwa. O to właśnie w tym chodzi.

PS
Wczoraj sonda Rosetta wypuściła lądownik, a ten wylądował na komecie 67P/Churyumov-Gerasimenko. Sonda leciała przez 10 lat, a odległość między Ziemią, a owym miejscem operowania lądownika dzieli 500 mln kilometrów. Udało się. Lądownik wylądował na komecie. I zdaję sobie sprawę, że gdyby w wyniku tego lądowania miały stać się publicznie dostępne informacje na temat działania któregoś z zaangażowanych w projekt państw, to by się nie udało. Dlaczego? Padłyby pewnie takie pytania i wątpliwości, które formułowała p. Julia Pitera na posiedzeniu jednej z komisji sejmowych: "Nie bardzo wiem, dlaczego władza publiczna miałaby organizować poparcie dla projektów obywatelskich, zwłaszcza, że – prawdę powiedziawszy – „nie chwytam” tego celu"". No, cóż. Ale próbować trzeba. Może jeśli obywatele będą się domagali swoich praw, to władze łaskawie nie będą miały wyjścia.

Przeczytaj również:

Opcje przeglądania komentarzy

Wybierz sposób przeglądania komentarzy oraz kliknij "Zachowaj ustawienia", by aktywować zmiany.

a propos anonimozacjoi

Olgierd's picture

Z wyroku sądowego (SO we Wrocławiu, I C 1765/12), w którym nakazano przeprosić za nieprawdziwe informacje w ulotkach rozrzuconych na klatkach schodowych:

"ogłoszenie w formie wydruku na kartce formatu A4, po jednej na każdą klatkę schodową, czcionką czarną T. (...) nr (...)"

http://orzeczenia.wroclaw.so.gov.pl/content/$N/155025000000503_I_C_001765_2012_Uz_2014-10-09_001

--
pozdrawiam serdecznie, Olgierd

PDF nie nadaje się do analizy?

"Dodatkowo powinny być udostępniane nie jedynie w plikach PDF, ale również w postaci nadającej się do automatycznego przetwarzania. Dla mnie byłoby super, gdyby to było udostępniane również poprzez API."

Nie wiem jak to wygląda globalnie, ale te PDF-y udostępnione teraz, bez problemu można automatycznie przetwarzać i wyciągnąć z nich tekst.

Jak chcesz (Ty lub jakaś organizacja), to Ci możemy nawet zbudować do tego jakieś ładne API, w całkiem konkurencyjnej cenie.

Pozdrawiam

Tomasz Klim
Dyrektor IT
Klim Baron Business Solutions Sp. z o.o.

Jeśli PDF ma skany, ale ten już zre-usowany

VaGla's picture

Jeśli kontener PDF zawiera skany tekstu, to nie nadaje się. W przypadku tych tabelek z Sejmu istotnie da się tekst wyjąć. A jeśli tak, to znaczy, że te dane Sejm ma też w takiej postaci, która pozwoliłaby mu wystawić z nimi API. Stale aktualne, stale publikowane obok innych danych finansowych samej instytucji publikowanych w nadający się do automatycznego przetwarzania sposób.

Na przykład w takiej formie, jak tu już obywatele - w ramach re-use danych publicznych - potrafili w jeden dzień przygotować: Wyjazdy zagraniczne posłów. Do tego tylko jeszcze mapa okręgów wyborczych (PWK mogłaby udostępnić taką mapę w wektorach w ramach re-use) i będziemy mieli wizualizacje połączonych danych. Do tego m.in. służy re-use informacji publicznej.
--
[VaGla] Vigilant Android Generated for Logical Assassination

Co nie zmienia faktu, że można samodzielnie zrobić re-use...

Ma sens takie proszenie za każdym razem, aby publikowali dane w czymś innym niż PDF?

Może warto pójść w kierunku automatycznych mechanizmów OCR i data miningu dokumentów:
- instytucja publikuje dokument
- grupa zainteresowanych osób wrzuca link do dokumentu w automat
- automat parsuje stronę z linka, pobiera co się da, przepuszcza przez moduły OCR i ekstrakcji danych, potem robi data mining z wyciągniętego tekstu i układa wyciągnięte dane w jakiś układ sensowny do ręcznej weryfikacji przydatności
- grupa zainteresowanych osób weryfikuje treści, wprowadza ew. poprawki albo inaczej je układa itd. - tutaj już nie wiem, co tam chcesz dalej z tymi dokumentami robić :)

Zrobienie takiego automatu jest dość proste. Długotrwałe i przez to dość drogie, ale żadnego rocket science tutaj nie ma. Zalążki technologii mamy już teraz - chociaż głównie pod kątem zdobywania adresów mailowych :)

Nie uważasz, że tak by było prościej? Wilk syty i owca cała.

Pozdrawiam

Tomasz Klim
Dyrektor IT
Klim Baron Business Solutions Sp. z o.o.

Taki ma sens, że

VaGla's picture

Taki ma sens, że te systemy do udostępniania danych publicznych również powstają za moje pieniądze. Jako obywatel zatem oczekuję, że będą one powstawały zgodnie ze sztuką.
--
[VaGla] Vigilant Android Generated for Logical Assassination

OCR

Polecanie stosowania OCR-u do tekstów urzędowych sporządzonych w tekście ma taki sens funkcjonalny jak kupowanie sobie samochodu z dyszlem, który jeździ tylko wtedy, gdy zaprzęgnie się na przedzie parę koni. Na takie pomysły może wpaść tylko właściciel stadniny koni pociągowych lub ewentualnie pracownicy stajenni w tej stadninie koni.

Co do wyjazdów posłów

Co do wyjazdów posłów taki czyjś komentarz:

"Jest jeszcze jeden temat, który nie widziałem, żeby był poruszany. Jestem ciekaw, kto jest beneficjentem programów lojalnościowych w liniach lotniczych i kto dostaje potem darmowe bilety. Sądzę, że upusty powinny przysługiwać co najmniej kancelarii sejmu, jeśli nie skarbowi państwa. A można mieć podejrzenie, że osoby publiczne nie dość że latają za publiczne pieniądze, to mają z tego dodatkowe osobiste korzyści, które nie powinny im przysługiwać, a zmniejszać wartość pieniędzy do wydania przez państwo za bilety."
http://www.wykop.pl/link/2241116/#comment-24501462

Piotr VaGla Waglowski

VaGla
Piotr VaGla Waglowski - prawnik, publicysta i webmaster, autor serwisu VaGla.pl Prawo i Internet. Członek Rady ds Cyfryzacji przy Ministrze Cyfryzacji, ekspert w Departamencie Oceny Ryzyka Regulacyjnego Ministerstwa Rozwoju, felietonista miesięcznika "IT w Administracji" (wcześniej również felietonista miesięcznika "Gazeta Bankowa" i tygodnika "Wprost"). Uczestniczył w pracach Obywatelskiego Forum Legislacji, działającego przy Fundacji im. Stefana Batorego w ramach programu Odpowiedzialne Państwo. W 1995 założył pierwszą w internecie listę dyskusyjną na temat prawa w języku polskim, Członek Założyciel Internet Society Poland, pełnił funkcję Członka Zarządu ISOC Polska i Członka Rady Polskiej Izby Informatyki i Telekomunikacji. Był również Członkiem Rady Informatyzacji przy MSWiA, członkiem Zespołu ds. otwartych danych i zasobów przy Komitecie Rady Ministrów do spraw Cyfryzacji oraz Doradcą społecznym Prezesa Urzędu Komunikacji Elektronicznej ds. funkcjonowania rynku mediów w szczególności w zakresie neutralności sieci. W latach 2009-2014 Zastępca Przewodniczącego Rady Fundacji Nowoczesna Polska, w tym czasie był również Członkiem Rady Programowej Fundacji Panoptykon. Więcej >>