Ochłap informacji publicznej od afery do afery

Mamy klasyczną sytuację. Oto pod wpływem afery ktoś decyduje się udostępnić nieco danych, by jakoś poradzić sobie z sytuacją. Chodzi oczywiście o komunikat na stronach Sejmu RP, a raczej nie komunikat, tylko "Informacje dotyczące wyjazdów zagranicznych posłów". Tymczasem takie akcyjne działanie nie jest rozwiązaniem problemu braku przejrzystości działań władzy publicznej. Takie informacje powinny być stale dostępne w BIP (w przypadku Sejmu i Senatu to strony tych instytucji) i być stale aktualne. Dodatkowo powinny być udostępniane nie jedynie w plikach PDF, ale również w postaci nadającej się do automatycznego przetwarzania. Dla mnie byłoby super, gdyby to było udostępniane również poprzez API.

Dzięki temu, że udostępniono dane na temat wyjazdów - "zwyczajni ludzie" mogą teraz badać i analizować te dane. Mamy zatem społeczny audyt działania państwa. Już media zdążyły napisać tekst "Cudów" w podróżach posłów ciąg dalszy. Adam Hofman miał być w Londynie, a występował w radiu, a na Twitterze czytam, że Poseł M.A. Kamiński w dniach 23-27/06 "był" w delegacji w Strasburgu! A tymczasem... No cóż. To jest właśnie jeden z powodów, dla których zabiegam o to, by w Biuletynach Informacji Publicznej były publikowane aktualne, kompletne, rzetelne informacje na temat umów zawieranych z instytucjami publicznymi i związane z publicznymi pieniędzmi. Wykazy, które zawierają dane wskazujące na tożsamość podmiotów zawierających takie umowy z państwem. Dlatego też uważam, że nadmierna anonimizacja orzeczeń sądowych jest niewłaściwa (por. Nadmierna anonimizacja orzeczeń prowokuje wnioski o dostęp do informacji publicznej oraz Uchwała SN w sprawie wyboru Prezydenta RP pokazuje, że państwo stoi na głowie). Zwłaszcza, gdy sądy anonimizują nazwy organów i ich siedziby, a zwłaszcza wówczas, gdy chodzi o wyroki, w których Skarb Państwa działając przez takie organy przegrywa setki tysięcy złotych np. tytułem odszkodowania za naruszenia praw autorskich. Bo wyobraźcie sobie, że jednym kliknięciem dowiadujecie się, które ministerstwo w zeszłym roku (albo w ostatnim miesiącu) przegrało najwięcej tysięcy złotych?

Tymczasem można sobie pokliklać we wspomniane Informacje dotyczące wyjazdów zagranicznych posłów. Co ciekawe - owe "informacje" opublikowano w strukturze strony Sejmu RP w dziale "dla mediów", jakby obywatele nie nie byli tu właściwymi adresatami. A przecież prasa - zgodnie z ustawą Prawo prasowe - korzysta z takich samych praw w zakresie dostępu do informacji publicznej, jak wszyscy inni obywatele, a więc korzysta z dostępu na zasadach ustawy o dostępie do informacji publicznej oraz Konstytucji RP. Ale nie. Opublikowano w dziale "dla prasy". Jeśli obywatele nie będą się tego domagali, to te "informacje" nie będą aktualizowane, kolejne ochłapy nie zostaną rzucone mediom i dotychczasowa praktyka nieudostępniania informacji publicznej obywatelom (w tym obywatelom będącym prasą) będzie miała się dobrze.

Zgodnie z art 61 ust 4 w związku z art. 202a i następnych Uchwały Sejmu RP z dnia 30 lipca 1992 r. Regulamin Sejmu Rzeczypospolitej Polskiej Kancelaria Sejmu RP udostępnia informacje publiczne w "Systemie Informacyjnym Sejmu", czyli w takim sejmowym odpowiedniku Biuletynu Informacji Publicznej (por. Taka obserwacja dotycząca obowiązywania ciasteczkowego prawa w aktywności informacyjnej Parlamentu). Regulamin Sejmu odwołuje się nawet do ustawy o dostępie do informacji publicznej...

Drogi Marszałku Sejmu RP, zarządź, proszę, by na internetowych stronach Sejmu RP informacje o delegacjach, dodatkowej kasie branej przez posłów, informacje tego typu, które właśnie zostały opublikowane incydentalnie, by takie informacje stale były publikowane w odpowiedniej zakładce. Zarządź, Drogi Marszałku Sejmu, by na stronach Sejmu RP był też publikowany stale aktualny, kompletny wykaz umów zawieranych przez Kancelarię Sejmu RP. Wykaz umów nie w skanach i ubranych w kontenerek PDF, tylko w postaci nadającej się do automatycznego pobierania i przetwarzania. Wykaz, który opublikowany byłby w taki sposób, by nie była anonimizowana tożsamość podmiotów, z którymi te umowy są zawierane, by było wiadomo czego te umowy dotyczą, kiedy zostały zawarte, na jaki okres i jakie są kwoty tych umów. Wszak chodzi o stałe, nie zaś pojawiające się tylko w wyniku jakiejś afery, budowanie (pogłębianie) zaufania obywateli do państwa.

I właśnie do tego służy re-use informacji publicznej. By obywatele mogli kontrolować działanie państwa. O to właśnie w tym chodzi.

PS
Wczoraj sonda Rosetta wypuściła lądownik, a ten wylądował na komecie 67P/Churyumov-Gerasimenko. Sonda leciała przez 10 lat, a odległość między Ziemią, a owym miejscem operowania lądownika dzieli 500 mln kilometrów. Udało się. Lądownik wylądował na komecie. I zdaję sobie sprawę, że gdyby w wyniku tego lądowania miały stać się publicznie dostępne informacje na temat działania któregoś z zaangażowanych w projekt państw, to by się nie udało. Dlaczego? Padłyby pewnie takie pytania i wątpliwości, które formułowała p. Julia Pitera na posiedzeniu jednej z komisji sejmowych: "Nie bardzo wiem, dlaczego władza publiczna miałaby organizować poparcie dla projektów obywatelskich, zwłaszcza, że – prawdę powiedziawszy – „nie chwytam” tego celu"". No, cóż. Ale próbować trzeba. Może jeśli obywatele będą się domagali swoich praw, to władze łaskawie nie będą miały wyjścia.

Przeczytaj również:

Opcje przeglądania komentarzy

Wybierz sposób przeglądania komentarzy oraz kliknij "Zachowaj ustawienia", by aktywować zmiany.

a propos anonimozacjoi

Z wyroku sądowego (SO we Wrocławiu, I C 1765/12), w którym nakazano przeprosić za nieprawdziwe informacje w ulotkach rozrzuconych na klatkach schodowych:

"ogłoszenie w formie wydruku na kartce formatu A4, po jednej na każdą klatkę schodową, czcionką czarną T. (...) nr (...)"

http://orzeczenia.wroclaw.so.gov.pl/content/$N/155025000000503_I_C_001765_2012_Uz_2014-10-09_001

--
pozdrawiam serdecznie, Olgierd

PDF nie nadaje się do analizy?

"Dodatkowo powinny być udostępniane nie jedynie w plikach PDF, ale również w postaci nadającej się do automatycznego przetwarzania. Dla mnie byłoby super, gdyby to było udostępniane również poprzez API."

Nie wiem jak to wygląda globalnie, ale te PDF-y udostępnione teraz, bez problemu można automatycznie przetwarzać i wyciągnąć z nich tekst.

Jak chcesz (Ty lub jakaś organizacja), to Ci możemy nawet zbudować do tego jakieś ładne API, w całkiem konkurencyjnej cenie.

Pozdrawiam

Tomasz Klim
Dyrektor IT
Klim Baron Business Solutions Sp. z o.o.

Jeśli PDF ma skany, ale ten już zre-usowany

Jeśli kontener PDF zawiera skany tekstu, to nie nadaje się. W przypadku tych tabelek z Sejmu istotnie da się tekst wyjąć. A jeśli tak, to znaczy, że te dane Sejm ma też w takiej postaci, która pozwoliłaby mu wystawić z nimi API. Stale aktualne, stale publikowane obok innych danych finansowych samej instytucji publikowanych w nadający się do automatycznego przetwarzania sposób.

Na przykład w takiej formie, jak tu już obywatele - w ramach re-use danych publicznych - potrafili w jeden dzień przygotować: Wyjazdy zagraniczne posłów. Do tego tylko jeszcze mapa okręgów wyborczych (PWK mogłaby udostępnić taką mapę w wektorach w ramach re-use) i będziemy mieli wizualizacje połączonych danych. Do tego m.in. służy re-use informacji publicznej.
--
[VaGla] Vigilant Android Generated for Logical Assassination

Co nie zmienia faktu, że można samodzielnie zrobić re-use...

Ma sens takie proszenie za każdym razem, aby publikowali dane w czymś innym niż PDF?

Może warto pójść w kierunku automatycznych mechanizmów OCR i data miningu dokumentów:
- instytucja publikuje dokument
- grupa zainteresowanych osób wrzuca link do dokumentu w automat
- automat parsuje stronę z linka, pobiera co się da, przepuszcza przez moduły OCR i ekstrakcji danych, potem robi data mining z wyciągniętego tekstu i układa wyciągnięte dane w jakiś układ sensowny do ręcznej weryfikacji przydatności
- grupa zainteresowanych osób weryfikuje treści, wprowadza ew. poprawki albo inaczej je układa itd. - tutaj już nie wiem, co tam chcesz dalej z tymi dokumentami robić :)

Zrobienie takiego automatu jest dość proste. Długotrwałe i przez to dość drogie, ale żadnego rocket science tutaj nie ma. Zalążki technologii mamy już teraz - chociaż głównie pod kątem zdobywania adresów mailowych :)

Nie uważasz, że tak by było prościej? Wilk syty i owca cała.

Pozdrawiam

Tomasz Klim
Dyrektor IT
Klim Baron Business Solutions Sp. z o.o.

Taki ma sens, że

Taki ma sens, że te systemy do udostępniania danych publicznych również powstają za moje pieniądze. Jako obywatel zatem oczekuję, że będą one powstawały zgodnie ze sztuką.
--
[VaGla] Vigilant Android Generated for Logical Assassination

OCR

Polecanie stosowania OCR-u do tekstów urzędowych sporządzonych w tekście ma taki sens funkcjonalny jak kupowanie sobie samochodu z dyszlem, który jeździ tylko wtedy, gdy zaprzęgnie się na przedzie parę koni. Na takie pomysły może wpaść tylko właściciel stadniny koni pociągowych lub ewentualnie pracownicy stajenni w tej stadninie koni.

Co do wyjazdów posłów

Co do wyjazdów posłów taki czyjś komentarz:

"Jest jeszcze jeden temat, który nie widziałem, żeby był poruszany. Jestem ciekaw, kto jest beneficjentem programów lojalnościowych w liniach lotniczych i kto dostaje potem darmowe bilety. Sądzę, że upusty powinny przysługiwać co najmniej kancelarii sejmu, jeśli nie skarbowi państwa. A można mieć podejrzenie, że osoby publiczne nie dość że latają za publiczne pieniądze, to mają z tego dodatkowe osobiste korzyści, które nie powinny im przysługiwać, a zmniejszać wartość pieniędzy do wydania przez państwo za bilety."
http://www.wykop.pl/link/2241116/#comment-24501462

Piotr VaGla Waglowski

VaGla
Piotr VaGla Waglowski - prawnik, publicysta i webmaster, autor serwisu VaGla.pl Prawo i Internet. Ukończył Aplikację Legislacyjną prowadzoną przez Rządowe Centrum Legislacji. Radca ministra w Departamencie Oceny Ryzyka Regulacyjnego a następnie w Departamencie Doskonalenia Regulacji Gospodarczych Ministerstwa Rozwoju. Felietonista miesięcznika "IT w Administracji" (wcześniej również felietonista miesięcznika "Gazeta Bankowa" i tygodnika "Wprost"). Uczestniczył w pracach Obywatelskiego Forum Legislacji, działającego przy Fundacji im. Stefana Batorego w ramach programu Odpowiedzialne Państwo. W 1995 założył pierwszą w internecie listę dyskusyjną na temat prawa w języku polskim, Członek Założyciel Internet Society Poland, pełnił funkcję Członka Zarządu ISOC Polska i Członka Rady Polskiej Izby Informatyki i Telekomunikacji. Był również członkiem Rady ds Cyfryzacji przy Ministrze Cyfryzacji i członkiem Rady Informatyzacji przy MSWiA, członkiem Zespołu ds. otwartych danych i zasobów przy Komitecie Rady Ministrów do spraw Cyfryzacji oraz Doradcą społecznym Prezesa Urzędu Komunikacji Elektronicznej ds. funkcjonowania rynku mediów w szczególności w zakresie neutralności sieci. W latach 2009-2014 Zastępca Przewodniczącego Rady Fundacji Nowoczesna Polska, w tym czasie był również Członkiem Rady Programowej Fundacji Panoptykon. Więcej >>