Udzielisz wsparcia, gdy na horyzoncie pojawi się alternatywny dostęp do informacji publicznej?

Po stronie rządowej można zaobserwować wzmożone deklaracje chęci zwiększenia partycypacji społecznej dla lepszego udostępniania informacji publicznej obywatelom, w szczególności w celu udrożnienia kanałów konsultacji społecznych stanowionego prawa. Można z troską pochylić się nad tym, że aż trzy (lub więcej) ośrodków decyzyjnych po stronie rządowej podejmuje - jak się wydaje - niezależne działania. Można martwić się o to, że w procesie zamówień publicznych państwo kupi jakieś platformy do konsultacji/publikacji... Być może coś z tego wyjdzie, a może niewiele. Gdyby jednak pojawił się na horyzoncie projekt społeczny, wykorzystujący narzędzia o otwartym kodzie z możliwością udziału w nim zainteresowanych, a którego celem byłoby przeparsowanie opublikowanych już na różnych stronach www informacji publicznych (Sejm, Senat, Prezydent, Rząd) i udostępnienie wszystkim zainteresowanym API do tak zebranych danych... Pojawią się pewne problemy, gdyż wyobrażam sobie, że aktualni ich "gospodarze" nie są jeszcze gotowi na zmianę paradygmatu oceny "własności" informacji publicznej i mogą poczuć się niekomfortowo zdając sobie sprawę, że poza ich kontrolą pojawi się serwis (serwisy) agregujący i udostępniający "ich" informacje na dużą skalę (por. Przejmujemy państwo). Pojawią się też problemy logistyczne, trzeba by rozwiązać również kwestie finansowania takiego projektu. Gdyby zatem pojawił się taki projekt na horyzoncie, to... Jakie widzicie Państwo problemy do rozwiązania i jakie drogi rozwiązania warto rozważyć?

O problematyce Re-use opublikowałem już sporo różnych notatek w tym serwisie. Jedną z nich była Propozycja planu publicznej dyskusji na temat Re-use, gdzie starałem się wypunktować główne obszary problemowe (w tym np. potencjalne zagrożenie traktowania danych gromadzonych i publikowanych w celu publicznym jako przedmiotu ochrony prawa własności intelektualnej, co - jak uważam - w dyskusji aksjologicznej mogłoby zostać poddane rzetelnej krytyce argumentów; warto też pamiętać, że materiały urzędowe i dokumenty urzędowe nie są przedmiotem prawa autorskiego).

Strukturalizowane dane publiczne udostępniane są coraz częściej przez kolejne rządy na świecie: data.gov.uk, data.australia.gov.au, data.gov, data.govt.nz. Pojawiają się publikacje para-standaryzacyjne, np. opublikowany przez W3C dokument Publishing Open Government Data (W3C Working Draft 8 September 2009). Pojawiają się inicjatywy gromadzące już opublikowane API do wydobytych danych publicznych, np. Government APIs and Mashups - ProgrammableWeb Resource Center, albo World Government Data...

W Polsce możliwe było wydobycie (chociaż nie automatyczne) informacji z KRS i zrobienie "na tych danych" komercyjnego serwisu. Gdyby wydobyć dane ze stron Rządu, Sejmu, Senatu, Prezydenta i udostępnić API (ang. application programming interface) do takich danych, to wówczas nie miałoby istotniejszego znaczenia, czy ktoś z wykorzystaniem takich danych chciałby przygotować serwis komercyjny (ktoś chciałby zrobić serwis prezentujący reklamy - proszę bardzo, ktoś chciałby włączyć takie dane do posiadanej i rozwijanej bazy artykułów lub innych dokumentów, a więc wydawnictwa, organizacje pracodawców, lub izby gospodarcze - dlaczego nie?) czy np. społeczny w innym ujęciu (stowarzyszenie zabiegające o przejrzystość działania władzy publicznej mogłoby zrobić serwis będący narzędziem w jego codziennej pracy, fundacja zabiegająca o poprawę losu określonej grupy społecznej - serwis informujący o zmianach sytuacji publicznej w obszarze swoich zainteresowań).

Oczywiście świadomy jestem tego, że KRS "zabezpieczył się" nie tak dawno, wprowadzając CAPTCHA, oczywiście wiem, że Główny Urząd Geodezji i Kartografii nie widzi możliwości udostępniania posiadanych danych... Oczywiście zdaję sobie sprawę z blokowania linków i niechęci do "mirrorów" w administracji publicznej. W polu widzenia pojawiają się wciąż nowe zagrożenia. Skoro założenie 90 kont w serwisie społecznościowym mogło sprowokować kogoś do formułowania zarzutów zakłócania pracy sieci teleinformatycznej, to ktoś inny mógłby uznać, że cykliczne pobieranie danych z internetowych serwisów władzy publicznej jest niczym innym, jak atakiem na infrastrukturę krytyczną państwa. Trzeba by przekonywać państwowych włodarzy, że tego typu działanie nie powinno być oceniane negatywnie, że chodzi o działanie w interesie publicznym...

A gdyby tak pojawił się projekt, który jednak spróbuje przebić się przez te wszystkie problemy? Nie twierdzę, że jutro. Gdyby tak pojawił się, powiedzmy, za miesiąc? Projekt, który mógłby mieć wymiar ponadnarodowy, gdyż problem ponownego wykorzystania informacji z sektora publicznego jest aktualny w całej Europie. Wszędzie są problemy z właściwą transpozycją dyrektywy i zapadają kolejne wyroki Trybunału Sprawiedliwości, w których orzeka o niedopełnieniu obowiązków państw członkowskich. W Polsce jakoś nie idzie sprawnie praca nad transpozycją dyrektywy 2003/98/WE (por. Ponowne wykorzystanie informacji z sektora publicznego - dyskusja w Polsce, raport w UE). Gdyby powstały programistyczne narzędzia do otwierania administracji publicznej na tego typu "oczekiwania społeczne", to mogłyby być one rozwijane w projekcie ponadkrajowym.

Tylko się głośno zastanawiam: gdyby aktywność spółki takiej, jak Google wpisać się miała w aktualne, globalne ramy prawne, to - prawdopodobnie - nikt o tej spółce nigdy by nie usłyszał. Nie odniosłaby sukcesu. Skoro zatem Pan Prezydent RP nie widzi problemu związanego z korzystaniem z narzędzi tej spółki, jeśli takiego problemu nie widzą poszczególne ministerstwa, a nawet wpleciono je w stronę główną naszego urzędowego publikatora informacji publicznej, to może nie będą również mieli problemu, jeśli ktoś inny również postanowi przetrzeć szlak na bezdrożach systemu prawnego, tam, gdzie żyją smoki?

Jest ryzyko prawne, jest ryzyko logistyczne. Projekt wymagałby - w pewnym momencie - zaangażowania społecznego, zebrania zasobów tworzących zaplecze sprzętowe i zarządzania nim, podobnie, jeśli chodzi o zasoby finansowe i osobowe...

Jeśli funkcjonujesz, Drogi Czytelniku, w strukturach administracji publicznej, to w jaki sposób chciałbyś wesprzeć taki projekt? Jeśli jesteś programistą, to czy widzisz w takim projekcie możliwości swojego rozwoju? Jeśli reprezentujesz organizację społeczną, to czy widzisz możliwości zaangażowania się w rzecznictwo idei takiego projektu? Czy - jeśli jesteś adwokatem - zdecydowałbyś się bronić (pro bono) osób, które byłyby zaangażowane w tego typu projekt, jeśli ktoś uznałby, że korzystanie z informacji publicznej stanowi naruszenie norm karnych? Czy, skoro jesteś przedsiębiorcą, uważasz, że wsparcie finansowe dla takiej koncepcji zasługuje na chwilę zadumy? A jeśli odpowiedź na powyższe pytania brzmi "nie", to dlaczego? Każda (rozsądna) odpowiedź może mieć znaczenie dla lepszego przygotowania analizy szans i zagrożeń takiego projektu.

To byłoby smaczne, gdyby serwis zorganizowany społecznie pojawił się wcześniej, niż serwisy przygotowywane siłą budżetu państwa i wspierane jego organizacyjnym zapleczem biur i sekretariatów. Trochę szkoda tych pieniędzy publicznych, ale - jak sobie wyobrażam - czasem sytuację skuteczniej można leczyć z zewnątrz.

Przeczytaj również materiały zebrane w dziale re-use niniejszego serwisu, a zwłaszcza:

Opcje przeglądania komentarzy

Wybierz sposób przeglądania komentarzy oraz kliknij "Zachowaj ustawienia", by aktywować zmiany.

udzielę wsparcia

ksiewi's picture

Obawiam się, że jeżeli projekt taki miałby być realizowany bez wsparcia dysponentów informacji publicznej, to prędko podzieliłby los Janosika. Główny wysiłek prowadzących ten projekt nie powinien iść na wydzieranie informacji publicznej od organów państwowych, lecz na projektowanie nowych sposobów ponownego wykorzystania tej informacji.

Nie twierdzę, że takiego projektu nie warto zaczynać bez pozytywnego nastawienia dysponentów informacji. Tylko, że wtedy zmarnuje się wiele sił. Twórców projektu na wydobycie informacji, a organów państwa na jej niepotrzebne chronienie.

Optymalne byłoby zatem rozpoczęcie takiego projektu w sytuacji, w której organy państwa byłyby świadome, że nie muszą i nie powinny chronić dostępu do informacji publicznej, a powinny wręcz udostępniać ją w formie jak najlepiej ułatwiającej ponowne wykorzystanie.

Przeciwna sytuacja stanowiłaby przejaw swoistego paradoksu, w którym państwo przeciwstawiałoby się społeczeństwu. Ale może popadam w patetyczny ton?

Edukacja administracji

kravietz's picture

Edukacja administracji publicznej może być jednym z elementów wspomnianej przez Piotra inicjatywy. Cały czas to w gruncie rzeczy robimy, ale można to robić bardziej systematycznie i na masową skalę.

--
Paweł Krawczyk
IPSec.pl - Podpis elektroniczny i bezpieczeństwo IT

Udzieliłbym

Nie należę do żadnej z powyższych kategorii, ale jako bloger i okazjonalny dziennikarz chętnie nagłośnię, a jako obywatel chętnie przyłączę się do wszelkich inicjatyw mających na celu przyciśnięcie strony rządzącej. Ostatnio "nacisk" się udał, trzeba kuć żelazo…

projektpi

reptile's picture

@Jurgi zerknij na projektpi.pl, ale spróbuj nie patrzeć na otoczkę (polityczną), lecz na możliwości. Dostępność narzędzi - portal, forum, wiki, blogi, irc-czat wystarczy to rozbudować dodać to i owo i można działać. Pojawia się jednak problem finansowania... (mam nadzieje, że właściciel serwisu vagla wykaże się tolerancją wobec linków)
Ja uważam to za szansę dla społeczności internautów - obywateli. Szansa by odciąć mediokrację na rzecz prawa i możliwości które, mógłby zyskać zwykły obywatel jeśli tylko zechce. Mielibyśmy wówczas do czynienia z dużymi zmianami :)

Udzieliłbym

Tomasz Rychlicki's picture

Aż mnie korci żeby dodać "i wyroki!". Ale mam nadzieję, że bezdyskusyjne jest stwierdzenie, że orzeczenia sądowe (wraz z uzasadnieniem), decyzje Urzędu Patentowego RP oraz wszelka wokanda, należą do kategorii "informacji publicznej".

Jajko czy kura

Jak zwrócił mi uwagę Vagla i ksiewi w powyższym komentarzu największym problemem będzie pozyskanie informacji publicznej. Tylko czy przekonywanie administracji do tego, żeby stosowała się do obowiązujących przepisów i implementowała re-use, nie zajmie za dużo czasu? Według mnie pokazanie oporu administracji na konkretnych przykładach pozwoli na szybsze rozwiązanie problemów związanych z tymi przykładami.

Na pewno warto zacząć pracę nad rzeczami, które tak czy siak trzeba ustalić przed fazą zbierania informacji:

  1. jakie informacje chcemy zbierać
  2. w jaki sposób chcemy je przetwarzać/przeszukiwać
  3. w jakim dokładnie formacie chcemy je przetrzymywać/importować/eksportować

O ile odpowiedź na punkty 1. i 2. to "wszystkie" i "każdy możliwy", to trzeba zacząć od podzielenia tego na mniejsze kawałki. Punkt 3 jest o tyle ważny, że będzie on odpowiedzią na pytanie administracji "Czego od nas oczekujecie?". Trzeba to wykonać precyzyjnie, w przeciwnym wypadku możemy dostać np. coś takiego:

<?xml version="1.0"?>
<document title="...">
  <content>
    <page number="1">
      <blob type="image/jpeg" dt:dt="binary.base64">

Ze swojej strony mogę zaoferować pomoc przy pisaniu robotów zbierających informacje oraz innych pokrewnych sprawach technicznych.

Rozwiązania informatyczne

Rozwiązania informatyczne z konserwatywnego punktu widzenia nie są w stanie wprowadzić więcej przejrzystości do systemu niż on sam posiada i a ogół wzmagają problemy niż je rozwiązują. Przypuśćmy że dysponujemy narzędziem pozwalającym publikować informacje rządowe w standardowy sposób. Pojawiają się problemy jakie informacje są wymagane aby dany dokument mógł być opublikowany. Brak takich procedur w chwili obecnej spowoduje w momencie wdrażania systemu powstanie podwójnego obiegu dokumentów: tych do pracy (rzeczywistej) i tych do publikacji (pozornych, na pokaz). Dokładnie jak w chwili obecnej tyle że obecnie te dwa obiegi są "zintegrowane" to znaczy rząd publikuje przypadkowe dokumenty ale trzyma łapę na tym co istotne bo publikacja wymaga wysiłku który zostanie każdorazowo zauważony. Wobec wprowadzenia możliwości publikacji bez większego wysiłku pojawia się potrzeba kontroli co się publikuje i rozdzielenia obiegu dokumentów roboczych od oficjalnych. Efekt: jeszcze większy bałagan, bo przy dziennikarzach trzeba dyskutować dokument oficjalny ale prace dotyczą nieoficjalnego itp.

Optymistyczne podejście do systemów informatycznych zakłada, że pomagają one rozwiązać jakieś problemy z którymi boryka się klient. Niestety, w większości przypadków problemy te nie dadzą się tak rozwiązać, bo są zwykle brakami w zasadach obiegu dokumentów, decyzyjności, podległości zgrania terminów, a to są kwestie nie mające nic wspólnego z archiwizacją, publikacja itp. Proces który jest nieprzejrzysty w naturze nie stanie się przejrzysty w komputerze, ba, dla większości ludzi jeszcze się zaciemni.

Słowem: jeśli obecnie ministerstwa nie mają wypracowanych procedur konsultacji czy publikacji (co jest proste) a tym bardziej edycji (co jest znacznie trudniejsze), to wprowadzanie systemów informatycznych w niczym nie ułatwi osiągnięcia celów, a zrealizowane ZANIM pojawią się stosowne procedury prawne i organizacyjne tylko utrudni ich stworzenie i implementację (co ma długa tradycję w naszych strukturach władzy - pierwsze kupuje się sprzęt i oprogramowanie, a potem się zastanawia po co).

And my axe!

Nieśmiało piszę, że udzieliłbym wsparcia. Nieśmiało, bo jako programista jestem raczej amatorem, a przedsięwzięcie jest naprawdę poważne. Poza tym potrafię robić efektywne kampanie AdWords, gdyby zaszła potrzeba promowania projektu tą drogą. Mógłbym też wziąć udział w formułowaniu wymagań i poszukiwaniu technologii optymalnych względem przyjętych założeń.

Ja bym udzielił wsparcia

kravietz's picture

Ja bym udzielił wsparcia zarówno nieregularnego merytorycznego jak i regularnego finansowego.

To ostatnie wydaje mi się krytyczne, bo większość tego typu inicjatyw pada jeśli nie ma tam choćby jednej osoby zatrudnionej w jakiejkolwiek formie.

Zdolność do zatrudnienia prawnika, programisty czy sekretarki nawet na 1 godzinę tygodniowo może przełożyć się na to czy inicjatywa będzie kolejnym Janosikiem czy nie.

Jeśli wypali to warto pamiętać o możliwości finansowania tego ze środków zewnętrznych - np. grantów ISOC czy różnych innych.

--
Paweł Krawczyk
IPSec.pl - Podpis elektroniczny i bezpieczeństwo IT

Wsparłbym projekt

Jako programista.

Jeszcze jeden chętny

Programista.

History in the making...

Mogę zaoferować skromny wkład w postani wsparcia finansowego i propoagowania idei w środowisku administracji publicznej (wprawdzie w zakresie terytorialnie i rzeczowo ograniczonym ale za to z dużym entuzjazmem).

podatnik/ klient AP vs przedsiębiorca/obywatel

Jako podatnik/klient administracji
mówię NIE:

-wyręczanie niedołężnej administracji publicznej ("AP") trwoniącej również moje podatki nie podniesie poziomu jej usług, tylko wprowadzi ją w stan apatii i nicnierobienia
AP: prywatni zrobią to za nas, lepiej, taniej, wydatniej i nie będziemy mieć problemu na głowie)

-jakość IP można podnieść jednym ruchem legislacyjnym - wprowadzając odpowiedzialność finansową urzędników za nie stosowanie ustawy o IP, np na wniosek obywateli którzy są z tego powodu pokrzywdzeni (wg k.p.a)

-remodelowanie istniejących struktur w ramach ministerstw, urzędów centralnych i ich inicjatywy w zakresie "mega-BIPa/-ów" mają szanse być wydajniejsze niż inicjatywa społeczna (dajmy np szanse RCLowi na modelowy projekt "przejrzysty proces stanowienia prawa" - czyli monitorują, publikują wszystkie projekty ustaw i rozporządzeń, etc od momentu gdy projekt aktu trafia do nich do konsultacji)

Jako przedsiębiorca/obywatel:
mówię TAK

Dlaczego warto spróbować: efektywne pozyskanie materiału źródłowego będzie utrudniane przez administrację, ponieważ informacja i to jeszcze indeksowana lub skatalogowana to broń i podstawa zysku obywateli lub co gorsza dla AP narzędzie do występowania z pytaniami, roszczeniami, etc ze strony obywateli wszak - interesy są przeciwstawne biurokratów/AP vs obywateli

P.S Stowarzyszenie Bonafides udostępnia raporty nt stanu BIPów w województwie śląskim - przygnębiająca lektura wstępna przed praca nad postulowanym projektem

udzielę

jako członkini Stowarzyszenia, które walczy o zwiększenie przejrzystości (za całe Stowarzyszenie nie odpowiadam, ale mogę się zapytać)

Z mojej skromnej perpektywy

Z mojej skromnej perpektywy istnieją dwa główne zagrożenia:
- poprawne zaprojektowanie warstwy semantycznej, to jest uchwycenie w spójny model nie tylko możliwych danych z udostępnionej IP, ale i relacji między nimi; zbudowanie struktury danych dla contentu tworzonego w trakcie dyskusji.
- podtrzymanie ciągłości w rozwoju takiej platformy; musi być kilka osób, które projekt będą ciągnąć w poszczególnych obszarach oraz osoby, które będą zajmować się usuwaniem problemów i zapełniać poszczególne luki; Idealnie byłoby, gdyby każdy był do zastąpienia, inaczej prędzej czy później każdy projekt zaczyna kuleć - a to komuś urodzi się dziecko, a to ktoś zacznie nową, bardziej wymagającą pracę, czy zainteresuje się innym projektem. Prężny projekt, to taki w którym nawet jednoczesne "wypadnięcie" kilku osób nie powoduje większych perturbacji.

Ze mojej strony chęci byłyby, o ile byłyby szanse na faktyczne ruszenie z takim projektem. Ciut gorzej może być z konsekwencją i faktycznymi umiejętnościami. Może mógłbym być przydatny przy architekturze informacji (choć pewnie znajdą się bardziej doświadczone osoby), przy żmudnych pracach typu opracowywanie informacji - oraz na pewno przy szukaniu dziury w cały, bo do tego talent mam wybitny... ;)

KRS, Regon

Co do tego KRS-a, to można wykorzystać http://decaptcher.com/client/ - 1000 rozwiązanych CAPTCH za 2$. Udostępniają API, dzięki któremu takie CAPTCHE poprzez jakieś proxy wyświetlają się rozwiązywaczom w Indiach. Myślę, że na dobrym łączu po dobrze rozwiązanej jednej CAPTCHY dałoby się wystrzelić z 1000 requestów i za te 2$ obrócić całą bazę danych KRS 300k+ rekordów nawet codziennie, potem sparsować np. Nokogiri, Hpricotem albo WWW::Mechanize z dysku (obojętnie czy Perlowe czy w Ruby). W razie dostania bana za takie działania może możnaby ruch rozłożyć na jakieś open proxies albo exity Tora nawet pozostające w Polsce, gdyby obrona tych danych po IP zaistniała. Osobiście mam jakiś stan bazy sprzed kilku miesięcy, ale z takich nieświeżych danych to można sobie statystyki robić, a nie udostępniać ludziom jako materiał referencyjny. Przedstawiam oczywiście scenariusz wojenny ;) a nie uprzejmą prośbę "Panie Ministrze Krzysztofie Kwiatkowski, proszę usunąć tu tę CAPTCHĘ albo najlepiej podesłać mi dumpa bazy danych". ;)

Jest też baza Regon online http://www.stat.gov.pl/regon/ za CAPTCHĄ, którą się rozpykuje ImageMagickiem http://www.stat.gov.pl/regon/ mogrify -fx 'G' -level '0%,8%', a potem tesseractem albo gocrem konwertuje na tekst.

Tylko czy tam za tymi serwisami nie kryje się jakiś MS SQL Server, Oracle czy inne korpo z vested interesami w niewycieknięciu kontentu? ;))) Nie chce mi się przegryzać przez dokumentację przetargów ani skanować portów opcjonalnie w tej chwili.

lista W

No i na marginesie, przedmiot burzliwych dyskusji w przeszłości, z którego podobno można jakoś wyłuskać także dane agentów wywiadu działających obecnie ;) (przykro mi, nie rozumiem, jak może być dla mnie wartościowy ktoś, o kogo istnieniu nie wolno mi wiedzieć - rozumiem, że wolno mi mówić o agentach wywiadu 190 pozostałych państw) - http://web.archive.org/web/*/http://www2.glos.com.pl/IPN/Akta_osobowe.xls - lista Widsteina - chociaż to pewnie jedna z mniej wartościowych informacji "publicznych", za której wiarygodność nikt nie zechciał ręczyć i w związku z grubą kreską za wiele z niej wnioskować na forum publicznym.

wrota

Właśnie mi się przypomniało, czy kolejną inkarnacją BIP-ów w docieraniu z informacją do obywateli nie miały być Wrota po jednych na województwo? Kilka, które udało mi się znaleźć:
* http://www.wrota.podkarpackie.pl/
* http://www.wrotapodlasia.pl/
* http://wrota.warmia.mazury.pl/
* http://pio.wrota-swietokrzyskie.pl/
* http://www.wrotamalopolski.pl/

Odnotowuję to pewnie dla późniejszego zaciągania informacji. Bo strony i BIP-y Urzędów Województw, Urzędów Miast, kierownictw powiatów (?) i Urzędów Gmin to pewnie naturalnie każdemu przychodzą do głowy jako źródła treści dla tego typu portalu. Fajnie by było mieć także zagregowany dział "spółki skarbu państwa" - żeby wiedzieć, co może czekać na prywatyzację. ;)))

Owszem...

Mikołaj's picture

Udzieliłbym wsparcia na miarę doświadczenia i możliwości. Wydaje mi się, że skoro powiedziało się A, trzeba powiedzieć B.

--
Piotr "Mikołaj" Mikołajski
http://piotr.mikolajski.net

Bym wsparł

.. jako informatyk i architekt systemowy, ale jako architekt właśnie mam spore wątpliwości co do przydatności takiego rozwiązania. I zaraz wyjaśnię czemu:

1. Nie da się automatycznie zrobić dobrych danych ze złych danych. Jeśli dane, które system będzie pozyskiwał z BIPów czy innych źródeł publicznych będą kiepskie (nieopisane, ze złymi datami, chaotyczne, błędne, niekompletne) to nie ma cudów - nie stworzy się serwisu, który będzie to przedstawiał w formie nadającej się do konsumpcji (chyba że zatrudni się ludzi, którzy te dane będą weryfikowali, uzupełniali itd. Obecnie pracuję w firmie, która w pewnym sensie pełni takie funkcje - pobiera dane z kiepskich źródeł i robi z nich coś sensownego - więc wiem ile z tym zachodu).

2. Z szybkiego rzutu oka na stronę takiego np. BIPu wynika, że nie zaimplementowano tam nawet mechanizmu RSS. W związku z czym, aby dowiedzieć się co i czy zostało zmienione, "nasz" system musiałby ściągać co jakiś czas całą jego zawartość i porównywać. Działalność taką można (przy odrobinie złej woli) podciągnąć pod "atak na systemy informatyczne". Konieczna byłaby zatem współpraca rządu przy tym projekcie, choćby w zakresie wdrożenia najskromniejszej informacji o zmianach dokonywanych w treści poszczególnych BIPów. Lub jakiś "list żelazny" umożliwiający "naszym" harvesterom generowanie sporego ruchu na rządowych/gminnych/samorządowych/whatever serwerach.

+1

Ze względu na ograniczony czas, chyba głównie finansowego. Ale jeżeli pojawi się akurat temat na którym się znam, to chętnie również merytorycznego.

Chętnie

Zaangażowałbym się w taki projekt. Jako prawnik, redaktor lub w inny sposób.

następny krok

I jaki widzisz, Vagla, następny krok? Ja bym wystartował ściepę na współdzielony hosting, chociaż z dużą ilością miejsca na dysku na PDF-y sejmowe na przykład i domenę na start, postawił w subdomenie wiki do wielowątkowego obdyskutowania, co skąd pobierać, a także jak poza Internetem pozyskiwać informację publiczną i jaką - bo pewnie o tę trudno dostępną nawet bardziej chodzi. Obdyskutowania, co ma większy priorytet i zaczął stawiać drobne kroczki w ramach wolnego czasu contributorów. Na mój gust już bardzo pomocne na start byłyby często Apache directory listings z SQL-ami, CSV, XML, TXT. No, od biedy jakaś wyszukiwarka ;) Chyba że ktoś ma jakieś większe zacięcie do formalnej metodologii i zechce dyscyplinować zespół - jestem otwarty na propozycje. ;) Architektura prezentacji, zarządzania sama by wynikła (czyt. zająłby się tym ktoś inny ;)) - czy zechciałbyś to Drupalem zarządzać czy czymś innym - i tak trzeba będzie jakiś customowy kod backendowy stworzyć.

Użycie CMS narzuca

kravietz's picture

Użycie CMS narzuca określoną - i niezbyt fortunną w tym zastosowaniu - formę, do której trzeba później dostosowywać sposób publikacji dokumentów. Nie wydaje mi się przy tym, by taki serwis powinien mieć formę prezentacji bardziej skomplikowaną niż Craigslist czy Gumtree. Kluczowa jest odpowiednia kategoryzacja i otagowanie zasobów, a resztę niech zrobią wyszukiwarki.

--
Paweł Krawczyk
IPSec.pl - Podpis elektroniczny i bezpieczeństwo IT

Chętnie pomogę

Chętnie udostępnie wszelkie niezbędne zasoby typu sieć/serwery/administracja.

Udzielę wsparcia

Jeśli będzie potrzeba, to jak najbardziej.
Jako admin/programista/tester/użytkownik. Finansowo również.

Będą problemy, bo urzędnicy stawią zaciekły opór przed udostępnieniem czegokolwiek, byc może będzie trzeba rozważyć po prostu mirrorowanie serwisów rządowych wgetem i parsowanie tego co się zdobędzie, żeby później móc zrobić z tym cokolwiek sensownego.

Należy spróbować wykorzystać publiczne obietnice premiera o współpracy z internautami do wytargowania pisemnej zgody na republikację wszystkich informacji publicznych w takim serwisie, żeby można było za pomocą odpowiedniego pisma pokazanego urzędnikom zmusić ich do współpracy (dobrowolnie nie zechcą, to jest pewne na 150%).

Od strony technicznej to do prezentacji pozyskanych danych: mediawiki. Jeśli serwis ma być powszechny, to należy spodziewać się rosnącego z czasem obciążenia i większych ilości zapytań. Mediawiki jest z powodzeniem używane przez Wikipedię i daje radę obsłużyć miliony użytkowników, artykułów i plików z danymi (fotografie, schematy, rysunki, itp), więc do serwowania informacji publicznej (np. przepisów prawa, swieżo uchwalonymi przez Sejm) z załącznikami też da radę.

Bonusami są możliwości zapanowania nad tym kto może edytować treść z pełną historią zmian, co w połączeniu z np. automatycznym dodawaniem danych z serwisów rządowych dałoby możliwość łatwego śledzenia co kiedy i gdzie się zmieniło (znika problem pt. 'lub czasopisma', oczywiście przy założeniu że dane z serwisów rządowych mają porządnie wypełnione metadane). Poza tym wyszukiwarka artykułów, cała masa dodatków, możliwość eksportu do pdf i wersji przyjaznej dla drukarek.

(nie, nie jestem współautorem mediawiki, nie płacą mi za reklamę - uważam że to dobre narzędzie do publikacji dużej ilości danych, zwłaszcza przepisów prawa uchwalanych przez parlament, różnej maści uchwał, rozporządzeń itp, które urzędnicy codziennie produkują w ilościach hurtowych)

Piotr VaGla Waglowski

VaGla
Piotr VaGla Waglowski - prawnik, publicysta i webmaster, autor serwisu VaGla.pl Prawo i Internet. Członek Rady ds Cyfryzacji przy Ministrze Cyfryzacji, ekspert w Departamencie Oceny Ryzyka Regulacyjnego Ministerstwa Rozwoju, felietonista miesięcznika "IT w Administracji" (wcześniej również felietonista miesięcznika "Gazeta Bankowa" i tygodnika "Wprost"). Uczestniczył w pracach Obywatelskiego Forum Legislacji, działającego przy Fundacji im. Stefana Batorego w ramach programu Odpowiedzialne Państwo. W 1995 założył pierwszą w internecie listę dyskusyjną na temat prawa w języku polskim, Członek Założyciel Internet Society Poland, pełnił funkcję Członka Zarządu ISOC Polska i Członka Rady Polskiej Izby Informatyki i Telekomunikacji. Był również Członkiem Rady Informatyzacji przy MSWiA, członkiem Zespołu ds. otwartych danych i zasobów przy Komitecie Rady Ministrów do spraw Cyfryzacji oraz Doradcą społecznym Prezesa Urzędu Komunikacji Elektronicznej ds. funkcjonowania rynku mediów w szczególności w zakresie neutralności sieci. W latach 2009-2014 Zastępca Przewodniczącego Rady Fundacji Nowoczesna Polska, w tym czasie był również Członkiem Rady Programowej Fundacji Panoptykon. Więcej >>