Blokowanie linków i niechęć do "mirrorów" w administracji publicznej
To właściwie temat do przedyskutowania. Istnieje sobie serwis, który nazywa się Portal Nauka Polska. Znajduje się tam baza danych prowadzona przez Ośrodek Przetwarzania Informacji, a dane gromadzone są od 1991 roku. Jest to "najkompletniejsza i najaktualniejsza baza tego typu w Polsce". Gromadzone dane dotyczą instytucji naukowych i badawczo-rozwojowych, instytutów i organizacji wspierających naukę, ludzi nauki (osób fizycznych, które posiadają co najmniej stopień doktora), o pracach naukowych, etc. Ostatnio jednak zablokowano możliwość linkowania do udostępnionych zasobów. "Przez sztywne łącza próbowano ściągnąć całą naszą bazę na własne serwery. Na razie więc nie będzie możliwości tworzenia linków."
Gdyby ktoś chciał prześledzić polskie regulacje dotyczące publikacji w internecie, to musiałby sięgnąć do ustawy o dostępie do informacji publicznej (a wcześniej do konstytucji), ale też np. do rozporządzenia w sprawie Biuletynu Informacji Publicznej (por. dział BIP niniejszego serwisu). Przykład blokowania możliwości linkowania do zasobów ustawiłbym w jednym szerego z takim problemem jak zapewnienie dostępności zasobów, w tym: dla osób niepełnosprawnych (por. accessibility). I tak jak w przypadku rozważania problemów dostępności w aspekcie poprawnie przygotowanych do publikacji materiałów, tak i kwestia blokowania możliwości blokowania jest kwestią odpowiedzi na pytanie: jak udostępniać. Obok tego problemu jest to, co udostępniać.
O ile w przypadku serwisów "prywatnych" blokowanie linków jest pewnym rozwiązaniem, którego stosowanie w pewien sposób sam wskazywałem jako alternatywę do działań prawnych przeciwko "głębokim linkom" (generalnie uważam, że posługiwanie się takim pojęcie jak "głębokie linkowanie" świadczy o braku świadomości sposobu funkcjonowania odesłań hipertekstowych, gdyż wszystkie takie odesłania - moim zdaniem - są "głębokie"; por. m.in. "Głębokie" linki nielegalne!, Głębokie linki trafiły do Polski, Głębokie linkowanie we Francji, Głębokie linkowanie w Niemczech, czy felieton Bijące źródła i problemy odnośników), o tyle w przypadku instytucji budujących swoje zasoby za pieniądze publiczne (realizujących zadania publiczne) chciałbym widzieć szczególne obowiązki dotyczące sposobu udostępniania zasobów.
W Rozporządzeniu Ministra Spraw Wewnętrznych i Administracji z dnia 18 stycznia 2007 r. w sprawie Biuletynu Informacji Publicznej przewidziano, że treści zgromadzone na stronach BIP "nie są zabezpieczone przed drukowaniem i kopiowaniem". Prawdą jest też to, że o blokowaniu linkowania nic w rozporządzeniu nie ma. Być może to postulat do prawodawcy, by wyjaśnił tę sytuację w przyszłości, gdyż blokowanie linkowania może stanowić istotne naruszenie zasad dostępności, a już niebawem, jeśli Polska ratyfikuje Konwencję Narodów Zjednoczonych o prawach osób niepełnosprawnych, którą już Polska podpisała, w naszym systemie prawnym będzie trzeba zrobić trochę porządków. Inna sprawa, że w grę wchodzi jeszcze ocena naszego prawodawstwa przez pryzmat Dyrektywy 2003/98/WE Parlamentu Europejskiego i Rady z dnia 17 listopada 2003 r. w sprawie ponownego wykorzystywania informacji sektora publicznego (tam m.in. w preambule: "Powinno się zachęcać organy sektora publicznego do udostępniania do ponownego wykorzystywania wszystkich posiadanych przez nie dokumentów. W przypadkach, kiedy organ sektora publicznego ma prawo udzielania zgody na ponowne wykorzystywanie, organy sektora publicznego powinny promować i zachęcać do ponownego wykorzystywania dokumentów, w tym również tekstów urzędowych natury prawnej i administracyjnej", chociaż w tym samym miejscu: "Niniejsza dyrektywa nie zawiera żadnego zobowiązania, aby zezwalać na ponowne wykorzystywanie dokumentów").
Jest więc do rozstrzygnięcia istotny problem społeczny: na ile zasoby publiczne winny być "uwolnione" do dalszego wykorzystania i jakie są przesłanki do tego, by ktoś, kto się nimi "opiekuje" mógł decydować o sposobie ich udostępniania. Zdaję sobie sprawę, że dla wielu osób "opiekujących się" takimi zasobami wzbudzić może zaniepokojenie myślenie o tym, że oto: on pielęgnuje, ponosi nakłady, poświęca swój czas na to, by baza była kompletna, aktualna, dobrze przygotowana, a społeczność chce potem sobie to wszystko zabrać i to bezpłatnie, a może nawet jeszcze zarabiać na tym pieniądze. Ale mamy dobre przykłady z innych krajów (chociaż i tam są problemy; por. Wyszukiwanie osób w brytyjskim serwisie). Mam niestety też i inne przykłady: Ograniczono możliwość korzystania z materiałów serwisu Sejmu, Wielkiej Brytanii tradycja grodzenia, a więc o BBC i IPlayerze, Biuletyn, sankcje, cena informacji publicznej, ah! i jeszcze jej udostępnienie, Walka o publiczny dostęp do gromadzonych danych kartograficznych...
Udostępnianie informacji publicznych zderza się z "prawami własności intelektualnej" i to zderzenie przynosi nam coraz więcej problemów do rozstrzygnięcia. Istnieje też konflikt między dostępnością informacji a np. bezpieczeństwem publicznym (por. Zamknięto rządowy serwis z jawnymi tajnymi dokumentami). Nie wolno zapominać też o tym, iż koszt utrzymania infrastruktury potrzebnej do udostępniania takich baz danych i innych zasobów, również istnieje. Kto i w jaki sposób powinien łożyć na stałą dostępność takich materiałów? Harvestery i inne boty przeszukujące sieć potrafią skutecznie przyblokować dostępność (wysycić zasoby; por. Jak to jest z oglądalnością witryn administracji publicznej?, a i ja coś o tym wiem: Mam się cieszyć, czy martwić?). Widać też jak informacja ogólnie dostępna i bezpłatna stopniowo zagraża modelom biznesowym opartym na niedostępności informacji i jej odpłatności, ale przecież żyjemy w "społeczeństwie informacyjnym", a podmioty realizujące zadania publiczne mają określone funkcje i cele do osiągnięcia. Warto o tym pamiętać. Ja bym postulował otwartość i najszerszą z możliwych dostępność takich informacji, które są we władaniu instytucji publicznych.
O problemie z Portalem Nauka Polska napisał na liście dyskusyjnej Internet Society Poland Tomek "Polimerek" Ganicz, który zaangażowany jest w rozwój polskiej Wikipedii. Przywołam fragmenty tej wypowiedzi:
Serwis Nauka Polska ostatnio wprowadził dość dziwną politykę uniemożliwiającą bezpośrednie linkowanie do ich zasobów. Uzasadniają to tym, że były próby pobrania całej ich bazy danych przez "sztywne łącza". Zastanawiam co by im się stało jakby ktoś nawet pobrał całą bazę i udostępnił na swoim serwerze?
Wydają co prawda swoją bazę w formie opracowań papierowych - te wydania są jednak dotowane przez MENiSW, czyli przynoszą stratę a nie dochód. Jakby ktoś chciał to wydać i na tym zarobić - to chyba dobrze? Budżet Państwa by na tym zaoszczędził, bo samo OPI mogłoby przestać wydawania niedochodowego wydawnictwa, z korzyścią dla podatnika :-)
Może zatem zależy im na wysokiej oglądalności serwisu internetowego, żeby uzasadnić w ten sposób wysokie koszty własnego istnienia? Jeśli tak, to blokada na możliwość bezpośredniego linkowania do poszczególnych wpisów raczej im to obciążenie zmniejszy i to dość radykalnie. Z kolei jeśli chcą zmniejszenia obciążenia, co zapewne obniżyło by im koszty działania, to czemu uniemożliwiają tworzenie mirrorów?
(...)
Taki oto zostawiam niniejszym temat do dyskusji. Wypadałoby też podlinkować Portal Nauka Polska. Warto też pamiętać, że ten serwis nie jest Biuletynem Informacji Publicznej...
- Login to post comments
Piotr VaGla Waglowski
Piotr VaGla Waglowski - prawnik, publicysta i webmaster, autor serwisu VaGla.pl Prawo i Internet. Ukończył Aplikację Legislacyjną prowadzoną przez Rządowe Centrum Legislacji. Radca ministra w Departamencie Oceny Ryzyka Regulacyjnego a następnie w Departamencie Doskonalenia Regulacji Gospodarczych Ministerstwa Rozwoju. Felietonista miesięcznika "IT w Administracji" (wcześniej również felietonista miesięcznika "Gazeta Bankowa" i tygodnika "Wprost"). Uczestniczył w pracach Obywatelskiego Forum Legislacji, działającego przy Fundacji im. Stefana Batorego w ramach programu Odpowiedzialne Państwo. W 1995 założył pierwszą w internecie listę dyskusyjną na temat prawa w języku polskim, Członek Założyciel Internet Society Poland, pełnił funkcję Członka Zarządu ISOC Polska i Członka Rady Polskiej Izby Informatyki i Telekomunikacji. Był również członkiem Rady ds Cyfryzacji przy Ministrze Cyfryzacji i członkiem Rady Informatyzacji przy MSWiA, członkiem Zespołu ds. otwartych danych i zasobów przy Komitecie Rady Ministrów do spraw Cyfryzacji oraz Doradcą społecznym Prezesa Urzędu Komunikacji Elektronicznej ds. funkcjonowania rynku mediów w szczególności w zakresie neutralności sieci. W latach 2009-2014 Zastępca Przewodniczącego Rady Fundacji Nowoczesna Polska, w tym czasie był również Członkiem Rady Programowej Fundacji Panoptykon. Więcej >>
i to ma ich zabezpieczyć?
Rozumiem, że chodzi o to, że co chwila jest "sesja wygasła"... Takie mechanizmy są dosyć skuteczne przy zabezpieczaniu przed ściąganiem za pomocą skryptów PHP.
Ale jak ktoś chce na tym zarobić, to bez problemu takie zabezpieczenie obejdzie. Przykładowe sposoby:
1. Piszemy program, który steruje przeglądarką (np IE). Strona nie ma szans na rozpoznanie, czy informacje ogląda człowiek, czy program wszystko zapisuje.
2. Ktoś lepiej czuje się w Javascripcie? Instalujemy dodatek Greasemonkey do Firefoxa (opera ma to w sobie) - piszemy skrypcik, który będzie przeglądał strony i zapisywał. I znowu nie do wykrycia dla strony...
Tak więc nie rozumiem. Powstrzyma to osoby chcące podać po prostu linka, ale takich co chcą bazę skopiować w żaden sposób. Więc jaki sens?
Skrypt w PHP także może
Skrypt w PHP także może obsługiwać sesję przy automatycznych ściąganiu podstron. Można też stworzyć zwykłą aplikację np. windowsową. Nie ma żadnego problemu, a pomysły z wykorzystywaniem IE to zawracanie głowy.
ale jest jeszcze Javascript...
Którego odpowiednia działalność może być warunkiem na prawidłowe wysyłanie danych. Oczywiście można symulować to przez PHP... Ale naprawdę cwana strona będzie naprawdę trudna do takiego potraktowania - dlatego lepiej po prostu sterować przeglądarką.
Mam doświadczenia z
Mam doświadczenia z robieniem tego typu rzeczy i można to zrobić na kilka sposobów:
1) Sterowanie przeglądarką poprzez mechanizm DDE.
2) Napisanie własnego programu pod Windows (w przypadku javascriptu na stronie sprawa może się skomplikować):
Np. aby wyszukać w googlu "Piotr Waglowski" wysyłamy do hosta www.google.pl taki pakiecik:
GET /search?hl=pl&q=%22Piotr+Waglowski%22&lr= HTTP/1.1
Accept: */*
Referer: http://www.google.pl/
Accept-Language: pl
User-Agent: Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1)
Host: www.google.pl
Connection: Keep-Alive
Cookie: PREF=ID=4089947ad9cb2084: TM=1209584146: LM=1209584146: S=dDg0Q5GGyCo-3vt6
Jedyne, co tak naprawdę (tylko przy niektórych serwisach) trzeba zrobić, to przy otrzymaniu pierwszej odpowiedzi odebrać informację o cookie i ją potem podstawiać do pola "Cookie:". Otrzymujemy kilka pakietów z kodem HTML strony wynikowej i znajdujemy tam poszukiwaną informację.
3) Napisanie parunastu linijek kodu w PHP - jeszcze prostsze, odsyłam do tego niezmiernie krótkiego artykułu/przykładu.
Chciałbym zwrócić uwagę
Chciałbym zwrócić uwagę na jeszcze jeden aspekt całej sprawy. Przeglądając ten serwis niejednokrotnie mogłem zauważyć, że zawiera informacje, które nie są na bieżąco uaktualniane. Z informacjami dotyczącymi osób jest nieco lepiej, ale informacje dotyczące doktoratów i innych prac badawczych jest całkiem źle...
Gdyby informacja Portalu Nauka Polska była odpowiednio ustrukturyzowana (jakiś XML) - jednostki naukowe mogłyby bardzo łatwo włączać informacje o swoich pracownikach (i pracach) na swoich stronach. Powinno to istotnie zwiększyć ich zainteresowanie aktualnością informacji...
"Przez sztywne łącza
Wydaje mi się, że zaprezentowane uzasadnienie sugeruje, że blokowanie linków jest właśnie wprowadzone w charakterze "zabezpieczenia przed kopiowaniem"?
Idealny jest tutaj moim
Idealny jest tutaj moim zdaniem rozwiązanie amerykańskie. Otóż tam, materiały udostępniane przez _wszystkie_ instytucje federalne, wolno wykorzystywać w dowolny sposób. Czy to komercyjny czy niekomercyjny. Ktoś widać wyszedł ze słusznego założenia, że skoro są to instytucje finansowane z podatków obywateli, to obywatele mają prawo korzystać z wytwarzanych przez nie "dóbr intelektualnych".
Zgodnie z „Ustawą o
Zgodnie z „Ustawą o dostępie do informacji publicznej z dnia 6 września 2001 r.” każda informacja o sprawach publicznych powinna być jawna i każdemu przysługuje prawo do uzyskania takiej informacji. OPI niewątpliwie jest organem, który informację publiczną udostępniać powinien. I tak jest! Zgodnie z „Ustawa…” posiada własny Biuletyn Informacji Publicznej, gdzie znajdziemy informacje o statusie prawnym, majątku, organizacji i wszelkie inne informacje wymienione w „Ustawie..” . W BIP’ie tym czytamy również, że „przedmiotem działania Ośrodka jest prowadzenie badań naukowych i prac rozwojowych, projektowych, wdrożeniowych i usługowych w zakresie systemów informacyjnych”, a także, że w celu realizacji zadań określonych w Statucie Ośrodek „upowszechnia wyniki badań naukowych i prac rozwojowych” oraz „upowszechnia informacje o nauce i technice polskiej”. Patrząc przez ten pryzmat, zablokowanie możliwości linkowania do baz OPI wydaje się niezrozumiałe.
Z drugiej strony Dyrektywa 2003/98/WE w sprawie ponownego wykorzystywania informacji sektora publicznego... I nietrudno dziwić się OPI, że chce w jakiś sposób "panować" nad ponownym wykorzystaniem jego (?) informacji...
A Polskie Normy?
Według mnie taki sam problem występuje w przypadku Polskich Norm, których nie tylko nie da się linkować (bo nie ma do czego) ale nawet nie można wypożyczyć z biblioteki! A PKN w końcu też jest finansowany z naszych podatków...
Polskie Normy
Polskie Normy chronione są przez prawo autorskie, a w samym PKN istnieje tendencja, by dodatkowo wyłączyć działanie komitetu spod działania ustawy o dostępie do informacji publicznej: Szykuje się poważna nowelizacja ustawy o normalizacji.
--
[VaGla] Vigilant Android Generated for Logical Assassination
Ciekawostka
Być może tylko luźno związane z tematem, ale myślę że to jest ciekawy przypadek braku zrozumienia działania Sieci: http://www.boingboing.net/2007/10/17/lawfirm-copyright-pr.html
(proszę skasować jeśli komentarz nie na miejscu)