Archiwizacja oceanów informacji

Co przechowywać? Na jakich nośnikach? W Internecie z pewnością jest wiele interesujących materiałów, które mogą mieć znaczenie jako źródło informacji o wartości historycznej. Znaczna część przesyłanych w systemach teleinformatycznych danych to jednak zwykłe śmieci...

Ustawa o narodowym zasobie archiwalnym i archiwach przewiduje, iż materiałami archiwalnymi wchodzącymi do narodowego zasobu archiwalnego są wszelkiego rodzaju akta i dokumenty, korespondencja, dokumentacja finansowa, techniczna i statystyczna, mapy i plany, fotografie, filmy i mikrofilmy, nagrania dźwiękowe i wideofonowe oraz inna dokumentacja, bez względu na sposób jej wytwarzania, mająca znaczenie jako źródło informacji o wartości historycznej o działalności Państwa Polskiego, jego poszczególnych organów i innych państwowych jednostek organizacyjnych oraz o jego stosunkach z innymi państwami, o rozwoju życia społecznego i gospodarczego, o działalności organizacji o charakterze politycznym, społecznym i gospodarczym, zawodowym i wyznaniowym, o organizacji i rozwoju nauki, kultury i sztuki, a także o działalności jednostek samorządu terytorialnego i innych samorządowych jednostek organizacyjnych - powstała w przeszłości i powstająca współcześnie. Przepis wyraźnie wskazuje, iż sposób wytworzenia dokumentacji nie ma znaczenia, a więc trzeba uznać, iż dokumenty elektroniczne mogą wchodzić w skład narodowego zasobu archiwalnego.

Tylko, co należałoby archiwizować? W Internecie z pewnością jest wiele interesujących materiałów, które mogą mieć znaczenie jako źródło informacji o wartości historycznej o działalności Polski. Wszak nie chodzi tylko o dokumenty wytworzone przez urzędników administracji publicznej. Praktycznie każda organizacja społeczna, gospodarcza, zawodowa czy wyznaniowa stawia sobie za punkt honoru posiadanie i aktualizowanie swojego serwisu internetowego. Każda z nich również prowadzi bogatą korespondencję, wysyłając codziennie wiele listów elektronicznych.

Przy okazji tzw. Afery Rywina Wicemarszałek Sejmu Tomasz Nałęcz skomentował na łamach Gazety Wyborczej oświadczenie byłej minister kultury Aleksandry Jakubowkiej, która przyznała, iż na jej prośbę jeden z jej współpracowników usunął z ministerialnego twardego dysku jej prywatną korespondencję. Nałęcz stwierdził min.: "Jeśli to były ważne dokumenty, winny być zarchiwizowane zgodnie z obowiązującymi przepisami. Jeśli zaś korespondencję z prezes Łuczywo w sprawie autopoprawki do rządowego projektu ustawy o mediach Jakubowska traktuje jako prywatną korespondencję, to znaczy, że prywatnie kontaktowała się w tej sprawie z jednym z nadawców". W 2002 roku w USA dwa amerykańskie wydawnictwa oraz dwie tamtejsze stacje telewizyjne pozwały gubernatora stanu Utah, Mike'a Leavitt'a. Jaka była tego przyczyna? Gubernator kasował pocztę elektroniczną. Media uznały, że elektroniczna listy, które wysyłał gubernator, w danym przypadku pełniły funkcję dokumentów urzędowych (public records) i nie można było ich dowolnie kasować.

Truizmem jest stwierdzenie, że w Internecie pełno jest elektronicznych śmieci. Powstaje pytanie: które z dostępnych poprzez Sieć (lub za jej pomocą przesyłanych) informacji warto archiwizować? Z jednej strony rząd francuski wydał w 2001 roku rozporządzenie, na podstawie którego każda strona webowa powinna zostać oficjalnie zarchiwizowana, a obowiązek dopełnienia formalności z tym związanych spoczął na każdym z "właścicieli" i twórców witryn internetowych. Irlandzki resort sprawiedliwości poszedł jeszcze dalej, kiedy w 2002 roku zaproponował, by przez cztery lata archiwizować dane na temat przesłanych faxów, poczty elektronicznej, a nawet na temat każdego telefonu (wykonanego z telefonii tradycyjnej czy komórkowej). Podobnie, jeśli chodzi o dane dotyczące innej aktywności użytkowników internetu (n.p.: oglądalność stron internetowych). Z drugiej strony, podczas konferencji FedWeb 2002, przedstawiciele archiwów państwowych USA oraz innych tamtejszych agencji rządowych debatowali na temat dobrych praktyk archiwizacji zawartości stron www. W trakcie debaty stwierdzono, m.in., że nie wszystkie zasoby Internetu utrzymywane i tworzone nawet przez administrację publiczną nadają się do archiwizacji.

W Polsce obowiązuje ustawa o dostępie do informacji publicznej. Na jej podstawie miały powstać liczne strony internetowe, które w założeniach miały utworzyć ujednolicony system stron w sieci teleinformatycznej zwany "Biuletynem Informacji Publicznej". W stosownym rozporządzeniu Ministra Spraw Wewnętrznych i Administracji z dnia 17 maja 2002 r. w sprawie Biuletynu Informacji Publicznej można przeczytać, iż informacje zgromadzone w bazie danych strony głównej Biuletynu oraz informacje publiczne zgromadzone na podmiotowych stronach Biuletynu kopiuje się systematycznie na odrębne elektroniczne nośniki informacji, nie rzadziej niż raz na dobę. Pomyślmy. Jeden nośnik raz na dobę, to daje 365 indywidualnych nośników w roku, po dwóch latach - 730 indywidualnych nośników. Po trzech latach... Poza tym, że wiele organizacji zobowiązanych nie prowadzi stron BIP, nie ukształtowała się również praktyka, by w takich serwisach internetowych publikować elektroniczną korespondencję np. urzędników.

Nie tylko administracja publiczna ma obowiązek archiwizować informacje. Dotyczyć to może przykładowo dokumentów księgowych. W Polsce dokumentacja księgowa jednostek gospodarczych powinna być przechowywana w sposób zgodny z przepisami ustawy o rachunkowości. Zgodnie z nią księgi rachunkowe, dowody księgowe, dokumenty inwentaryzacyjne i sprawozdania finansowe należy przechowywać w należyty sposób i chronić przed niedozwolonymi zmianami, nieupoważnionym rozpowszechnianiem, uszkodzeniem lub zniszczeniem. Ustawa wskazuje okresy przechowywania poszczególnych zbiorów. A elektroniczne faktury? Minister właściwy do spraw finansów publicznych, w porozumieniu z ministrem właściwym do spraw informatyzacji, może określić, w drodze rozporządzenia, zasady przechowywania oraz tryb udostępniania organowi podatkowemu lub organowi kontroli skarbowej faktur przesyłanych drogą elektroniczną, uwzględniając przepisy prawa Wspólnot Europejskich, potrzebę zapewnienia kontroli prawidłowości rozliczania podatku oraz stosowane techniki w zakresie przesyłania danych w formie elektronicznej i kodowania tych danych. Tak mówi ustawa o podatku od towarów i usług. Jeśli dopuszcza się tworzenie odpowiednich dokumentów w postaci elektronicznej - należy również zastanowić się jak takie, elektroniczne dane przechowywać.

Czy archiwizować jedynie dokumenty księgowe i finansowe? Można pójść jeszcze dalej. W styczniu 2003 roku publicznie zastanawiano się nad archiwizacją dokumentacji handlowej w Australii. Mimo, iż w tamtejszych aktach normatywnych nie było szczegółowych zapisów na temat archiwizacji i przechowywania dokumentów wytworzonych i przesyłanych w postaci elektronicznej, prawo australijskie przewidywało generalnie konieczność przechowywania takich dokumentów jak zamówienia, cenniki, etc. Jeśli chodzi o podmioty prawa handlowego - powinny one przechowywać takie dokumenty przez pięć lat, w przypadku agend rządowych: lat siedem. Wedle danych z 2003 roku: 77% australijskich firm wykorzystywało pocztę elektroniczną by takie dane przesyłać. W tym miejscu zacząłem się zastanawiać nad archiwizacją ofert niezamówionych. Spam, a więc przesyłanie drogą elektroniczną niezamówionych informacji, to na całym świecie coraz bardziej dotkliwy problem. Czy potencjalny obowiązek archiwizowania napływających ofert handlowych dotyczyć by miał również tych, które zaśmiecają mi codziennie skrzynkę pocztową? Chyba tak daleko iść nie trzeba.

Wracając do spraw sądowych związanych z kasowaniem poczty. Warte odnotowania jest stanowisko sądu amerykańskiego, który w 2004 roku ukarał firmę Philip Morris grzywną w wysokości 2.75 miliona dolarów w związku z nieprzestrzeganiem wcześniejszego nakazu sądu, na mocy którego firma miała zabezpieczyć wszystkie dokumenty oraz inne informacje, które potencjalnie mogły mieć znaczenie w toczącym się postępowaniu. W procesie chodziło o to, że rząd oskarżył przemysł tytoniowy o wprowadzenie opinii publicznej w błąd, odnośnie informacji na temat skutków palenia papierosów. Sąd nakazał zabezpieczenie danych ("all documents and other records containing information which could be potentially relevant to the subject matter of this litigation"), jednak firma przez dwa lata kasowała co miesiąc pocztę elektroniczną, która miała więcej niż 60 dni. Sąd uznał, że przynajmniej jedenaście osób nie poddało się procedurze archiwizacji dokumentów elektronicznych, a były to osoby, które zajmują w firmie najbardziej eksponowane i odpowiedzialne stanowiska. Obowiązek archiwizowania elektronicznej korespondencji może zatem wynikać z stosownego postanowienia sądu.

Kiedy w listopadzie 2002 roku odbywało się inauguracyjne posiedzenie kolejnej kadencji Rady Archiwalnej, ciała opiniodawczego przy Naczelnej Dyrekcji Archiwów Państwowych, zgromadzeni uznali, że najważniejszym z zadań stawianych sobie przez nową Radę jest informatyzacja w archiwistyce. To twardy orzech do zgryzienia. Pierwszy problem, to zapewnienie nośników. Poza przechowywaniem olbrzymiej ilości informacji konieczne są również mechanizmy wyszukiwania tych, które w danej chwili są nam potrzebne. Warto również położyć nacisk na to, by dane były przechowywane w taki sposób, aby w przyszłości można było z nich skorzystać. Kto z szanownych czytelników pamięta jeszcze dyskietki 5,25"? No dobrze. W takim razie: kto przechowywał swoje dane na kartach perforowanych? Ja mam takie nośniki. Ale informacje tam zgromadzone uznałem już za stracone. Nie mam na czym ich "przejrzeć". Należy zastanowić się nad formą, gdy myśli się, by przechowywać jakieś dane wiecznie. Warto również zastanowić się nad formatem przechowywanych danych. Być może z czasem utracimy prawnoautorską licencje na oprogramowanie, dzięki któremu zgromadzone informacje możliwe są do odczytania.

Mając do dyspozycji cały Internet nie mogłem znaleźć precyzyjnej informacji, ile jest obecnie i z jaką dynamika przybywa publikowanych w Sieci treści. Są za to mało istotne i niepracyzyjne komunikaty: jak podała firma Netcraft w październiku 2004 roku, w ciągu poprzednich pięciu miesięcy na świecie powstało ponad pięć milionów nowych stron internetowych. Wedle Netcraft oznacza to, że obecnie jest ponad 55 mln aktywnych witryn. Z drugiej strony, Gazeta Bankowa prawie w tym samym czasie cytuje inne szacunki. Podobno obecnie prawie 90 proc. dokumentów powstaje najpierw w wersji elektronicznej, a aż 70 proc. z nich w ogóle nie istnieje w wersji papierowej. Tylko ile to jest dokumentów?

Piotr VaGla Waglowski

VaGla
Piotr VaGla Waglowski - prawnik, publicysta i webmaster, autor serwisu VaGla.pl Prawo i Internet. Członek Rady ds Cyfryzacji przy Ministrze Cyfryzacji, ekspert w Departamencie Oceny Ryzyka Regulacyjnego Ministerstwa Rozwoju, felietonista miesięcznika "IT w Administracji" (wcześniej również felietonista miesięcznika "Gazeta Bankowa" i tygodnika "Wprost"). Uczestniczył w pracach Obywatelskiego Forum Legislacji, działającego przy Fundacji im. Stefana Batorego w ramach programu Odpowiedzialne Państwo. W 1995 założył pierwszą w internecie listę dyskusyjną na temat prawa w języku polskim, Członek Założyciel Internet Society Poland, pełnił funkcję Członka Zarządu ISOC Polska i Członka Rady Polskiej Izby Informatyki i Telekomunikacji. Był również Członkiem Rady Informatyzacji przy MSWiA, członkiem Zespołu ds. otwartych danych i zasobów przy Komitecie Rady Ministrów do spraw Cyfryzacji oraz Doradcą społecznym Prezesa Urzędu Komunikacji Elektronicznej ds. funkcjonowania rynku mediów w szczególności w zakresie neutralności sieci. W latach 2009-2014 Zastępca Przewodniczącego Rady Fundacji Nowoczesna Polska, w tym czasie był również Członkiem Rady Programowej Fundacji Panoptykon. Więcej >>