![]() | Nr 4/2006 (74), Digitalizacja - kierunki działań Europy i Polski. Artykuł | ![]() ![]() |
![]() | ![]() | ![]() | ![]() |
Bożena Bednarek-Michalska
| |||
![]() | ![]() |
![]() | Miniony rok był rokiem niezwykle ciekawym i twórczym w polskim bibliotekarstwie. Powstanie wielu bibliotek cyfrowych stało się faktem, czymś tak naturalnym i normalnym, jak współkatalogowanie w latach 90. Dorastaliśmy do tego startu kilka lat, analizując dokonania światowe, przyglądając się bibliotekom cyfrowym znanych instytucji, ucząc się tego, jakie mają cechy zasoby elektroniczne i według jakich standardów należy je tworzyć. Wydaje się jednak, że jakkolwiek nieco wiedzy teoretycznej mamy, to jednak brakuje nam praktycznego doświadczenia, które jest niezwykle ważne, kiedy chcemy zmierzyć się z tak poważnym przedsięwzięciem, jakim jest budowa biblioteki cyfrowej. Wiemy, jak ważnym jest, aby na tym początkowym etapie jej tworzenia skorzystać z praktycznej wiedzy tych, którzy jakieś etapy prac mają za sobą, zawsze warto przyjrzeć się błędom, jakie popełnili, dopytać o przeszkody, które utrudniają wdrażanie nowych rozwiązań. Na konferencji CPI w Warszawie w styczniu 2006 roku Marek Nahotko przedstawił bardzo potrzebny i ważny referat na temat amerykańskich standardów tworzenia kolekcji cyfrowych [por. Marek Nahodko http://www.ebib.info/2006/74/nahotko.php]. Ponieważ wydawało mi się, że wiele z zasad, jakie określa dokument amerykańskiej organizacji NISO (National Information Standards Organization) pt.: A Framework of Guidance for Building Good Digital Collections [1], zostało spełnionych przy tworzeniu KPBC, sądzę, że warto je opisać od strony praktycznej i wdrożeniowej dla wszystkich tych, którzy o takie praktyczne rady nas pytają. Dokument ten, jak określił to Marek Nahotko, zajmuje się:
W kontekście tych standardów i naszych praktyk opisuję, jakie zasady i działania podjęto przy budowaniu Kujawsko-Pomorskiej Biblioteki Cyfrowej. Będzie to próba porównania konkretnych rozwiązań z zapisami normatywnymi, ale także szersze wyjście poza ten dokument, by wskazać na inne ważne elementy. Standardy te nie ujmują technologii, które wydają mi się w tym kontekście istotne. Dodaję zatem na końcu informacje o wymaganiach sprzętowych i oprogramowaniu. Standardy budowania dobrej biblioteki cyfrowej według NISOStandardy amerykańskie przedstawione w cytowanym wyżej oficjalnym dokumencie odnoszą się do planowania kolekcji cyfrowej. Są uniwersalne i pokazują najważniejsze zasady, jakie powinny być spełnione, by pomysł mógł być zrealizowany w stopniu poprawnym. PLANOWANIEZasada 1: Ważnym elementem dobrego projektu tworzenia biblioteki cyfrowej jest projektowanie i planowanie. Projektowanie przedsięwzięcia to niezwykle ważny czynnik, dlatego tej umiejętności trzeba się nauczyć. Warto na początek uświadomić sobie, że nieplanowe, chaotyczne podejście prędzej czy później zemści się tym, że projekt będzie niespójny i niemożliwy do zrealizowania, bo nie określimy przykładowo jakichś warunków początkowych, które powinny być spełnione, żeby wszystko się udało. W projektowaniu KPBC bardzo pomogła nam wiedza merytoryczna i umiejętności zespołu. Wiedzę taką nabywa się na różne sposoby, na przykład na studiach z zarządzania, kiedy wykładowca uświadamia nam, jaką wagę ma planowanie i projektowanie, dlaczego wszystko powinno być spisane na papierze, jak ma wyglądać porządny projekt od strony strukturalnej, jakie zawierać elementy składowe, co to jest biznes plan i harmonogram prac, wskaźniki efektywności czy jak osiągnąć końcowy rezultat. Ważne okazują się doświadczenia praktycznie wyniesione np. z realizacji projektów w ramach prac w organizacjach pozarządowych. Po zrealizowaniu 5 projektu, każdy następny wydaje się łatwiejszy, choć każdy jest inny zarówno co do celów, zasięgu, wagi, jak i skomplikowania. Wiele nauczymy się także, pisząc pierwszy wniosek o pieniądze unijne czy rządowe. Wniosek taki jest bardzo szczegółowy i żeby go wypełnić, trzeba zrobić szkicowy plan działania. Nie wszystkie składowe projektu uda się opracować profesjonalnie. Najwięcej problemu możemy mieć z określeniem potrzeb użytkowników polskich. Dobrze byłoby określić dokładnie odbiorcę treści biblioteki cyfrowej i zrobić analizę jego potrzeb i wymagań, ale w Polsce jest to prawie nierealne, wzbudza śmiech decydentów i zwykle na to nie ma czasu i pieniędzy. Gdyby w Polsce na bieżąco prowadzone były badania użytkowników bibliotek, badania dotyczące digitalizacji czy dostępne dane statystyczne związane z Internetem i nowymi technologiami, to opracowywanie takich przedsięwzięć byłoby łatwiejsze, ale tak nie jest. Nie mamy badań, analiz, koniecznych przy modernizacji usług bibliotecznych; zwykle musielibyśmy je zamawiać na rzecz projektu, co jest bardzo kosztowne i postrzegane przez decydentów jako fantasmagorie. Takie badania robią np. Niemcy (BIBWEB), zanim zaczną coś realizować ? pytają potencjalnych użytkowników, czy oni naprawdę potrzebują takich usług i wówczas opierając się na tych analizach wiedzą, jaki zakres mają przypisać danemu przedsięwzięciu. Na taki profesjonalizm musimy albo zarobi, albo poczekać na uczonych, którzy nam będą takie badania robić w ramach swoich planów badawczych. Zasada 2: Dobry projekt posiada plan oceny. Ocena powinna wynikać z realizacji wskaźników, które określi się podczas planowania. Ocena może skupiać się na procesach pracy zespołu i wynikach, jakie się uzyska w określonym czasie. Można w niej też uwzględnić: zarządzanie zespołem, zasobami oraz procedury działania, jakość produktu. Wreszcie ważne są wyniki: ile zeskanowaliśmy stron, ile to jest obiektów, czy systemy wdrożone działają, czy zakupiony sprzęt i wyposażenie zostały zakupione zgodnie z założeniami i są optymalnie wykorzystane, czy liczba użytkowników biblioteki cyfrowej rośnie itp. Dane do oceny mogą być zbierane za pomocą ekspertyz, badania grup celowych, wywiadów, badania logów transakcji i studiów przypadków. Wskaźniki celów projektu z KPBC:
Zasada 3: Dobry projekt generuje raport z realizacji projektu i szeroko rozpowszechnia informację o procesach projektu i jego wynikach. Realizatorzy projektów powinni zrobić wszystko, żeby informacja o działaniach była przejrzysta i dostępna dla każdego, zwłaszcza tam, gdzie projekt realizowany jest z pieniędzy podatników, czy to polskich, czy europejskich. W Polsce nie ma obyczaju dostarczania dokumentacji projektowej do wglądu zainteresowanym, twórcy zwykle trzymają ją pod kluczem i strzegą, jakby to był prywatny majątek. Słyszy się nawet taką interpretację, że jest to dorobek intelektualny własny, który nie powinien być rozpowszechniany. Zapominamy jednak o tym, że podobne zagraniczne projekty i opisy zgodnie ze standardami amerykańskimi i europejskimi są dostępne w Internecie i każdy, kto zechce je mieć, dotrze do nich. Co więcej są publikowane podręczniki dotyczące dobrych praktyk, by każdy mógł się z nimi zapoznać i nie popełniać tych samych błędów. Ten zwyczaj szerokiego dzielenia się wiedzą praktyczną ma wpływ na rozwój krajów i mnożenie się podobnych realizacji w poszczególnych instytucjach. Uważam to za ważne i sądzę, że jeżeli efektem naszego projektu będzie dobry model biblioteki cyfrowej, powinniśmy się nim dzielić, by mógł być zastosowany gdzie indziej. Jeżeli projekt ma znaczenie lokalne, regionalne lub narodowe, powinien być opisany w publikacjach, prezentacjach, anonsowany w mediach. W przypadku KPBC wszystkie te standardy zostały zrealizowane. Zarówno dokumentacja projektowa, jak i doświadczenie toruńsko-bydgoskiego zespołu są szeroko omawiane w prasie fachowej [12] [13]. Na życzenie jest także rozsyłana szczegółowa dokumentacja projektowa, a modele z niej wynikające zostały opublikowane w EBIB-ie [11] i przekazywane podczas konferencji krajowych. Opracowano także dla SBP poradniki projektowania dla szerokiego dzielenia się wiedzą. Promocja projektu prowadzona jest na skalę regionalną i krajową, bez zagranicznej. Ta ostatnia zaplanowana jest na później, po osiągnięciu wyższych wskaźników rezultatu i ocenie projektu. Koordynator projektu co trzy miesiące składa raport z wykonania projektu do Urzędu Wojewódzkiego, z którym UMK podpisał umowę na realizację zadania. Elementy promocji:
Zasada 4: Dobry projekt dotyczy całego cyklu życia zasobu cyfrowego i związanych z nim usług. Istotnym jest, by przy planowaniu pamiętać o tym, że projekt ma przetrwać nie tylko do zakończenia harmonogramu związanego z wnioskowaniem o pieniądze, ale i dłużej. W przypadku biblioteki cyfrowej ważnym jest, by dokonać dobrego wyboru sprzętu, platformy cyfrowej, zapewnić dalsze finansowanie, opracować taką organizację pracy zespołu, żeby po roku zespół się nie rozpadł. Należy także zaprojektować wykorzystywanie zasobów w długim okresie i niezbędne aktualizacje zasobu i stron WWW. Planowanie II fazy (2007-2010):
Biblioteki powinny przyjąć niedługo digitalizację jako taki sam stały proces pracy w swojej instytucji, jak kiedyś przyjęły katalogowanie elektroniczne i NUKAT. Biblioteka cyfrowa posadowiona na stronie internetowej własnej instytucji jest nową usługą ? nową jakością i należy o nią dbać, jak o każdą inną usługę, którą się wdraża w ramach prac rozwojowych. KPBC jest jedną z wielu usług elektronicznych, jakie BG UMK daje swoim czytelnikom. Rokrocznie wdraża się jakąś nową usługę i powoli zaczynamy się do tego przyzwyczajać. Nie mamy opracowanego jeszcze tego cyklu życia zasobów związanego ze zmianami technologicznymi w kolejnych 10 latach, ale to jest jakby poza naszym zasięgiem. Nie mamy wiedzy na temat zmian technologicznych, ich głębokości i kierunków, dlatego tak ważnym jest monitorowanie tego, co się dzieje w obszarze digitalizacji i utrzymywanie kontaktów z kolegami z Europy i USA, by być na bieżąco z tym, co może nas czekać za 10 lat. Uczestnictwo w międzynarodowych spotkaniach i konferencjach, czytanie zagranicznej prasy fachowej uważam w tym kontekście za niezbędne. Mówiąc o przyszłości, musimy myśleć o zagrożeniach i kłopotach, jakie niewątpliwie się pojawią. Opisaliśmy zagrożenia projektu i zidentyfikowaliśmy problemy nie tylko na poziomie lokalnym, ale i krajowym oraz europejskim, co daje nam pogląd na to, czemu mamy się bacznie przyglądać i co analizować. Niektóre z tych problemów powtarzają się na różnych poziomach, są zatem wspólne, np. copyright. Na poziomie lokalnym:
Na poziomie krajowym:
Na poziomie Europy w ramach budowania Strategia 2010 Digital Libraries, Bruksela 2005 ? identyfikacja problemów:
ZASOBYZasada 1: Dobry zasób cyfrowy jest tworzony na podstawie jasno określonej polityki rozwoju zasobu, uzgodnionej i udokumentowanej przed rozpoczęciem digitalizacji. W przypadku budowania dobrych zasobów cyfrowych jedną z ważniejszych spraw jest określenie polityki wypełniania zasobu. Zarówno co do treści, jak i typów dokumentów. Musimy zdecydować, co i dlaczego musimy digitalizować. Każda biblioteka taką politykę gromadzenia i specjalizacji ma, ma też od lat określonego odbiorcę, więc wie, dla kogo ma budować zasób i jaki on ma być. W KPBC jasno wyjaśniliśmy sobie na wstępie, dlaczego tworzymy trzy kategorie zasobów i według tego podziału skanujemy obiekty:
To ostatnie kryterium jest także użyteczne/przydatne w skali kraju, regionalizacja bowiem zapobiega dublowaniu skanowania. W przypadku KPBC przyjęto zasadę, że musimy dostarczać niektóre materiały edukacyjne dla studentów i wykładowców uczelni regionu, by wesprzeć proces edukacji (także e-learning) oraz kolekcje regionalne, by promować region i wspierać turystykę. Finansowanie projektu zakładało jego regionalizację i realizację polityki lokalnej. Inną zasadą przyjętą przez nas w planowaniu było myślenie o zbiorach specjalnych (dziedzictwo kulturowe), tu w grę wchodziły nasze specjalizacje i cenne kolekcje takie, jakich inne biblioteki nie posiadają. Są to: Pommeranica, Copernicana, Vilniana, zbiory emigracyjne. Ważnym zadaniem każdej akademickiej biblioteki jest także promowanie badań swojej uczelni ? w KPBC pojawiają się już prace toruńskich i bydgoskich uczonych. Zasada 2: Zasoby powinny być opisane w sposób pozwalający użytkownikowi uzyskać charakterystyki zasobów, w tym ich zakres, format, ograniczenia dostępu, własność i inne informacje istotne dla określenia autentyczności, integralności i interpretacji zasobów. Tego, jak ważny jest opis bibliograficzny (metadane) ściśle powiązany z obiektami cyfrowymi, nie trzeba bibliotekarzom tłumaczyć. Opis jest sporządzony według standardu Dublin Core i powinien być w przyszłości powiązany z NUKAT-em. W tej chwili staramy się w KPBC, by te obiekty, które mogą dostać rekord nukatowy (książka, czasopismo), miały taki opis najpierw w naszym katalogu lokalnym, który jest eksportowany do NUKAT-u, a potem kopiowany do formatu Dublin Core. Niestety, biblioteki cyfrowe zwykle mają obiekty, których do NUKAT-u wprowadzić nie można, bo nie ma norm opisu. Są to: grafiki, fotografie, DŻS-y, mapy, rękopisy. NUKAT jak najszybciej powinien usunąć te bariery, bo koordynacja digitalizacji w Polsce będzie bardzo utrudniona. Pomocne w tym zakresie mogą być nowe narzędzia wyszukujące. Jeśli w najbliższej przyszłości multiwyszukiwarki zaczną przeszukiwać wszystkie krajowe biblioteki cyfrowe (PCSS nad tym pracuje [3]), to może się okazać, że przy rosnącym zasobie cyfrowym dającym do wglądu nie tylko pełne teksty, ale i inne obiekty, do NUKAT-u nie będzie się zaglądać i jego funkcja koordynacyjna ulegnie znacznemu ograniczeniu. Technologie rozwijają się szybciej niż bibliotekarze adaptują konieczne normy ? na efekty uboczne nie będziemy czekać długo. Zasada 3: Zasób powinien być rozwijany w czasie. Szczególnie dla zasobów tworzonych przy pomocy specjalnych funduszy wewnętrznych lub zewnętrznych powinno się tworzyć plany dalszego rozwoju po zakończeniu finansowania. Tworzenie zasobu łączy się z jego zabezpieczeniem i niezmiennością w czasie. Musimy już dziś myśleć o tym, że zarządzanie całością zasobu jest związane z jego melioracją, tworzeniem statystyk, administrowaniem systemu, implementacją nowych wersji oprogramowania, zapewnieniem bezpieczeństwa. Administrowanie platformą cyfrową można i trzeba zapewnić sobie na poziomie biblioteki (jeśli jest to konsorcjum, to może to się odbywać tylko w jednej bibliotece), zarządzaniem zasobami powinni zająć się redaktorzy we wszystkich bibliotekach uczestniczących w budowaniu zasobów. Oni też powinni pilnować jakości zasobów, natomiast kopię bezpieczeństwa można robić na poziomie uczelni w ośrodkach informatycznych. Zalecane jest nawet, żeby kopie były przechowywane na serwerach w różnych budynkach. Powinniśmy też zacząć już myśleć w skali kraju o kopii krajowej i bezpiecznym banku danych dla wszystkich zasobów Polski. Zasada 4: Dobry zasób jest szeroko dostępny oraz pozwala unikać przeszkód w jego użytkowaniu. Zasoby powinny być dostępne dla osób niepełnosprawnych i efektywnie wykorzystywane w połączeniu z technologiami adaptacyjnymi. KPBC ma być biblioteką publiczną, dostępną szeroko i za darmo każdemu obywatelowi naszego kraju. Jeżeli będą wprowadzone ograniczenia dostępu, to będą one wynikały jedynie z przepisów prawa i ograniczeń autorskich. dLibra jest oprogramowaniem, które nie sprawia wielu kłopotów jego użytkownikom. System dLibra oferuje swoim użytkownikom wiele interesujących cech, takich jak rozbudowane możliwości opisu bibliograficznego, mechanizm wersjonowania przechowywanych treści, kompleksowa kontrola dostępu do przechowywanych zasobów, zabezpieczenia przed kopiowaniem treści czy przeszukiwanie treści i opisów publikacji [3]. Znanym kłopotem jest jednorazowe instalowanie programu, który obsługuje format DjVu. Ale dlatego dLibra ma wmontowany mechanizm podpowiadający użytkownikom, co należy zrobić, żeby ten proces nie był uciążliwy. Takie informacje zamieszcza się także w opcji POMOC. Biorąc pod uwagę przepustowość łączy, format DjVu jest bardzo dobry, bo pliki nie są tak wielkie, jak w przypadku np. PDF. Każda przeglądarka widzi dLibrę. Jeśli chodzi o niepełnosprawnych niedowidzących czytelników, to oprogramowanie pozwala na dowolne powiększanie tekstu, tak by był dobrze odczytywalny. Nie ma jeszcze wbudowanej opcji czytania na głos, ale to jest kwestia czasu i kosztów. Dyskutujemy także nad tym, by w przyszłości móc zamieścić w dLibrze pliki audio-video oraz nuty w formacie pozwalającym na odegranie melodii w nich zapisanej. W tej chwili KPBC ma tylko pliki graficzne i tekstowe. Zasada 5: Przestrzegamy praw autorskich. Zarządzający biblioteką cyfrową powinni prowadzić zapisy dotyczące właścicieli praw autorskich i udzielonych pozwoleń dla wszystkich materiałów, których to dotyczy. Twórcy bibliotek cyfrowych powinni znać polskie i europejskie prawo autorskie, korzystać z opinii prawników, by dobrze nimi zarządzać. W KPBC zamówiono ekspertyzy i opinie prawne z Instytutu Wynalazczości i Własności Intelektualnej UJ [6], wskazując jednocześnie na standardy obowiązujące w Europie i USA, by nasi prawnicy mogli się do nich odnieść. Poradzono się prawników uczelnianych, dzięki którym powstały jasno określone zasady pozyskiwania i udostępniania dzieł w KPBC. W chwili starsze obiekty idą bez zgody do Internetu (po 70 latach od śmierci autora), o młodsze za każdym razem pytamy i podpisujemy licencje na udostępnienie dzieła w sieci (mamy dwa modele licencji) albo z wydawcą książki czy czasopisma, albo z autorem, a czasem z obydwoma na raz. Każdy obiekt to indywidualna historia prawna. Musimy wiedzieć, że:
Zarządzanie prawami jest trudne, żmudne, kosztowne i czasem nieefektywne. Wszystkie licencje trzeba przechowywać w postaci papierowej, prowadzić szeroką korespondencję z autorami i wydawcami, dzwonić, przekonywać, wyjaśniać i negocjować. Dlatego warto przygotować sobie serię standardowych wzorów pism, które potem modyfikując rozsyła się w różne miejsca i do różnych odbiorców. Warto poprosić o pomoc w pozyskiwaniu praw autorskich instytucje współpracujące czy inne biblioteki z regionu. W Europie toczy się teraz debata na temat, co zrobić z copyright i jak szybko można udostępnić dzieła w Internecie bez łamania zasad. Na złagodzenie prawa i rozwiązania systemowe musimy jeszcze trochę poczekać. Na uczelni dobrze jest przyjąć ogólną politykę publikowania elektronicznego, zgodną z ruchem Open Access, która może przyspieszyć pozyskiwanie praw. Wydawca uczelniany w takiej sytuacji automatycznie wydaje zgodę na publikacje, a autorzy sami się zgłaszają do biblioteki, lub czas na perswazję skraca się do minimum. Modele takich polityk są opracowane przez OAI. Trudnym może okazać się przekonanie rektorów, że taka polityka jest niezbędna i z tym trzeba się liczyć. Zasada 6: Dobre zasoby posiadają mechanizmy pozwalające na zbieranie informacji o użyteczności zasobów. Do mierzenia wykorzystania zasobów można zastosować różne metody. W przypadku KPBC nie mamy jeszcze miarodajnych wywiadów, ekspertyz czy obliczeń, projekt jest zbyt krótki i zbyt mało jest zasobów, by mierzyć faktyczne ich wykorzystanie. Badanie logów nie jest miarodajne, choć pokazuje, że ludzie są bardzo zainteresowani bibliotekami cyfrowymi. dLibra ma wbudowane liczniki, które pokazują:
Zbieramy także bardzo szczegółowe informacje statystyczne przy pomocy programu Awstat:
Ruch nieoglądany zawiera ruch generowany przez roboty, robaki internetowe lub odpowiedzi ze specjalnymi kodami statusu HTTP. Historia miesięczna![]()
Czas wizyt:
Możemy także na bieżąco obserwować, jakie publikacje cieszą się największym zainteresowaniem, przy każdym obiekcie jest informacja: Liczba wyświetleń treści publikacji: 19. Jest to przykład obiektu, do którego wchodzono 19 razy. Poniżej inne obiekty:
Dostajemy listy od czytelników, którzy pytają, proszą o zeskanowanie konkretnych obiektów, pokazują wady lub chwalą bibliotekę. Rozmawiamy ze studentami (Radio Sfera, IINiB), a przy pertraktacjach autorskich z pracownikami uczelni negocjacje też przebiegają raczej sprawnie. Mieliśmy jak do tej pory parę odmów, ale generalnie podejście pracowników uczelni jest otwarte, gdyż są oni świadomi roli biblioteki wspierającej proces dydaktyczny. Dane statystyczne zamierzamy analizować rokrocznie i porównywać je tak, by wyrobić sobie opinię na temat tego, co najczęściej jest oglądane i dlaczego. Zamierzamy także w przyszłości zrobić ankietę wśród studentów i pracowników uczelni na temat przydatności zasobów w procesie nauki i pracy. Zasada 7: Dobra biblioteka cyfrowa pasuje do większego kontekstu ważnych inicjatyw narodowych i międzynarodowych. Lokalne inicjatywy powinny być zgodne z inicjatywami realizowanymi w skali ogólnokrajowej. Staramy się widzieć KPBC w kontekście własnej uczelni oraz regionu ? stąd realizujemy ją jako projekt konsorcyjny (dwie uczelnie) i regionalny ? jest otwarty dla wszystkich instytucji regionu przechowujących zasoby kultury. Biblioteka Uniwersytecka w Toruniu wspólnie z Poznańską Fundacją Bibliotek Naukowych stara się zainicjować Alians Bibliotek Cyfrowych ? konsorcjum ogólnopolskie, które miałoby spełnić rolę koordynatora krajowego. Intencją jest, by zasoby powstające w Polsce były tworzone w sposób planowany, komplementarny i zgodnie ze światowymi standardami. Przy Ministerstwie Kultury i Dziedzictwa Narodowego ma powstać zespół doradczy ministra, który będzie budował strategię rozwoju zasobów cyfrowych w Polsce. Mamy nadzieję, że w ten sposób uda się skoordynować dotychczasowe działania i zbudować listę zasad, których wszyscy powinniśmy się trzymać. Wymaga też tego od nas Unia Europejska. OBIEKTYZasada 1: Dobry obiekt cyfrowy produkowany jest w sposób, który zapewnia realizację priorytetów zasobów, jego jakość wpływa na możliwość wielokrotnego wykorzystania. Bibliotekarze specjaliści zbiorów specjalnych (a w przyszłości i specjaliści dziedzinowi) dobierają obiekty według ich ważności, częstotliwości wykorzystania, stopnia zaczytania i zagrożenia jednostki. Na wybór mają także wpływ pracownicy działu udostępniania i bibliotek wydziałowych, ponieważ ich bezpośredni kontakt z czytelnikiem pozwala szybciej określić potrzeby studentów czy pracowników nauki. Wiemy, co cyrkuluje. Przygotowywanie spisów obiektów do skanowania jest etapem wstępnym określania, jak obiekt ma być wykonany, żeby nie trzeba było tego procesu powtarzać. Określają oni parametry skanowania takie jak: rozdzielczość, skalę barw, OCR, zaznaczają w uwagach cechy charakterystyczne obiektu, które mogą zaważyć na wyborze metody skanowania i skanera. Staramy się tworzyć produkt dobry, trwały i sensowny, tak by był wykorzystany. Mamy już wiele listów od czytelników, także z zagranicy, pozytywnie oceniających nasze zasoby. Oczywiście będziemy stale monitorować sytuacje i poprawiać to, co trzeba. Zasada 2: Dobry obiekt jest niezmienny. Oznacza to, że istnieje dobrze znana osoba lub instytucja, która dba o to, aby obiekt pozostawał dostępny w długim okresie czasu bez względu na zmiany technologiczne. Kujawsko-Pomorska Biblioteka Cyfrowa jest pod opieką konsorcjum, a jej części składowe: sprzęt, oprogramowanie, praca ludzi, infrastruktura należą do poszczególnych uczelni biorących udział w projekcie. Każda z uczelni wzięła na siebie obowiązek opieki nad cyfrowym zasobem wynikający z naturalnego procesu rozwojowego i będzie go chroniła tak długo, jak długo będzie to wynikało z potrzeb środowiska, wykorzystania, bezpieczeństwa zasobów i opłacalności całego procesu. Każda z uczelni wyznaczyła osoby do opieki nad projektem. Są to osoby na najwyższych stanowiskach w bibliotekach i fachowcy znający swoją pracę. Bibliotekarze wiedzą, jaka spoczywa na nich odpowiedzialność za tworzenie cyfrowych obiektów i że trzeba im zapewnić stabilność i długotrwałość. Szkolimy się i chcemy brać udział w pracach ogólnopolskich związanych z budowaniem stabilności zasobów. Zasada 3: Dobry obiekt jest digitalizowany w formacie ułatwiającym jego wykorzystywanie obecnie i w przyszłości lub ułatwiającym tworzenie kopii odpowiednich do wykorzystania. W efekcie dobry obiekt można wymieniać pomiędzy platformami, jest on ogólnie dostępny i został zdigitalizowany zgodnie ze znanymi standardami. Informacja cyfrowa jest krótkotrwała. Okres życia obiektów cyfrowych, sprzętu i oprogramowania oraz formatów określono w Bielefeld na 10-20 lat. Nie wiadomo, ile razy w tym czasie przyjdzie nam zmienić platformę, migrować dokumenty i metadane, poprawiać jakość czy format obrazu. Dlatego podjęliśmy decyzję, że przechowujemy TIFF ? plik źródłowy, DjVu ? format udostępniania. .djvu ? format plików graficznych. DjVu posiada bardzo efektywną metodę kompresji obrazu. Dokumenty DjVu są najmniejsze ze spotykanych w zastosowaniach przemysłowych, nawet do 1000 razy mniejsze niż pliki TIFF. Są też zwyczajowo 5 do 100 razy mniejsze niż pliki JPEG czy PDF. Chociaż pliki PDF są obecnie powszechnie używane, były rozwijane głównie jako formaty stosowane do wydruków i nie są najlepsze do zastosowań archiwizacyjnych. Dokumenty DjVu wyświetlane są zawsze w taki sam sposób. Oglądanie dokumentów DjVu jest niezależne od platformy. Wysoka jakość obrazu w dokumentach DjVu powoduje, że z dobrym skutkiem stosowane są w nich techniki rozpoznawania pisma OCR. Wyniki takiego rozpoznania zapisywane są wewnątrz dokumentu DjVu na specjalnej warstwie i mogą być poddane przeszukiwaniu lub eksportowane do pliku TXT lub XML. Dodatkowo dokumenty DjVu wygenerowane elektronicznie mogą pozyskać warstwę tekstową bezpośrednio z dokumentu źródłowego, z którego powstay. Warstwa tekstowa wówczas jest wierna z oryginałem w 100% [10]. Proces skanowania staramy się robić poprawnie tak, by obiekty jak najdłużej przetrwały. Myślimy także o zabezpieczeniu obiektów przynajmniej na dwóch serwerach. Obiekt skanowany i pokazywany w sieci ma rozdzielczość 300 dpi. Dla obiektów o szczególnym przeznaczeniu (np. do procesu wydawniczego czy archiwizacji) stosuje się wyższą rozdzielczość. Obiekty można wymieniać zgodnie z protokołem OAI-PMH. Możliwości Libry w tym zakresie zostały opisane w artykule Marcina Werli Protokół OAI-PMH jest w oprogramowaniu dLibra wykorzystywany do realizacji mechanizmu wyszukiwania rozproszonego. Mechanizm ten dostępny jest od wersji 2.2 oprogramowania [15]. Dzięki temu nasze biblioteki cyfrowe będą mogły być widziane przez takie wyszukiwarki, jak Google Scholar czy OAIster. Zasada 4: Dobry obiekt posiada nazwę będącą niezmiennym, unikalnym identyfikatorem. Nie powinna to być nazwa odwołująca się do nazwy pliku lub adresu (takiego jak URL), gdyż nazwy i adresy często się zmieniają. Bieżącemu adresowi powinien być przydzielony stały identyfikator. W KPBC identyfikator ma schemat URL (http://kpbc.umk.pl/publication/1207) i jest stały dla danego obiektu. Być może oznaczenie obiektu jednym identyfikatorem to za mało, być może trzeba będzie pomyśleć o identyfikatorze DOI? Myślę jednak, że ta sprawa powinna być przedyskutowana i metoda oznaczania obiektu przyjęta oraz zaakceptowana na poziomie krajowym. Jest to praca dla zespołu roboczego ds. metadanych przyszłego konsorcjum bibliotek cyfrowych. Recommended best practice is to identify the resource by means of a string or number conforming to a formal identification system. Example formal identification systems include the Uniform Resource Identifier (URI) (including the Uniform Resource Locator (URL)), the Digital Object Identifier (DOI) and the International Standard Book Number (ISBN) [9]. Dodajemy także do naszych obiektów sygnaturę biblioteczną lub numer inwentarza, by szybko dotrzeć do fizycznego materiału. Może to być uyteczne z punktu widzenia tego czytelnika, który zdecyduje się jednak obiekt obejrzeć w bibliotece. Na co także po cichu liczymy, nie chcielibyśmy tak do końca tracić naszych użytkowników z oczu na rzecz biblioteki cyfrowej. Zasada 5: Autentyczność dobrego obiektu może być określona na przynajmniej trzy sposoby. Po pierwsze użytkownik powinien mieć możliwość określenia pochodzenia obiektu, jego struktury i kolejnych wersji. Po drugie użytkownik powinien mieć możliwość określenia, czy obiekt jest tym, czego on oczekuje. Po trzecie użytkownik powinien móc określić, że obiekt nie został uszkodzony lub zmieniony w sposób niedozwolony. W KPBC informacja dokumentująca pochodzenie obiektu jest zapisana w dwóch polach metadanych tak, że czytelnik wie, z jakiej biblioteki pochodzi obiekt, jaką ma sygnaturę. Swoją tradycją i reputacją gwarantujemy także to, że obiekty przez nas opracowane są autentyczne i prawidłowo sporządzone. Nie wspominamy w ogóle w chwili obecnej o wersjonowaniu. Ale Libra ma możliwości wersjonowania, każda z wersji może mieć odrębny opis i są pola, w które możemy wpisać datę wprowadzenia kolejnej wersji. Te obiekty, które teraz skanujemy, nie są wersjonowane. Informacje umieszczane przez nas są następujące:
Data dodania publikacji: 2006-01-10. METADANEPoznańska platforma cyfrowa dLibra została przygotowana tak, by w pełni zastosować metadane w schemacie DC i MARC, RDF. Zawiera te dane na trzech poziomach:
Schematy danych należy jeszcze poprawiać i omówić na poziomie krajowym tak, by w całej Polsce był podobny schemat danych dla lepszego ich łączenia i wyszukiwania. Zasada 1: Dobre metadane powinny być odpowiednie dla materiałów w zasobach, dla użytkowników tych zasobów oraz zamierzonego, bieżącego i prawdopodobnego przyszłego wykorzystania obiektu cyfrowego. W KPBC mamy do czynienia z wieloma różnymi obiektami od książki i czasopisma do pocztówki i mapy regionalnej. Dla niektórych z tych obiektów, jak wyżej wspomniałam, nie ma norm, dlatego ważnym jest, by opisy były robione według jednego schematu w całym kraju, żeby były dość szczegółowe tam, gdzie NUKAT tego nie opisuje, natomiast tam, gdzie jest szczegółowy opis w katalogu NUKAT, można by stosować opis skrócony, to przyspieszyłoby znacznie napełnianie zasobu. Jeśli jest możliwość przerzucania danych z katalogu lokalnego czy katalogu NUKAT do dLibry, to należy to robić. Do opracowania zasobu KPBC wykorzystuje się doświadczenie najlepszych bibliotekarzy, którzy katalogują od lat i znają zasady i wartość standaryzacji. To zapewnia spójność metadanych i ich jakość. Przykład opisu bibliograficznego z KPBC wg schematu DublinCore:
W swojej podstawowej postaci system dLibra oferuje 15 atrybutów zgodnych ze standardem DublinCore w wersji 1.1. Wartości poszczególnych atrybutów są gromadzone w słowniku, wspierającym grupowanie wyrażeń o podobnym znaczeniu. Grupowanie to jest następnie wykorzystywane w celu poprawy wyników wyszukiwania. Ponadto każdy zasób może być przechowywany w systemie w wielu wersjach, z których każda może mieć odrębny opis i prawa odczytu [3]. Zasada 2: Dobre metadane ułatwiają współdziałanie. Konwersja danych jest istotnym elementem napełniania zasobów cyfrowych. W KPBC kopiujemy to, co mamy, a jak nie mamy opisu, tworzymy go od nowa, zachowując poprawność na tyle, by potem można było wykorzystać go do migracji w odwrotnym kierunku. dLibra korzysta z protokołu OAI-PMH przesyłania danych, udostępnia swoje metadane narzędziom indeksującym (Google), co pozwala włączyć metadane do ich własnych baz i wykorzystywać przez narzędzia wyszukiwawcze. W obecnej chwili trwają także prace w PCSS nad stworzeniem metawyszukiwarki, która będzie widziała wszystkie biblioteki cyfrowe w kraju i indeksowała je. Dzięki połączeniu bibliotek cyfrowych w rozproszoną platformę możliwe jest, aby każda z bibliotek cyfrowych stanowiła punkt dostępu do zasobów zgromadzonych w ramach całej rozproszonej platformy. System dLibra w wersji 2.2 umożliwia stworzenie takiej właśnie platformy dzięki wykorzystaniu mechanizmów rozproszonego pobierania i indeksowania metadanych opartego na protokole OAI-PMH. Interesujące w tym kontekście mogą być również inne protokoły, jak np. związane z sieciami P2P (ang. Peer to Peer). Dzięki takiemu podejściu możliwe będzie wykorzystanie usług rozproszonych bibliotek cyfrowych w wielu istniejących już systemach, takich jak na przykład systemy e-learningowe, portale edukacyjne, systemy dostarczania treści multimedialnej itp. Oznacza to, iż rozproszone biblioteki cyfrowe przy odpowiedniej strukturze i oferowanych usługach zdynamizują powstawanie nowych usług i aplikacji funkcjonujących w oparciu o dobre i pełne zasoby informacyjne [3] [15]. Zasada 3: Dobre metadane stosują kontrolę autorytarną i narzędzia kontroli treści, takie jak słowniki kontrolowane, spełniające wymagania użytkowników, co do opisu treści obiektów i łączenia ze sobą obiektów podobnych. Przy imporcie danych czy tworzeniu nowych wykorzystujemy istniejące kartoteki wzorcowe przy NUKAT i tezaurusy słów kluczowych, np. opracowane przez PAN. Nie mamy jednak automatycznej kontroli danych ani podłączonych do dLibry kartotek wzorcowych, ani słowników. Być może przyjdzie kiedyś czas na integrowanie zasobów NUKAT-u (i innych baz danych, np. bibliograficznych BN) z zasobami posadowionymi na platformach dLibra i wtedy ten problem będzie rozwiązany na poziomie technicznym. Jest to też zadanie do wykonania w skali kraju dla przyszłego konsorcjum. Zasada 4: Dobre metadane zawierają jasno określone warunki i zasady wykorzystywania obiektu cyfrowego.
W chwili obecnej w KPBC mamy obiekty, które nie są objęte prawami autorskimi majątkowymi (te mają znaki wodne poszczególnych bibliotek oznaczające, do kogo należy dany obiekt) oraz takie, na których udostępniane uzyskaliśmy licencje autora lub wydawcy. Nie mamy szczegółowych danych jasno określonych dla użytkownika poza określeniem ogólnym w opinie bibliograficznym: Czytelnicy mają ogólną informację o tym na stronie głównej KPBC i dwie licencje do wglądu: autorską i wydawniczą. Mamy świadomość, że ta kwestia musi być opracowana lepiej. Myślimy o wprowadzeniu licencji Creative Commons dla poszczególnych obiektów, ale to także należy przedyskutować na poziomie krajowym i międzynarodowym, ponieważ jest to rozwiązanie bardzo nowatorskie i ciągle jeszcze dyskutowane w Europie i USA. Sprawa copyright jest trudna. Zasada 5: Dobre metadane techniczne i administracyjne ułatwiają długoterminowe zarządzanie obiektami w zasobach. Za metadane administracyjne i techniczne odpowiedzialny jest administrator platformy dLibra i redaktorzy. Metadane służą ułatwieniu zarządzania zasobami. Są to informacje: jak i kiedy obiekt został utworzony, kto jest odpowiedzialny za kontrolę dostępu lub archiwizację, jakie działania kontrolne lub przetwarzania były podejmowane i jakie są ograniczenia użytkowania.
Przykładowe metadane techniczne:
Przykładowe metadane administracyjne: Ta lista oczywiście nie jest wyczerpująca. Metadanych techniczno-administracyjnych jest więcej, są też pewne niuanse, np. takie, że w bazie danych metadane zapisywane są w nieco innej postaci niż widać to w aplikacji redaktora i administratora. Zasada 6: Rekordy dobrych metadanych same są obiektami, więc powinny być tworzone zgodnie z zasadami tworzenia dobrych obiektów, takimi jak: autorytarność, autentyczność, archiwizacja, niezmienność i unikalna identyfikowalność. Poprawność metadanych jest bardzo ważna ? biblioteki akademickie uczestniczące w projekcie od lata katalogują zgodnie ze standardami przyjętymi w Polsce. Gwarantują więc autentyczność i poprawność metadanych. Wyżej wielokrotnie wspominałam już o współpracy z NUKAT-em i odpowiedzialności bibliotekarzy. Nie pozwalamy sobie na wprowadzanie niepoprawnych opisów. Być może uda się nam także opracować normy polskie związane z opracowywaniem zasobu, oczywiście na podstawie już istniejących norm światowych.
Opis bibliograficzny czasopisma widziany przez użytkownika: Wszystkie dostępne wydania tej publikacji: http://kpbc.umk.pl/publication/2047. TECHNOLOGIEBiblioteka cyfrowa nie będzie prawidłowo funkcjonować, jeśli nie oprze się jej o dobre oprogramowanie, sprzęt komputerowy i fachowców, którzy je będą utrzymywać, obsługiwać i rozwijać. Biblioteka cyfrowa jest drogim przedsięwzięciem nie tylko w momencie jej tworzenia, ale i długoterminowego przechowywania. Trzeba o tym pamiętać, bo stworzenie biblioteki cyfrowej generuje stałe wydatki. KPBC jest przechowywana na platformie cyfrowej dLibra ? http://kpbc.umk.pl/dlibra, stworzonej w Poznańskim Centrum Superkomputerowo-Sieciowym. Wybór tej platformy wiązał się z oceną, jaką zrobiliśmy, stosując następujące kryteria:
Rodzaje oprogramowania, które wspomagają proces tworzenia biblioteki cyfrowej: Nad oprogramowaniem i sprzętem czuwają informatycy i technicy Uniwersytetu Mikołaja Kopernika w Toruniu, zatrudnieni w Bibliotece Uniwersyteckiej i Uczelnianym Centrum Komputerowym. Bibliotekarze mogą myśleć o wprowadzaniu nowych usług elektronicznych, pod warunkiem jednak, że mają wsparcie informatyczne, które pozwoli utrzymać całą infrastrukturę i zabezpieczyć wytwarzany zasób. Jeśli instytucja takich warunków nie spełnia, nie ma co marzyć o samodzielnym przedsięwzięciu, trzeba pomyśleć o partnerstwie z silniejszą i bogatszą instytucją. Wymiana samych serwerów kosztuje tysiące złotych, a jest ona konieczna co parę lat. Sprzęt zakupiony do trzech pracowni digitalizacji w Toruniu i Bydgoszczy:
Dodatkowo wykorzystuje się dostępny w Instytucie Geografii UMK skaner specjalny do map. Mapy wymagają bardzo specyficznych urządzeń, związane to jest z formatami i odmiennym typem publikacji. Na tym skanerze wykonuje się mapy, które przechowywane są w bibliotece Instytutu. ZakończeniePrzyjrzeliśmy się wspólnie standardom amerykańskim i widzimy, że zasady, jakie zostały przyjęte, są bardzo pragmatyczne, wynikają z pewnością z doświadczeń, w tym także doświadczeń The Library of Congress, która jako jedna z pierwszych bibliotek na świecie zbudowała kolekcję cyfrową American Memory, prezentowaną u nas w latach 90. i rekomendowaną przez lata wszystkim, którzy rozmawiali z bibliotekarzami o tworzeniu zasobów cyfrowych. Kolekcja ta, składająca się dziś już z wielu tysięcy podkolekcji, jest przykładem solidnej amerykańskiej roboty, prostego podejścia do sprawy, które lubię. Amerykanie zamiast prowadzić wieloletnie debaty (patrz Unia Europejska) po prostu robią swoje, zdobywają doświadczenie, uczą się, zapisują dobre przykłady i zasady, tworzą modele, udostępniają w sieci dla wszystkich, są otwarci i zawsze chętni do pomocy. To dzięki doświadczeniu naszych kolegów z USA, liderów przemian, my dziś mamy znacznie prostszą drogę do zbudowania własnych zasobów. Ten tekst, który przygotowałam, pokazuje, że możemy w Polsce zbudować dobrą bibliotekę cyfrową. Bibliografia1. A Framework of Guidance for Building Good Digital Collections (2004) [on-line]. Wyd. 2. Bethesda: NISO Framework Advisory Group [dostęp 16 marca 2006]. Dostępny w World Wide Web: http://www.niso.org/framework/Framework2.html. 2. 8th International Bielefeld Conference: Academic Library and Information Services: New Paradigms for the Digital Age [on-line]. Bielefeld: Bielefeld University Library, 2006 [dostęp 16 marca 2006]. Dostępny w World Wide Web: http://conference.ub.uni-bielefeld.de/. 3. HELIŃSKI, M., MAZUREK, C., PARKOŁA, T., WERLA, M. Biblioteka Cyfrowa jako otwarte internetowe repozytorium publikacji. In Barbara Szczepańska (red.) III Konferencja Internet w bibliotekach. Zasoby elektroniczne: podaż i popyt. Wrocław, 12-14 grudnia 2005 roku [on-line]. [Warszawa] : Stowarzyszenie Bibliotekarzy Polskich, K[omisja] W[ydawnictw] E[lektronicznych], 2006 [dostęp 16 marca 2006]. EBIB Materiały Konferencyjne. Dostępny w World Wide Web: http://ebib.oss.wroc.pl/konferencje/iwb3/pdf/mazurek_in.pdf. 4. NAHOTKO, Marek. Biblioteki cyfrowych książek w środowisku akademickim i bibliotekarskim. In Cyfrowy świat bibliotek ? problemy techniczne, prawne, wdrożeniowe. Warszawa, 17-18 stycznia 2006 roku. Warszawa: Centrum Promocji Informatyki, 2006, s. 177-204. 5. FRANKE, Jerzy. Warianty rozwoju cyfrowych kolekcji. In Bibliologia, biblioteki, bibliotekarze. Pod red. Dariusza Grygrowskiego, Elżbiety Zybert. Warszawa: Wydaw. SBP, 2005, s. 73-89. 6. STANISŁAWSKA-KLOC, Sybilla. Prawo autorskie a biblioteka cyfrowa ? opinia prawna: sporządzona w ramach projektu KPBC finansowanego z Funduszy Strukturalnych UE. In Biuletyn EBIB [on-line]. 2005 nr 9 (70) [dostęp: 16 marca 2006]. Dostępny w World Wide Web: http://ebib.oss.wroc.pl/2005/70/stanislawska-kloc.php. ISSN 1507-7187. 7. JANUSZKO-SZAKIEL, Aneta. Open Archival Information System ? standard w zakresie archiwizacji publikacji elektronicznych. Przegląd Biblioteczny 2005 nr 3, s. 341-358. ISSN 0033-202X. 8. Reference Model for an Open Archival Information System (OAIS). Blue Book. Issue 1. January 2002. Adopted as ISO 14721:2003. 9. Guidelines for using resource identifiers in Dublin Core metadata and IEEE LOM, OCLC, [on-line]. [dostęp 20 luty 2006]. Dostępny w World Wide Web: http://www.ukoln.ac.uk/metadata/dcmi-ieee/identifiers/. 10. NAJSAREK Paweł. Terminologia Open Access. In Biuletyn EBIB [on-line]. 2006 nr 3 (73). [dostęp 16 marca 2006]. Dostępny w World Wide Web: http://www.ebib.info/2006/73/najsarek.php. ISSN 1507-7187. 11. SZCZEPAŃSKA, Barbara. Analiza stosowania Copyright w procesie digitalizacji i tworzenia bibliotek cyfrowych w Europie. In Biuletyn EBIB [on-line]. 2005 nr 9 (70). [dostęp 16 marca 2006]. Dostępny w World Wide Web: http://ebib.oss.wroc.pl/2005/70/szczepanska.php. ISSN 1507-7187. 12. CZYŻAK, Dominika. Kujawsko-Pomorska Biblioteka Cyfrowa ? stan zaawansowania realizacji projektu ZPORR. In Biuletyn EBIB [on-line]. 2005 nr 9 (70) [dostęp 16 marca 2006]. Dostępny w World Wide Web: http://ebib.oss.wroc.pl/2005/70/czyzak.php. ISSN 1507-7187. 13. KEMPA, Małgorzata. Konsorcjum Bibliotek Naukowych Regionu Kujawsko-Pomorskiego ? powstanie, zarys działalności, projekty na przyszłość. In Biuletyn EBIB [on-line]. 2004 nr 10 (61) [dostęp 16 marca 2006]. Dostępny w World Wide Web: http://ebib.oss.wroc.pl/2004/61/kempa.php. ISSN 1507-7187. 14. BEDNAREK-MICHALSKA, Bożena. Sprawozdanie z konferencji w Bielefeld. In Biuletyn EBIB [on-line]. 2006 nr 2 (72) [dostęp 16 marca 2006]. Dostępny w World Wide Web: http://www.ebib.info/2006/72/bielefeld.php. ISSN 1507-7187. 15. WERLA, Marcin. Biblioteka cyfrowa jako repozytorium OAI-PMH [on-line]. [dostęp 15 marca 2006]. Dostępny w World Wide Web: http://dlibra.psnc.pl/index.php?option=com_content&task=view&id=62&Itemid=62&lang=pl ![]() | ![]() |
![]() | ![]() | ![]() | ![]() |
| |||
![]() | ![]() |