Internet w bibliotekach II - łączność, współpraca, digitalizacja, Wrocław, 23-26 września 2003 roku |
- Spis treści
- Poprzedni - Następny
WprowadzeniePrace nad bibliotekami cyfrowymi w Poznańskim Centrum Superkomputerowo-Sieciowym trwają już od 1999 roku. W roku 2002 nawiązana została współpraca z Poznańską Fundacją Bibliotek Naukowych, której efektem było wdrożenie 1 października 2002 roku rozwijanego w PCSS pakietu dLibra [3,5] i powstanie Wielkopolskiej Biblioteki Cyfrowej[1] (WBC). Od tego czasu do projektu włączyło się wiele lokalnych bibliotek naukowych i akademickich, co spowodowało pojawienie się specyficznych wymagań wobec środowiska biblioteki cyfrowej. Charakter projektuOprogramowanie dLibra, wykorzystywane do obsługi Wielkopolskiej Biblioteki Cyfrowej, konstruowano z myślą o trzech generalnych założeniach:
Uzasadnieniem pierwszego z tych założeń jest to, że wiele bibliotek naukowych - choć dotyczy to po części również dużych bibliotek publicznych - dysponuje unikalnymi zbiorami wymagającymi odpowiedniego sposobu opracowania i udostępniania. Są to najczęściej zbiory takie jak: rękopisy, starodruki, druki ulotne itp. Ich katalogowanie wymaga odpowiednio wysokich kwalifikacji, które w znacznym stopniu związane są z wiedzą o tego rodzaju źródłach, wiedzą historyczną, umiejętnościami w zakresie odczytywania różnych rodzajów pisma, orientacją w stosowanych w danym okresie oznaczeniach, symbolach itp. Poza tym dzieła te ze względu na swój charakter najczęściej wymagają obszernych opracowań, komentarzy i objaśnień. Należy bowiem pamiętać o tym, że biblioteka cyfrowa udostępnia swoje zasoby wszystkim zainteresowanym, a nie tylko - jak to się obecnie dzieje na przykład w przypadku inkunabułów - wąskiej grupie specjalistów. W tej sytuacji regionalizacja sprawdza się znakomicie. To właśnie pracownicy biblioteki, której unikalne zbiory są udostępniane w Internecie, najlepiej potrafią je skatalogować, opatrzyć komentarzami i wreszcie przygotować dla nich odpowiednią postać witryny, poprzez którą są one udostępniane. Nie należy również zapominać o konieczności przygotowywania różnego rodzaju okolicznościowych wystaw i prezentacji, które wymagają zestawiania wielu źródeł w odpowiednie konfiguracje opatrzone znów licznymi, fachowymi komentarzami. Drugie założenie ma fundamentalny znaczenie, dotyczy ono bowiem sposobu funkcjonowania współczesnych bibliotek. Tworzenie biblioteki cyfrowej o charakterze centralnym oznacza w istocie powstanie odrębnej instytucji. Jest to rozwiązanie po pierwsze dość kosztowne, po drugie raczej niechętnie widziane przez istniejące biblioteki, widzące w bibliotece centralnej swego rodzaju konkurenta. Zatem słuszne wydaje się założenie, że każda biblioteka powinna mieć możliwość korzystania z oprogramowania biblioteki cyfrowej w taki sposób, aby mogła sama dostosowywać je do swoich potrzeb oraz potrzeb swoich czytelników. Nie podnosi to w sposób drastyczny kosztów (biblioteka w zasadzie nie ponosi żadnych wydatków), bo sprowadza się jedynie do utrzymywania serwerów i ich serwisu. Obsługę zasobu wykonuje biblioteka siłami własnego personelu. Takie lokalne podejście ułatwia również elastyczne kształtowanie zasobu udostępnianego poprzez Internet. Dotyczy to szczególnie podręczników. Wiadomo, że lokalna biblioteka najlepiej zna potrzeby swoich czytelników i najszybciej może dostosować swój zbiór do ich oczekiwań. W przypadku wysokiego stopnia centralizacji jest zapewne niemożliwe uwzględnianie potrzeb wszystkich lokalnych społeczności. Założenie trzecie wiąże się z metadanymi. Otóż do przeszukiwania i wyszukiwania informacji w zbiorach biblioteki cyfrowej konieczny jest odpowiedni zbiór metadanych, czyli biblioteczny katalog. Ponieważ biblioteki na ogół dysponują doskonale opracowanymi katalogami, najbardziej sensownym rozwiązaniem wydaje się być wykorzystanie tych tworzonych przez lata zbiorów metadanych. Takie podejście znów pozwala zaoszczędzić bardzo poważne środki. Równocześnie ułatwia bibliotekarzom wprowadzanie danych. Wykorzystują oni interfejs, który doskonale znają i który jest dobrze dostosowany do ich potrzeb. Czytelnicy również mogą posługiwać się dotychczas używanym programem i efektywniej korzystać z biblioteki cyfrowej. Podstawowe funkcje oprogramowania dLibraPoczątkowo środowisko dLibra realizowane było z myślą o stworzeniu wydawnictwa elektronicznego. Dopiero po podjęciu współpracy Poznańskiego Centrum Superkomputerowo-Sieciowego z Poznańską Fundacją Bibliotek Naukowych okazało się, że wiele z funkcji tego oprogramowania odpowiada potrzebom bibliotek cyfrowych. Poniżej przedstawiono i krótko omówiono podstawowe funkcje bibliotek cyfrowych, które realizowane są w pełni przez środowisko dLibra.
Zaawansowane funkcje biblioteki cyfrowejChociaż podstawowe funkcje umożliwiają odnalezienie i przeczytanie publikacji podobnie jak ma to miejsce w "prawdziwej" bibliotece, to cyfryzacja stwarza ogromne, dodatkowe możliwości. Dzieła wydanego na papierze nie sposób podzielić na mniejsze części, wyodrębnić z niego definicji, diagramów, wzorów czy obrazów. Trudno też sobie wyobrazić, aby czytelnik zapisywał swoje uwagi do właśnie czytanego akapitu na marginesie książki, a przecież wszystko to możliwe jest w odniesieniu do bibliotek cyfrowych. Wystawy tematyczne to pierwsza z funkcji, która korzysta z możliwości wydzielenia z publikacji poszczególnych części. Ponieważ liczba dzieł zgromadzonych w bibliotece cyfrowej jest ogromna, czytelnikowi może być trudno odnaleźć interesujące go informacje, przedstawione w przejrzysty i zrozumiały dla niego sposób, szczególnie, jeśli nie jest specjalistą z danej dziedziny. W takim przypadku niezbędna wydaje się być pomoc kustosza biblioteki, który, korzystając ze swojej wiedzy oraz obiektów znajdujących się w bibliotece, może przygotować wystawę tematyczną. Na przykład, chcąc przybliżyć czytelnikowi malarstwo impresjonistów, kustosz może wybrać najważniejsze ze swojego punktu widzenia dzieła impresjonizmu, ustawić je w dowolnej kolejności, opatrzyć własnym komentarzem i zaprezentować czytelnikowi w formie wspomnianej wystawy. Innym przykładem mogą być wystawy organizowane w połączeniu z imprezami okolicznościowymi, kiedy to warto zgromadzony w bibliotece materiał wykorzystać do stworzenia ciekawej i unikalnej publikacji na temat danego wydarzenia. Możliwość tworzenia wystaw tematycznych nakłada jednakże pewne ścisłe ograniczenia na budowę biblioteki cyfrowej. Po pierwsze, aby w ogóle móc tworzyć wystawę, kustosz musi mieć możliwość zarządzania nie tylko całymi zbiorami, ale pojedynczymi obrazami. A zatem każdy najmniejszy składnik publikacji znajdujących się w bibliotece, na przykład plik z obrazem, powinien być rozróżnialny jako osobny, samowystarczalny obiekt. Co za tym idzie, powinna istnieć możliwość opisania takiego pojedynczego obiektu metadanymi. Dzięki takiemu podejściu twórca wystawy traktuje bibliotekę jako pewien zbiór obiektów, które można dowolnie układać, łączyć, opisywać i dodawać komentarze, aby osiągnąć pożądany efekt [10]. Podział publikacji na małe części składowe jest przydatny także w wielu innych sytuacjach. Publikacja raz wydana na papierze nie może zostać zmieniona. Pewnym rodzajem zmiany jest przygotowanie nowego wydania, wydrukowanie i rozpowszechnienie dzieła. Taki cykl wydawniczy trwa bardzo długo, a w efekcie czytelnikowi trudno jest znaleźć i przeanalizować tylko zmienione lub dodane w nowym wydaniu informacje. Nie jest także łatwo przekonać czytelnika, aby poniósł koszt związany z nabyciem nowego wydania dzieła. Niestety, w wielu przypadkach ciągłe zmiany w publikacji są konieczne, aby zachować jej aktualność. Przykładem mogą być materiały wykładowe przygotowywane przez wykładowców uczelni wyższych. Dlatego też cykl życia publikacji elektronicznej przedstawia się następująco:
W punkcie 6 cyklu życia pojawia się wersjonowanie. Autor modyfikuje w dowolny sposób tylko te obiekty składowe publikacji, które uzna za stosowne. Całe rozdziały może pozostawić niezmienione, za to może dopisać nowe lub wymienić rysunki. Jednak system doskonale wie, co zostało zmienione, usunięte lub dodane i jest w stanie później te zmiany wskazać czytelnikowi. Podział na małe części jest także korzystny z punktu widzenia wyszukiwania konkretnej informacji na dany temat, na przykład definicji czy twierdzenia. Jeśli w książce każda definicja jest osobnym elementem, który można opisać niezależnie od pozostałych, wówczas czytelnik może bezpośrednio odnaleźć tę definicję, która go interesuje. W przeciwnym wypadku wynikiem wyszukiwania byłaby cała książka, w której gdzieś w środku znajdowałaby się szukana definicja. Można to porównać do indeksu, który tworzony jest nie dla pojedynczego dzieła, ale dla wszystkich publikacji znajdujących się w bibliotece. Zastosowanie XML w bibliotekach cyfrowychJak wynika z opisu powyższych funkcji, podział publikacji na małe elementy składowe o zdefiniowanym znaczeniu jest bardzo przydatny. Powstaje jednak zasadniczy problem. Chociaż człowiekowi łatwo jest wyróżnić w tekście takie elementy jak rozdziały, definicje czy akapity, to dla komputera jest to zadanie bardzo trudne. Dlatego też postuluje się wprowadzanie do bibliotek cyfrowych dzieł w takiej postaci, aby program komputerowy po pierwsze mógł rozróżnić akapity, wykresy, definicje etc., a po drugie mógł przetwarzać te (na przykład przeszukiwać) publikacje. Do tego celu wykorzystywany jest na świecie format XML [12] [13]. Umożliwia on wyspecyfikowanie poszczególnych części dokumentu w sposób zrozumiały dla programu komputerowego. Pisząc publikację, autor dokładnie określa, co jest tytułem, definicją, rozdziałem lub akapitem, a informacje te przechowywane są wewnątrz dokumentu XML. Przy tworzeniu tego rodzaju publikacji nie specyfikuje się ostatecznego wyglądu dokumentu (nie zmienia się wielkości czcionki, wprowadza pogrubień etc.), podaje tylko jego logiczną strukturę. Wygląd publikacji zostanie ustalony automatycznie w późniejszym etapie życia dokumentu. Dokona tego system komputerowy, który, znając semantykę poszczególnych części, będzie potrafił dobrać odpowiedni sposób ich prezentacji. Dzięki takiemu podejściu możliwe jest przygotowanie na życzenie czytelnika takiej wersji publikacji, która najlepiej odpowiada jego potrzebom. Zupełnie inaczej ten sam dokument będzie przygotowany do druku, do wyświetlenia na ekranie komputera lub urządzenia przenośnego jak palm. Oczywiście w bibliotekach cyfrowych przechowywane są różne rodzaje dokumentów. Mogą to być kolekcje obrazów, być literatura piękna czy podręcznik do fizyki. Każdy z tych dokumentów różni się rodzajem zawartości, na przykład w powieści nie spotyka się definicji czy wzorów. Inaczej też powinny być te dokumenty prezentowane. Dlatego też w przypadku dokumentów XML mówi się o definicji typu dokumentu (DTD). Każdy dokument XML przechowywany w bibliotece cyfrowej ma określony typ i musi przestrzegać reguł przez typ ten narzuconych. Na przykład typ książka może pozwalać na tworzenie rozdziałów, ale typ artykuł już niekoniecznie. Wyniki doświadczeń z Wielkopolską Biblioteką Cyfrową wskazują, że najbardziej rozpowszechnione DTD to docbook [8] dla publikacji technicznych oraz TEI [4] dla dzieł humanistycznych. Jednakże lista obsługiwanych przez bibliotekę standardów XML nie powinna być zamknięta. Ponieważ wspomniane dwa standardy w żadnej mierze nie wyczerpują wszystkich rodzajów informacji zapisywanych w publikacjach, środowisko biblioteki cyfrowej powinno umożliwiać wprowadzanie i obsługę nowych definicji typu dokumentu, w miarę pojawiania się nowych potrzeb użytkowników systemu. Przykładem mogą być publikacje zawierające wzory chemiczne, do których opisania konieczne jest zastosowanie specjalistycznych standardów DTD. Niestety, umiejętność obsłużenia przez środowisko biblioteki cyfrowej publikacji w formacie XML to nie wszystko. Często pracownicy bibliotek przygotowują do wprowadzenia dzieła w postaci zbiorów zeskanowanych obrazków. Jednakże taki nieuporządkowany i nieopisany zbiór rzadko przedstawia dużą wartość dla czytelnika. Dlatego też w skład oprogramowania biblioteki cyfrowej wchodzą odpowiednie narzędzia, które umożliwiają specjalistom łatwe przygotowywanie publikacji cyfrowych w formacie XML. Zarządzanie zawartością w bibliotekach cyfrowychZe względu na prawa autorskie lub inne ograniczenia, konieczne jest kontrolowanie dostępu do wszelkich zasobów biblioteki. Warto też dać użytkownikowi dodatkowe możliwości, które ułatwiają dostęp do zawartości. Poniżej opisana jest funkcjonalność środowiska dLibra, która umożliwia zarządzanie zawartością.
|
- Spis treści
- Poprzedni - Następny
(C) 2003 EBIB
Zastosowanie oprogramowania dLibra do budowy Wielkopolskiej Biblioteki Cyfrowej / Mirosław Górny, Cezary Mazurek i inni // W:Internet w bibliotekach II [Dokument elektroniczny] : łączność, współpraca, digitalizacja : Wrocław, 23-26 września 2003 roku. - Dane tekstowe. - [Warszawa] : Stowarzyszenie Bibliotekarzy Polskich, K[omisja] W[ydawnictw] E[lektronicznych], Redakcja "Elektronicznej Biblioteki", 2003. - (EBIB Materiały konferencyjne). - Tryb dostępu : http://www.ebib.pl/publikacje/matkonf/iwb2/dlibra.php . - Internet w bibliotekach II. - ISBN 83-915689-5-4