|
Jadwiga Sadowska Instytut Informacji Naukowej i Bibliotekoznawstwa Uniwersytetu Wrocławskiego
Polskie dziedzinowe bibliograficzne bazy danych w perspektywie lokalnej i globalnej
Abstrakt
W artykule podjęto próbę porównawczego spojrzenia na polskie dziedzinowe bazy danych i określenie na tej podstawie charakterystycznych i wspólnych ich cech, a także wskazanie tendencji rozwojowych. Przedmiotem zainteresowania są takie zagadnienia, jak: zawartość rekordów (dane bibliograficzne i pozabibliograficzne) i ich powiązania zewnętrzne (teksty, adresy), sposoby charakteryzowania treści (stosowane języki informacyjno-wyszukiwawcze, abstrakty), status baz i dostępność do nich, powiązania baz, organizacja pracy, związek z bibliografiami drukowanymi.
Słowa kluczowe
bibliografie dziedzin i zagadnień, bazy danych dziedzinowe, polskie dziedzinowe bazy danych, bazy bibliograficzno-abstraktowe
Abstract
Polish topical bibliographic databases in local and global perspective. In the paper the attempt is made to look at the Polish topical (subject) bibliographic databases from the comparative point of view and define on this basis both their distinctive and common features, as well as trends of their development. Attention is given to issues such as: content of records (bibliographic and non-bibliographic data), their links (to texts, addresses, records), ways of characterizing content (applied information retrieval languages, abstracts), status of databases and their availability, workflow and relationship with printed bibliographies.
Keywords
topical and subject bibliographies, topical and subject bibliographic databases, Polish topical and subject databases, abstracts and bibliographical databases
Od bibliografii dziedzin i zagadnień do dziedzinowych baz danych
Bibliografie dziedzinowe są ściśle powiązane z rozwojem nauk. Im bardziej rozwija się jakaś dyscyplina, tym bardziej potrzebne są jakieś „przewodniki”, które analizowałyby piśmiennictwo, wskazywały, co nowego i gdzie napisano na określony temat. Taką rolę pełnią spisy bibliograficzne dziedzin i zagadnień w odniesieniu do poszczególnych dyscyplin naukowych. O znaczeniu tego typu bibliografii świadczą liczby. Nawet pobieżna analiza współcześnie wydawanych roczników „Bibliografii Bibliografii Polskich” pozwala stwierdzić, że bibliografie dziedzin i zagadnień zajmują istotne miejsce wśród innych typów bibliografii. Dla przykładu, w roczniku za 2005 rok zanotowano ich 2776 na ogólną liczbę 4876, co stanowi 57%. Spostrzeżenia te potwierdza też analiza spisów bibliograficznych za lata 1979–1993, przeprowadzona przez Teresę Pawlikową[1]. W analizowanym okresie 15 lat ukazało się 8800 tego typu bibliografii, a więc średnio rocznie ok. 630 spisów. Jak stwierdziła autorka, najliczniej reprezentowane są pod tym względem dyscypliny humanistyczne: bibliologia, historia, językoznawstwo, literatura, prawo, naukoznawstwo, pedagogika, religioznawstwo. Opracowywane bibliografie mają różne zakresy tematyczne (czasem bardzo wąskie) i zasięgi chronologiczne są też różnej wielkości. Większość z nich ma charakter jednorazowy, niemniej jednak warto podkreślić, że wśród polskich bibliografii dziedzinowych są bibliografie bieżące o długiej tradycji, ukazujące się od pół wieku, a nawet dłużej i obejmujące całe dziedziny, jak np. „Polska Bibliografia Wojskowa”, „Przegląd Bibliograficzny Czasopiśmiennictwa Ekonomicznego” (wcześniej: „Przegląd Bibliograficzny Piśmiennictwa Ekonomicznego”), „Bibliografia Ekonomicznych i Społecznych Zagadnień Pracy. Piśmiennictwo polskie”, „Bibliografia Historii Polskiej”, „Polska Bibliografia Literacka” czy „Polska Bibliografia Bibliologiczna”.
Od lat 90. bibliografie dziedzin i zagadnień w Polsce zaczynają powoli przekształcać się w bazy danych (http://www.bj.uj.edu.pl/var/bibl_dziedz1_pl.php[2]), co jest skutkiem upowszechniania się techniki komputerowej. Rozwój technologii ma wpływ na kształt i zawartość opisów bibliograficznych, opracowanie rzeczowe dokumentów oraz postać bibliografii, a w dalszej kolejności na organizację prac nad bibliografiami. Inaczej mówiąc, po długim okresie stabilności metodologicznej w bibliografii (trwającym prawie do ostatniej dekady XX wieku), nastąpiły radykalne zmiany. Dotyczyły one także organizacji pracy nad bibliografiami – w XX wieku nasilił się proces przechodzenia od pojedynczego autorstwa (por. bibliografie: L. Finkla, W. Hahna, H. Sawoniaka) przez autorstwo instytucjonalne pojedynczych bibliotek, towarzystw, instytutów do zaangażowania wielu instytucji pokrewnych. .
W rozwoju bibliografii dziedzinowych w ostatnich kilkunastu latach (przełomu XX i XXI wieku) da się wyróżnić umowne trzy etapy.
A. Etap pierwszy
Można uznać, że rozpoczyna się on od lat 90. XX wieku i polega na stopniowym oddalaniu się od tradycyjnej, drukowanej bibliografii dziedzinowej i przechodzeniu do dziedzinowych bibliograficznych baz danych. Etap ten charakteryzuje się współistnieniem wersji równoległych bibliografii drukowanej i bibliograficznej bazy danych. Jako przykłady podajmy tu:
„Polską Bibliografię Bibliologiczną” (Biblioteka Narodowa, http://mak.bn.org.pl/w15.htm),
„Polską Bibliografię Wojskową” (Centralna Biblioteka Wojskowa, http://www.cbw.pl/cgi-bin/makwww.exe?BM=05),
„Polską Bibliografię Lekarską” (Główna Biblioteka Lekarska, http://www.gbl.waw.pl),
„Polską Bibliografię Literacką” (IBL PAN, http://pbl.ibl.poznan.pl),
„Bibliografię Geografii Polskiej” (Centralna Biblioteka Geografii i Ochrony Środowiska, http://www.cbgios.pan.pl), „Bibliografię Historii Polskiej” (Instytut Historii PAN, http://www.bibliografia.ipn.gov.pl). Do tej grupy można dołączyć także „Bibliografię Zawartości Czasopism”, która tym różni się od innych zakresowo, że dotyczy kilkunastu dziedzin. Każda z wymienionych bibliografii ukazywała się (lub ukazuje dotychczas) najpierw w postaci drukowanej, następnie otrzymywała równoległą postać jako baza danych.
Tworzenie bazy danych było skorelowane z bibliografią tradycyjną w tym sensie, że opis bibliograficzny został podporządkowany wymogom bazy danych (opis w strukturze formatowej), ale z jednoczesnym zachowaniem wszystkich elementów bibliografii tradycyjnej, łącznie ze sposobem charakterystyki treściowej. Powstające bazy bibliograficzne i wydawane spisy bibliograficzne w zasadzie nie różniły się. Baza danych była jakby odzwierciedleniem bibliografii, której edycja z kolei powstawała na podstawie bazy. Organizacyjnie i merytorycznie odpowiadała za bazę ta sama instytucja, która opracowywała bibliografię tradycyjną.
Na tym etapie można też obserwować dążenie do tworzenia wielu wąskozakresowych baz tematycznych, odpowiadających w przeszłości kartotekom zagadnieniowym. Z taką sytuacją mamy do czynienia np. w Centralnej Bibliotece Wojskowej, w której utworzono ponad 20 takich baz (np.: „Kampania Wrześniowa 1939”; „Powstanie Warszawskie”; „NATO”; „Polskie Misje Pokojowe”; „Terroryzm”; „Grób Nieznanego Żołnierza”; „Wojskowa Służba Kobiet”; „Patriotyzm”), w Ośrodku „KARTA” (np. „Baza Danych Ofiar Konfliktu Polsko-Ukraińskiego w Latach 40-tych XX w.”), w Bibliotece Narodowej (np. „Bibliografia Przekładów Literatury Polskiej” lub „Bibliografia Dzieł Jana Pawła II za Granicą”), w bibliotekach federacji FIDES (ponad 20 szczegółowych baz teologicznych). Te specjalistyczne bazy dają gotową informację z wyraźnie określonego zakresu, ale ponieważ można przeszukiwać je jednocześnie i równolegle, stosując przeglądarki działające w oparciu o protokół Z39.50 (np. FIDKAR lub KARO), stają się wirtualną bazą wyszukiwawczą o znacznie szerszym zakresie i wartości informacyjnej.
Dla końcowej fazy etapu pierwszego charakterystyczne jest stopniowe odrywanie się bazy bibliograficznej od bibliografii tradycyjnej, co wyraża się poszerzeniem charakterystyk treściowych, wprowadzeniem streszczeń i rezygnacją z formy drukowanej (np. „Polska Bibliografia Literacka”), bywa, raczej rzadko, że na rzecz odpowiednika elektronicznego formy drukowanej, czyli pliku PDF (taką postać mają np. „Bibliografia Historii Wielkopolski 1993–2000” i „Bibliografia Historii Kościoła na Śląsku”).
B. Etap drugi
Wymienione wyżej cechy mają charakter dynamiczny i progresywny, prowadzący ku drugiemu etapowi, którego główną cechą staje się współtworzona przez wiele instytucji bibliograficzna lub bibliograficzno-abstraktowa baza danych, niepowiązana i nieograniczona związkiem z bibliografią drukowaną. Wymieńmy tu: bazę PSJC – Polish Scientific Journals Contents (http://psjc.icm.edu.pl/), tworzoną przez PAN i ośrodki (instytuty) akademickie, obejmującą artykuły z angielskojęzycznych czasopism naukowych rolniczych i biologicznych, bazę SIGŻ – System Informacji o Gospodarce Żywnościowej (http://www.cbr.edu.pl/sigz.htm), tworzoną przez Centralną Bibliotekę Rolniczą i 15 instytutów naukowych, obejmującą zagadnienia rolnictwa i gospodarki żywnościowej, bazę EDUKACJA (http://www.dbp.wroc.pl/podbazy/dbp03.htm), tworzoną przez kilka dolnośląskich bibliotek pedagogicznych z zakresu szeroko rozumianej oświaty, szkolnictwa, pedagogiki i dziedzin pokrewnych, bazy teologiczne (http://fides.org.pl/), tworzone przez biblioteki Federacji FIDES, bazę BazHum (http://polishhistory.pl), tworzoną przez Muzeum Historii Polski, Interdyscyplinarne Centrum Modelowania Matematycznego i Komputerowego UW i biblioteki warszawskie instytutów PAN, zawierającą artykuły z czasopism humanistyczno-społecznych (właściwie historycznych) czy wreszcie BazTech (http://baztech.icm.edu.pl), tworzoną od 1998 r. przez ponad 20 bibliotek o profilu technicznym.
Współtworzenie baz dziedzinowych przez wiele instytucji nie jest jednak jeszcze zjawiskiem częstym w Polsce, choć widoczne jest dążenie do poszerzania tej formy organizacji pracy, zwłaszcza że od kilku lat istnieją odpowiednie warunki technologiczne.
Etap współtworzonych bibliograficznych baz danych ma dwa wyraźne aspekty: technologiczno-organizacyjny i merytoryczny. Aspekt technologiczno-organizacyjny wiąże się z architekturą klient-serwer, która pozwala na tworzenie centralnych baz danych, zlokalizowanych w jednym miejscu, zasilanych opisami bibliograficznymi przez wiele instytucji, dzielących między siebie źródła. Stosowane jednolite oprogramowanie pozwala na wysoki stopień kontroli i unifikacji danych. Współpracujące instytucje godzą się na korzystanie z tego samego oprogramowania, tych samych zasad opisu bibliograficznego i treściowego, tej samej organizacji pracy. Jest to model scentralizowanej bazy danych. Ten model może być realizowany także bez użycia technologii klient-serwer, a tylko przez dostarczanie danych do jednej bazy (np. baza artykułów z gazet i tygodników w BN).
Drugi kierunek aspektu technologiczno-organizacyjnego wiąże się ze standardem Z39.50, tj. protokołem jednoczesnego, równoległego przeszukiwania wielu baz, niezależnie od stosowanego systemu operacyjnego, oprogramowania użytkowego i formatu zapisu danych. Efekty przeszukania wielu różnorodnych baz danych wydawane są użytkownikowi w jednolitej postaci. Mamy tu do czynienia z rozproszonymi bibliograficznymi bazami danych, które są autonomiczne organizacyjnie i technologicznie. Dobrym przykładem są tu bibliograficzne bazy bibliotek teologicznych zrzeszonych w Federacji FIDES.
Aspekt merytoryczny etapu drugiego rozwoju bibliograficznych baz danych, w którym baza uwolniona jest od powiązań z wersją pierwotną bibliografii, pozwala myśleć o zmianach bardziej radykalnych, odnoszących się do zawartości rekordu dokumentu (a więc nie tylko opisu bibliograficznego, ale i innych informacji). Do rekordu zostają wprowadzone informacje dotyczące afiliacji autora, dane adresowe wydawcy, dodatkowe charakterystyki wyszukiwawcze, wreszcie abstrakty w języku narodowym i często angielskim. Możemy to obserwować w takich bazach, jak np. „Polska Bibliografia Lekarska” (streszczenia polskie i angielskie, deskryptory, słowa kluczowe GBL) lub w BazTech (streszczenia polskie lub angielskie, słowa kluczowe) czy PSJC, gdzie mamy słowa kluczowe, przynależność do dyscypliny, abstrakt, przy czym w tej bazie wymienione elementy są wyłącznie w języku angielskim.
C. Etap trzeci
Trzeci etap rozwoju dziedzinowych bibliograficznych baz danych określić można jako przechodzenie od opisu bibliograficznego do pełnego tekstu, czyli od baz bibliograficznych (bibliograficzno-abstraktowych) skierowujących do baz pełnotekstowych. Wydaje się, że dobrym wzorcem jest tu międzynarodowa baza DOAJ – Directory of Open Access Journals. Baza zawiera artykuły z ponad 4 tys. czasopism ze wszystkich dziedzin – jest w niej 68 tytułów polskich czasopism naukowych, głównie angielskojęzycznych z nauk matematyczno-przyrodniczych, ale i innych (według stanu do 2008 r.) http://www.ebib.pl/content/category/8/102/79. Baza daje informację bibliograficzną i faktograficzną o czasopiśmie, opis bibliograficzny artykułu oraz jego pełny tekst, do którego jest dostęp z poziomu opisu bibliograficznego. To bardzo ważna cecha tej bazy.
W Polsce dziedzinowe bazy pełnotekstowe są raczej unikatowe, co ma związek i z prawami autorskimi, i z obawami wydawców o los czasopism drukowanych. Można jednak sądzić, że jest to kierunek, do którego będziemy zmierzać. Niektóre bazy pełnotekstowe (polskie i zagraniczne) są dostępne tylko z sieci lokalnych uczelni, co wiąże się z wykupieniem prawa do korzystania (np. bazy ekonomiczne, prawne, statystyczne). Usługa dostarczenia pełnego tekstu z bazy jest też możliwa na zamówienie odpłatnie np. z bazy EDUKACJA, po uprzednim wniesieniu opłaty.
Wskazane etapy przenikają się i na pewno jeszcze długi czas będą współistniały, o czym świadczą także doświadczenia zagraniczne. Mimo rozwoju dostępu do baz pełnotekstowych nie znikają bazy bibliograficzne, a co najwyżej modernizują zawartość rekordów dokumentów, stając się bazami bibliograficzno-abstraktowymi.
Od opisu bibliograficznego do rekordu dokumentu
Analizując strukturę i zawartość rekordów bibliograficznych w dziedzinowych bazach danych, możemy dostrzec pewną ewolucję, którą da się określić jako przechodzenie od „klasycznego” opisu bibliograficznego, takiego jak w bibliografii drukowanej, do opisu (rekordu) dokumentu, zawierającego informacje bibliograficzne, adresowe i inne. Przykłady „opisu (rekordu) klasycznego” w dziedzinowych bazach danych znajdziemy np. w „Polskiej Bibliografii Bibliologicznej”, „Polskiej Bibliografii Wojskowej”, „Bibliografii Historii Polskiej”, „Bibliografii Geografii Polskiej”, „Bibliografii Nauk Kościelnych”. Zamieszczone tam rekordy dokumentów zawierają wszystkie elementy opisu bibliograficznego, ze wszystkich stref, pozwalając odtworzyć opis bibliograficzny w druku. Zawierają też hasła przedmiotowe czy symbole klasyfikacji w takiej postaci, jak mogą być wykorzystane w druku (indeksy, układ zrębu głównego bibliografii). W opisach tych są oczywiście aktywne linki kierujące do autora, tytułu, haseł przedmiotowych itp. Warto też zwrócić uwagę, że opis bibliograficzny dokumentu jest od razu powiązany z opisami pokrewnymi, np. recenzja dokumentu, polemika czy też inny związek między dokumentami. Jednak cały czas pozostajemy w kręgu „klasycznych” opisów bibliograficznych.
Rekord dokumentu w dziedzinowych bazach bibliograficznych, które oderwały się od postaci drukowanej, ma już nieco inny charakter. Przykładem może być baza „Polskiej Bibliografii Lekarskiej”. W rekordach uwzględniono podstawowe elementy opisu bibliograficznego (autor, tytuł, tytuł oryginału, tytuł równoległy, wydanie, adres wydawniczy, cytata wydawnicza), ale to, co szczególnie jest widoczne, to wyeksponowanie charakterystyk treściowych, mianowicie mamy tu cztery rodzaje charakterystyk treściowych (CHWD) i jednocześnie kluczy dostępu: deskryptory, podzielone na główne i pomocnicze, czego raczej nie spotykamy w bibliografiach drukowanych; następnie hasła przedmiotowe (a raczej słowa kluczowe) GBL, wskazanie typu dokumentu (np.: praca epidemiologiczna, praca związana ze zjazdem, praca kazuistyczna, standard), co można uznać za pewnego rodzaju charakterystykę formalno-rzeczową dokumentu; następnie wskaźnik treści (np. ludzie, dzieci, płeć żeńska). Oprócz tych czterech typów charakterystyk rekord zawiera streszczenia w języku polskim i angielskim (czasem tylko polskim).
I posłużmy się jeszcze przykładem rekordów z BazTech, które należą do tej drugiej grupy, ale są pełniejsze pod względem innych informacji niż bibliograficzne. Rekordy te zawierają dane bibliograficzne (autor, tytuł, tytuł równoległy, cytata wydawnicza), CHWD w postaci słów kluczowych w językach polskim i angielskim oraz streszczenia polskie i angielskie. Jest też informacja o typie dokumentu. Ale najbardziej istotną różnicą są informacje faktograficzne dotyczące autora (miejsce zatrudnienia) oraz czasopisma – mamy nie tylko informację bibliograficzną (tytuł czasopisma, częstotliwość, ISSN), ale informację o adresie wydawcy, jego stronie domowej, e-mailu, o prenumeratorach, o punktacji ministerialnej czasopism. W rekordzie bibliograficznym czasopisma jest też link do zasobu czasopisma. Na tym ostatnim przykładzie najlepiej widać, jaką ewolucję przeszedł rekord dokumentu w bibliograficznej bazie danych, stając się rekordem wielopoziomowym formalnie (linki) i merytorycznie, zawierającym informację skierowującą do faktografii. Bardzo podobną strukturę i zawartość jak w BazTech mają rekordy w bazie PSJC. Porównując opis bibliograficzny w takich bazach, jak Polska Bibliografia Lekarska, BazTech, PSJC, SIGŻ, można stwierdzić, że zawartość rekordów dokumentów, sposób przedstawienia podobne są do baz międzynarodowych, takich jak: LISA – Library and Information Science Abstracts lub DOAJ – Directory of Open Access Journals). Nie oznacza to jednak, że nie istnieją bazy z tej grupy (autonomicznych), które mają tylko skrócony opis bibliograficzny, nie mają żadnego opracowania rzeczowego ani streszczeń. Przykładem może być wymieniana już polska baza BazHum, a z międzynarodowych baza językoznawcza „European Bibliography of Slavic and East European Studies”, w których zapowiada się uzupełnienie informacji w rekordach.
Zakres informacyjny dziedzinowych baz danych
Mówiąc o zakresie informacyjnym, mamy na myśli takie czynniki, jak: zakres tematyczny bazy, typy uwzględnianych dokumentów, liczba analizowanych czasopism, zawartość opisu bibliograficznego, typy CHWD.
Najogólniej możemy powiedzieć, że zakres informacyjny baz jest zróżnicowany pod każdym względem, co jest zrozumiałe, gdyż bazy powstają w różnym czasie, wywodzą się z określonej tradycji opracowania bibliograficznego i treściowego dokumentów, wreszcie nie bez znaczenia są tu ograniczenia finansowe. Są bazy, w których bierze się pod uwagę 50 czasopism (np. BazHum) lub około 100 (np. w PSJC) i takie, w których bierze się pod uwagę ok. 500 (np. BazTech), zależy to od wyznaczonego zakresu tematyczno-dziedzinowego. Są bazy dziedzinowe, które z założenia rejestrują tylko artykuły z czasopism (np. PSJC, BazTech, EDUKACJA), jak i takie, które z założenia rejestrują wszystkie typy dokumentów (np. bazy „Polskiej Bibliografii Bibliologicznej”, „Polskiej Bibliografii Wojskowej”, „Polskiej Bibliografii Lekarskiej”, „Bibliografii Historii Polskiej”, „Polskiej Bibliografii Literackiej”, SIGŻ). Warto też podkreślić, że wiele baz nie poprzestaje na rejestracji bieżącej dokumentów, ale podejmuje prace nad bibliografią retrospektywną (np. EDUKACJA, „Bibliografia Geografii Polskiej”, „Polska Bibliografia Bibliologiczna”, bazy teologiczne FIDES).
Szczególną uwagę należałoby zwrócić na problem zakresu tematycznego, zdając sobie sprawę z tego, że granice dziedzin i dyscyplin naukowych nie są ostre. Oznacza to, że pewna część materiałów znajdzie się w więcej niż jednej bazie. Tak na pewno jest w przypadku baz: EDUKACJA dolnośląskich bibliotek pedagogicznych i „PEDAGOG” Biblioteki Uniwersytetu w Opolu http://aleph.uni.opole.pl/F/GA8L5GCAPYLKHKKG5F94AY6XJRPJSIACSX8NLRJQDEBDR6S4QQ-01804?func=find-b-0&local_base=uop03, „Polskiej Bibliografii Wojskowej” i „Bibliografii Historii Polskiej”, bazy BZCz i „Polskiej Bibliografii Literackiej”.
Wartość informacyjna bazy zależy na pewno i od zasięgu chronologicznego, i od liczby dokumentów, które do niej trafiają, ale też i od sposobu ich opracowania treściowego (rzeczowego). I tu ogólnie możemy powiedzieć, że niewielką rolę odgrywają klasyfikacje biblioteczno-bibliograficzne, choć spotyka się je („Polska Bibliografia Literacka”, „Polska Bibliografia Wojskowa”, „Polska Bibliografia Bibliologiczna”). Większą rolę odgrywają deskryptory, słowa kluczowe i hasła przedmiotowe – czasami te trzy kategorie są bardzo podobne w swojej strukturze, choć twórcy baz nazwali je odmiennie. I wreszcie istotnym elementem są streszczenia (polskie i obcojęzyczne). Jakieś elementy streszczeń występowały również w bibliografiach dziedzinowych tradycyjnych w postaci tzw. adnotacji zawartościowych, jednak streszczenia w bazach danych stanowią zupełnie nową jakość informacyjną – zazwyczaj są to streszczenia autorskie przejmowane bezpośrednio z tekstów artykułów. Nie wszystkie jednak bazy dziedzinowe mają wypełnione pole „streszczenia”. Bardzo dobrze jest to realizowane w BazTech, PSJC, SIGŻ czy „Polskiej Bibliografii Lekarskiej”, gdzie streszczenia są obszerne i zazwyczaj dwujęzyczne. W innych bazach są to raczej krótkie adnotacje treściowe w języku polskim (EDUKACJA) lub też brak jest w ogóle streszczeń („Bibliografia Historii Polskiej”, „Bibliografia Geografii Polskiej”).
O wartości informacyjnej bazy dziedzinowej decydują też linki, czyli jej powiązania: z innymi bazami, rekordami, tekstami, informacjami faktograficznymi). I tu również można zauważyć pewną prawidłowość. Mało rozbudowane linki mają bazy powiązane z bibliografiami tradycyjnymi, wyrosłe z tych bibliografii, natomiast bardzo rozbudowane linki mają bazy dziedzinowe autonomiczne, niezależne od form tradycyjnych, takie jak np. BazTech czy PSJC.
Dostęp do informacji w dziedzinowych bazach danych
Ocena dostępu do baz danych wiąże się z warunkami zewnętrznymi (dostęp otwarty i darmowy – dostęp ograniczony lokalnie, odpłatny, prenumerata), warunkami technologicznymi oraz merytorycznymi.
Jeśli chodzi o dostęp otwarty lub ograniczony, to zazwyczaj jest tak, że bazy dziedzinowe przygotowywane przez komercyjne firmy mają dostęp ograniczony, bazy przygotowywane przez instytucje non profit są natomiast bazami otwartymi. Spotykamy się jednak z pewnymi ograniczeniami i w bazach opracowywanych w instytucjach non profit, gdzie są one udostępniane tylko z komputerów należących do sieci lokalnej lub wymagana jest zgoda na korzystanie z nich – dotyczy to np. baz w Głównej Bibliotece Lekarskiej, Instytucie Badań Literackich, Centralnej Bibliotece Rolniczej czy Bibliotece Szkoły Głównej Handlowej.
Warunki technologiczne wiążą się z tzw. interfejsem użytkownika. Panuje tu dosyć duże zróżnicowanie i wynikający stąd stopień utrudnienia, gdyż interfejsy baz, zarówno polskich, jak i zagranicznych są zindywidualizowane. Wystarczy powiedzieć, że wśród kilku międzynarodowych dziedzinowych baz w wolnym dostępie każda ma inny interfejs użytkownika (http://www.bj.uj.edu.pl/zb/lbazy_free_zagr1_pl.php). Nie dotyczy to polskich baz tworzonych w powszechnie znanych systemach, takich jak Aleph (EDUKACJA, bazy prawnicze Biblioteki Sejmowej) czy MAK (bazy: bibliologiczna, piśmiennictwa wojskowego, teologiczne). Nie są łatwe interfejsy baz rolniczych i gospodarki żywnościowej (CBR), piśmiennictwa medycznego (GBL), „Polskiej Bibliografii Literackiej” (IBL). Wydaje się, że różnorodność interfejsów może wpływać na efektywność wyszukiwania. Trzeba też podkreślić, że większość polskich baz dziedzinowych zapewnia interfejs w języku angielskim.
Perspektywa lokalna i globalna w ocenie bibliograficznych baz dziedzinowych
Gdybyśmy chcieli ocenić polskie dziedzinowe bazy danych z punktu widzenia światowych standardów technicznych i merytorycznych, to ocena ta nie wypadnie źle. Nasze bazy widoczne są w Internecie, obsługujące je systemy komputerowe wykorzystują standardy międzynarodowe, w tym zwłaszcza protokół Z39.50 oraz architekturę klient-serwer, standardy kodowania znaków (Unicode).
Analizując je z punktu widzenia użytkownika, ważne są takie cechy, jak:
- bezpłatny dostęp – większość naszych baz jest niekomercyjna i otwarta, ale część jest dostępna tylko w sieciach lokalnych;
- reprezentatywność baz dla poszczególnych dziedzin – należy uznać, że wszystkie dziedziny wiedzy są reprezentowane, aczkolwiek nie w jednakowym stopniu;
- informacja bibliograficzna o dokumentach – jest wystarczająca do identyfikacji dokumentów;
- informacja treściowa o dokumentach – jest zróżnicowana: od słów kluczowych, deskryptorów, haseł przedmiotowych po streszczenia polskie i obcojęzyczne;
- informacja faktograficzna związana z rekordami bibliograficznymi (informacje adresowe wydawcy, autora, informacje bibliograficzne o autorze i innych dokumentach) jest zróżnicowana; bazy wyrosłe z bibliografii tradycyjnych i ciągle powiązane z nimi mają tę informację bardzo słabo rozbudowaną, bazy autonomiczne natomiast znacznie lepiej;
- informacja pełnotekstowa w polskich dziedzinowych bazach danych jest raczej niedostępna lub trudna do uzyskania.
Patrząc na polskie dziedzinowe bazy danych z perspektywy zagranicznego użytkownika, musimy sobie zadać pytanie, czy nasze bazy są atrakcyjne pod względem informacyjnym? Zapewne tak, choć przede wszystkim dla tych, którzy znają język polski, aczkolwiek znaczna część dokumentów jest publikowana w innych językach, głównie angielskim. Nie bez znaczenia są też streszczenia angielskojęzyczne wpisywane do rekordu dokumentu oraz słowa kluczowe w języku angielskim.
Czy polskie dziedzinowe bazy danych uwzględniają użytkownika zagranicznego? Na to pytanie w jakiejś części możemy odpowiedzieć, analizując interfejs użytkownika oraz stwierdzając, czy system obsługi ma angielską wersję. I tu nie możemy udzielić jednoznacznej odpowiedzi, choć można uznać, że większość dziedzinowych baz danych ma obok polskiego interfejs i obsługę w języku angielskim.
Warto podkreślić, że część polskich baz jest podłączona do międzynarodowych baz (np. rolnicze) lub ich zawartość jest indeksowana przez światowe przeglądarki, np. Google Scholar (np. BazTech, PSJC).
Podsumowanie
Analiza polskich dziedzinowych baz danych pozwala na sformułowanie następujących uwag końcowych:
- Część dziedzinowych bibliograficznych baz danych współistnieje z bibliografiami drukowanymi; część stopniowo odrywa się od bibliografii drukowanych, zmieniając jednocześnie kształt i zakres informacji bibliograficznych. Można przypuszczać, że będzie następował proces rezygnacji z formy drukowanej na rzecz bazy danych, co jest uzasadnione i wielkością tych bibliografii, i ich aktualnością oraz kosztami.
- Dziedzinowe bibliograficzne bazy danych, zwłaszcza te, które powstały jako bazy autonomiczne, niezależne od bibliografii drukowanych zawierają informacje wykraczające poza „klasyczny” opis bibliograficzny, podając afiliację autora, adres wydawcy, linki do innych dokumentów autora, do wydawcy, do zawartości czasopisma. W opisie uwzględniają streszczenia polskie i angielskie, wprowadzają CHWD w językach obcych. Zakres przekazywanych w rekordzie dokumentu informacji jest porównywalny z zakresem informacji w rekordach baz zagranicznych.
- Część dziedzinowych baz danych jest współtworzona przez kilka/kilkanaście instytucji (np. PSJC, BazTech, SIGŻ) i wydaje się, że ta tendencja będzie się upowszechniać.
- Polskie dziedzinowe bazy danych powstają z reguły w instytucjach non profit, co sprawia, że dostęp do nich jest w zasadzie wolny od opłat, ale w niektórych przypadkach wymagana jest prenumerata lub zgoda na zalogowanie. Z kolei pewna część baz dostępna jest tylko w sieciach lokalnych bibliotek czy uczelni. Dobrze byłoby, aby raczej były to bazy z otwartym dostępem dla wszystkich.
- Brak jest w zasadzie polskich baz pełnotekstowych z wolnym dostępem, choć jest dostępna pełnotekstowa zawartość części polskich czasopism naukowych (zob. DOAJ). Ta sprawa wymaga podjęcia negocjacji z wydawcami; na pewno można myśleć o stopniowym wprowadzaniu pełnych tekstów czasopism, jeśli nie na bieżąco, to retrospektywnie. Jest to także problem techniczno-organizacyjny.
- Dyskusyjną sprawą jest przyszłość organizacyjno-technologiczna polskich baz danych, tzn. czy mają one iść w kierunku baz centralnych, czy raczej baz rozproszonych, a tylko współpracujących merytorycznie.
- Wobec wielości dziedzinowych (i zagadnieniowych) bibliograficznych baz danych istotną sprawą jest podział prac i określenie zakresów tematycznych, aby uniknąć dublowania opracowywania materiałów.
- Ważne jest też retrospektywne uzupełnianie baz, co w wielu przypadkach dzieje się (np. w bazach ekonomicznych).
Przypisy
[1] PAWLIK, T. Stan bibliografii dziedzin i zagadnień w latach 1979–1993. W: Czwarta Ogólnokrajowa Narada Bibliografów, Warszawa 7–9 czerwca 1995 : referaty i dyskusja. Warszawa : BN, 1996, s. 160–167. Prace Instytutu Bibliograficznego, nr 28. ISSN 0860-2921. [2] Wszystkie podane odesłania do stron internetowych przedstawiają wersję aktualną w dn. 28.04.2009 r.
| |