Zpracování a zpřístupňování časopiseckých článků v Digitální knihovně AV ČR – část 1

Zpracování a zpřístupňování časopiseckých článků v Digitální knihovně AV ČR – část 1

 

Knihovna AV ČR provozuje Digitální knihovnu Akademie věd ČR, ve které jsou dlouhodobě ukládány a zpřístupňovány plné texty seriálů a monografií z produkce ústavů AV ČR. Mimo Digitální knihovnu AV ČR existuje také Institucionální repozitář AV ČR. Ten slouží k ukládání záznamů o publikační aktivitě vědců z AV a není předmětem tohoto článku.

Digitální knihovna AV ČR má dvě součásti, jimiž jsou systém Kramerius a systém EPrints. V nich jsou archivovány a zpřístupněny plné texty a k nim se vztahující bibliografické záznamy.

Plné texty článků jsou získávány jako dokumenty vzniklé v digitální podobě od vydavatelů časopisů a ukládány v systémech EPrints a Orbeon, kde jsou také vytvářeny jejich metadatové záznamy. Další způsob získání plných textů je digitalizace tištěných předloh. Digitalizované plné texty jsou ukládány v systému Kramerius.

Pro tvorbu záznamů jsou využívány systémy Orbeon, Aleph a systém EPrints. Záznamy jsou zpracovávány z online verzí článků, dostupných volně na webu, z digitálních verzí článků, dodávaných redakcemi časopisů a z tištěných verzí článků. Schéma zpracování záznamů článků znázorňuje obrázek 1.

Obrázek 1: Aktuální stav zpracování metadatových záznamů v KNAV

 

obr1-aktualni-stav

 

1. Systémy využívané pro zpracování časopiseckých článků v KNAV

Jak již bylo naznačeno výše, pro zpracování v KNAV jsou používány systémy EPrints, Aleph, Orbeon a Kramerius.

1.1 EPrints

Systém EPrints je přístupný na adrese: http://dlib.lib.cas.cz.

EPrints je systém pro provoz digitální knihovny. Má tyto hlavní funkce:

  • vkládání plných textů a vytváření záznamů pomocí webového formuláře,
  • ukládání plných textů a záznamů do databáze,
  • zpřístupnění plných textů a záznamů prostřednictvím webového rozhraní.

Vytváření metadatových záznamů a vkládání plných textů provádějí proškolení zpracovatelé přímo v redakcích příslušných periodik. Tvorba záznamů nemusí probíhat jen manuálně přes formulář. Pokud má zpracovatel k dispozici metadata ve strukturovaném formátu, může je ve spolupráci se správcem systému importovat přímo do databáze. Schéma tvorby metadatových záznamů je znázorněno v obrázku 2.

Metadata jsou ukládána ve formátu EP3. Pravidla pro vyplňování polí nejsou určena.

Obrázek 2: Tvorba metadat v systému EPrints

obr2-tvorba-metadat

Zpřístupnění plných textů probíhá na základě licenčních smluv uzavřených s vydavateli časopisů.

Záznamy článků z oborů sociálních a humanitních věd, uložené v systému EPrints, jsou exportovány do databáze Central European Journal of Social Sciences and Humanities (CEJSH). Jedná se o bibliografickou databázi článků ze sociálních a humanitních oborů, která je provozována akademiemi věd sídlícími v zemích Visegrádské čtyřky.

Systém EPrints byl představen na jednání Ediční rady AV ČR v říjnu 2007. Na konci roku 2009 byl zahájen vlastní provoz systému EPrints. Od jeho spuštění do současnosti (červen 2014) v něm bylo vytvořeno 7 779 metadatových záznamů. Ke všem záznamům jsou přidány i plné texty. Jsou zpracovány články z 20 titulů periodik. Z nich 14 vychází v ústavech AV, tři byly dříve akademické, ale jejich vydávání převzal jiný vydavatel, jeden už nevychází a dva mají externí vydavatele. Zpracovanou retrospektivu jednotlivých titulů přehledně shrnuje tabulka 1.

Tabulka 1: Tituly zpracované v systému EPrints

Název ISSN Zpracované roky Vydavatel
Acta onomastica 1211-4413 2006–2013 ústav AV ČR
Acta Universitatis Carolinae. Oeconomica 1802-4696 2007–2013 externí subjekt
Collection of Czechoslovak Chemical Communications 0010-0765 1991–2011 změna vydavatele
Časopis pro moderní filologii 0862-8459 2009–2012 změna vydavatele
Česká literatura 0009-0468 2005–2012 ústav AV ČR
Český lid 0009-0794 2008–2012 ústav AV ČR
Data a výzkum – SDA Info 1802-8152 2007–2013 ústav AV ČR
Engineering Mechanics 1802-1484 2007–2011 ústav AV ČR
Estetika 0014-1291 2006–2014 změna vydavatele
Gender, rovné příležitosti, výzkum 1213-0028 2008–2013 ústav AV ČR
Historica 1803-7550 2009–2013 ukončeno
Hudební věda 0018-7003 2000–2011 ústav AV ČR
Journal of Hydrology and Hydromechanics 0042-790X 2001–2013 externí subjekt
Linguistica Pragensia 0862-8432 2005–2012 změna vydavatele
Naše řeč 0027-8203 2008–2013 ústav AV ČR
Naše společnost 1214-438X 2008–2010 ústav AV ČR
Slovo a slovesnost 0037-7031 2004–2013 ústav AV ČR
Sociologický časopis 0038-0288 2008–2013 ústav AV ČR
Studie o rukopisech 0585-5691 2005–2013 ústav AV ČR
Teorie vědy 1210-0250 2007–2010 ústav AV ČR

1.2 Aleph

Databáze článků Knihovny AV ČR je přístupná na adrese http://aleph20.lib.cas.cz/F/?func=file&file_name=find-b&local_base=KNAVA.

Systém Aleph je pro celou Akademii věd ČR provozován Knihovnou AV ČR. Každá ústavní knihovna, která se rozhodne Aleph používat, v něm má přidělenou svou bázi[1], případně báze. Do nich ukládá své záznamy. V KNAV jsou pro zpracování záznamů využívány tří báze KNA pro monografie, KNAVC pro seriály a KNAVA pro analytika.

Aleph je knihovní systém, který umožňuje vytvářet záznamy článků. Na rozdíl od systémů EPrints a Orbeon neumožňuje přidání plných textů.

Záznamy v Alephu jsou ukládány ve formátu MARC 21. Jsou zpracovány podle 2. revidovaného vydání Anglo-amerických katalogizačních pravidel (AACR2R) a bibliografického popisu definovaného Všeobecným mezinárodním standardním bibliografickým popisem (ISBD(G)). Metadatové záznamy splňují požadavky na rozsah záznamu podle standardu „Záznam pro soubornou databázi : MARC 21. Fyzicky nesamostatné části dokumentu. Tištěné monografie a seriály“. Zpracovávání analytických záznamů se řídí metodikou, která byla vypracována analytickým oddělením Národní knihovny ČR.

Schéma zpracování článků v systému Aleph znázorňuje obrázek 3.

Obrázek 3: Zpracování záznamů článků v systému Aleph

obr3-zpracovani-zaznamu

Báze KNAVA byla spuštěna v testovacím režimu v roce 2012. V ostrém provozu jsou v ní články zpracovávány od začátku roku 2013. Počátek zpracování článků v Alephu se pojí s účastí KNAV na projektu „Vytváření a obohacení záznamů článků pro databázi ANL“. Projektu se KNAV účastní od roku 2013 do současnosti (2014). Projekt je financován z programu Veřejné informační služby knihoven (VISK) 9/I Ministerstva kultury České republiky. Jedná se kooperační projekt krajských knihoven a KNAV. Hlavním požadavkem pro získání dotace z programu VISK je zasílání záznamů ve formátu MARC 21 do Souborného katalogu ČR, konkrétně do báze ANL. Dalším požadavkem je dodržování pravidel Souborného katalogu „Záznam pro soubornou databázi: MARC 21. Fyzicky nesamostatné části dokumentu. Tištěné monografie a seriály“, stanovených Národní knihovnou ČR. Vzhledem k požadavkům projektu bylo vyhodnoceno jako optimální řešení začít zpracovávat analytika v systému Aleph, který už byl dříve v KNAV využíván k bibliografickému zpracování seriálů a monografií.

Tituly časopisů pro zpracování v Alephu a odeslání do ANL jsou vybírány po konzultaci s koordinátorem celého projektu – Studijní a vědeckou knihovnou v Hradci Králové. Tím se zamezuje duplicitnímu zpracování ve spolupracujících knihovnách. Výhodou účasti na kooperačním projektu a přispívání do souborné databáze je možnost stahování záznamů z báze ANL do báze KNAVA. Záznamy článků z akademických časopisů, které v rámci kooperačního projektu zpracovávají ostatní knihovny, mohou být stahovány přes protokol Z39.50. Knihovny spolupracující na projektu, jsou povinné dodržovat stejný formát dat a stejná pravidla popisu. To při stahování záznamů zaručuje stejnou kvalitu a úroveň zpracování.

V roce 2013 bylo v Alephu KNAV zpracováno 5 100 záznamů z 52 titulů časopisů a stejný objem je plánován i pro letošní rok. Primární bylo souběžné zpracování roku vydání 2013. Následovalo retrospektivní zpracování od data vydání 2012 do 2009. V současné době je zpracováván hlavně rok vydání 2014 a pokračuje retrospektivní zpracování do roku 2009.

Zpracovanou retrospektivu jednotlivých titulů přehledně shrnuje tabulka 2. Většina časopisů zpracovávaných v Alephu je vydávána ústavy AV ČR. Čtyři časopisy změnily vydavatele už v průběhu roku 2013, ovšem jejich excerpce v zájmu zachování kontinuity zpracování pokračuje i nadále.

Tabulka 2: Tituly zpracované v systému Aleph

Název ISSN Zpracované roky Vydavatel
Acta onomastica 1211-4413 2010–2013 ústav AV ČR
Akademický bulletin 1210-9525 2010–2013 ústav AV ČR
Applications of Mathematics 0862-7940 2012–2013 ústav AV ČR
Archiv orientální 0044-8699 2012–2013 ústav AV ČR
Biologia plantarum 0006-3134 2012–2013 ústav AV ČR
Byzantinoslavica 0007-7712 2011–2013 ústav AV ČR
Časopis pro moderní filologii 0862-8459 2009–2013 změna vydavatele
Časopis zdravotnického práva a bioetiky 1804-8137 2011–2013 ústav AV ČR
Česká literatura 0009-0468 2012–2013 ústav AV ČR
Československá psychologie 0009-062X 2012–2013 ústav AV ČR
Československý časopis pro fyziku 0009-0700 2012–2013 ústav AV ČR
Český časopis historický 0862-6111 2012–2013 ústav AV ČR
Český lid 0009-0794 2012–2013 ústav AV ČR
Data a výzkum – SDA Info 1802-8152 2009–2012 ústav AV ČR
Echo 1214-7982 2010–2013 ústav AV ČR
Ergo 1802-2006 2010–2013 ústav AV ČR
Estetika 0014-1291 2012–2013 změna vydavatele
European Journal of Entomology 1210-5759 2011–2013 ústav AV ČR
Filosofický časopis 0015-1831 2012–2013 ústav AV ČR
Folia Historica Bohemica 0231-7494 2009–2013 ústav AV ČR
Folia Parasitologica 0015-5683 2012–2013 ústav AV ČR
Gender, rovné příležitosti, výzkum 1213-0028 2012–2013 ústav AV ČR
Germanoslavica 1210-9029 2009–2013 ústav AV ČR
Historická demografie 0323-0937 2009–2013 ústav AV ČR
Historická geografie 0323-0988 2010–2013 ústav AV ČR
Hospodářské dějiny 0231-7540 2009–2012 ústav AV ČR
Hudební věda 0018-7003 2012 ústav AV ČR
Jemná mechanika a optika 0447-6441 2012–2013 ústav AV ČR
Linguistica Pragensia 0862-8432 2009–2012 změna vydavatele
Listy filologické 0024-4457 2012–2013 ústav AV ČR
Mathematica Bohemica 0862-7959 2009–2013 ústav AV ČR
Mediaevalia Historica Bohemica 0862-979X 2012–2013 ústav AV ČR
Moderní dějiny 1210-6860 2012–2013 ústav AV ČR
Naše řeč 0027-8203 2009–2013 ústav AV ČR
Naše společnost 1214-438X 2012–2013 ústav AV ČR
Nový Orient 0029-5302 2012–2013 ústav AV ČR
Photosynthetica 0300-3604 2012–2013 ústav AV ČR
Physiological Research 0862-8408 2012–2013 ústav AV ČR
Právník 0231-6625 2012–2013 ústav AV ČR
Preslia 0032-7786 2012–2013 ústav AV ČR
Přehled výzkumů 1211-7250 2009–2012 ústav AV ČR
Slavia 0037-6736 2012–2013 ústav AV ČR
Slovanský přehled 0037-6922 2012–2013 ústav AV ČR
Slovo a slovesnost 0037-7031 2012–2013 ústav AV ČR
Sociologický časopis 0038-0288 2012–2013 ústav AV ČR
Soudobé dějiny 1210-7050 2012–2013 ústav AV ČR
Studia Geophysica et Geodaetica 0039-3169 2010–2013 změna vydavatele
Studia Mediaevalia Bohemica 1804-0977 2009–2012 ústav AV ČR
Studia Rudolphina 1213-5372 2009–2013 ústav AV ČR
Teorie vědy 1210-0250 2010–2012 ústav AV ČR
Umění 0049-5123 2012–2013 ústav AV ČR
Živa 0044-4812 2012–2013 ústav AV ČR

 1.3 Orbeon

Orbeon je systém, který umožňuje vytvářet záznamy článků a přikládat k nim plné texty. Záznamy jsou v něm ukládány ve formátu MODS a jsou vytvářeny podle interních pravidel KNAV. Metadata do Orbeonu se vkládají přes webový formulář. V něm také probíhá přidávání plných textů.

Zpracování v tomto systému začalo v KNAV v roce 2011 (zkušební provoz), resp. 2012 (ostrý provoz). V roce 2012 byly záznamy z Orbeonu posílány do databáze ANL+, kde byly doplněny o vybraná jmenná a věcná metadata a poslány do báze ANL. V roce 2012 bylo takto vytvořeno 6 830 záznamů článků. V následujícím roce 2013 zpracování v Orbeonu pomalu ustávalo, jak jej postupně nahrazoval Aleph. Vytvořeno bylo pouze 3 739 záznamů. Za první polovinu roku 2014 bylo vytvořeno pouze 197 záznamů.

Celkem je v Orbeonu zpracováno 43 titulů, z toho 39 jsou akademické časopisy, tři změnily v roce 2013 vydavatele a už nejsou akademické a jeden má externího vydavatele. Zpracovanou retrospektivu jednotlivých titulů přehledně shrnuje tabulka 3.

Záznamy ani plné texty vytvořené v Orbeonu nejsou přístupné pro uživatele. Počítá se s jejich exportem do systému Kramerius a jejich zveřejněním prostřednictvím tohoto systému.

Tabulka 3: Tituly zpracované v systému Orbeon

Název ISSN Zpracované roky Vydavatel
Acta Technica 0001-7043 2008–2012 ústav AV ČR
Akademický bulletin 1210-9525 2011–2012 ústav AV ČR
Applications of Mathematics 0862-7940 2011 ústav AV ČR
Archeologické rozhledy 0323-1267 2005–2011 ústav AV ČR
Archiv orientální 0044-8699 2011 ústav AV ČR
Biologia Plantarum 0006-3134 2011 ústav AV ČR
Byzantinoslavica 0007-7712 2011 ústav AV ČR
Časopis pro moderní filologii 0862-8459 2011 změna vydavatele
Časopis zdravotnického práva a bioetiky 1804-8137 2011–2012 ústav AV ČR
Česká literatura 0009-0468 2011 ústav AV ČR
Československá psychologie 0009-062X 2011 ústav AV ČR
Československý časopis pro fyziku 0009-0700 2011 ústav AV ČR
Český časopis historický 0862-6111 2011 ústav AV ČR
European Journal of Entomology 1210-5759 2010–2011 ústav AV ČR
Filosofický časopis 0015-1831 2011 ústav AV ČR
Folia Historica Bohemica 0231-7494 2011 ústav AV ČR
Folia Parasitologica 0015-5683 2011 ústav AV ČR
Folia Zoologica 0139-7893 2002–2013 ústav AV ČR
Gender, rovné příležitosti, výzkum 1213-0028 2011 ústav AV ČR
Germanoslavica 1210-9029 2011 ústav AV ČR
Historická geografie 0323-0988 2011–2012 ústav AV ČR
Hospodářské dějiny 0231-7540 2011 ústav AV ČR
Hudební věda 0018-7003 2011 ústav AV ČR
Linguistica Pragensia 0862-8432 2011 změna vydavatele
Listy filologické 0024-4457 2011 ústav AV ČR
Mathematica Bohemica 0862-7959 2011 ústav AV ČR
Mediaevalia Historica Bohemica 0862-979X 2011 ústav AV ČR
Moderní dějiny 1210-6860 2011–2012 ústav AV ČR
Naše řeč 0027-8203 2011 ústav AV ČR
Naše společnost 1214-438X 2011 ústav AV ČR
Nový Orient 0029-5302 2011 ústav AV ČR
Photosynthetica 0300-3604 2011 ústav AV ČR
Physiological Research 0862-8408 2011 ústav AV ČR
Právník 0231-6625 2005–2013 ústav AV ČR
Preslia 0032-7786 2004–2011 ústav AV ČR
Slavia 0037-6736 2011 ústav AV ČR
Slovanský přehled 0037-6922 2011 ústav AV ČR
Soudobé dějiny 1210-7050 2004–2011 ústav AV ČR
Studia Geophysica et Geodaetica 0039-3169 2011 změna vydavatele
Studia Rudolphina 1213-5372 2011 ústav AV ČR
Theatralia 1803-845X 2009–2013 externí subjekt
Umění 0049-5123 2008–2012 ústav AV ČR
Živa 0044-4812 2003–2011 ústav AV ČR

1.4. Kramerius

Systém Kramerius je přístupný na adrese https://kramerius.lib.cas.cz.

Ročníky akademických časopisů vydané před rokem 2005 jsou digitalizovány v Digitalizačním centru KNAV. Časopisy jsou skenovány po jednotlivých stránkách a ty jsou přiřazovány k jednotlivým titulům a jejich ročníkům a číslům. Metadatové záznamy tedy existují na úrovni jednotlivých titulů, ročníků, čísel a stránek, nikoliv na úrovni jednotlivých článků. Systém Kramerius slouží především k uložení a zpřístupnění plných textů digitalizovaných dokumentů a metadatových záznamů.

Popisná metadata jsou v systému Kramerius ukládána ve formátu MODS a splňují metadatovou specifikaci Národní digitální knihovny (NDK) a Pravidla pro popis periodik NDK.

 

 

[1] Knihovní systém Aleph používá jednu fyzickou bázi, která je v KNAV z důvodu snazší správy rozdělena na více logických bází.