Článek byl převzat a aktualizován ze sborníku: České oborové bibliografie: sborník z interdisciplinárního semináře. Praha: Ústav pro českou literaturu AV ČR, 2017. Bibliographica (Ústav pro českou literaturu AV ČR). ISBN 978-80-88069-46-1.
Digitální knihovna Akademie věd České republiky
Digitalizační centrum Knihovny Akademie věd České republiky bylo vybudováno v roce 2003 a otevřeno na počátku roku 2004. Začal v něm probíhat proces digitalizace a zpřístupnění knihovního fondu vědecké produkce Akademie věd České republiky (dále jako AV ČR) a jejích předchůdkyň. Hlavním výstupem Digitalizačního centra se stala Digitální knihovna AV ČR (dále jen jako Digitální knihovna), která se zaměřuje na ukládání a zpřístupnění vědeckých publikací. Jako prezentační rozhraní Digitální knihovny byl zvolen systém Kramerius – software vyvinutý pro zpřístupnění digitalizovaných materiálů.
Digitální knihovna soustředí digitalizovanou produkci vědeckých ústavů AV ČR. Její součástí jsou jak periodika (v polovině roku 2017 je to 190 titulů), tak monografie (aktuálně 3 000 titulů). Digitální knihovna obsahuje přes 3 miliony digitalizovaných stránek vědeckých publikací, převážně z 20. a 21. století. Nejstarší publikace v Digitální knihovně jsou z přelomu 16. a 17. století. Nově přibývají také digitální dokumenty, které vznikají jako born digital. Jedná se především o články z akademických periodik a knihy z nakladatelství Academia. Takto vzniklých článků obsahuje Digitální knihovna již více než 14 700. Navíc jsou v Digitální knihovně postupně zpřístupňovány speciální kolekce dokumentů. Chloubou mezi nimi je sbírka starých tisků, z nichž jako první byla zpřístupněna unikátní Martinická bible, dále pak soubor starých čínských tisků z fondu Orientálního ústavu AV ČR.
Analytická báze Knihovny AV ČR a její využití pro Digitální knihovnu
V Digitální knihovně jsou archivovány a zpřístupněny plné texty a k nim se vztahující bibliografické záznamy článků, periodik a monografií. Plné texty článků jsou získávány buď jako dokumenty vzniklé v digitální podobě od vydavatelů periodik nebo digitalizací tištěných předloh.
Pro tvorbu metadatových záznamů jsou využívány systémy Aleph a ProArc. Záznamy jsou zpracovávány z online verzí článků, dostupných volně na webu, z digitálních verzí článků dodávaných redakcemi periodik a z tištěných verzí článků. Schéma zpracování záznamů článků znázorňuje obrázek 1.
Obrázek 1: Schéma zpracování analytických záznamů periodik
Zpracování analytických záznamů z periodik v systému Aleph
Databáze článků Knihovny AV ČR je přístupná na adrese http://aleph20.lib.cas.cz/F/?func=file&file_name=find-b&local_base=KNAVA.
Systém Aleph je pro všechny ústavy Akademie věd ČR provozován Knihovnou AV ČR (dále jako KNAV). Každá ústavní knihovna, která se rozhodne Aleph používat, v něm má přidělenou svou bázi, případně báze. Do nich ukládá své záznamy. V Knihovně AV ČR jsou pro zpracování záznamů využívány tři báze – KNA pro monografie, KNAVC pro seriály a KNAVA pro analytické záznamy.
Záznamy v Alephu jsou ukládány ve formátu MARC 21[1] a jsou zpracovány podle katalogizačních pravidel RDA[2], aktuálně platných v ČR. Zpracovávání analytických záznamů se řídí metodikou, která byla vypracována analytickým oddělením Národní knihovny ČR.
Báze KNAVA byla spuštěna v testovacím režimu v roce 2012. V ostrém provozu jsou v ní články zpracovávány od začátku roku 2013. Počátek zpracování článků v Alephu se pojí s účastí KNAV na projektu „Vytváření a obohacení záznamů článků pro databázi ANL“. Projektu se KNAV účastní od roku 2013 do současnosti. Projekt je financován z programu Veřejné informační služby knihoven (VISK) 9/I Ministerstva kultury České republiky. Jedná se kooperační projekt krajských knihoven a KNAV. Hlavním požadavkem pro získání dotace z programu VISK je zasílání záznamů ve formátu MARC 21 do Souborného katalogu ČR, konkrétně do báze ANL. Dalším požadavkem je dodržování pravidel pro popis Souborného katalogu „Záznam pro soubornou databázi: MARC 21. Fyzicky nesamostatné části dokumentu. Tištěné monografie a seriály“, stanovených Národní knihovnou ČR.
Tituly periodik pro zpracování v Alephu a odeslání do ANL jsou vybírány po konzultaci s koordinátorem celého projektu – Studijní a vědeckou knihovnou v Hradci Králové. Tím se zamezuje duplicitnímu zpracování ve spolupracujících knihovnách. Výhodou účasti na kooperačním projektu a přispívání do souborné databáze je možnost stahování záznamů z báze ANL do báze KNAVA. Záznamy článků z akademických periodik, které v rámci kooperačního projektu zpracovávají ostatní knihovny, mohou být stahovány přes protokol Z39.50. Knihovny spolupracující na projektu jsou povinny dodržovat stejný formát dat a stejná pravidla popisu. To při stahování záznamů zaručuje stejnou kvalitu a úroveň zpracování.
V letech 2013–2017 bylo v Alephu KNAV zpracováno přes 28 000 záznamů z 56 titulů periodik. Primárním cílem je souběžné zpracování aktuálního roku vydání. Současně probíhá i retrospektivní zpracování do roku 1999. Zpracovanou retrospektivu jednotlivých titulů přehledně shrnuje Tabulka 1:
Tabulka 1: Přehled periodik zpracovaných v systému Aleph
Název | ISSN | Zpracovaná retrospektiva |
A / věda a výzkum | 2533-784X | 2017 |
Acta geodynamica et geomaterialia | 1214-9705 | 2004–2008 |
Acta onomastica | 1211-4413 | 2010–2016 |
Akademický bulletin | 1210-9525 | 2002–2016 |
Applications of mathematics | 0862-7940 | 1999–2017 |
Archiv orientální | 0044-8699 | 2012–2017 |
Biologia plantarum | 0006-3134 | 2012–2017 |
Botanika | 2336-2243 | 2013–2016 |
Byzantinoslavica | 0007-7712 | 2011–2015 |
Czechoslovak mathematical journal | 0011-4642 | 2015–2017 |
Časopis pro moderní filologii | 0862-8459 | 2007–2016 |
Časopis zdravotnického práva a bioetiky | 1804-8137 | 2011–2017 |
Česká literatura | 0009-0468 | 2012–2017 |
Československá psychologie | 0009-0468 | 2012–2017 |
Československý časopis pro fyziku | 0009-0700 | 2007–2017 |
Český časopis historický | 0862-6111 | 2012–2017 |
Český lid | 0009-0794 | 2012–2017 |
Data a výzkum – SDA info | 1802-8152 | 2003–2015 |
Echo | 1214-7982 | 2004–2017 |
Ergo | 1802-2006 | 2006–2017 |
Estetika | 1802-2006 | 2012–2017 |
European journal of entomology | 1210-5759 | 2011–2017 |
Filosofický časopis | 0015-1831 | 2012–2017 |
Folia historica Bohemica | 0231-7494 | 2007–2015 |
Folia parasitologica | 0015-5683 | 2011–2017 |
Gender, rovné příležitosti, výzkum | 1213-0028 | 2007–2016 |
Germanoslavica | 1210-9029 | 2009–2017 |
Historická demografie | 0323-0937 | 2003–2017 |
Historická geografie | 0323-0988 | 2003–2016 |
Hospodářské dějiny | 0231-7540 | 2009–2012 |
Hudební věda | 0018-7003 | 2012–2013 |
Jemná mechanika a optika | 0447-6441 | 2000–2017 |
Linguistica Pragensia | 0862-8432 | 2006–2014 |
Listy filologické | 0024-4457 | 2012–2016 |
Mathematica Bohemica | 0862-7959 | 2009–2017 |
Mediaevalia historica Bohemica | 0862-979X | 2007–2015 |
Moderní dějiny | 0862-979X | 2004–2016 |
Naše řeč | 0027-8203 | 2009–2017 |
Naše společnost | 1214-438X | 2003–2016 |
Nový Orient | 0029-5302 | 2012–2016 |
Photosynthetica | 0300-3604 | 2012–2017 |
Physiological research | 0862-8408 | 1999–2017 |
Právník | 0231-6625 | 2012–2017 |
Preslia | 0032-7786 | 2012–2017 |
Přehled výzkumů | 1211-7250 | 2003–2015 |
Slavia | 0037-6736 | 2010–2016 |
Slovanský přehled | 0037-6922 | 2012–2016 |
Slovo a slovesnost | 0037-7031 | 2012–2017 |
Sociologický časopis | 0038-0288 | 2011–2017 |
Soudobé dějiny | 1210-7050 | 2012–2015 |
Studia geophysica et geodaetica | 0039-3169 | 2002–2017 |
Studia mediaevalia Bohemica | 1804-0977 | 2009–2014 |
Studia Rudolphina | 1213-5372 | 2009–2015 |
Teorie vědy | 1210-0250 | 2003–2016 |
Umění | 0049-5123 | 2012–2017 |
Živa | 0044-4812 | 2012–2017 |
Zpracování analytických záznamů z periodik v systému ProArc
ProArc je produkční a archivační systém pro digitalizaci, který umožňuje vytvářet záznamy článků a přikládat k nim plné texty. Záznamy jsou v něm ukládány ve formátu MODS[3] a jsou vytvářeny podle standardů Národní digitální knihovny pro periodika[4], rozšířených o interní pravidla Knihovny AV ČR. Metadata do ProArcu jsou vkládána přes webový formulář. V něm také probíhá přidávání plných textů. Zpracování v tomto systému začalo v roce 2015 (zkušební provoz), resp. 2016 (ostrý provoz).
Obrázek 2: Metadatový formulář v systému ProArc
Systém ProArc umožňuje také stahování a upravování záznamů z analytické báze v Alephu Knihovny AV ČR a ze Souborného katalogu ČR. Stažené záznamy jsou v ProArcu konvertovány do metadatového formátu MODS, doplněny o potřebná metadata a jsou k nim přiloženy plné texty článků. Takto obohacené záznamy jsou využívány pro Digitální knihovnu.
V letech 2016–2017 bylo v ProArcu zpracováno 40 titulů periodik. Primárním cílem je, stejně jako v případě zpracování v Alephu, souběžné vytváření záznamů z aktuálního roku vydání. Současně probíhá i retrospektivní zpracování do roku 1994. Zpracovanou retrospektivu jednotlivých titulů přehledně shrnuje Tabulka 2.
Tabulka 2: Přehled periodik zpracovaných v systému ProArc
Název | ISSN | Zpracovaná retrospektiva |
Acta Comeniana | 0231-5955 | 2014 |
Acta geodynamica et geomaterialia | 1214-9705 | 2017 |
Acta onomastica | 1211-4413 | 2016 |
Acta technica | 1210-714X | 2008, 2012–2017 |
Akademický bulletin | 1210-9525 | 2009–2016 |
Archeologické rozhledy | 0323-1267 | 2012–2017 |
Critical housing analysis | 2336-2839 | 2014–2017 |
Časopis zdravotnického práva a bioetiky | 1804-8137 | 2011–2017 |
Česká literatura | 0009-0468 | 2012–2017 |
Československá psychologie | 0009-062X | 2009–2017 |
Český časopis historický | 0862-6111 | 2012–2016 |
Český lid | 0009-0794 | 2013–2017 |
E-psychologie | 1802-8853 | 2007–2017 |
Estetika | 1802-2006 | 2016–2017 |
Filosofický časopis | 0015-1831 | 2005, 2007–2017 |
Folia historica Bohemica | 0231-7494 | 2012–2016 |
Folia zoologica | 0139-7893 | 2012–2017 |
Gender, rovné příležitosti, výzkum | 1213-0028 | 2015–2016 |
Historica | 1210-8499 | 2002–2010 |
Historická demografie | 0323-0937 | 2010–2017 |
Historická geografie | 0323-0988 | 2012–2016 |
Hudební věda | 0018-7003 | 2014–2016 |
Journal of hydrology and hydromechanics | 0042-790X | 2017 |
Knihy a dějiny | 1210-8510 | 1994–2003, 2009–2016 |
Kybernetika | 0023-5954 | 2017 |
Mediaevalia historica Bohemica | 0862-979X | 2016 |
Moderní dějiny | 0862-979X | 2012–2016 |
Naše řeč | 0027-8203 | 2016–2017 |
Physiological research | 0369-9463 | 1995–2017 |
Právník | 0231-6625 | 2013–2017 |
Preslia | 0032-7786 | 2012–2017 |
Slovo a slovesnost | 0037-7031 | 2016–2017 |
Sociologický časopis | 0038-0288 | 2016–2017 |
Střed | 1803-9243 | 2015–2016 |
Studie o rukopisech | 0585-5691 | 2016 |
Teorie vědy | 1210-0250 | 2016 |
Theatralia | 1803-845X | 2015–2016 |
Umění | 0049-5123 | 2013–2016 |
Vesmír | 0042-4544 | 2017 |
Živa | 0044-4812 | 2003–2004, 2012–2017 |
Systém ProArc umožňuje využití metadat nejen v Digitální knihovně, ale také jejich odesílání do různých vědeckých databází článků a periodik. Nyní prvním rokem probíhá odesílání článkových metadat do databáze CEJSH[5]. V listopadu 2016 bylo spuštěno také odesílání informací do databáze CrossRef[6]. Zprostředkovaně přes prezentační software Kramerius probíhá také odesílání záznamů článků do databází Web of Science[7] a Scopus[8]. Zároveň je ProArc kompatibilní s již existujícími řešeními v České republice, mezi něž patří zejména Registr digitalizace[9], takže je možné metadata odesílat také do něj.
Zpřístupnění Digitální knihovny AV ČR v systému Kramerius
Obrázek 3: Úvodní strana Digitální knihovny AV ČR
Webové rozhraní Digitální knihovny je přístupné na adrese http://kramerius.lib.cas.cz/. Úvodní obrazovka je určena k vyhledávání v plných textech dokumentů a v metadatech. Prohledávání plných textů digitalizovaných dokumentů je umožněno díky rozpoznávání textu metodou OCR. Výsledky vyhledávání lze zpřesnit použitím filtrů, například podle dostupnosti dokumentu nebo klíčových slov. Hned na úvodní stránce je možné si také zobrazit nejžádanější, nejnovější nebo vybrané dokumenty. Systém v neposlední řadě nabízí prohledávání názvového a autorského rejstříku, vyhledávání na časové ose podle data vzniku dokumentu a prohlížení sbírek – tematických kolekcí, vytvořených administrátorem.
Vyhledané dokumenty lze buď prohlížet přímo online v Digitální knihovně, nebo je uložit na vlastní zařízení ve formě originálního souboru nebo ve formátu PDF. Systém podporuje také vyhledávání v plných textech konkrétního článku nebo určité stránky. Dále Kramerius poskytuje možnost ukládání vyhledaných dokumentů do oblíbených a jejich sdílení na sociálních sítích.
Obrázek 4: Zobrazení článku v Digitální knihovně AV ČR
Zpřístupnění plných textů v Digitální knihovně je limitováno Autorským zákonem. Proto jsou na internetu volně dostupné ty dokumenty, které již nespadají pod ochranu Autorského zákona. Výjimku tvoří případy, kdy licenční smlouva s příslušnými vydavateli umožňuje zpřístupnění před uplynutím této lhůty. Některá periodika jsou volně dostupná v režimu open access, nebo jen s několikaletým embargem od data vydání. Volný přístup k plným textům všech dokumentů je zajištěn ve studovně Knihovny AV ČR.
Použitá literatura
- GEC, Tomáš. Rozhovor s Martinem Lhotákem. Duha [online]. 2012, roč. 26, č. 1.
- LHOTÁK, Martin. Česká digitální knihovna. Duha [online]. 2016, roč. 30, č. 3.
- ŠLAPÁKOVÁ, Ivana: Zpracování a zpřístupňování časopiseckých článků v Digitální knihovně AV ČR – část 1. Informace [online]. 2014, č. 3.
- ŠLAPÁKOVÁ, Ivana: Zpracování a zpřístupňování časopiseckých článků v Digitální knihovně AV ČR – část 2. Informace [online]. 2014, č. 4.
[1] Machine-Readable Cataloging; https://www.loc.gov/marc/
[2] Resource, Description and Access; https://www.loc.gov/aba/rda/
[3] Metadata Object Description Schema; http://www.loc.gov/standards/mods
[4] http://www.ndk.cz/standardy-digitalizace/metadata
[5] The Central European Journal of Social Sciences and Humanities; http://cejsh.icm.edu.pl
[7] https://webofknowledge.com/
[9] http://www.registrdigitalizace.cz/