| ZPRACOVÁNÍ ZÁVĚREČNÝCH ZPRÁV PROJEKTŮ
MZ ČR DO DATABÁZE BMČ
Filip Kříž, Ondřej Horsák, Michaela Opatrná, Radana Kodetová, Štěpánka Fremutová |
||
| ABSTRAKT: Článek popisuje proces zpracování závěrečných zpráv grantových projektů podpořených Agenturou pro zdravotnický výzkum MZ ČR do databáze Bibliographia medica Čechoslovaca (BMČ). Národní lékařská knihovna (NLK) získává zprávy ve formátu XML s přílohami výsledků ve formátu PDF. Tato data jsou následně konvertována na bibliografické záznamy ve formátu MARCXML. Proces zahrnuje dávkové zpracování dat skripty v jazyce Python a tvorbu importních balíčků pro Digitální knihovnu NLK. Více Jsou představeny možnosti využití externích metadatových API pro usnadnění tvorby bibliografických záznamů a experimentální testování generativních jazykových modelů (LLM) pro extrakci metadat z textových a obrazových vstupů. Přehledně je popsáno zpřístupnění dat BMČ v portálu Medvik, včetně hybridního vyhledávání, možností výstupů a propojení s dalšími databázemi a službami. Zpracování závěrečných zpráv významně obohacuje databázi BMČ a umožňuje systematické uchování a zpřístupnění výsledků zdravotnického výzkumu v ČR. Plánovaná integrace nástrojů vyvinutých pro zpracování dat AZV do webové aplikace BibMetaFlow zefektivní zpracování záznamů a tato aplikace zjednoduší koordinaci celého procesu zpracování publikací do databáze BMČ. Klíčová slova: bibliografická databáze, závěrečné zprávy projektů, Agentura pro zdravotnický výzkum MZ ČR, Bibliographia medica Čechoslovaca, Národní lékařská knihovna, systém Medvik, jazykové modelyDOI: 10.35191/medsoft_2025_1_37_kriz |
||
|
PROCESSING OF FINAL REPORTS OF PROJECTS OF
THE MINISTRY OF HEALTH OF THE CZECH REPUBLIC
INTO THE BMC DATABASE
ABSTRACT: The article describes the processing of final reports of grant projects funded by the Czech Health Research Council (AZV) for inclusion in the Bibliographia medica Čechoslovaca (BMČ) database. The National Medical Library receives reports in XML format with PDF attachments. The data are subsequently converted into bibliographic records in MARCXML format. The process involves batch data processing using Python scripts and the creation of import packages for the Digital Library of NML. MoreThe article presents the use of external metadata APIs to facilitate the creation of bibliographic records and experimental testing of generative large language models (LLMs) for metadata extraction from textual and image-based inputs. It also provides a clear overview of BMC data accessibility through the Medvik portal, including hybrid search capabilities, multiple output options, and integration with other databases and services. Processing the final project reports significantly enriches the BMČ database and enables the systematic preservation of medical and healthcare research output in the Czech Republic. The planned integration of tools developed for processing AZV data into the BibMetaFlow web application will simplify records processing. The new application will improve coordination of the entire workflow for incorporating publications into the BMČ database. Keywords: bibliographic database, final project reports, Czech Health Research Council, Bibliographia medica Czechoslovaca, National Medical Library, Medvik system, language models DOI: 10.35191/medsoft_2025_1_37_kriz |

















