medsoft

 

  tlacitko ZPRACOVÁNÍ ZÁVĚREČNÝCH ZPRÁV PROJEKTŮ MZ ČR DO DATABÁZE BMČ
Filip Kříž, Ondřej Horsák, Michaela Opatrná, Radana Kodetová, Štěpánka Fremutová
  cz ABSTRAKT:

Článek popisuje proces zpracování závěrečných zpráv grantových projektů podpořených Agenturou pro zdravotnický výzkum MZ ČR do databáze Bibliographia medica Čechoslovaca (BMČ). Národní lékařská knihovna (NLK) získává zprávy ve formátu XML s přílohami výsledků ve formátu PDF. Tato data jsou následně konvertována na bibliografické záznamy ve formátu MARCXML. Proces zahrnuje dávkové zpracování dat skripty v jazyce Python a tvorbu importních balíčků pro Digitální knihovnu NLK.


Více

Jsou představeny možnosti využití externích metadatových API pro usnadnění tvorby bibliografických záznamů a experimentální testování generativních jazykových modelů (LLM) pro extrakci metadat z textových a obrazových vstupů. Přehledně je popsáno zpřístupnění dat BMČ v portálu Medvik, včetně hybridního vyhledávání, možností výstupů a propojení s dalšími databázemi a službami. Zpracování závěrečných zpráv významně obohacuje databázi BMČ a umožňuje systematické uchování a zpřístupnění výsledků zdravotnického výzkumu v ČR. Plánovaná integrace nástrojů vyvinutých pro zpracování dat AZV do webové aplikace BibMetaFlow zefektivní zpracování záznamů a tato aplikace zjednoduší koordinaci celého procesu zpracování publikací do databáze BMČ.

Klíčová slova: bibliografická databáze, závěrečné zprávy projektů, Agentura pro zdravotnický výzkum MZ ČR, Bibliographia medica Čechoslovaca, Národní lékařská knihovna, systém Medvik, jazykové modely

DOI: 10.35191/medsoft_2025_1_37_kriz

Skrýt


  eng PROCESSING OF FINAL REPORTS OF PROJECTS OF THE MINISTRY OF HEALTH OF THE CZECH REPUBLIC INTO THE BMC DATABASE

ABSTRACT:

The article describes the processing of final reports of grant projects funded by the Czech Health Research Council (AZV) for inclusion in the Bibliographia medica Čechoslovaca (BMČ) database. The National Medical Library receives reports in XML format with PDF attachments. The data are subsequently converted into bibliographic records in MARCXML format. The process involves batch data processing using Python scripts and the creation of import packages for the Digital Library of NML.

More

The article presents the use of external metadata APIs to facilitate the creation of bibliographic records and experimental testing of generative large language models (LLMs) for metadata extraction from textual and image-based inputs. It also provides a clear overview of BMC data accessibility through the Medvik portal, including hybrid search capabilities, multiple output options, and integration with other databases and services. Processing the final project reports significantly enriches the BMČ database and enables the systematic preservation of medical and healthcare research output in the Czech Republic. The planned integration of tools developed for processing AZV data into the BibMetaFlow web application will simplify records processing. The new application will improve coordination of the entire workflow for incorporating publications into the BMČ database.


Keywords: bibliographic database, final project reports, Czech Health Research Council, Bibliographia medica Czechoslovaca, National Medical Library, Medvik system, language models

DOI: 10.35191/medsoft_2025_1_37_kriz

Hide