AplikaceAplikace

HiČKoK: Historie češtiny v korpusovém kontinuu

O projektu HiČKoK

Cílem projektu HiČKoK je vytvořit datové, softwarové a znalostní zázemí pro studium češtiny v celém jejím historickém kontinuu (od 13. do 21. století). Projekt je unikátní tím, že se vůbec poprvé pokouší propojit jednotlivá centra, v nichž se nezávisle budovaly textové korpusy pro různé fáze vývoje češtiny, a sloučením jejich zdrojů vytvořit unikátní nástroj pro studium vývoje jazyka.

Druhým ambiciozním cílem projektu je vytvoření nástrojů pro jednotnou morfologickou a syntaktickou anotaci češtiny napříč všemi obdobími v rámci schématu Universal dependencies (UD).

Plánované výsledky projektu

Výsledkem projektu by mělo být vytvoření:

 • Monitorovacího korpusu pokrývajícího všechny etapy vývoje češtiny
 • jazykových modelů ve schématu Universal Dependencies (UD), které umožní automatickou lingvistickou anotaci textů z libovolného období
 • aplikace umožňující zkoumat diachronní fenomény v monitorovacím korpusu
 • online kurzu pro studenty a badatele pracující s historickými texty, který poskytne průpravu pro využití vytvořených výstupů a dalších relevantních technologií, které jsou dostupné v rámci projektového konsorcia.

Řešitelský tým

Za ÚČNK FF UK:

 • Martin Stluka (hlavní řešitel)
 • Klára Pivoňková
 • Václav Cvrček
 • Lucie Nováková (administrativa)
 • Petra Poukarová

Za ÚJČ AV ČR:

 • Jiří Pergler
 • Ondřej Svoboda
 • Jana Zdeňková
 • Anna Michalcová
 • Olga Navrátilová

Za ÚFAL MFF UK:

 • Daniel Zeman

Za NK ČR:

 • Anna Vandasová
 • Michaela Bežová
 • Jana Hrzinová
 • Šárka Forgáčová

Podpora

Projekt HiČKoK (č. TQ01000072) byl na období realizace na období 09/2023 – 11/2026 podpořen TA ČR v rámci programu na podporu aplikovaného výzkumu a inovacı́ SIGMA.

Výstupy

Martin Stluka, Václav Cvrček: HiČKoK: historie češtiny v korpusovém kontinuu (29. 4. 2024). Záznam přednášky, Odborné fórum ÚISK FF UK