Ve svém příspěvku představím korpus UčebKo, který byl vybudován přes Sketch Engine v rámci projektu TA ČR s názvem Slovotvorný analyzátor pro výuku češtiny pro cizince (SLAN). Je tvořen z učebnic češtiny pro cizince na jazykových úrovních A2–B1. Cílem jeho budování bylo zachytit jazyk, který by měl být na dané jazykové úrovni osvojen.
Jak buňky interpretují: znaky, kódy a významy v ontogenezi
Od objevu struktury molekuly dědičnosti v 50. letech minulého století se do biologického myšlení v různých podobách neustále vkrádají analogie mezi životem a jazykem. Do jaké míry je tato analogie relevantní, jaké nové pohledy může biologii přinést a jak ji lze vědecky zkoumat? Po stručné historické exkurzi do tohoto tématu se přednáška zaměří na konkrétní příklady z vývojové a buněčné biologie a ukáže, že buňky své texty a signály spíše interpretují, než aby je pouze mechanicky dekódovaly. Rovněž bude nastíněn rozdíl mezi biosémiotikou a sémantickou biologií, které se paralelám mezi organickými procesy a jazykem dlouhodobě věnují.
představení výzkumného projektu našeho stipendisty Exploring classical Belarusian fiction with the methods of corpus and computational linguistics
Alyaxey Yaskevich
Morfematická struktura sloves a její vztah k syntakticko-sémantickým charakteristikám
Příspěvek datově vychází z materiálu slovesných lemmat extrahovaných ze srovnatelných korpusů čtyř indoevropských jazyků – češtiny, angličtiny, němčiny a španělštiny – anotovaných pro jejich morfematickou strukturu s použitím velkých datových zdrojů. Zkoumáme možnosti propojení tohoto vzorku, poskytujícího informaci o morfematické struktuře sloves, a syntakticky anotovaných dat k výzkumu vztahu morfematické struktury sloves a jejich syntaktického chování, především ve vtahu k jejich valenci, a to napříč celým frekvenčním spektrem. V příspevku budou prezentovány dílčí experimenty, které demonstrují různé možnosti, jak lze k otázce slovesné morfematické komplexity a slovesné valence přistupovat s použitím různých typů datových zdrojů.