Ve svém příspěvku představím korpus UčebKo, který byl vybudován přes Sketch Engine v rámci projektu TA ČR s názvem Slovotvorný analyzátor pro výuku češtiny pro cizince (SLAN). Je tvořen z učebnic češtiny pro cizince na jazykových úrovních A2–B1. Cílem jeho budování bylo zachytit jazyk, který by měl být na dané jazykové úrovni osvojen.
Jak buňky interpretují: znaky, kódy a významy v ontogenezi
Od objevu struktury molekuly dědičnosti v 50. letech minulého století se do biologického myšlení v různých podobách neustále vkrádají analogie mezi životem a jazykem. Do jaké míry je tato analogie relevantní, jaké nové pohledy může biologii přinést a jak ji lze vědecky zkoumat? Po stručné historické exkurzi do tohoto tématu se přednáška zaměří na konkrétní příklady z vývojové a buněčné biologie a ukáže, že buňky své texty a signály spíše interpretují, než aby je pouze mechanicky dekódovaly. Rovněž bude nastíněn rozdíl mezi biosémiotikou a sémantickou biologií, které se paralelám mezi organickými procesy a jazykem dlouhodobě věnují.
Slang, neologie a korpusová lingvistika včera a dnes
Slangismy bývají označovány jako „koření“ expresivně laděných diskurzů a jsou-li navíc inovativní, posluchačům neznámé (ne nutně nové), upoutávají svou formou a (často jen) svým významem v daném kontextu. Jak s tzv. neologickým pocitem pracují korpusoví lingvisté a jak se vyvíjí korpusová lingvistika ve vztahu k výzkumu slangismů a neologismů, bude hlavním tématem této přednášky. Dále budou představeny korpusy frankofonních rapových textů RapCor a RapCor boosted.
Morfematická struktura sloves a její vztah k syntakticko-sémantickým charakteristikám
Příspěvek datově vychází z materiálu slovesných lemmat extrahovaných ze srovnatelných korpusů čtyř indoevropských jazyků – češtiny, angličtiny, němčiny a španělštiny – anotovaných pro jejich morfematickou strukturu s použitím velkých datových zdrojů. Zkoumáme možnosti propojení tohoto vzorku, poskytujícího informaci o morfematické struktuře sloves, a syntakticky anotovaných dat k výzkumu vztahu morfematické struktury sloves a jejich syntaktického chování, především ve vtahu k jejich valenci, a to napříč celým frekvenčním spektrem. V příspevku budou prezentovány dílčí experimenty, které demonstrují různé možnosti, jak lze k otázce slovesné morfematické komplexity a slovesné valence přistupovat s použitím různých typů datových zdrojů.