Seminář ÚČNK

Harmonogram pro akademický rok 2021/2022

Místo konání
Panská 890/7 (Kaunický palác), 1. patro levého křídla
Online
seminář je přenášen také online, v případě zájmu o link prosím napište Honzovi nebo Janě.
Čas konání
úterý, 13:00, není-li uvedeno jinak
Datum Téma · Přednášející · Abstrakt

Akvizice wh-konstrukcí v češtině: Korpusová studie

  1. Klára Matiasovitsová
  2. Radek Šimík
  3. Filip Smolík

Čeština je velmi flexibilní z hlediska užití formálně interogativních zájmen. Kromě interogativní funkce (Co uletělo? Ptala se, co uletělo.) mohou být použita v různých typech korelativních konstrukcí (Co uletělo, to necháme být. Ať uletělo cokoliv, necháme to být.), v tzv. volných vztažných větách (Posbírali jsme, co(koliv) uletělo.), vztažných větách s pronominální hlavou (Posbírali jsme všechno, co uletělo.) a konečně i ve standardních vztažných v větách s nominální hlavou (Posbírali jsme noviny, co/které uletěly.). Z kroslingvistického, morfosyntaktického, sémantického i diachronního hlediska si tyto jednotlivé funkce nejsou rovny. Interogativní funkce (I) se jeví jako základní a relativní (R) jako odvozená, přičemž korelativní užití (C) je někde mezi (I < C < R). V naší studii si klademe otázku, jak si děti jednotlivé funkce interogativních zájmen osvojují. Naší hypotézou je, že osvojování probíhá v souladu s danou hierarchií. K otázce přistupujeme skrze analýzu longitudinálního korpusu konverzací rodičů s dětmi (CHILDES; Chromá et al. 2020). Součástí přednášky bude obecná charakteristika korpusu CHILDES a jeho specifik.

pozor: pouze online

Korpusy a diachronní konfrontační lingvistika. Příklady ze slovotvorby a valence západoslovanských jazyků

  1. Katja Brankačkec

V přednášce popisuji své zkušenosti s empirickým diachronním, „corpus-based“ výzkumem češtiny, dolní a horní lužické srbštiny (z nabídky ČNK). Uvedu několik dílčích výsledků naší práce, na kterých chci exemplifikovat výhody a problémy, ukázat, jak jsme hledali a (ne)našli „ideální“ způsob práce s korpusy, a proč je špatný korpus pořád lepší než žádný korpus. Přednáška se opírá o výsledky grantu GAČR č. P406 16-10866S (2016-2018) a následnou publikaci Brankačkec, Martínek, Paap 2019: Lehnprägungen im Tschechischen und Sorbischen.

Možnosti automatizovaného obohacení anotace mluvených korpusů

  1. David Lukeš

V rámci mluvené sekce už delší dobu přemýšlíme, jak naše mluvené korpusy obohatit o další vrstvy anotace, které by blíže zachytily různé zvukové aspekty promluv a usnadnily tak uživatelům orientaci v datech a práci s nimi. Např. v korpusu ORTOFON v2 je 7802 výskytů typu protože: když uživatelům nabídneme možnost je roztřídit do různých kategorií (podle trvání, intonačního průběhu, odchylek od kanonické výslovnosti atp.), bude se jim nejen snáze hledat pověstná jehla v kupce korpusového sena, ale bude to bezpochyby i zdrojem nových výzkumných otázek a podnětů ke studiu druhů funkční variability v mluveném jazyce, které doposud prostřednictvím našich korpusů studovány nebyly.

V současné době tuto roli granulárnější kategorizace vycházející ze zvukové realizace plní ručně připravovaná fonetická transkripce, s jejíž pomocí můžeme např. u onoho protože rozlišit podtypy jako bře, prže apod. Její éra ale příští rok s ORTOFONem v3 pro dohlednou budoucnost skončí, i kvůli časové, finanční a personální náročnosti. V přednášce rozeberu její připravované i zvažované (realistické i méně realistické) automaticky generované alternativy či doplňky, jejich výhody i omezení, a doufám, že nám vaše zpětná vazba pomůže vytipovat a případně dopilovat obzvlášť slibné kandidáty.

seminář se nekoná

seminář se nekoná

pozor: o 1,5 hod. později

seminář se nekoná

vánoční prázdniny