Seminář ÚL

Harmonogram pro akademický rok 2024/2025

Místo konání: P104, hlavní budova, 1. patro
Online: seminář je přenášen také online, v případě zájmu o link prosím napište Honzovi nebo Magdě.
Čas konání: středa, 14:10–15:40, není-li uvedeno jinak

		Datum	Téma · Přednášející · Abstrakt
		úterý 1. 10. 2024 13:00	Velké úterý
		úterý 15. 10. 2024 13:00	představení výzkumného projektu naší stipendistky Digital Analysis of the Baltic Germans' Monthly Newspaper „Baltische Briefe“ Anna Baryshnikova BB.pptx
		úterý 22. 10. 2024 13:00	Eva Lehečková et al. Setkání a diskuse s naší spectabilis a jejím týmem (možná přijde i prod. Cvrček...)
		úterý 29. 10. 2024 13:00 (online)	Učebnicový korpus UčebKo Adriana Válková Ve svém příspěvku představím korpus UčebKo, který byl vybudován přes Sketch Engine v rámci projektu TA ČR s názvem Slovotvorný analyzátor pro výuku češtiny pro cizince (SLAN). Je tvořen z učebnic češtiny pro cizince na jazykových úrovních A2–B1. Cílem jeho budování bylo zachytit jazyk, který by měl být na dané jazykové úrovni osvojen.
		úterý 5. 11. 2024 13:00	Jak buňky interpretují: znaky, kódy a významy v ontogenezi Jana Švorcová Od objevu struktury molekuly dědičnosti v 50. letech minulého století se do biologického myšlení v různých podobách neustále vkrádají analogie mezi životem a jazykem. Do jaké míry je tato analogie relevantní, jaké nové pohledy může biologii přinést a jak ji lze vědecky zkoumat? Po stručné historické exkurzi do tohoto tématu se přednáška zaměří na konkrétní příklady z vývojové a buněčné biologie a ukáže, že buňky své texty a signály spíše interpretují, než aby je pouze mechanicky dekódovaly. Rovněž bude nastíněn rozdíl mezi biosémiotikou a sémantickou biologií, které se paralelám mezi organickými procesy a jazykem dlouhodobě věnují.
		úterý 19. 11. 2024 13:00	představení výzkumného projektu našeho stipendisty Exploring classical Belarusian fiction with the methods of corpus and computational linguistics Alyaxey Yaskevich
		úterý 3. 12. 2024 13:00	Morfematická struktura sloves a její vztah k syntakticko-sémantickým charakteristikám Hana Hledíková Příspěvek datově vychází z materiálu slovesných lemmat extrahovaných ze srovnatelných korpusů čtyř indoevropských jazyků – češtiny, angličtiny, němčiny a španělštiny – anotovaných pro jejich morfematickou strukturu s použitím velkých datových zdrojů. Zkoumáme možnosti propojení tohoto vzorku, poskytujícího informaci o morfematické struktuře sloves, a syntakticky anotovaných dat k výzkumu vztahu morfematické struktury sloves a jejich syntaktického chování, především ve vtahu k jejich valenci, a to napříč celým frekvenčním spektrem. V příspevku budou prezentovány dílčí experimenty, které demonstrují různé možnosti, jak lze k otázce slovesné morfematické komplexity a slovesné valence přistupovat s použitím různých typů datových zdrojů.
		úterý 17. 12. 2024 16:59	Vánoční besídka (poslední korpusářská)
		středa 19. 2. 2025 14:10	~~třídnická hodina...? nejspíš odpadne, resp. přesune se dál do hloubi LS~~
		středa 5. 3. 2025 14:10	Paradigmatika slovotvorby: Jiný pohled na tvoření slov v češtině Magda Ševčíková Odvozování je nejen v české lingvistické tradici chápáno jako způsob tvoření slov, při kterém je ze slova základového obměnou jeho morfologické stavby utvořeno slovo nové. V přednášce představím alternativní, tzv. paradigmatický přístup k popisu slovotvorných vztahů. Ústředním pojmem tohoto přístupu je derivační (slovotvorné) paradigma, které je – analogicky k flektivnímu (tvaroslovnému) paradigmatu jakožto souboru tvarů daného slova – chápáno jako množina příbuzných slov sdílejících stejný kořen. Na příkladech z češtiny ukážu, že paradigmatický přístup umožnuje efektivní popis odvozování a slovotvorby vůbec nejen v případech, kdy je identifikace základového slova obtížná. Sevcikova_UL_2025_03_05.pdf
		středa 19. 3. 2025 14:10	Automated assessment of language proficiency: research and applications Agnieszka Leńko-Szymańska The testing and certification of foreign language proficiency have become increasingly important in education. High-stakes language tests are frequently used as gatekeeping tools, serving as key requirements for admission to and completion of educational programs. A standard feature of modern language assessment is the inclusion of open-ended tasks that require candidates to produce extended samples of writing and speech. However, assessing such tasks poses significant challenges: it is time-consuming, costly, and often suffers from reliability issues. As a result, automated assessment of both written and spoken production has become a critical area of research and commercial development. Several automated language assessment systems have been developed. The most widely-known are e-rater and SpeechRater, created by Educational Testing Service (ETS) and used in the assessment of the TOEFL exam. Research indicates that these systems demonstrate high levels of accuracy, validity, and reliability. However, they provide limited meaningful feedback to both examiners and test-takers relating to specific linguistic features influencing the assessment result. This raises concerns about the accountability, particularly in cases when candidates seek justification for their scores. This presentation will review research on the role of linguistic features in automated assessment of non-native speakers’ written and spoken production. It will include the results of my own studies, which examined how lexical and phraseological characteristics of EFL learners' written output contributed to the prediction of scores assigned by human raters.
		středa 26. 3. 2025 14:10	celoústavní schůze s novým vedením Mirjam Friedová et al. pelmel převážně administrativní...
		středa 2. 4. 2025 14:10 pozor! změna místa konání – P111	Are nouns biased, or are we? Data and theories, counting and measuring, Old and Present Day English Kurt Erbach Much of the work on countability stems from personal observations about which nouns occur in which co-texts: e.g. "one chair" is well formed but "one plastic" is not; "much plastic" is well formed but "much chair" is not. From these sorts of observations, a great deal of work has been done in the name of explaining why such examples are well formed or not. When it comes to diachrony, while the observations are potentially more repeatable in the sense that they come from corpus based research, I will argue that the previous studies are not exactly straightforwardly repeatable. Despite some degree of opacity, these previous studies point towards something like a consensus that countability in Old English looked very different from Present Day English. Using the OED as a corpus, we see a different picture, i.e. Old English countability appears quite similar to Present Day English. This begs questioning the extent to which bias may play a role in previous studies and/or the work of the lexicographers and the present project, to what extent we can circumvent this, and what sort of methods can be used to uncover the nature of countability in Old English.
		středa 16. 4. 2025 14:10	Slangismy v korpusech rapových textů RapCor a RapCor boosted Alena Němcová Polická Slangismy bývají označovány jako „koření“ expresivně laděných diskurzů a jsou-li navíc inovativní, posluchačům neznámé (ne nutně nové), upoutávají svou formou a (často jen) svým významem v daném kontextu. Jak s tzv. neologickým pocitem pracují korpusoví lingvisté a jak se vyvíjí korpusová lingvistika ve vztahu k výzkumu slangismů a neologismů, bude hlavním tématem této přednášky. Dále budou představeny korpusy frankofonních rapových textů RapCor a RapCor boosted. Slangismy v korpusech rapových textů RapCor a RapCor.ppsx
		středa 30. 4. 2025 14:10	Katarína Gajdošová Peter Malčovský představení slovenské mutace aplikace Mapka (https://mapka.korpus.sk/)
		středa 14. 5. 2025 14:10	Český fonetický stereotyp maďarštiny (work in progress) Jiří Januška To, že české jazykové společenství žijící historicky na dnešním území ČR má víceméně(!) koherentní představu o tom, jak „zní maďarština“, se zdá být faktem. Příspěvek představí plány a doposavad provedené přípravné práce nad výzkumem této otázky.