AplikaceAplikace

Seminář ÚL

Harmonogram pro akademický rok 2024/2025

Místo konání
P104, hlavní budova, 1. patro
Online
seminář je přenášen také online, v případě zájmu o link prosím napište Michalovi.
Čas konání
středa, 14:10–15:40, není-li uvedeno jinak
Datum Téma · Přednášející · Abstrakt

Velké úterý

představení výzkumného projektu naší stipendistky Digital Analysis of the Baltic Germans' Monthly Newspaper „Baltische Briefe“

  1. Anna Baryshnikova
  1. Eva Lehečková et al.

Setkání a diskuse s naší spectabilis a jejím týmem (možná přijde i prod. Cvrček...)

(online)

Učebnicový korpus UčebKo

  1. Adriana Válková

Ve svém příspěvku představím korpus UčebKo, který byl vybudován přes Sketch Engine v rámci projektu TA ČR s názvem Slovotvorný analyzátor pro výuku češtiny pro cizince (SLAN). Je tvořen z učebnic češtiny pro cizince na jazykových úrovních A2–B1. Cílem jeho budování bylo zachytit jazyk, který by měl být na dané jazykové úrovni osvojen.

Jak buňky interpretují: znaky, kódy a významy v ontogenezi

  1. Jana Švorcová

Od objevu struktury molekuly dědičnosti v 50. letech minulého století se do biologického myšlení v různých podobách neustále vkrádají analogie mezi životem a jazykem. Do jaké míry je tato analogie relevantní, jaké nové pohledy může biologii přinést a jak ji lze vědecky zkoumat? Po stručné historické exkurzi do tohoto tématu se přednáška zaměří na konkrétní příklady z vývojové a buněčné biologie a ukáže, že buňky své texty a signály spíše interpretují, než aby je pouze mechanicky dekódovaly. Rovněž bude nastíněn rozdíl mezi biosémiotikou a sémantickou biologií, které se paralelám mezi organickými procesy a jazykem dlouhodobě věnují.

představení výzkumného projektu našeho stipendisty Exploring classical Belarusian fiction with the methods of corpus and computational linguistics

  1. Alyaxey Yaskevich

Morfematická struktura sloves a její vztah k syntakticko-sémantickým charakteristikám

  1. Hana Hledíková

Příspěvek datově vychází z materiálu slovesných lemmat extrahovaných ze srovnatelných korpusů čtyř indoevropských jazyků – češtiny, angličtiny, němčiny a španělštiny – anotovaných pro jejich morfematickou strukturu s použitím velkých datových zdrojů. Zkoumáme možnosti propojení tohoto vzorku, poskytujícího informaci o morfematické struktuře sloves, a syntakticky anotovaných dat k výzkumu vztahu morfematické struktury sloves a jejich syntaktického chování, především ve vtahu k jejich valenci, a to napříč celým frekvenčním spektrem. V příspevku budou prezentovány dílčí experimenty, které demonstrují různé možnosti, jak lze k otázce slovesné morfematické komplexity a slovesné valence přistupovat s použitím různých typů datových zdrojů.

 

Vánoční besídka (poslední korpusářská)

třídnická hodina...? nejspíš odpadne, resp. přesune se dál do hloubi LS

Paradigmatika slovotvorby: Jiný pohled na tvoření slov v češtině

  1. Magda Ševčíková

Odvozování je nejen v české lingvistické tradici chápáno jako způsob tvoření slov, při kterém je ze slova základového obměnou jeho morfologické stavby utvořeno slovo nové. V přednášce představím alternativní, tzv. paradigmatický přístup k popisu slovotvorných vztahů. Ústředním pojmem tohoto přístupu je derivační (slovotvorné) paradigma, které je – analogicky k flektivnímu (tvaroslovnému) paradigmatu jakožto souboru tvarů daného slova – chápáno jako množina příbuzných slov sdílejících stejný kořen. Na příkladech z češtiny ukážu, že paradigmatický přístup umožnuje efektivní popis odvozování a slovotvorby vůbec nejen v případech, kdy je identifikace základového slova obtížná.

Automated assessment of language proficiency: research and applications

  1. Agnieszka Leńko-Szymańska

The testing and certification of foreign language proficiency have become increasingly important in education. High-stakes language tests are frequently used as gatekeeping tools, serving as key requirements for admission to and completion of educational programs. A standard feature of modern language assessment is the inclusion of open-ended tasks that require candidates to produce extended samples of writing and speech. However, assessing such tasks poses significant challenges: it is time-consuming, costly, and often suffers from reliability issues. As a result, automated assessment of both written and spoken production has become a critical area of research and commercial development.

Several automated language assessment systems have been developed. The most widely-known are e-rater and SpeechRater, created by Educational Testing Service (ETS) and used in the assessment of the TOEFL exam. Research indicates that these systems demonstrate high levels of accuracy, validity, and reliability. However, they provide limited meaningful feedback to both examiners and test-takers relating to specific linguistic features influencing the assessment result. This raises concerns about the accountability, particularly in cases when candidates seek justification for their scores.

This presentation will review research on the role of linguistic features in automated assessment of non-native speakers’ written and spoken production. It will include the results of my own studies, which examined how lexical and phraseological characteristics of EFL learners' written output contributed to the prediction of scores assigned by human raters.

celoústavní schůze s novým vedením

  1. Mirjam Friedová et al.

pelmel převážně administrativní...

pozor! změna místa konání – P111

Are nouns biased, or are we? Data and theories, counting and measuring, Old and Present Day English

  1. Kurt Erbach

Much of the work on countability stems from personal observations about which nouns occur in which co-texts: e.g. "one chair" is well formed but "one plastic" is not; "much plastic" is well formed but "much chair" is not. From these sorts of observations, a great deal of work has been done in the name of explaining why such examples are well formed or not.
When it comes to diachrony, while the observations are potentially more repeatable in the sense that they come from corpus based research, I will argue that the previous studies are not exactly straightforwardly repeatable. Despite some degree of opacity, these previous studies point towards something like a consensus that countability in Old English looked very different from Present Day English. Using the OED as a corpus, we see a different picture, i.e. Old English countability appears quite similar to Present Day English. This begs questioning the extent to which bias may play a role in previous studies and/or the work of the lexicographers and the present project, to what extent we can circumvent this, and what sort of methods can be used to uncover the nature of countability in Old English.

Slangismy v korpusech rapových textů RapCor a RapCor boosted

  1. Alena Němcová Polická

Slangismy bývají označovány jako „koření“ expresivně laděných diskurzů a jsou-li navíc inovativní, posluchačům neznámé (ne nutně nové), upoutávají svou formou a (často jen) svým významem v daném kontextu. Jak s tzv. neologickým pocitem pracují korpusoví lingvisté a jak se vyvíjí korpusová lingvistika ve vztahu k výzkumu slangismů a neologismů, bude hlavním tématem této přednášky. Dále budou představeny korpusy frankofonních rapových textů RapCor a RapCor boosted.

  1. Katarína Gajdošová
  2. Peter Malčovský

představení slovenské mutace aplikace Mapka (https://mapka.korpus.sk/)