Mluvený jazyk je bohatý a mnohotvárný fenomén. Při přípravě mluvených korpusů je ovšem tato mnohotvárnost svým způsobem komplikací: každý aspekt navíc, který se v jejich transkripci či anotaci snažíme zachytit, je povětšinou vykoupen velkým množstvím mravenčí manuální práce, která dále navyšuje již tak poměrně vysokou finanční náročnost těchto korpusů. Možnosti automatické anotace, zejména rysů specifických pro mluvený jazyk, jsou tedy vítaným zpestřením, které lze realizovat jen za v porovnání zlomkovou cenu práce strojů.
Jednou takovou oblastí je prozodie, tedy suprasegmentální jevy v rovině frekvenční (průběh intonace, intonační rozpětí) i temporální (mluvní či artikulační tempo, rytmus), případně i kombinované (např. protažení slabiky spojené se specifickou intonační konturou). Aktuální mluvené korpusy ČNK jsou ručně zarovnané na úrovni segmentů o délce max. 25 slov, ale detailnější temporální rozlišení lze automaticky získat pomocí nástrojů pro tzv. forced alignment, např. Montreal Forced Aligner. Průběh F0 (základní hlasové frekvence) lze zase extrahovat např. v prostředí Praat a analýzu pro účely výzkumu intonace dále obohatit a zpřesnit pomocí nástrojů pro automatickou analýzu intonace, např. Prosogram.
Automatická aplikace takových nástrojů na velké množství materiálu mnohdy kolísavé zvukové kvality má samozřejmě i svá úskalí. V průběhu přednášky si ukážeme, na co je potřeba si dát pozor, ale i čeho lze s pomocí takové anotace dosáhnout. Blíže se podíváme na intonační rozpětí a využití glissand v různých komunikačních kontextech a v podání různých typů mluvčích; nastíníme i porovnání s angličtinou. Poodhalíme, jak se tato anotace promítne do nových verzí korpusů ORTOFON a ORATOR v rozhraní KonText a rozšíří tak možnosti cíleného vyhledávání v mluvených datech.