English version below
Český národní korpus | Aktuality
Srpen 2020 | Facebook

ČNK potřebuje znát vaše výstupy!

Blíží se další pravidelné hodnocení ČNK prováděné MŠMT, v němž se rozhodne o míře podpory našeho projektu v dalším grantovém období. Jedním z klíčových kritérií hodnocení bude rozsah a kvalita vědeckých výstupů, které byly pomocí nástrojů a dat ČNK vytvořeny. Ze statistik víme, že naši uživatelé s korpusy ČNK pracují hojně, nemáme ovšem jak se dozvědět, které výstupy na nich vznikly.

Pomozte nám v tomto hodnocení a zadejte do Repozitáře vědeckých publikací Biblio základní bibliografické údaje Vámi vytvořených výstupů, Repozitář přináší řadu výhod vám i celé badatelské komunitě, na jeho průběžné doplňování bychom navíc – s odkazem na podmínky pro využívání služeb ČNK – chtěli apelovat i do budoucna. Zadání údajů o publikacích je pro vás velice jednoduché a rychlé, pro nás však existenčně důležité.

Nemusí jít jen o odborné články či monografie, žádány jsou také aplikované výstupy jako např. software, specializované databáze apod. Vedle prací vysloveně korpusových nás zajímají i studie, kde je využití zdrojů ČNK spíše okrajové, a také starší práce (od r. 2015). V případě jakýchkoli nejasností prosíme pište na cnk@korpus.cz.

Děkujeme za pomoc!

Mapka: nová mapová aplikace

Během letošního roku byla zveřejněna další dvě uživatelská rozhraní. Jedním z nich je Mapka, in­ter­ak­tivní ma­pová apli­kace ur­čená pro práci s kor­pusy mlu­vené češ­tiny, zejména s kor­pu­sem ná­řeč­ním. Spo­juje v sobě ně­ko­lik růz­ných funkcí, jed­nou z nich je pre­zen­tace cha­rak­te­ris­tic­kých rysů ná­řeč­ních ob­lastí ČR v po­době uká­zek au­ten­tic­kých pro­jevů mluv­čích.

Korpus DB: Databáze variability

Další nová webová apli­kace se jmenuje Kor­pusDB a umož­ňuje snadné pro­hle­dá­vání da­ta­báze lem­mat a slov­ních tvarů, které se vy­sky­tují v kor­pusech ČNK. Kor­pusDB uka­zuje úplná slovní pa­ra­dig­mata s frek­ven­cemi tvarů a je­jich va­ri­ant v růz­ných ty­pech textů a umož­ňuje snadno fil­tro­vat ka­te­go­rie s růz­nou mí­rou va­ri­a­bi­lity.

Nová verze Trequ

Ná­stroj Treq na vy­hle­dá­vání pře­kla­do­vých ekvi­va­lentů se v srpnu do­čkal ak­tu­a­li­zace pod­kla­do­vých dat, která nyní od­po­ví­dají verzi 12 pa­ra­lel­ního kor­pusu In­ter­Corp. Dále byly do­pl­něny slov­níky, takže nyní je možné vy­hle­dá­vat neje­nom v pře­kla­dech z/do češ­tiny a an­g­lič­tiny, ale také z/do špa­něl­štiny.

Podobně používaná slova

V letošním roce také průběžně pracujeme na vylepšování aplikace Slovo v kostce. V květnu v ní při­byla dlaž­dice s po­dobně po­u­ží­va­nými slovy, která je za­lo­žená na srov­nání blíz­kosti kon­textu vy­já­d­ře­ného po­mocí tzv. word em­bed­dings, další vylepšení přijdou již brzy!

Czech National Corpus | Newsletter
August 2020 | Facebook

CNC needs to know your outputs!

The next round of regular evaluations of the CNC is now approaching. It will determine the amount of support for the CNC project in the next grant period. One of the key criteria is the abundance and quality of research outputs that have been created using CNC data and tools. Statistics show that users access the CNC a lot, but they don't tell us what concrete outputs these interactions lead to.

Please help us in this evaluation and enter basic bibliographical information about your outputs into the Repository of scientific publications. The repository has additional benefits for you and the research community, and this is why we would like to appeal to you – with a reference to our T&Cs – for keeping it updated also in the future. For you, it is quick and simple. For us, it is a matter of existence.

We welcome both publication results (articles, books etc.) and non-publication ones (pieces of software, databases etc.), including studies which only partially rely on CNC resources. To complete the picture, we are interested in all your outputs since 2015. Should you have any queries, please e-mail us at cnk@korpus.cz.

Many thanks for your help!

Mapka: a new map application

So far this year, we have released two new web applications. One of them is Mapka, an in­ter­ac­tive map-based ap­pli­ca­tion for work­ing with spo­ken di­alec­tal cor­po­ra. It fea­tures var­i­ous func­tions in­clud­ing a pre­sen­ta­tion of char­ac­ter­is­tic fea­tures of Czech di­alec­tal ar­eas il­lus­trat­ed by au­then­tic speak­er­s' ut­ter­ances.

Korpus DB: Variation Database

The other new web application is KorpusDB, which allows search­ing the data­base of all word forms and lem­mas that ac­tu­al­ly oc­cur in CNC cor­po­ra. Ko­r­pus­DB shows com­plete par­a­digms to­geth­er with a fre­quen­cy break­down of word forms in var­i­ous types of texts, and results can be filtered based on the de­gree of vari­abil­i­ty.

A new version of Treq

An up­date of Treq, the on­line tool for look­ing up trans­la­tion equiv­a­lents, is out! Its data­base has been up­dat­ed to re­lease 12 of the In­ter­Corp par­al­lel cor­pus. Fur­ther­more, you can now al­so search in trans­la­tions from/to Span­ish (in ad­di­tion to Czech and Eng­lish).

Similarly used words

We also keep working on improving the Word at the Glance web interface. In May, a new tile with sim­i­lar­ly used words was added. The tile is based on a com­par­i­son of the word­s' con­texts as re­flect­ed by word em­bed­dings. Further improvements are on the way!

Ústav Českého národního korpusu, Filozofická fakulta Univerzity Karlovy
www.korpus.cz | ucnk@korpus.cz | +420 221 619 837