Prezentace představuje projekt „Language across generations: Contact induced change in morphosyntax in German-Polish bilingual speech“ (LanGener), jehož součástí je i česko-německý projekt zaměřený na strukturní výpůčky v jazyce česko-německých bilingvních mluvčích. Východiskem analýzy těchto fenoménů jsou jazyková data česky a německy vedených jazykověbiografických interview, jež jsou rovněž zdrojem metajazykových dat. Na příkladu výběru, sběru, dokumentaci, transkripci a anotaci zmíněných dat v rámci česko-německého projektu se v prezentaci ilustrují posuny při produkci jazykových a metajazykových dat, jež jsou nejen východiskem, ale i výsledkem lingvistické analýzy a lingvistického výzkumu. Tím prezentace na jedné straně přibližuje, co lze očekávat od dat v rámci vznikajícího dílčího korpusu ČNK, na druhé straně klade obecnější otázky k validitě dat, jež se v korpusech stávající východiskem kvantitativních analýz.