Opublikowane: 2020-11-21

Budowa i zastosowania korpusu monitorującego MoncoPL

Piotr Pęzik Logo ORCID

Abstrakt

This paper introduces the methodology of compiling and maintaining MoncoPL, a large monitor corpus of web-based Polish. Furthermore, an overview of the search engine of the same name is provided to show how the size and composition of the corpus, currently reaching over 5.6 billion word tokens, facilitates research on distributional properties of rare words, neologisms and phraseological units. Finally, the article exemplifies some advantages of using a densely-sampled diachronic corpus for the purposes of observing frequency trends and cycles of various constructions in online media discourse.

Pobierz pliki

Zasady cytowania

Pęzik, P. (2020). Budowa i zastosowania korpusu monitorującego MoncoPL. Forum Lingwistyczne, 7(7), 133–150. https://doi.org/10.31261/FL.2020.07.11

Cited by / Share

Nr 7 (2020)
Opublikowane: 2020-11-24


ISSN: 2449-9587
eISSN: 2450-2758
Ikona DOI 10.31261/FL

Wydawca
Wydawnictwo Uniwersytetu Śląskiego | University of Silesia Press

Ta strona używa pliki cookie dla prawidłowego działania, aby korzystać w pełni z portalu należy zaakceptować pliki cookie.