Opublikowane: 2020-11-20

Projektowanie metadanych w korpusie tekstów polskich do 1500 roku – wielopoziomowa struktura informacji

Mariusz Leńczuk Logo ORCID

Abstrakt

The subject of research are selected metadata that should characterize the texts collected in the corpus of the oldest attestations of the Polish language. The author of the article compares and analyses the factors affecting the development of the basic data structure used in synchronic and diachronic corpora (author, title, date of the text, text channel, text classification, source of citation). Without those factors taken into account the disambiguation of the object in the database becomes impossible, and the use of grammatical information is unreliable and impractical. The result of the presented analysis is a proposal to extend the level of description for individual markers.

Pobierz pliki

Zasady cytowania

Leńczuk, M. (2020). Projektowanie metadanych w korpusie tekstów polskich do 1500 roku – wielopoziomowa struktura informacji. Forum Lingwistyczne, 7(7), 59–69. https://doi.org/10.31261/FL.2020.07.05

Cited by / Share

Nr 7 (2020)
Opublikowane: 2020-11-24


ISSN: 2449-9587
eISSN: 2450-2758
Ikona DOI 10.31261/FL

Wydawca
Wydawnictwo Uniwersytetu Śląskiego | University of Silesia Press

Ta strona używa pliki cookie dla prawidłowego działania, aby korzystać w pełni z portalu należy zaakceptować pliki cookie.