Badania korpusowe w składni: możliwości i ograniczenia
nd.
Abstrakt
Celem artykułu jest pokazanie możliwości wykorzystania korpusów internetowych w badaniach syntaktycznych. Analiza korpusowa pozwala na weryfikację aksjomatycznie zmodelowanych kompozycji znaków, z tym że polecenie może mieć charakter materialny (wyszukiwanie dokładne) lub algorytmiczne (wyszukiwanie leksykalno-gramatyczne). Narzędzia korpusowe są przede wszystkim przydatne przy określeniu częstości występowania jednostek i ich kombinacji w tekstach oraz regularności występowania wstępnie ustalonych cech. Na podstawie częstości mogą być opisywane cechy typologiczne różnych języków pod względem wybranych parametrów. Analiza korpusowa daje również możliwość sprawdzenia, czy dana właściwość walencyjna leksemu jest poświadczona, czy nie, także ustalenia jej funkcjonalności. Autor też pokazuje, że wykorzystanie korpusu internetowego w badaniach syntaktycznych ma pewne ograniczenia. W przypadku zjawisk częstych, zwłaszcza w mowie potocznej, analiza korpusowa jest skuteczna, ale nie zawsze pozwala na udokumentowanie zjawisk mniej typowych i stylistycznie nacechowanych. Jest to tym bardziej niebezpieczne w wypadku jednostek mniej częstych, ale regularnych pod względem realizacji opozycji systemowych. Korpus w równym stopniu powinien dawać możliwości opisu zjawisk mowy, jak i systemu języka – konkluduje autor. Jednym z wniosków jest to, że analiza korpusowa powinna być skonfigurowana z introspekcją i ankietowaniem.
Słowa kluczowe
korpus językowy; lingwistyka korpusowa; lingwistyka empiryczna
Bibliografia
Andryukhina, Lyudmila M. Stil' nauki: kul'turno-istoricheskaya priroda.Yekaterinburg: Izdatel'stvo Yekaterinburgskogo universiteta, 1992 [Андрюхина, Людмила М. Стиль науки: культурно-историческая природа. Екатеринбург: Издательство Екатеринбургского университета, 1992.]
Yevgen'yeva, Anastasiya P. Slovar' russkogo yazyka. T. 4. Moskva: Nauka, 1984 [Евгеньева, Анастасия П. Словарь русского языка. Т. 4. Москва: Наука, 1984.]
Plungyan, Vladimir A. “Zachemmy delayem natsional'nyy korpus russkogo yazyka?” Otechestvennyye zapiski 2005, no. 2: 296–308 [Плунгян, Владимир А. “Зачем мы делаем национальный корпус русского языка?” Отечественные записки 2005, no. 2: 296–308.]
Urmantsev, Yuriy A. “Nachala obshchey teorii sistem.” Sistemnyy analiz i nauchnoye nauchnoye znaniye. Dmitriy P. Gorskiy (ed.). Moskva: Nauka, 1978. 7–41 [Урманцев, Юрий А. “Начала общей теории систем.” Системный анализ и научное знание. Ред. Дмитрий П. Горский. Москва: Наука, 1978. 7–41.]
Biber, Douglas, Fitzmaurice, Susan, Reppen, Randi (eds.). Using Corpora to Explore Linguistic Variation, Amsterdam: Benjamins, 2002.
Dębowski, Józef. “Wolność nauki a zasada bezzłożeniowości. Między «epistemologicznym anarchizmem» a «epistemologicznym restrykcjonizmem».” Wolność w epoce poszukiwań. Red. Szulakiewicz, M.imię, and Karpus. Zimię?. Toruń: Wydawnictwo UMK, 2007: 109–122.
Gries; Stefan G., “What is Corpus Linguistics?” Language and Linguistics Compass 2009, no. 3: 1–17.
Karolak, Stanisław. “Składnia wyrażeń predykatywnych.” Gramatyka współczesnego języka polskiego. Składnia. Red. Topolińska, Zuzana. Warszawa: PWN, 1984: 11–212.
Karolak, Stanisław. Podstawowe struktury składniowe języka polskiego. Warszawa: Instytut Slawistyki PAN, 2002.
Kiklewicz, Aleksander, Korytkowska, Małgorzata. Podstawowe struktury zdaniowe współczesnych języków słowiańskich: białoruski, bułgarski, polski. Olsztyn: CBEW, 2010.
Kiklewicz, Aleksander, Korytkowska, Małgorzata, Mazurkiewicz-Sułkowska, Julia et al. Zintegrowany opis semantyczno-syntaktyczny czasowników bułgarskich, polskich i rosyjskich (verba cogitandi i verba sentiendi). Część I. Warszawa: Instytut Slawistyki PAN & Fundacja Slawistyczna, 2019.
Kiklewicz, Aleksander. “Sintaksicheskiye kharakteristiki russkikh i pol'skikh internet-forumov (na materiale prostykh i slozhnykh predlozheniy s mental'nymi predikatami).” Interaktion von Internet und Stilistik, Internet und Stil. Branko Tosović, Arno Wonisch (Hrsg.). Graz: Universität Graz, 2016: 93–110 [Kiklewicz, Aleksander. “Синтаксические характеристики русских и польских интернет-форумов (на материале простых и сложных предложений с ментальными предикатами).” Interaktion von Internet und Stilistik, Internet und Stil. Branko Tosović, Arno Wonisch (Hrsg.). Graz: Universität Graz, 2016: 93–110.]
Korytkowska, Małgorzata, Małdżijewa, Wiara. Od zdania złożonego do zdania pojedynczego. Nominalizacja argumentu propozycjonalnego w języku polskim i bułgarskim. Toruń: Wydawnictwo UMK, 2002.
Kotin, Michaił L. “Möglichkeiten und Grenzen der korpusbasierten Grammatikforschung.” Biuletyn Polskiego Towarzystwa Językoznawczego 2018, no. LXXIV: 61–70.
Marzo, Stefania, Heylen, Kris, Sutter Gert De. “Developments in Corpus-based Contrastive Linguistics.” Corpus Studies in Contrastive Linguistics. Marzo, Stefania, Heylen, Kris, Sutter Gert De (eds.). Amsterdam: Benjamins, 2012: 1–7.
Meurers, Detmar W. “On the use of electronic corpora for theoretical linguistics: Case studies from the syntax of German.” Lingua 2005, no. 115/11: 1619–1639.
Mustajoki, Arto. “The Integrum Database as a Powerful Tool in Research on Contemporary Russian.” Integrum: tochnye metody i gumanitarnye nauki. Galina Nikiporets-Takigava (ed.). Moskva: Letniy sad, 2006: 50–75.
Münzberg, Franziska. “Korpusrecherche in der Dudenredaktion: Ein Werkstattbericht.” Grammatik und Korpora 2009. Dritte Internationale Konferenz. Mannheim, 22.–24.9.2009. M. Konopka, J. Kubczak, Jacqueline, C. Mair et al. (Hrsg.). Tübingen: Narr Verlag, 2011, S. 181–197.
Piątkowski, Łukasz. “Zastosowanie analiz korpusowych w badaniach leksyko-gramatycznych. Perspektywa porównawcza niemiecko-polska.” Zeszyty Naukowe Towarzystwa Doktorantów UJ Nauki Humanistyczne 2018, no. 21 (2): 131–150.
Polański, Kazimierz. Słownik syntaktyczno-generatywny czasowników polskich. 1/A-M. Wrocław etc.: Ossolineum, 1980.
https://orcid.org/0000-0002-6140-6368
Pracuje w Instytucie Dziennikarstwa i Komunikacji Społecznej Uniwersytetu Warmińsko-Mazurskiego w Olsztynie. Kierownik Zakładu Komunikacji Społecznej i Języka Mediów. Dyrektor Centrum Badań Europy Wschodniej UWM w Olsztynie. Redaktor naczelny czasopisma „Przegląd Wschodnioeuropejski”. Redaktor trzech serii wydawniczych. Autor ponad 450 publikacji, w tym 21 monografii. Publikował w wielu językach i w wielu krajach. Przedmiotem zainteresowań jest teoria i filozofia języka, metodologia badań lingwistycznych, socjologia językoznawstwa, gramatyka funkcjonalna, składnia semantyczna, komunikologia i pragmatyka językowa, psycholingwistyka i semantyka kognitywna, semantyka logiczna, językoznawstwo konfrontatywne:
polsko-wschodniosłowiańskie oraz słowiańsko-germańskie. Kierownik bądź wykonawca kilku projektów naukowo-badawczych, w tym realizowanych we współpracy międzynarodowej. Jest członkiem Komisji Stylistycznej oraz Komisji Lingwistyki Dyskursu przy Międzynarodowym Komitecie Slawistów, a także członkiem Socjetas Humboldtiana Polonorum. Jest (powtórnie) członkiem Zarządu Polskiego Towarzystwa Językoznawczego.
Utwór dostępny jest na licencji Creative Commons Uznanie autorstwa – Na tych samych warunkach 4.0 Miedzynarodowe.
Właściciele praw autorskich do nadesłanych tekstów udzielają Czytelnikowi prawa do korzystania z dokumentów pdf zgodnie z postanowieniami licencji Creative Commons 4.0 International License: Attribution-Share-Alike (CC BY-SA 4.0). Użytkownik może kopiować i redystrybuować materiał w dowolnym medium lub formacie oraz remiksować, przekształcać i wykorzystywać materiał w dowolnym celu.
1. Licencja
Wydawnictwo Uniwersytetu Śląskiego zapewnia natychmiastowy otwarty dostęp do treści swoich czasopism na licencji Creative Commons BY-SA 4.0 (http://creativecommons.org/licenses/by-sa/4.0/). Autorzy publikujący w tym czasopiśmie zachowują wszelkie prawa autorskie i zgadzają się na warunki wyżej wymienionej licencji CC BY-SA 4.0.
2. Oświadczenie Autora
Autor deklaruje, że artykuł jest oryginalny, napisany przez niego (i współautorów), nie był wcześniej publikowany, nie zawiera stwierdzeń niezgodnych z prawem, nie narusza praw innych osób, jest przedmiotem praw autorskich, które przysługują wyłącznie autorowi i jest wolny od wszelkich praw osób trzecich, a także, że autor uzyskał wszelkie niezbędne pisemne zgody na cytowanie z innych źródeł.
Jeśli artykuł zawiera materiał ilustracyjny (rysunki, zdjęcia, wykresy, mapy itp.), Autor oświadcza, że wskazane dzieła są jego dziełami autorskimi, nie naruszają niczyich praw (w tym osobistych, m.in. prawa do dysponowania wizerunkiem) i posiada do nich pełnię praw majątkowych. Powyższe dzieła udostępnia jako część artykułu na licencji „Creative Commons Uznanie autorstwa-Na tych samych warunkach 4.0 Międzynarodowe”.
UWAGA! Bez określenia sytuacji prawnej materiału ilustracyjnego oraz załączenia stosownych zgód właścicieli majątkowych praw autorskich publikacja nie zostanie przyjęta do opracowania redakcyjnego. Autor/autorka oświadcza równocześnie, że bierze na siebie wszelką odpowiedzialność w przypadku podania nieprawidłowych danych (także w zakresie pokrycia kosztów poniesionych przez Wydawnictwo UŚ oraz roszczeń finansowych stron trzecich).
3. Prawa użytkownika
Zgodnie z licencją CC BY-SA 4.0 użytkownicy mogą udostępniać (kopiować, rozpowszechniać i przekazywać) oraz adaptować (remiksować, przekształcać i tworzyć na podstawie materiału) artykuł w dowolnym celu, pod warunkiem, że oznaczą go w sposób określony przez autora lub licencjodawcę.
4. Współautorstwo
Jeśli artykuł został przygotowany wspólnie z innymi autorami, osoba zgłaszająca niniejszy formularz zapewnia, że została upoważniona przez wszystkich współautorów do podpisania niniejszej umowy w ich imieniu i zobowiązuje się poinformować swoich współautorów o warunkach tej umowy.
Oświadczam, że w przypadku nieuzgodnionego z redakcją i/lub wydawcą czasopisma wycofania przeze mnie tekstu z procesu wydawniczego lub skierowania go równolegle do innego wydawcy zgadzam się pokryć wszelkie koszty poniesione przez Uniwersytet Śląski w związku z procedowaniem mojego zgłoszenia (w tym m.in. koszty recenzji wydawniczych).