Towards Lexicon-Grammar Verbnets Through Lexical Ontologies
Résumé
In this article, we present research directly inspired by the Princeton WordNet lexical ontology project (Miller, Fellbaum), which was a response to the real need for ontologies corresponding to the natural conceptualization common to all language users, within a given natural language, or within a specific sublanguage. Lexical ontologies for a given language or language subsystem determined by the scope of communication needs turn out to be useful and even necessary for constructing formal models of linguistic competence and, consequently, for designing and implementing AI systems with linguistic communicative competence, both passive and active. An important milestone of the research program presented in this work is the acquisition of tools in the form of extensive lexical ontologies of a new type, referred to in this work as Lexicon-Grammar Verbnets. In the article, we refer to the works of authors such as: Alain Colmerauer, Charles Fillmore, Christiane Fellbaum, Gaston Gross, Maurice Gross, Thomas R. Gruber, Richard Kittredge, George A. Miller, Martha Palmer, Kazimierz Polański, and Piek Vossen.
Références
Colmerauer A., & Kittredge, R. (1982). ORBIS, 9th International Conference on Computational Linguistics, COLING.
Danlos, L. (1980). Représentation d’informations linguistiques : constructions N être Prép X. Thèse de 3 cycle. Paris, L.A.D.L., Université Paris VII.
Dubisz, St. (Ed.). (2006). Uniwersalny słownik języka polskiego PWN [Universal Dictionary of Polish; PWN], 2nd edition. Wydawnictwo Naukowe PWN.
Fillmore, Ch., Baker, C. F., & Sato, H. (2002). Seeing arguments through transparent structures. Third International Conference on Language Resources and Evaluation, Proceedings, Vol. III (pp. 787–791). ELRA.
Giry-Schneider, J. (1978). Les nominalisations en français : l’opérateur « faire » dans le lexique. Librairie DROZ.
Godfrey, J. J., & Zampolli, A. (1997). Language resources. Overview. In R. Cole (Ed.), Survey of the state of the art in human language technology (pp. 381–408). Cambridge University Press.
Gross, G. (1987). Les constructions converses en français. Librairie DROZ.
Gross, G. (1994). Classes d’objets et description des verbes. Langages, 15, 15–30.
Gross, M. (1975). Méthodes en syntaxe. Hermann.
Gross, M. (1979). On the failure of generative grammar. Language, 55(4) (Dec. 1979), 859–885.
Gross, M. (1981). Les bases empiriques de la notion de prédicat sémantique. Langages, 63, 7–52.
Gruber, Th. R. (1993). A translation approach to portable ontology specifications. Knowledge Acquisition, 5(2), 199–220.
Karolak, S. (1984). Składnia wyrażeń predykatywnych. In Z. Topolińska (Ed.), Gramatyka współczesnego języka polskiego. Składnia (pp. 11–30). Wydawnictwo Naukowe PWN.
Miller, G. A., Beckwith, R., Fellbaum, Ch., Gross, D., & Miller, K. (1990). WordNet: An online lexical database. Int. J. Lexicograph., 3(4), 235–244.
Miller, G. A. (1995). WordNet: A lexical database for English. Communications of the ACM,38 (11), 39–41.
Miller, G. A., & Fellbaum, Ch. (2007). WordNet then and now. Lang. Resour. Evaluation, 41(2), 209–214.
Pala, K., Horák, A., Rambousek, A., Vetulani, Z., Konieczka, P., Marciniak, J., Obrębski, T., Rzepecki, P., & Walkowska, J. (2007). DEB Platform tools for effective development of WordNets in application to PolNet. In Z. Vetulani (Ed.), Proceedings of the 3rd Language and Technology Conference: Human Language Technologies as a Challenge for
Computer Science and Linguistics, October 5–7, 2007, Poznań, Poland (pp. 514–518). Wyd. Poznańskie.
Palmer, M. (2009). Semlink: Linking PropBank, VerbNet and FrameNet. Proceedings of the Generative Lexicon Conference. Sept. 2009, Pisa, Italy. GenLex-09.
Polański, K. (1976). Słownik syntaktyczno-generatywny czasowników polskich, zeszyt próbny. Prace Naukowe Uniwersytetu Śląskiego, 124. Wydawnictwo Uniwersytetu Śląskiego.
Polański, K. (Ed.) (1980–1992). Słownik syntaktyczno-generatywny czasowników polskich, vol. I–IV, 1980–1990. Ossolineum, vol. V, 1992. Instytut Języka Polskiego PAN, Kraków.
Przepiórkowski, A. (2004) Korpus IPI PAN. Wersja wstępna. Instytut Podstaw Informatyki PAN.
Szymczak, M. (1983–1985). Słownik Języka Polskiego PWN [Dictionary of Polish Language, in Polish]. Państwowe Wydawnictwo Naukowe.
Vetulani, G. (2000). Rzeczowniki predykatywne języka polskiego. W kierunku syntaktycznego słownika rzeczowników predykatywnych. Wydawnictwo Naukowe UAM.
Vetulani, G. (2004). Le rôle du verbe dans le réseau dérivationnel des prédicats nominaux. Studia Romanica Posnaniensia, XXXI, 459–467.
Vetulani, G., Vetulani, Z, & Obrębski, T. (2008). Verb-Noun Collocation SyntLex Dictionary – Corpus-based approach. Proc. of 6th International Conference on Language Resources and Evaluation, Marrakech, Morocco (pp. 1561–1564). ELRA.
Vetulani, G. (2012). Kolokacje werbo-nominalne jako samodzielne jednostki języka. Syntaktyczny słownik kolokacji werbo-nominalnych języka polskiego na potrzeby zastosowań informatycznych. Część I. Wydawnictwo Naukowe UAM.
Vetulani, G. (2022). L’apport du Vsup au tour prédicatif verbo-nominal en polonais. Neophilologica, 34 (2022), 1–18. Wydawnictwo Uniwersytetu Śląskiego. https://doi.org/10.31261/NEO.2022.34.10.
Vetulani, Z. (1988). PROLOG Implementation of an access in Polish to a data base. Studia z Automatyki, XII. Państwowe Wydawnictwo Naukowe (PWN), 5–23.
Vetulani, Z. (1989). Linguistic problems in the theory of man-machine communication in natural language. A study of consultative question answering dialogues. Empirical approach. Brockmeyer.
Vetulani, Z. (1990). Corpus of consultative dialogues. Experimentally collected source data for AI applications. Wydawnictwo Naukowe UAM.
Vetulani, Z., Walczak, B., Obrębski, T., & Vetulani, G. (1998a). Unambiguous coding of the inflection of Polish nouns and its application in the electronic dictionaries – Format POLEX. Wydawnictwo Naukowe UAM.
Vetulani, Z., Martinek, J. Obrębski, T., & Vetulani, G. (1998b). Dictionary based methods and tools for language engineering. Wydawnictwo Naukowe UAM.
Vetulani, Z., Obrębski, T., & Vetulani, G. (2007). Towards a lexicon-grammar of Polish: Extraction of verbo-nominal collocations from corpora (pp. 267–268). In Proceedings of the Twentieth International Florida Artificial Intelligence Research Society Conference (FLAIRS-07), AAAI Press.
Vetulani, Z. (2004). Komunikacja człowieka z maszyną. Komputerowe modelowanie kompetencji językowej. Akademicka Oficyna Wydawnicza EXIT.
Vetulani, Z., Marcinak, J., Obrębski, J., Vetulani, G., Dabrowski, A., Kubis, M., Osiński, J., Walkowska, J., Kubacki, P., & Witalewski, K. (2010). Zasoby językowe i technologie przetwarzania tekstu. POLINT-112-SMS jako przykład aplikacji z zakresu bezpieczeństwa publicznego [Language resources and text processing technologies. POLINT-112-SMS as example of homeland security oriented application]. Wydawnictwo Naukowe UAM.
Vetulani, Z., & Marciniak, J. (2011). Natural language based communication between human users and the emergency center: POLINT-112-SMS (pp. 303–314). In Z. Vetulani (Ed.), Human language technology. Challenges for computer science and linguistics. LTC 2009. Revised Selected Papers. LNAI 6562. Springer-Verlag.
Vetulani, Z. (2014). (PolNt-Polish WordNet (pp. 408–416). In Z. Vetulani & J. Mariani (Eds.), Human language technology. Challenges for computer science and linguistics. LTC 2011 Revised Selected Papers. LNAI 8387. Springer-Verlag.
Vetulani, Z., & Vetulani, G. (2014). Through Wordnet to Lexicon Grammar. In F. K. Doa (Ed.), Penser le lexique grammaire: perspectives actuelles (pp. 531–543). Editions Honoré Champion.
Vetulani, Z., & Vetulani, G. (2015). Synonymie et granularité dans les bases lexicales du type WordNet. Studia Romanica Posnaniensia, XLII (1), 113–127.
Vetulani, Z., Vetulani, G., & Kochanowski, B. (2016). Recent advances in development of a lexicon-grammar of Polish: PolNet 3.0 (pp. 2851–2854). In N. Calzolari et al. (Eds.), Proceedings of the Tenth International Conference on Language Resources and Evaluation (LREC 2016). European Language Resources Association (ELRA), Paris, France.
Vetulani, Z., & Osiński, J. (2017). Intelligent information bypass for more efficient emergency management. Computational Methods in Science and Technology, 23(2), 105–123. https://doi.org/10.12921/cmst.2017.0000019.
Vetulani, Z., Vetulani, G., & Mohanty, P. (2021). Development of real size IT systems with language competence as a challenge for a Less-Resourced Language: a methodological proposal for Indo-Aryan languages. Journal of Information and Telecommunication, 5(4), 514–535. https://doi.org/10.1080/24751839.2021.1966236.
Vivès, R. (1983). Avoir, prendre, perdre : constructions à verbe support et extension aspectuelle. Thèse de 3 cycle. Paris, L.A.D.L. et Université Paris-VIII.
Vossen, P. (Ed.) (2002). EuroWordNet. General Document.Version 3. University of Amsterdam.
Walkowska, J. (2012). Modelowanie kompetencji dialogowej człowieka na potrzeby jej emulacji w zarządzających wiedzą systemach informatycznych współpracujących z wieloma użytkownikami. PhD Dissertation at IPI PAN Warszawa (supervised by Z. Vetulani).
Zampolli, A. (1996). Współpraca międzynarodowa w dziedzinie LR [International cooperation in the field of Language Resources, in Polish]. Informatyka, 3, 34–37.
Web pages
http://alain.colmerauer.free.fr/alcol/ArchivesPublications/PrologHistory/19november92.pdf (Alain Colmerauer and Philippe Roussel (1992). The birth of Prolog. GIA, Marseille). Last access: 12.09.2023.
https://pl.wikipedia.org/wiki/Słownik_języka_polskiego_(Mieczysław_Szymczak). Last access: 15.12.2023.
https://www.jstor.org/stable/412748 (Maurice Gross (1979). On the Failure of Generative Grammar). Last access: 12.09.2023.
https://en.wikipedia.org/wiki/Giuseppe_Peano (Giuseppe Peano, 1889). Last access: 12.09.2023.
http://www.illc.uva.nl/EuroWordNet/docs/GeneralDocDOC.zip (Piek Vossen. (2002). EuroWordNet. Final Document). Last access: 12.09.2023.
Adam Mickiewicz University, Poznań, Poland Pologne
https://orcid.org/0000-0003-4833-8601
Adam Mickiewicz University, Poznań, Poland Pologne
https://orcid.org/0000-0002-2138-3704
Ce travail est disponible sous licence Creative Commons Attribution - Partage dans les Mêmes Conditions 4.0 International.
Les propriétaires des droits d'auteur du texte soumis sont l'auteur et l'éditeur. Le lecteur a le droit d'utiliser les documents pdf selon les termes de la licence internationale Creative Commons 4.0 : Attribution-Share-Alike (CC BY-SA 4.0). Vous pouvez copier et redistribuer le matériel sur tout support ou dans tout format et remixer, transformer et utiliser le matériel à toutes fins.
1. Licence
La Maison d'édition de l'Université de Silésie offre un accès libre et immédiat au contenu de ses revues sous la licence Creative Commons BY-SA 4.0 (http://creativecommons.org/licenses/by/4.0/). Les auteurs qui publient dans ce journal conservent tous les droits d'auteur et acceptent les termes de la licence CC BY-SA 4.0 susmentionnée.
2. Déclaration d'auteur
L'auteur déclare que l'article est original, qu'il a été écrit par l'auteur (et les co-auteurs), qu'il n'a pas été publié précédemment, qu'il ne contient pas de contenus illégaux, qu'il n'enfreint pas les droits d'autrui, qu'il fait l'objet des droits d’auteur qui appartienent exclusivement à l'auteur et qu'il est libre de tout droit de tiers, et que l'auteur a obtenu toutes les autorisations écrites nécessaires pour citer d'autres sources.
Si l'article contient du matériel d'illustration (dessins, photographies, graphiques, cartes, etc.), l'auteur déclare que les œuvres indiquées sont les siennes, qu'elles ne portent pas atteinte aux droits de quiconque (y compris les droits personnels, par exemple le droit de disposer de son image) et qu'il en détient tous les droits patrimoniaux. Il met les œuvres ci-dessus à disposition comme partie d'un article sous la licence "Creative Commons Attribution-ShareAlike 4.0 International".
ATTENTION : Sans déterminer la situation juridique du matériel d'illustration et joindre les consentements appropriés des propriétaires des droits d'auteur, la publication ne sera pas acceptée pour un travail éditorial. En même temps, l'auteur déclare prendre toute la responsabilité en cas de données incorrectes (y compris en ce qui concerne la couverture des frais encourus par la Maison d'édition de l'Université de Silésie et les réclamations financières de tiers).
3. Droits des utilisateurs
En vertu de la licence Creative Commons Attribution, les utilisateurs peuvent partager (copier, distribuer et transmettre) et adapter (remixer, transformer et construire à partir du matériel) l'article à n'importe quelle fin, à condition de le marquer de la manière spécifiée par l'auteur ou le concédant de licence.
4. Co-auteurs
Si l'article a été cosigné avec d'autres auteurs, la personne qui soumet ce formulaire garantit qu'elle a été autorisée par tous les co-auteurs à signer cet accord en leur nom et s'engage à informer ses co-auteurs des termes de cet accord.
En tant que l'auteur du texte proposé, je déclare qu'en cas de retrait du texte du processus de publication non convenu avec le comité de rédaction et/ou l'éditeur de la revue par moi-même ou de son renvoi parallèle à un autre éditeur, je m'engage à couvrir tous les frais encourus par l'Université de Silésie dans le cadre de la procédure de ma soumission (y compris, entre autres, les frais de publication des revues).