The Use of Electronic Historical Dictionary Data in Corpus Design

Renata Bronikowska,

Włodzimierz Gruszczyński,

Maciej Ogrodniczuk,

Marcin Woliński

Abstrakt

The History of the 17th and 18th c. Polish Language Laboratory, Institute of Polish Language, Polish Academy of Sciences, is in the process of creating two large databases: The Electronic Dictionary of the 17th−18th c. Polish and The Electronic Corpus of the 17th and 18th c. Polish Texts (up to 1772), the latter in cooperation with the Institute of Computer Science, Polish Academy of Sciences. It is expected that combining these two sets of data will help to achieve the objectives established for both database projects. The present article shows the benefits that the Corpus creators can get from the data gathered in the dictionary, with special emphasis put on the use of grammatical information included in the dictionary entries to design tools for automatic text annotation in the Corpus.

Słowa kluczowe: text corpus, text annotation, historical dictionary, historical corpus, Old Polish, inflectional analysis
References

Gruszczyński Włodzimierz (ed.) (2004–). Elektroniczny słownik języka polskiego XVII i XVIII wieku. [URL: http://sxvii.pl/; accessed December 15, 2015].

Przepiórkowski Adam, Bańko Mirosław, Górski Rafał L., Lewandowska-Tomaszczyk Barbara (eds.) (2012). Narodowy Korpus Języka Polskiego. Warsaw: Wydawnictwo Naukowe PWN. [URL: http://nkjp.pl; accessed December 15, 2015].

Siekierska Krystyna (ed.) (1999−2004). Słownik języka polskiego XVII i 1. połowy XVIII wieku. Vol. 1. Kraków: Wydawnictwo Instytutu Języka Polskiego PAN.

Saloni Zygmunt, Woliński Marcin, Wołosz Robert, Gruszczyński Włodzimierz, Skowrońska Danuta (2015). Słownik gramatyczny języka polskiego. 3rd ed. Warsaw. [URL: http://sgjp.pl; accessed December 15, 2015].

Woliński Marcin (2006). Morfeusz − a practical tool for the morphological analysis of Polish. In Intelligent Information Processing and Web Mining, Advances in Soft Computing. Mieczysław A. Kłopotek, Sławomir T. Wierzchoń, Krzysztof Trojanowski (eds.), 503−512. Berlin: Springer-Verlag.

Pierwotną wersją czasopisma jest wersja elektroniczna publikowana w internecie.

Czasopismo ukazuje się w sposób ciągły on-line